Все сервисы

Replicate

ML model hostingДёшево

Запуск и деплой любой open-source ML-модели через API — без своих GPU.

Что это

Replicate запускает, дообучает и деплоит тысячи open-source ML-моделей (картинки, видео, аудио, LLM) через простые API-вызовы с оплатой за секунды вычислений — без управления серверами. Хостит семейство FLUX, позволяет упаковать свои модели через open-source Cog, с автоскейлингом до нуля в простое.

Что умеет

  • Единый API для тысяч моделей сообщества
  • Модели изображений FLUX (schnell / dev / pro)
  • LLM и аудио/видео-модели
  • Деплой своих моделей через Cog (open source)
  • Файнтюнинг моделей на своих данных
  • GPU до 8× H100, автоскейл до нуля
  • Оплата посекундно или за вывод
  • Клиентские библиотеки и вебхуки

Цены

Бесплатный тариф

Постоянного фритира нет; небольшой стартовый кредит, далее по факту

Платно от

from ~$0.09/hr CPU; FLUX schnell ~$0.003/img

Похожие сервисы

СервисЧем отличается
Replicatefrom ~$0.09/hr CPU; FLUX schnell ~$0.003/imgЗапуск и деплой любой open-source ML-модели через API — без своих GPU.
fal.ai Быстрый инференс с малой задержкой для diffusion-моделей.
Hugging Face Хаб моделей с Inference Endpoints; самая широкая экосистема.
Modal Serverless-платформа GPU для кастомного Python ML-кода в масштабе.

Скиллы, которые используют сервис