Replicate

ML model hostingДёшево

Запуск и деплой любой open-source ML-модели через API — без своих GPU.

Что это

Replicate запускает, дообучает и деплоит тысячи open-source ML-моделей (картинки, видео, аудио, LLM) через простые API-вызовы с оплатой за секунды вычислений — без управления серверами. Хостит семейство FLUX, позволяет упаковать свои модели через open-source Cog, с автоскейлингом до нуля в простое.

Что умеет

Единый API для тысяч моделей сообщества
Модели изображений FLUX (schnell / dev / pro)
LLM и аудио/видео-модели
Деплой своих моделей через Cog (open source)
Файнтюнинг моделей на своих данных
GPU до 8× H100, автоскейл до нуля
Оплата посекундно или за вывод
Клиентские библиотеки и вебхуки

Цены

Бесплатный тариф

Постоянного фритира нет; небольшой стартовый кредит, далее по факту

Платно от

from ~$0.09/hr CPU; FLUX schnell ~$0.003/img

Похожие сервисы

Сервис	Чем отличается
Replicatefrom ~$0.09/hr CPU; FLUX schnell ~$0.003/img	Запуск и деплой любой open-source ML-модели через API — без своих GPU.
fal.ai	Быстрый инференс с малой задержкой для diffusion-моделей.
Hugging Face	Хаб моделей с Inference Endpoints; самая широкая экосистема.
Modal	Serverless-платформа GPU для кастомного Python ML-кода в масштабе.

Скиллы, которые используют сервис

content-gen→