Replicate
ML model hostingДёшевоЗапуск и деплой любой open-source ML-модели через API — без своих GPU.
Что это
Replicate запускает, дообучает и деплоит тысячи open-source ML-моделей (картинки, видео, аудио, LLM) через простые API-вызовы с оплатой за секунды вычислений — без управления серверами. Хостит семейство FLUX, позволяет упаковать свои модели через open-source Cog, с автоскейлингом до нуля в простое.
Что умеет
- Единый API для тысяч моделей сообщества
- Модели изображений FLUX (schnell / dev / pro)
- LLM и аудио/видео-модели
- Деплой своих моделей через Cog (open source)
- Файнтюнинг моделей на своих данных
- GPU до 8× H100, автоскейл до нуля
- Оплата посекундно или за вывод
- Клиентские библиотеки и вебхуки
Цены
Бесплатный тариф
Постоянного фритира нет; небольшой стартовый кредит, далее по факту
Платно от
from ~$0.09/hr CPU; FLUX schnell ~$0.003/img
Похожие сервисы
| Сервис | Чем отличается |
|---|---|
| Replicatefrom ~$0.09/hr CPU; FLUX schnell ~$0.003/img | Запуск и деплой любой open-source ML-модели через API — без своих GPU. |
| fal.ai | Быстрый инференс с малой задержкой для diffusion-моделей. |
| Hugging Face | Хаб моделей с Inference Endpoints; самая широкая экосистема. |
| Modal | Serverless-платформа GPU для кастомного Python ML-кода в масштабе. |