Replicate теперь часть Cloudflare: новый этап развития платформы для разработчиков

Мы с радостью сообщаем, что, начиная с сегодняшнего дня, Replicate официально стал частью Cloudflare.

Когда мы основали Replicate в 2019 году, OpenAI только что открыла исходный код GPT-2, и мало кто за пределами сообщества машинного обучения уделял большое внимание ИИ. Но для нас, работающих в этой области, чувствовалось, что должно произойти нечто значительное. В академических лабораториях создавались выдающиеся модели, но чтобы запустить их, вам понадобился бы, образно говоря, лабораторный халат.

Мы поставили своей миссией вывести исследовательские модели из лабораторий в руки разработчиков. Мы хотели, чтобы программисты творчески адаптировали и встраивали эти модели в продукты, о которых исследователи даже не задумывались.

Мы подошли к этому как к проблеме инструментария. Подобно тому, как такие инструменты, как Heroku, позволили запускать веб-сайты без управления веб-серверами, мы хотели создать инструменты для запуска моделей без необходимости разбираться в обратном распространении ошибки или бороться с ошибками CUDA.

Первым инструментом, который мы создали, был Cog: стандартный формат упаковки моделей машинного обучения. Затем мы построили Replicate как платформу для запуска моделей Cog в качестве конечных точек API в облаке. Мы абстрагировались как от низкоуровневого машинного обучения, так и от сложного управления кластерами GPU, необходимого для масштабного выполнения выводов.

Оказалось, что время было выбрано идеально. Когда в 2022 году был выпущен Stable Diffusion, у нас уже была зрелая инфраструктура, способная справиться с огромным интересом разработчиков к запуску этих моделей. На Replicate было создано множество фантастических приложений и продуктов — приложений, которые часто запускали одну модель, упакованную в стильный пользовательский интерфейс для решения конкретной задачи.

С тех пор AI Engineering выросло в серьёзное ремесло. ИИ-приложения больше не сводятся только к запуску моделей. Современный стек ИИ включает в себя вывод моделей, а также микросервисы, доставку контента, объектное хранилище, кэширование, базы данных, телеметрию и т.д. Мы видим, что многие наши клиенты строят сложные гетерогенные стеки, где модели Replicate являются частью системы более высокого порядка, охватывающей несколько платформ.

Вот почему мы присоединяемся к Cloudflare. У Replicate есть инструменты и примитивы для запуска моделей. У Cloudflare — лучшая сеть, Workers, R2, Durable Objects и все остальные примитивы, необходимые для построения полного стека ИИ.

Стек ИИ полностью существует в сети. Модели работают на GPU в центрах обработки данных и связываются между собой неболькими облачными функциями, которые обращаются к векторным базам данных, извлекают объекты из блоб-хранилища, вызывают MCP-серверы и т.д. «Сеть — это компьютер» никогда не было так верно.

В Cloudflare мы теперь сможем построить уровень ИИ-инфраструктуры, о котором мечтали с самого начала. Мы сможем делать такие вещи, как запуск быстрых моделей на границе сети, выполнение конвейеров моделей на мгновенно запускающихся Workers, потоковая передача входных и выходных данных моделей с помощью WebRTC и т.д.