В ответ на ошеломляющий успех DeepSeek бывшие инженеры Google и Apple запустили Oumi — новую платформу искусственного интеллекта с открытым исходным кодом и безграничными возможностями. В конце концов, несмотря на открытый исходный код, все равно существуют определенные условия для использования таких моделей, как Llama и DeepSeek-R1. Цель Oumi — устранить эти ограничения и сделать эту технологию более доступной для исследователей, разработчиков и предприятий.
Недавняя популярность модели ИИ DeepSeek подчеркивает растущий спрос на недорогой ИИ с открытым исходным кодом. Существующие фирменные модели, такие как OpenAI, весьма ограничены, особенно для разработчиков.
С другой стороны, существует очень мало вариантов с открытым исходным кодом, которые действительно открыты и просты в использовании. Спрос на них настолько высок, что китайская модель стартапов привела к резкому падению цен на акции американских технологических компаний в течение нескольких дней после их запуска.
Аспект открытого исходного кода (или лицензия MIT) обеспечивает пользователям свободный доступ, позволяя им использовать модель в различных целях без разрешения, изучать ее компоненты, изменять их и свободно делиться ими. Таким образом, данная лицензия предоставляет разработчикам полный доступ к архитектуре ИИ и ее возможностям.
Однако доступ к этим моделям требует соблюдения определенных условий. Хотя пользователи могут использовать эти модели и реализовывать их самостоятельно, они не знают наверняка, как они были разработаны. Например, код и конкретные данные обучения для таких моделей, как R1 и Janus-Pro от DeepSeek или Llama от Meta*, не были опубликованы. В частности, несмотря на открытый исходный код, методы обучения с подкреплением не являются общедоступными.
Эти ограничения ограничивают возможности пользователя по пониманию и полноценному использованию модели. Поэтому большинству исследователей приходится прилагать большие усилия, чтобы выяснить, как воспроизвести текущие модели с открытым исходным кодом. Это ограничивает преимущества совместных исследований.
«Даже самые крупные компании не могут сделать это в одиночку», — сказал VentureBeat Усама Элачкар, соучредитель Oumi и бывший инженер по машинному обучению Apple. «В Apple мы все работаем изолированно, и есть так много других компаний в отрасли, которые этим занимаются. «Должен быть лучший способ совместной разработки этих моделей».
В отличие от существующих моделей, Oumi рассчитана на неограниченный доступ, тогда как доступ к моделям DeepSeek или Meta* является условным. Oumi — это унифицированная среда, которая упрощает сложные рабочие процессы, необходимые для создания моделей ИИ. Платформа предоставляет исследователям и разработчикам полный набор инструментов для создания и развертывания базовых моделей.
Обратите внимание: MIT и IBM хотят изменить наш мир с помощью искусственного интеллекта.
Запуск платформы поддерживают 15 ведущих университетов и научно-исследовательских институтов, включая Принстонский университет, Стэнфордский университет, Массачусетский технологический институт (MIT), Калифорнийский университет в Беркли, Оксфордский университет, Кембриджский университет, Университет Ватерлоо и Университет Карнеги-Меллона. Университет.Несколько рабочих процессов в одной среде
Разработка базовой модели ИИ часто требует параллельного выполнения 10 и более шагов. Однако Oumi применяет совершенно иной подход, интегрируя инструменты и все необходимые рабочие процессы в единую среду. Это устранит необходимость для исследователей объединять компоненты, разработанные в разных средах.
«Нам не нужно проходить через ад открытого исходного кода, чтобы понять, что можно объединить и что работает хорошо», — пояснил Манос Кукумидис, генеральный директор Oumi и бывший руководитель направления искусственного интеллекта в Google Cloud.
Платформа поддерживает модели с числом параметров от 10 миллионов до 405 миллиардов. Это позволит пользователям начать работу в небольших масштабах, например, проводить предварительные эксперименты с использованием простого ноутбука. Затем, по мере развития моделей, они смогут использовать преимущества более крупных вычислительных систем, таких как университетские вычислительные кластеры или публичные облака, объединенные в единую среду Oumi.
Oumi также предоставляет передовые методы обучения, такие как SFT, LoRA, QLoRA и DPO, которые обычно используются для обучения больших языковых моделей. Система совместима с текстовыми и многомодальными моделями и имеет инструменты для синтеза и хранения данных.
кроме того, разработанные модели могут быть развернуты с использованием механизмов рассуждений следующего поколения (которые позволяют экспертным системам выполнять логические рассуждения), таких как vLLM и SGLang. Комплексную оценку можно провести с привлечением LLM-a-a-Judge. Они предназначены для оценки текстовых ответов на основе инструкций в оценочном задании.
Бюджет всего 10 миллионов долларов
Для создания платформы Элачкар и его соучредители собрали 10 миллионов долларов начального финансирования — на первый взгляд, это внушительный бюджет, но, по их мнению, более чем достаточный. Для сравнения, разработка модели DeepSeek обошлась менее чем в 6 миллионов долларов, в то время как таким крупным компаниям, как OpenAI и Meta*, требуются миллиарды долларов.
В то время как OpenAI планирует инвестировать 500 миллиардов долларов в новые централизованные центры обработки данных ИИ, децентрализованный подход Oumi значительно сократит расходы. «Идея о том, что на создание инфраструктуры ИИ потребуются сотни миллиардов долларов, в корне неверна», — сказал Кукумидис. «Распределяя вычисления по университетам и исследовательским институтам, мы можем получить аналогичную или даже лучшую производительность за меньшие деньги». Хорошие результаты».
Oumi также планирует разрабатывать продукты специально для предприятий, чтобы помочь им реализовать свою модель. «Благодаря открытой, безусловной платформе мы не будем ограничивать таланты, мы будем поощрять эксперименты, и общество от этого выиграет», — заключил Ганеш Шринивасан, партнер Venrock, одной из организаций, возглавляющих краудфандинг проекта платформа.
Читайте все последние новости об искусственном интеллекте на New-Science.ruБольше интересных статей здесь: Новости науки и техники.