Однако крошечный стартап Arcee AI, насчитывающий всего 30 человек, с этим не согласен. Компания только что выпустила по-настоящему и навсегда открытую (лицензия Apache) универсальную базовую модель под названием Trinity. В Arcee утверждают, что модель с 400 миллиардами параметров является одной из крупнейших открытых базовых моделей, когда-либо обученных и выпущенных американской компанией.
По данным Arcee, согласно эталонным тестам, проведенным на базовых моделях (с минимальной последующей донастройкой), Trinity сопоставима с Llama 4 Maverick 400B от *Meta и Z.ai GLM-4.5 — высокопроизводительной моделью с открытым исходным кодом от китайского Университета Цинхуа.

Как и другие передовые (SOTA) модели, Trinity ориентирована на кодирование и многоэтапные процессы, такие как агенты. Тем не менее, несмотря на свои размеры, она пока не является настоящим конкурентом SOTA, поскольку в настоящее время поддерживает только текст.
В разработке находятся другие режимы: в настоящее время создается модель для работы с изображениями, а в планах есть версия преобразования речи в текст, как сообщил TechCrunch технический директор Лукас Аткинс (на фото выше, слева). Для сравнения, Llama 4 Maverick от *Meta уже является мультимодальной, поддерживая текст и изображения.
Но прежде чем пополнять свой арсенал новыми режимами ИИ, Arcee заявляет, что хотела создать базовую LLM, которая впечатлит её основных целевых клиентов: разработчиков и ученых. Команда особенно стремится переманить американские компании любого размера от выбора открытых моделей из Китая.
«В конечном счете, победителями в этой игре, и единственный способ действительно завоевать популярность — это иметь лучшую модель с открытым весом», — сказал Аткинс. «Чтобы завоевать сердца и умы разработчиков, вы должны дать им лучшее».
Бенчмарки показывают, что базовая модель Trinity, которая в настоящее время проходит предварительный просмотр, пока идет наравне и в некоторых случаях немного превосходит Llama в тестах на кодирование, математику, здравый смысл, знания и рассуждения.
Прогресс, которого Arcee добилась на сегодняшний день, чтобы стать конкурентоспособной AI-лабораторией, впечатляет. Крупная модель Trinity следует за двумя предыдущими небольшими моделями, выпущенными в декабре: Trinity Mini с 26 миллиардами параметров, полностью донастроенной моделью для рассуждений, применимой для задач от веб-приложений до агентов, и Trinity Nano с 6 миллиардами параметров, экспериментальной моделью, созданной для расширения границ крошечных, но при этом «разговорчивых» моделей.
Самое интересное, что Arcee обучила их все за шесть месяцев, потратив в общей сложности 20 миллионов долларов, используя 2048 графических процессоров Nvidia Blackwell B300. Это составляет примерно половину из 50 миллионов долларов, которые компания привлекла на данный момент, сообщил основатель и генеральный директор Марк Маккуэйд (на фото выше, справа).
Такой объем средств был «огромным для нас», — сказал Аткинс, который руководил процессом создания модели. Тем не менее, он признал, что это меркнет по сравнению с тем, сколько тратят сейчас более крупные лаборатории.
Шестимесячный график «был очень просчитан», — отметил Аткинс, чья карьера до эпохи LLM была связана с созданием голосовых агентов для автомобилей. «Мы — моложе стартап, который очень голоден. У нас есть огромное количество талантливых и ярких молодых исследователей, которым, когда им предоставили возможность потратить эту сумму денег и обучить модель такого размера, мы доверяли, что они справятся с этой задачей. И они, безусловно, справились, пережив множество бессонных ночей и долгих часов работы».
Маккуэйд, ранее работавший одним из первых сотрудников на маркетплейсе открытых моделей HuggingFace, утверждает, что Arcee не начинала с целью стать новой американской AI-лабораторией: изначально компания занималась кастомизацией моделей для крупных корпоративных клиентов, таких как SK Telecom.
«Мы занимались только последующей настройкой. Мы брали превосходные наработки других: брали модель Llama, брали модель Mistral, брали модель Qwen с открытым исходным кодом и донастраивали ее, чтобы она лучше соответствовала предполагаемому использованию компанией», — сказал он, включая обучение с подкреплением.
Но по мере роста клиентской базы, по словам Аткинса, необходимость в собственной модели становилась насущной, а Маккуэйд беспокоился о зависимости от других компаний. В то же время многие из лучших открытых моделей поступали из Китая, чего американские предприятия опасались или не имели права использовать.
Это было тревожное решение. «Я думаю, в мире существует менее 20 компаний, которые когда-либо предварительно обучали и выпускали собственную модель» того масштаба и уровня, к которому стремилась Arcee, — сказал Маккуэйд.
Сначала компания начинала с малого, пробуя свои силы с крошечной моделью на 4,5 миллиарда параметров, созданной в партнерстве с тренинговой компанией DatologyAI. Успех этого проекта затем подтолкнул к более масштабным начинаниям.
Но если у США уже есть Llama, зачем им еще одна модель с открытым весом? Аткинс утверждает, что, выбрав лицензию Apache с открытым исходным кодом, стартап обязуется всегда сохранять свои модели открытыми. Это происходит после того, как генеральный директор *Meta Марк Цукерберг в прошлом году намекнул, что его компания, возможно, не всегда будет делать все свои самые передовые модели открытыми.
«Llama можно рассматривать как не совсем открытый исходный код, поскольку она использует лицензию, контролируемую *Meta, с оговорками относительно коммерческого использования и условий эксплуатации», — говорит он. Это заставило некоторые организации, занимающиеся открытым исходным кодом, заявить, что Llama вообще не соответствует требованиям открытого исходного кода.
«Arcee существует потому, что США нужна постоянно открытая, лицензированная Apache, передовая альтернатива, которая действительно может конкурировать на современном уровне», — сказал Маккуэйд.
Все модели Trinity, большие и малые, можно загрузить бесплатно. Самая большая версия будет выпущена в трех вариантах. Trinity Large Preview — это модель с минимальной последующей настройкой, то есть она была обучена следовать человеческим инструкциям, а не просто предсказывать следующее слово, что делает ее пригодной для общего чата. Trinity Large Base — это базовая модель без последующей настройки.
Затем у нас есть TrueBase — модель без каких-либо данных инструкций или последующей настройки, чтобы предприятиям или исследователям, желающим ее настроить, не приходилось отменять какие-либо данные, правила или предположения.
Acree AI в конечном итоге предложит размещенную версию своей общедоступной модели по, как она заявляет, конкурентоспособной цене API. Этот релиз ожидается через шесть недель, поскольку стартап продолжает совершенствовать обучение модели для рассуждений.
Стоимость API для Trinity-Mini составляет $0,045 / $0,15, также доступен бесплатный уровень с ограничением скорости. Между тем, компания по-прежнему продает услуги по последующей настройке и кастомизации.
*Facebook, *Instagram и *WhatsApp принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Julie Bort




