JetBrains открывает исходный код Mellum 2 с 12 млрд параметров

Jetbrains Mellum2 ии Open Source разработка по Pycharm neowin.net

JetBrains открыла исходный код Mellum 2, преемника модели Mellum, сфокусированной на автодополнении кода, которая также была выпущена с открытым исходным кодом в прошлом году. — neowin.net

Компания JetBrains объявила об открытии исходного кода своей новой модели машинного обучения, разработанной для систем разработки программного обеспечения, — Mellum2.

Это произошло чуть более чем через год после того, как компания открыла исходный код оригинальной Mellum в 2025 году — относительно небольшой модели с 4 миллиардами параметров. Ее преемник, Mellum2, имеет в общей сложности 12 миллиардов параметров, хотя JetBrains обещает, что она сохраняет высокую скорость вычислений, используя только 2,5 миллиарда активных параметров на токен. Инженерная команда внедрила разреженную структуру Mixture-of-Experts (MoE) для достижения такой высокой скорости инференса на стандартном оборудовании.

В отличие от Mellum, которая функционировала как «фокусная» модель (фокусная, то есть она концентрировалась только на одной задаче, такой как автодополнение кода в редакторе), Mellum2 выступает в роли полноценного помощника по кодированию, способного генерировать и редактировать код, вызывать внешние инструменты, выполнять многоэтапные агентные рабочие процессы, вести длительные диалоги и использовать явное логическое рассуждение. Разработчики могут развертывать базовую, инструктивную и «думающую» версии под разрешительной лицензией Apache 2.0, сохраняя полный контроль над данными. Ниже представлена краткая таблица характеристик, сравнивающая Mellum2 и Mellum:

Функция Mellum Mellum2
Тип параметров Плотный (Dense) Mixture-of-Experts
Общее число параметров 4 миллиарда 12 миллиардов
Активные параметры 4 миллиарда 2,5 миллиарда
Контекстное окно 8192 токена 131072 токена
Основной фокус Автодополнение кода Агентные рабочие процессы
Головы внимания (Attention Heads) 8 KV-голов 4 KV-головы
Тип лицензии Apache 2.0 Apache 2.0

JetBrains отмечает, что Mellum2 отлично подходит для таких задач, как маршрутизация и оркестрация рабочих нагрузок ИИ, построение низколатентных RAG-пайплайнов, обеспечение работы быстрых субагентов в сложных рабочих процессах и поддержка частного локального развертывания ИИ. Команда оптимизировала этап предварительного обучения с помощью трехфазного учебного плана данных, который постепенно смещал смесь от разнообразных веб-данных к отобранному коду и математическому контенту.

В других новостях JetBrains: компания прекращает поддержку DataSpell, популярной IDE, которую используют разработчики Python. JetBrains решила вывести DataSpell из эксплуатации 28 мая, чтобы консолидировать все функции науки о данных непосредственно в PyCharm Pro. Компания автоматически конвертирует активные подписки 1 сентября 2026 года.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: