JetBrains открывает исходный код Mellum 2 с 12 млрд параметров

David Uzondu

02.06.2026

Jetbrains Mellum2 ии Open Source разработка по Pycharm neowin.net

JetBrains открыла исходный код Mellum 2, преемника модели Mellum, сфокусированной на автодополнении кода, которая также была выпущена с открытым исходным кодом в прошлом году. — neowin.net

Компания JetBrains объявила об открытии исходного кода своей новой модели машинного обучения, разработанной для систем разработки программного обеспечения, — Mellum2.

Это произошло чуть более чем через год после того, как компания открыла исходный код оригинальной Mellum в 2025 году — относительно небольшой модели с 4 миллиардами параметров. Ее преемник, Mellum2, имеет в общей сложности 12 миллиардов параметров, хотя JetBrains обещает, что она сохраняет высокую скорость вычислений, используя только 2,5 миллиарда активных параметров на токен. Инженерная команда внедрила разреженную структуру Mixture-of-Experts (MoE) для достижения такой высокой скорости инференса на стандартном оборудовании.

В отличие от Mellum, которая функционировала как «фокусная» модель (фокусная, то есть она концентрировалась только на одной задаче, такой как автодополнение кода в редакторе), Mellum2 выступает в роли полноценного помощника по кодированию, способного генерировать и редактировать код, вызывать внешние инструменты, выполнять многоэтапные агентные рабочие процессы, вести длительные диалоги и использовать явное логическое рассуждение. Разработчики могут развертывать базовую, инструктивную и «думающую» версии под разрешительной лицензией Apache 2.0, сохраняя полный контроль над данными. Ниже представлена краткая таблица характеристик, сравнивающая Mellum2 и Mellum:

Функция	Mellum	Mellum2
Тип параметров	Плотный (Dense)	Mixture-of-Experts
Общее число параметров	4 миллиарда	12 миллиардов
Активные параметры	4 миллиарда	2,5 миллиарда
Контекстное окно	8192 токена	131072 токена
Основной фокус	Автодополнение кода	Агентные рабочие процессы
Головы внимания (Attention Heads)	8 KV-голов	4 KV-головы
Тип лицензии	Apache 2.0	Apache 2.0

JetBrains отмечает, что Mellum2 отлично подходит для таких задач, как маршрутизация и оркестрация рабочих нагрузок ИИ, построение низколатентных RAG-пайплайнов, обеспечение работы быстрых субагентов в сложных рабочих процессах и поддержка частного локального развертывания ИИ. Команда оптимизировала этап предварительного обучения с помощью трехфазного учебного плана данных, который постепенно смещал смесь от разнообразных веб-данных к отобранному коду и математическому контенту.

В других новостях JetBrains: компания прекращает поддержку DataSpell, популярной IDE, которую используют разработчики Python. JetBrains решила вывести DataSpell из эксплуатации 28 мая, чтобы консолидировать все функции науки о данных непосредственно в PyCharm Pro. Компания автоматически конвертирует активные подписки 1 сентября 2026 года.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – David Uzondu

Оригинал статьи