Компания JetBrains объявила об открытии исходного кода своей новой модели машинного обучения, разработанной для систем разработки программного обеспечения, — Mellum2.
Это произошло чуть более чем через год после того, как компания открыла исходный код оригинальной Mellum в 2025 году — относительно небольшой модели с 4 миллиардами параметров. Ее преемник, Mellum2, имеет в общей сложности 12 миллиардов параметров, хотя JetBrains обещает, что она сохраняет высокую скорость вычислений, используя только 2,5 миллиарда активных параметров на токен. Инженерная команда внедрила разреженную структуру Mixture-of-Experts (MoE) для достижения такой высокой скорости инференса на стандартном оборудовании.
В отличие от Mellum, которая функционировала как «фокусная» модель (фокусная, то есть она концентрировалась только на одной задаче, такой как автодополнение кода в редакторе), Mellum2 выступает в роли полноценного помощника по кодированию, способного генерировать и редактировать код, вызывать внешние инструменты, выполнять многоэтапные агентные рабочие процессы, вести длительные диалоги и использовать явное логическое рассуждение. Разработчики могут развертывать базовую, инструктивную и «думающую» версии под разрешительной лицензией Apache 2.0, сохраняя полный контроль над данными. Ниже представлена краткая таблица характеристик, сравнивающая Mellum2 и Mellum:
| Функция | Mellum | Mellum2 |
|---|---|---|
| Тип параметров | Плотный (Dense) | Mixture-of-Experts |
| Общее число параметров | 4 миллиарда | 12 миллиардов |
| Активные параметры | 4 миллиарда | 2,5 миллиарда |
| Контекстное окно | 8192 токена | 131072 токена |
| Основной фокус | Автодополнение кода | Агентные рабочие процессы |
| Головы внимания (Attention Heads) | 8 KV-голов | 4 KV-головы |
| Тип лицензии | Apache 2.0 | Apache 2.0 |
JetBrains отмечает, что Mellum2 отлично подходит для таких задач, как маршрутизация и оркестрация рабочих нагрузок ИИ, построение низколатентных RAG-пайплайнов, обеспечение работы быстрых субагентов в сложных рабочих процессах и поддержка частного локального развертывания ИИ. Команда оптимизировала этап предварительного обучения с помощью трехфазного учебного плана данных, который постепенно смещал смесь от разнообразных веб-данных к отобранному коду и математическому контенту.
В других новостях JetBrains: компания прекращает поддержку DataSpell, популярной IDE, которую используют разработчики Python. JetBrains решила вывести DataSpell из эксплуатации 28 мая, чтобы консолидировать все функции науки о данных непосредственно в PyCharm Pro. Компания автоматически конвертирует активные подписки 1 сентября 2026 года.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – David Uzondu




