Корпорация Microsoft только что выпустила Phi-4 15B — новую мультимодальную модель ИИ с открытым весом, главное преимущество которой заключается в том, что она точно знает, когда следует прекратить размышления, чего мы не видим во многих LLM с открытым исходным кодом.
Недавно выпущенная Phi-4-reasoning-vision-15B — это модель с 15 миллиардами параметров, предназначенная для решения сложных задач, таких как создание подписей к изображениям, привязка элементов пользовательского интерфейса и продвинутая математика. Особенно интересно в ней то, что Microsoft разработала Phi-4 15B так, чтобы она могла самостоятельно решать, когда активировать режим размышления, а когда давать мгновенные ответы.
Большинству моделей ИИ требуется, чтобы вы либо включили, либо отключили режим размышления, и они строго следуют этому решению. Способность Phi-4 15B самостоятельно выбирать, когда думать, может оказаться на удивление эффективной, но также может быть непредсказуемой. Для определения привлекательности такого подхода требуются дополнительные испытания в реальных условиях.
Microsoft также была очень эффективна при обучении этого варианта Phi-4, поскольку он обучался всего на 200 миллиардах токенов. Для справки: большинству достаточно крупных моделей ИИ требуется более триллиона токенов, чтобы набрать необходимую скорость. Команда разработчиков также была избирательна при выборе контента для обучения Phi-4 15B. Теоретически это должно означать, что модель дает более качественные ответы, просто потому, что она обучалась на данных более высокого качества. Но на практике это не обязательно так, особенно учитывая, что Microsoft использовала GPT 4o для помощи в обучении.
Microsoft представила результаты бенчмарков для Phi-4 15B в сравнении с другими открытыми LMM своего класса и немного выше, и результаты оказались неоднозначными. В то время как модель Microsoft превосходит даже более крупные модели в некоторых тестах, она также отстает в других категориях. Здесь следует отдать должное Microsoft за демонстрацию реалистичных результатов бенчмарков, а не за попытки их завысить в пользу своей модели. Тем не менее, бенчмарки часто дают неточное представление о возможностях модели, поэтому результаты в реальном мире могут отличаться.
Вот результаты бенчмарков модели Phi-4 15B:

Серия моделей с открытым весом Phi-4 от Microsoft часто недооценивается, поскольку сообщество открытого исходного кода больше сосредоточено на LLM от китайских компаний, таких как Qwen 3.5. И надо признать, Microsoft не прилагает особых усилий для ее рекламы, поскольку компания больше сосредоточена на предоставлении инфраструктуры для передовых сторонних моделей. Однако Phi-4 15B все же может стать неплохим выбором, поскольку она демонстрирует достойные результаты в компактном исполнении.
Более подробную информацию о Microsoft Phi-4 15B можно найти в блоге Microsoft.
Microsoft уже сделала модель общедоступной. Вы можете получить открытые веса прямо сейчас на Hugging Face и в Microsoft Foundry.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Ivan Jenic




