Годами технологическая индустрия хвасталась тем, чья облачная модель ИИ имеет больше триллионов параметров и кто вложил больше миллиардов долларов в центры обработки данных. Однако сцена открытого исходного кода в области ИИ, похоже, движется в ином направлении. Хотя верно, что существуют некоторые модели с открытым исходным кодом, для запуска которых по сути требуется оборудование уровня дата-центра, мы также постоянно получаем более компактные модели, которые становятся все более функциональными и могут работать на потребительском оборудовании. И под потребительским оборудованием я подразумеваю мобильные телефоны.
Недавно компания Alibaba выпустила свою новую серию малых моделей Qwen 3.5, включающую высокооптимизированные модели с количеством параметров от 0,8 до 9 миллиардов. Эти модели, несмотря на свой крошечный размер и скромные (по меркам ИИ) вычислительные требования, уже сокращают разрыв с проприетарными моделями технологических гигантов. Они могут обрабатывать как текст, так и изображения и даже превзошли некоторые небольшие модели от OpenAI и Google, такие как GPT-5 nano и Gemini 2.5 Flash-Lite, в определенных тестах.
Самая захватывающая часть этого релиза — это модель с 2B (два миллиарда параметров). В то время как такие модели, как Qwen 3.5-9B, по-прежнему требуют не менее 5 ГБ видеопамяти для плавной работы на ПК, вариант с 2B настолько сжат, что может работать на смартфоне. Фактически, люди уже загружают его и запускают полностью локально на своих Android-устройствах или iPhone.
Подумайте на секунду, что это на самом деле означает. Теперь у нас есть нативно мультимодальный ИИ, который может одновременно обрабатывать текст и изображения, работая полностью за счет процессора смартфона. Поскольку все вычисления происходят на устройстве, ваши данные никогда не попадают на сервер. Это не требует подключения к интернету и не стоит ничего ежемесячно.
Вы можете установить и запустить Qwen 3.5-2B на своем телефоне прямо сейчас совершенно бесплатно.
Тем не менее, Qwen 3.5-2B — это крошечная языковая модель с весьма ограниченными возможностями. Для справки: передовые модели ИИ имеют сотни миллиардов и даже триллионы параметров.
Qwen 3.5-2B не может сравниться со своими облачными аналогами в сложных рассуждениях, кодировании или написании текстов. Лучшее, что можно получить от нее, — это сеансы чата низкой сложности. Кроме того, настройка с помощью приложений для локального инференса не является простой задачей, а запуск модели ИИ локально на телефоне несомненно быстро разрядит батарею.
Вот почему такие эксперименты больше подходят энтузиастам, которые могут захотеть попробовать это ради самого процесса, а не обычным пользователям. Однако, учитывая темпы развития технологий, было бы разумно ожидать, что даже модели ИИ, работающие на оборудовании смартфонов, станут более функциональными и полезными для сложных задач.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Ivan Jenic




