Google анонсировала оптимизированную для агентов Gemini 3.5 Flash и универсальную модель Omni с широкими возможностями

Gemini ии Flash агенты Omni arstechnica.com

Google заявляет, что её более эффективная модель Gemini 3.5 Flash — ключ к вашему будущему в агентном ИИ. Новая модель оптимизирована для задач, а также представлен агент Gemini Spark и модель Omni. — arstechnica.com

На прошлогодней конференции I/O компания Google всё ещё говорила о ветке 2.5 Gemini, и как много изменилось за год. С тех пор мы прошли через семейства 3.0 и 3.1, и теперь на очереди версия 3.5. Gemini 3.5 Flash начинает развёртываться в широком спектре продуктов Google уже сегодня, и Google вновь заявляет, что эта модель даже лучше, чем Pro-модель предыдущего поколения.

Это стало тенденцией в обновлениях моделей Google по схеме “тик-так” за последний год, но команда утверждает, что этот релиз особенный. Gemini 3.5 Flash якобы предлагает интеллект передового уровня, будучи при этом достаточно эффективной, чтобы сложные агентные задачи наконец-то стали рентабельными в масштабе. Тулси Доши, старший директор по управлению продуктами Gemini, объясняет, что инновации Gemini 3.5 Flash вплетены в многочисленные продукты Google, и это только начало.

Google анонсировала оптимизированную для агентов Gemini 3.5 Flash и универсальную модель Omni с широкими возможностями
Источник: Google

Не секрет, что генеративный ИИ в настоящее время является “денежной ямой”, и все крупные игроки в сфере ИИ ищут пути повышения эффективности. Проблема усугубляется, когда вы начинаете создавать агентные интерфейсы, которые должны работать долго для выполнения сложных задач. Gemini 3.5 Flash может стать большим шагом к тому, чтобы сделать это жизнеспособным. Новая модель может выдавать почти 300 токенов в секунду, но её результаты тестов схожи с более крупными передовыми моделями (например, 3.1 Pro), которые генерируют результаты со скоростью в четыре раза ниже.

По словам Доши, команда внесла многочисленные улучшения в предварительное обучение Gemini 3.5 Flash, но выводы, полученные из того, как разработчики используют модели Gemini, действительно окупаются.

«С помощью постобучения мы действительно начинаем раскрывать часть ценности отзывов, которые получаем от пользователей, например, от Antigravity», — сказала Доши. «Именно это вы видите в плане производительности кода и использования инструментов. А затем есть надежда, что вы продолжите видеть скачок, когда 3.5 Pro станет лучше, а следующая Flash-версия достигнет производительности Pro в этой серии».

,

Google сосредоточилась на генерации кода с помощью новой модели, что является ключевым агентным аспектом для ИИ. Тесты Terminal Bench и SWE-Bench Pro показывают существенные улучшения — 3.5 Flash превосходит старые модели Flash и демонстрирует небольшое, но измеримое улучшение по сравнению с Gemini 3.1 Pro. Её результаты находятся в том же диапазоне, что и у гораздо более крупной и дорогой GPT 5.5 от OpenAI.

Одним из главных барьеров в агентных рабочих процессах является то, как генеративные модели могут использовать интерфейсы, предназначенные для людей. Это непростая проблема, отметила Доши. «Некоторые вещи, такие как управление пользовательским интерфейсом, требуют больших затрат, потому что модель должна искать страницу, она должна знать, куда нажать, она должна действовать в несколько этапов. Я думаю, Flash справляется с этим хорошо благодаря сочетанию качества и стоимости».

Оценки Google в области ИИ также демонстрируют эти улучшения. Среди текущей коллекции бенчмарков Google есть OSWorld-Verified, который проверяет, как модели справляются с общими задачами в реальных вычислительных средах. Это похоже на улучшения в кодировании. Gemini 3.5 Flash значительно превосходит старые модели Flash и даже немного быстрее, чем Gemini 3.1 Pro. По сути, она сравнима с GPT 5.5.

Google анонсировала оптимизированную для агентов Gemini 3.5 Flash и универсальную модель Omni с широкими возможностями
Новая Flash-модель от Google снова немного лучше, чем Pro предыдущего поколения. Источник: Google

Gemini 3.5 Flash развёрнута внутри Google, и Доши отметила, что она оказывает большое влияние. «У нас есть набор внутренних метрик, которые мы оцениваем, измеряя, как гуглеры пишут код, то есть мы смотрим на наши собственные кодовые базы и на то, насколько хорошо модели работают с ними», — сказала Доши. «И вы можете увидеть огромный, огромный скачок между тем, где была 3.1 Pro, и тем, где находится 3.5 Flash».

Google представила IDE Antigravity в прошлом году, и она обновляется до версии 2.0 с поддержкой Gemini 3.5 Flash. Это обновление будет поддерживать несколько параллельных рабочих процессов — по сути, суб-агентов, порождённых Gemini 3.5 Flash. Опять же, Google утверждает, что это возможно только потому, что новая модель настолько эффективна в быстрой генерации токенов.

,

Помимо Antigravity, Gemini 3.5 Flash появится в приложении Gemini, API, AI Studio, Android Studio и во всех корпоративных продуктах Google. Что касается варианта Pro, Google заявляет, что он уже проходит внутреннее тестирование и должен быть готов к выпуску в следующем месяце.

Gemini Spark — это 3.5 Flash в форме агента

Компании переходят от «ИИ» как основного модного слова к «агентам». С Gemini Spark Google предлагает пользователям своего первого выделенного агента. Spark работает круглосуточно в облаке Google, поэтому он не использует ваши вычислительные ресурсы и не привязан к какому-либо конкретному устройству или вкладке браузера. Вместо этого он охватывает весь ваш след в Google, используя Gemini Flash 3.5 для выполнения множества агентных рабочих процессов по вашей команде.

Google не всегда хорошо объясняет свои модные слова. Так что же такое ИИ-агент? Доши из Google объясняет: «Я представляю агентов как нечто, способное взять модель плюс программный интерфейс (harness), чтобы эта комбинация могла фактически действовать от вашего имени».

Со Spark вы можете давать ИИ инструкции, а он выполняет задачу. Это может происходить со временем, поскольку агент извлекает контекст из ваших файлов в Google Диске, Gmail и других источников. Вы можете поручить ему отслеживать определённые электронные письма и включать их в ежедневные сводки или следить за вашими встречами и генерировать резюме и пункты действий. Spark также может отправлять вам уведомления или задавать уточняющие вопросы для лучшего удовлетворения ваших потребностей, и Google подчёркивает, что он разработан так, чтобы запрашивать ваше одобрение перед выполнением «действий с высокими ставками».

Google анонсировала оптимизированную для агентов Gemini 3.5 Flash и универсальную модель Omni с широкими возможностями
Источник: Google

Доши говорит, что она ежедневно пользуется Gemini Spark во время внутреннего тестирования в последние несколько недель, используя его для личных и профессиональных задач. Она привела два примера агентов Spark, которые она использует. В преддверии I/O она использовала Spark для сбора оценок и другой статистики по 3.5 Flash, чтобы создать слайд-дек для высшего руководства Google. «Получилось великолепно», — сказала она. «Наверное, лучше и за гораздо меньшее время, чем я смогла бы сделать сама».

,

В личных целях она создала агента, который отслеживает этапы развития её новорождённого ребёнка. Агент предоставляет информацию о данных и предлагает другие метрики, которые стоит отслеживать. «Я отношусь к своему ребёнку как к модели ИИ», — пошутила Доши. «Я это понимаю, но это оказалось очень полезным».

Многие могут отнестись с пренебрежением к предоставлению такого большого объёма личных данных ИИ-модели, работающей в облаке Google, но настроения могут измениться, если эти вещи станут по-настоящему полезными. Многие способы, которыми люди сегодня делятся данными с Google, были бы немыслимы 10 или 15 лет назад.

Spark начнёт развёртываться для подписчиков AI Ultra на следующей неделе. Google добавила новый уровень Ultra, который даёт доступ к новейшим функциям. Он стоит 100 долларов в месяц, что большинство всё ещё сочли бы астрономической суммой за инструменты ИИ, но уровень в 200 долларов в месяц (на 50 долларов ниже, чем раньше) всё ещё существует для тех, кому нужны большие лимиты токенов. Google заявляет, что в будущем планирует развернуть Spark для всех пользователей (даже тех, кто не платит за Gemini).

Gemini Omni: модель «всё в одном» (в конечном итоге)

Veo 3, тревожно хорошая видеомодель от Google, дебютировала на прошлогодней I/O, но в этом году на сцене новый генератор видео. Gemini Omni Flash заменит Veo в таких продуктах, как приложение Gemini, YouTube и Flow. Google заявляет, что Omni была разработана как по-настоящему мультимодальная, поэтому она может принимать любые входные данные и выдавать всё, что вы захотите — изображения, текст, видео или аудио. Однако в настоящее время она делает не всё это. Google начинает с видео, отсюда и замена Veo.

Хотя она похожа на новые модели Gemini 3.5, Omni Flash явно не является частью этой ветки. Это нечто уникальное для Google, и это может ознаменовать новое направление для ИИ-продуктов компании. «Видение Gemini всегда заключалось в том, что она будет мультимодальной на входе и мультимодальной на выходе», — сказала Доши. «Omni — это шаг к этому видению».

,

В настоящее время вам нужно подключаться к модели, которая выполняет желаемое действие. Для изображений Google перенаправляет ваш запрос на Nano Banana. Если вам нужна музыка, ваш ввод поступает в Lyria. Разработчики должны подключаться к нужному API, и не все модели доступны во всех инструментах. Возможно, настанет день, когда всё будет проходить через унифицированную модель, такую как Omni, но пока это только начало, и команда Gemini ещё не уверена, как будет развиваться Omni.

Следующие несколько месяцев будут показательными, поскольку Google планирует открыть модель Omni для большего числа типов вывода, чтобы увидеть, как она будет работать по сравнению с другими моделями Google. «Мы можем обнаружить, что определённые варианты использования действительно выигрывают от наличия собственной настраиваемой модели и специфической направленности», — сказала Доши. «Ещё не доказано, что в ближайшие несколько месяцев мы сможем объединить всё в одном интерфейсе».

Первый релиз Omni — это модель Flash, что означает, что она меньше, чем передовые модели Pro. Google намерена выпустить модель Omni Pro в какой-то момент, но сроков для этого нет. Если мультимодальность в Omni сойдётся, эти модели могут в конечном итоге лечь в основу будущих релизов Gemini, чтобы упростить экосистему ИИ Google.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: