Новый агент предназначен не только для создания исследовательских отчетов, хотя он по-прежнему способен и на это. Теперь он позволяет разработчикам встраивать возможности Google для исследований на основе модели SATA в свои собственные приложения. Эта возможность реализована благодаря новому Interactions API от Google, который призван предоставить разработчикам больше контроля в грядущую эру агентного искусственного интеллекта.
Новый инструмент Gemini Deep Research — это агент, способный синтезировать огромные объемы информации и обрабатывать большие объемы данных в запросе. Google утверждает, что клиенты используют его для выполнения задач, начиная от комплексной проверки и заканчивая исследованиями токсичности лекарств.
Google также сообщает, что вскоре интегрирует этого нового агента глубоких исследований в такие сервисы, как Google Поиск, Google Финансы, приложение Gemini и популярный NotebookLM. Это еще один шаг к подготовке мира, в котором люди больше не будут искать информацию в Google — это будут делать их ИИ-агенты.
Технологический гигант заявляет, что Deep Research выигрывает от статуса Gemini 3 Pro как самой «фактологической» модели, обученной минимизировать галлюцинации при выполнении сложных задач.
AI-галлюцинации — когда большая языковая модель просто выдумывает информацию — являются особенно критической проблемой для длительных, глубоких рассуждений агентных задач, в которых множество автономных решений принимается в течение минут, часов или даже дольше. Чем больше выборов приходится делать большой языковой модели, тем выше вероятность того, что даже один сгенерированный галлюцинаторный выбор может обесценить весь результат.
Чтобы доказать свои заявления о прогрессе, Google также создал еще один эталон (как будто миру ИИ нужен еще один). Новый эталон получил незамысловатое название DeepSearchQA и предназначен для тестирования агентов в сложных, многоэтапных задачах по поиску информации. Google сделал этот эталон общедоступным.
Он также протестировал Deep Research на Humanity’s Last Exam — гораздо более интересно названном независимом эталоне общих знаний, наполненном невообразимо нишевыми задачами; и BrowserComp — эталоне для браузерных агентных задач.
Как и следовало ожидать, новый агент Google превзошел конкурентов на собственном эталоне и на Humanity’s. Однако ChatGPT 5 Pro от OpenAI оказался удивительно близким соперником и немного превзошел Google на BrowserComp.
Но эти сравнения эталонов устарели почти в тот момент, когда Google их опубликовал. Потому что в тот же день OpenAI выпустила свой долгожданный GPT 5.2 — под кодовым названием Garlic. OpenAI утверждает, что ее новейшая модель превосходит конкурентов — особенно Google — по ряду типичных эталонов, включая собственный эталон OpenAI.
Пожалуй, одной из самых интересных частей этого объявления было время. Зная, что мир ожидает выхода Garlic, Google сам выпустил новость об ИИ.
Автор – Julie Bort




