Компания Google уже привлекала к себе внимание моделью генерации изображений Nano Banana, которая на сегодняшний день сгенерировала более 50 миллиардов изображений. В этом году Google вывела свои разработки на новый уровень с новой моделью Gemini Omni, которую поисковый гигант позиционирует как способную «создавать что угодно из любых входных данных — начиная с видео».
Иными словами, новая модель позволяет комбинировать изображения, аудио, видео и текст в качестве входных данных для генерации высококачественных видеороликов и их редактирования с помощью диалоговых подсказок. Gemini Omni Flash — первая модель в семействе, а поддержка других выходных модальностей, таких как изображения и аудио, будет добавлена Google в будущем.
Во время презентации Google I/O 2026 поисковый гигант продемонстрировал несколько возможностей новой модели. При редактировании видео персонажи, последовательности сцен и другие аспекты остаются неизменными, а с помощью подсказок на естественном языке можно добавлять или удалять объекты, выбирать другие ракурсы камеры или изменять их полностью.
Вы можете загрузить снятое вами реальное видео в Omni и попросить добавить новых персонажей или объекты, либо добавить некоторые CGI-эффекты. «Изменяйте окружение, ракурс, стиль или даже конкретные детали, ни разу не теряя нити исходной сцены. Прокрутите карусель, чтобы увидеть, как правки наслаиваются друг на друга», — пояснила Google.
Поисковый гигант отмечает, что Omni обладает «интуитивным пониманием физики», а ее творения основаны на знаниях Gemini об истории, науке и культурном контексте для повышения фотореализма и качества повествования. Модель ИИ может генерировать объясняющие видеоролики по коротким подсказкам, включая озвучку с помощью ИИ.
В качестве входных данных можно использовать изображения персонажей, сцен или рисунки. Хотя модель поддерживает несколько форматов ввода, Google сообщила, что на начальном этапе будет поддерживаться только голосовое сопровождение для аудио, а другие типы аудио будут добавлены позже.
Обратите внимание, что все видео, созданные с помощью Omni, будут иметь водяной знак SynthID, который можно проверить через приложение Gemini, Chrome и Google Поиск. Вы также можете создать свой аватар или цифровую версию себя, которая может появиться в сгенерированных Omni видео, выглядя и звуча как вы.
Gemini Omni Flash уже развертывается в приложении Gemini и Google Flow для пользователей с подпиской Google AI Plus/Pro/Ultra. Она также предоставляется бесплатно пользователям, желающим делать ремиксы YouTube Shorts, а также в приложении YouTube Create.
Omni вышла одновременно с новой моделью Gemini 3.5 Flash, которая является самой «мощной» моделью Google для кодирования на сегодняшний день. Больше материалов с Google I/O 2026 можно найти по ссылке.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Aditya Tiwari




