Проект Google Дженни не для вас

искусственный интеллект Google Project Genie модели мира Genie 3 Llm

Google испытывает подход Яна ЛеКуна, представив Project Genie — модель, генерирующую интерактивные миры. Технология перспективна, но пока ограничена — 60 секунд, лаги и сомнения в масштабах. Будущее ИИ или временный тренд?

У Google появился целый новый мир для пользователей — но всего на минуту. На этой неделе компания представила Project Genie — так называемую «универсальную модель мира», способную генерировать интерактивные среды. Первоначально продемонстрированная узкой группе приглашённых тестировщиков ещё в августе прошлого года, модель Genie 3 теперь доступна подписчикам Google AI Ultra в США за скромную сумму в 250 долларов в месяц.

То, что Google делает ставку на «модели мира», уже само по себе примечательно. В отличие от больших языковых моделей (LLM), лежащих в основе большинства потребительских ИИ-инструментов, включая собственный Gemini, которые предсказывают следующую часть последовательности на основе огромных массивов обучающих данных, модели мира обучаются на динамике реального мира — физике и пространственных свойствах — чтобы имитировать работу физических сред.

Подход моделей мира предпочтителен для Яна ЛеКуна, бывшего главного научного сотрудника Meta* AI. ЛеКун убеждён (вероятно, справедливо), что LLM никогда не достигнут искусственного общего интеллекта — уровня, при котором ИИ сможет превзойти человека по всем направлениям. Вместо этого он считает, что модели мира могут проложить путь к этой цели, и недавно присоединился к стартапу, делающему ставку именно на это. Упрощённо говоря, LLM распознают закономерности, тогда как модели мира позволят ИИ запускать бесчисленные симуляции, чтобы понимать, как устроен мир, и делать новые выводы.

То, что Google инвестирует в эту концепцию, придаёт ей дополнительную легитимность — действительно, модели мира предлагают то, чего не могут дать LLM. Несмотря на краткость, видеопревью Project Genie выглядят впечатляюще. Однако Google ограничивает пользователей 60 секундами сгенерированного мира, при этом предупреждая, что результат «может не выглядеть полностью реалистичным, не всегда точно соответствовать промптам или изображениям, а также законам физики» — другими словами, может работать нестабильно. Сейчас на выходе — видео в разрешении 720p с частотой 24 кадра в секунду, по данным Ars Technica, а пользователи жалуются, что интерфейс часто лагает.

Для бета-версии это нормально, но такие ограничения указывают на масштаб модели — вероятно, создаваемые миры меньше, чем может показаться. Хотя пользователи в восторге и говорят, что технология может потеснить разработчиков видеоигр, пока стоит сохранять осторожность.

При этом Genie 3 от Google использует подход, отличающийся от идей ЛеКуна. Модель в рамках Project Genie создаёт непрерывный, основанный на видео мир. Пользователи могут перемещаться по нему как в игре, а в теории — ИИ-агенты могут бесконечно исследовать его, чтобы понять, как всё устроено. Концепция ЛеКуна в Meta* предполагала создание архитектуры совместного эмбеддинга (JEPA), встроенной в ИИ-агента для моделирования внешнего мира.

Тем не менее, сам факт, что Google делает ставку на модели мира, многого стоит. Конечно, компания столкнётся с теми же проблемами, что и при запуске других моделей генерации изображений и видео, например, OpenAI’s Sora 2 — включая нарушение авторских прав. Первые результаты Project Genie уже воспроизводят миры Nintendo, такие как Mario и Zelda, что, несомненно, вызовет юридические вопросы. Но это также говорит о том, что даже крупнейшие игроки ИИ-рынка понимают: LLM могут достичь предела.

Тем не менее, Google установил жёсткие ограничения на Project Genie не просто так. Если обучение и эксплуатация текстовой модели уже дорогостоящие, представьте, что требуется для полноценной симуляции мира. Модели нужны огромные объёмы многомерных данных — от визуального восприятия до физических законов — и значительная вычислительная мощность. Именно поэтому миры, пусть и кажутся обширными, на практике остаются компактными.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: