«Наш агент играет уже 100 часов без перерыва», — с сияющим видом заявил Кент Роллинс, директор по продуктам компании.
Прежде чем я успел погрузиться в зрелище того, как ИИ ориентируется в виртуальной среде игры, я услышал электронные шаги приближающегося крупного четвероногого робота.
«Тот же мозг, который управляет агентом, играющим в Fortnite, управляет и роботом», — сказал мне де Витте. Джош Дюплантис, аналитик данных, державший ноутбук со стримом с единственной камеры робота, вмешался, чтобы объяснить, что в режиме по умолчанию бот занимается «исследованием».
Используя эту камеру, свой единственный глаз, гигантский бот, похожий на насекомое, подошел ко мне, обошел меня и продолжил движение по офису. Иногда он задевал ножки стульев или натыкался на случайно оставленную мусорную корзину, совсем как малыш, который еще не понял, как его тело соотносится с окружающим миром. Дюплантис сообщил, что для точной настройки модели ИИ для четвероногого робота потребовалось всего восемь минут реальных данных о робототехнике. Более того, эти данные были собраны на улице, а не в офисе, где бот в данный момент перемещался.
Агентная модель, способная обобщать данные от игрового процесса к симуляции и воплощению в физическом мире, — это raison d’être компании General Intuition. А способность этой модели определять свое место в мире обеспечила ей поддержку серьезных игроков.
В четверг General Intuition объявила о привлечении 320 миллионов долларов при оценке в 2,3 миллиарда долларов, подтвердив предыдущие сообщения TechCrunch. Этот раунд довел общую сумму раскрытого финансирования General Intuition до 454 миллионов долларов после раунда на 134 миллиона долларов, привлеченного при запуске в октябре прошлого года.
Стартап был выделен из другой компании де Витте, Medal, которая позволяет геймерам загружать и делиться клипами из видеоигр. Сотни миллионов часов загруженного игрового процесса послужили первоначальным набором данных для обучения модели General Intuition пространственно-временному рассуждению — или пониманию того, как двигаться в пространстве и времени.
Но ключевым ингредиентом были не кадры игрового процесса; это были метки действий, встроенные в эти клипы: записи о том, какие именно кнопки нажимал игрок и когда. Большинство конкурентов, по словам де Витте, пытаются выводить действия только из видео, что, по его мнению, недостаточно.
«Мы рассматриваем это как следующий этап предварительного обучения», — сказал де Витте. «У нас есть единая модель, которая может реагировать на информацию из Fortnite на экране и совершать действия, а также на динамику реального мира так, как это никогда не смог бы сделать LLM».
В один из моментов де Витте дал мне ноутбук с запущенной моделью мира General Intuition — симуляционной средой, генерируемой покадрово, а не с помощью традиционного игрового движка. Как я часто делаю, тестируя модели мира, я на полной скорости врезался в ряд стен. В других демонстрациях, которые я пробовал, управляемые вами агенты иногда проходят сквозь них, но этот — нет. Из миллионов часов игрового процесса он каким-то образом усвоил, что стены — это стены, лестницы — для подъема, а тени удлиняются по мере движения солнца.
Для General Intuition эта модель мира не является продуктом; это тренировочная среда (внутренне именуемая «спортзалом»). В конечном счете компания хочет продавать саму агентную модель, и де Витте утверждает, что данные о действиях, встроенные в игровой процесс, помогают модели различать «себя» и «окружающую среду» таким образом, что это дает ей более глубокое понимание причинно-следственных связей.
Какими бы впечатляющими ни казались технологии General Intuition в демонстрациях, компания не единственная, кто пытается решить эту проблему. Более того, заставить такую модель работать в физическом мире в масштабе еще никому не удалось. Большинство подобных подходов требуют огромного количества реальных данных, которые собираются медленно и дорого. Ставка General Intuition заключается в том, что игровой процесс — это масштабируемый короткий путь.
Ее инвесторы тоже согласны с этой ставкой. Последний раунд General Intuition возглавила Khosla Ventures при участии General Catalyst, Джеффа Безоса, Эрика Шмидта, Нико Росберга, а также исследователей из Google DeepMind и MIT.
Подавляющая часть средств пойдет на масштабирование вычислительных мощностей. У General Intuition есть соглашение с CoreWeave, и компания планирует сосредоточиться на предварительном обучении следующей версии модели. Часть средств выделена на то, чтобы сделать их API более широко доступным к концу лета.
Винод Хосла, чья фирма возглавила раунд, заявил, что его привлекло видение де Витте и собственная позиция компании в отношении данных.
«Если вы посмотрите на LLM, когда появилось рассуждение, это был квантовый скачок», — сказал мне Хосла в телефонном интервью. «В моделях мира, я думаю, квантовый скачок — это появление интуиции в ИИ, способности, подобной человеческой интуиции. Человеческие данные о действиях и реакциях, которые вы имеете в играх, являются ключевой частью появления интуиции».
Видение — компания на поколения

General Intuition — не единственная компания, заметившая, что данные о действиях человека из Medal являются ключевым элементом в построении динамических моделей мира и общих агентов. Брианна Мартин, руководитель аппарата стартапа, сообщила, что компания родилась отчасти после того, как Medal отклонила предложение о поглощении от крупной лаборатории. С тех пор были и другие предложения.
Де Витте и его соучредители, Элой Алонсо, Адам Джелли и Винсент Мишели, не заинтересованы в поглощении, как и инвесторы стартапа, которые пока не ищут выхода. Объем и качество проприетарных данных, которыми General Intuition располагает через Medal, — одна из причин, по которой Хосла убежден, что стартап — это ставка на поколения, а не цель для M&A; что он может стать основой для обобщенных агентов и моделей мира в симуляции и реальном мире.
«На данном этапе это было бы приобретение данных, что несколько неинтересно», — сказал Хосла.
Часть этой ставки также связана с доверием к ценностям де Витте.
Предприниматель семь лет проработал в гуманитарной сфере, в том числе с «Врачами без границ». Поэтому он четко обозначил, как будет использоваться технология General Intuition: ни один агент не будет применяться для причинения вреда людям.
«Мы не хотим быть эскалационной частью системы», — сказал де Витте. «Допустим, я заявлю: „Мы занимаемся летальной автономией“. Что, по вашему мнению, произойдет в других странах?»
Это ограничение на военное применение происходит на фоне растущего оптимизма Кремниевой долины в отношении войны. Де Витте говорит, что он рад, если его модели будут использоваться для поисково-спасательных миссий, хотя и считает, что недавняя одержимость Кремниевой долины обороной «заражает экосистему».
Де Витте — голландец, и большая часть его команды — европейцы, что формирует идентичность компании. Он говорит, что нанял Мартин отчасти из-за ее решения публично уволиться из Palantir из-за ее работы с Иммиграционно-таможенной службой США.
«Я не знаю, чем занимается Кремниевая долина», — сказал он. «Есть причина, по которой меня там нет».
Этика де Витте не просто ограничивает то, что модели не будут делать. Как геймер, заработавший 1,5 миллиона долларов, создав и управляя частным сервером RuneScape в подростковом возрасте, де Витте также размышляет о том, что происходит с людьми, которые остаются позади из-за возможностей моделей ИИ.
General Intuition недавно запустила платформу под названием Nerve — маркетплейс вакансий, который позволяет геймерам зарабатывать деньги, используя свои существующие установки. Те, кто регистрируется, начинают с разметки данных, а затем могут перейти к телеоперации роботов и другим задачам. Де Витте отметил, что база пользователей Medal — это именно то поколение, которое наиболее подвержено риску вытеснения из-за ИИ, и он хочет, чтобы они имели долю в том, что произойдет дальше.
Маховик данных
Де Витте хочет, чтобы General Intuition стала катализатором экосистемы, как Anthropic или OpenAI — поставщиком моделей, который позволяет другим строить на основе своих технологий.
«Мы не собираемся создавать компанию по производству беспилотных автомобилей», — сказал де Витте. «Мы собираемся в 10 раз облегчить следующему человеку создание такой компании».
Компания заявляет, что как только ее API попадет в руки большего числа клиентов, она сможет проверить свои силы в различных сценариях использования — например, протестировать робота в цифровом двойнике заводского цеха, обеспечить работу человекоподобного бота в игровом центре или отправить четвероногого робота для навигации в опасных условиях.
Хотя четвероногий робот является первым физическим воплощением, которое General Intuition опробовала в реальном мире, компания также пробовала дроны и другие устройства, включая тестирование модели в гоночных играх.
«Это работает на всем, чем можно управлять с помощью геймпада или клавиатуры и мыши», — сказал де Витте.
Возможность создать маховик данных — одна из целей.
«Мы будем выбирать клиентов, где мы сможем диверсифицировать воплощения, для которых эта обобщенная базовая модель служит основой», — сказал де Витте. «Поэтому мы будем отдавать приоритет выбору клиентов в зависимости от того, могут ли они предоставить реальные данные, которые будут интересны и полезны для продвижения исследований. И если у них будет гибкая внутренняя команда, с которой мы сможем быть реальными встроенными партнерами и учиться друг у друга».
Хосла заявил, что проприетарные данные General Intuition позволили компании зайти так далеко, и ее способность продолжать собирать данные, которых нет ни у кого другого, будет иметь решающее значение. Особенно потому, что, несмотря на впечатляющие демонстрации, вопрос о том, сможет ли перенос из симуляции в реальный мир выдержать масштабирование, остается открытым, на который пока никто не дал полного ответа.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Rebecca Bellan




