Мировая модель Яна Лекуна получила формальное доказательство: бенчмарки выявили хрупкость современных моделей

янн лекун Jepa мировые модели ии препринты Ami Labs techtimes.com

Исследование мировых моделей Янна ЛеКуна достигло важной вехи в мае 2026 года: два препринта от его группы формально доказали, когда архитектура JEPA может восстановить структуру реального мира, а парный бенчмарк выявил, что современные модели разрушаются при незначительных визуальных сдвигах, намечая как теоретическую цель, так и. — techtimes.com

Ставка Янна ЛеКуна в $1,03 млрд на мировые модели как будущее ИИ только что получила самое четкое на сегодняшний день теоретическое и эмпирическое описание. Две препринта с arXiv от его исследовательской группы — опубликованные с разницей в несколько дней в конце мая — совместно точно определяют, когда Совместно-встраиваемая Предсказательная Архитектура (JEPA) может выучить достоверную модель мира, и насколько текущие реализации все еще далеки от этого стандарта.

Сроки публикации обеих статей совпали с началом циркуляции материалов об идентифицируемости, что делает их самым значительным исследовательским результатом группы ЛеКуна с момента основания им AMI Labs в начале 2026 года — и самым весомым ответом на сообщество, наблюдающее за его тезисом со скептицизмом и $1,03 млрд инвестиционного капитала.

Две статьи различны по своему охвату, но их невозможно читать по отдельности: одна — это теорема, другая — стресс-тест, и их выводы рифмуются таким образом, что определяют и пункт назначения, и текущее расстояние до него.

Формальное доказательство: Когда LeJEPA действительно изучает модель мира

Первая статья, “When Does LeJEPA Learn a World Model?”, поданная на arXiv 25 мая Дэвидом Клиндтом из Лаборатории Колд-Спринг-Харбор, ЛеКуном и Рэндаллом Балестриером из Университета Брауна, затрагивает центральный для программы мировых моделей вопрос: когда машина изучает компактное представление необработанных наблюдений, соответствует ли это представление реальным скрытым причинам этих наблюдений — или лишь какому-либо статистическому шаблону, который было дешевле всего найти?

LeJEPA, архитектура, представленная Балестриером и ЛеКуном в ноябре 2025 года, сочетает цель предиктивного согласования с Гауссовой регуляризацией под названием SIGReg. Новая статья доказывает, что эта комбинация достигает того, что математики называют линейной идентифицируемостью: при наличии зашумленных, нелинейных наблюдений — необработанных пикселей, потоков с датчиков или любого высокоразмерного входа — LeJEPA восстанавливает истинные лежащие в основе переменные, такие как положение объекта, его скорость и ориентация, с точностью до линейного поворота. Согласно заявленным условиям статьи, архитектура не просто изучает полезные обходные пути; она изучает фактическую структуру мира, который сгенерировал данные.

Ключевой результат статьи имеет форму «если и только если». В классе миров, где латентные переменные эволюционируют при стационарной динамике с аддитивным шумом, Гауссово распределение является единственным, для которого гарантия идентифицируемости LeJEPA сохраняется. Прямое направление основано на спектральном аргументе с использованием полиномов Эрмита, в котором строго наказывается каждый уровень нелинейности; обратное исключает любую негауссову альтернативу. Четвертая теорема расширяет результат на планирование: при тех же условиях планирование в изученном латентном пространстве дает те же действия и ту же ценность, что и планирование в истинном латентном пространстве. Доказательства также формализованы в помощнике доказательств Lean 4, что выходит за рамки стандартных конвенций математических статей.

Какое отношение имеет исследование данных к этому?

Гарантия идентифицируемости сопровождается практическим нюансом, который исследователям и инженерам, работающим с JEPA, следует внимательно изучить. Латентные переменные должны быть Гауссовыми, и данные должны собираться таким образом, чтобы аппроксимировать изотропное — приблизительно равномерное — исследование пространства состояний. Нарушите эти условия, и гарантия ослабевает или исчезает.

Авторы проверяют это напрямую, используя симуляцию двухсуставчатого роботизированного манипулятора, отображенного в необработанные пиксели. Когда конфигурации манипулятора сэмплировались изотропно — равномерно исследуя пространство углов суставов — восстановление истинных углов было почти идеальным, с R² около 0,95, как указано в препринте. Когда же обучающие данные поступали от целенаправленной политики обучения с подкреплением, траектории которой кластеризовались в узкой, негауссовой области пространства, восстановление никогда не превышало 0,5. Урок для всех, кто создает мировые модели, включая саму AMI Labs: то, как собираются данные, может определить, возможно ли вообще достоверное обучение. Целенаправленное поведение — то, на что полагается большинство конвейеров обучения роботов — может незаметно перевести данные именно в тот режим, где гарантия идентифицируемости больше не действует.

Бенчмарк мировых моделей ИИ: Как на самом деле работают современные модели?

Если теоретическая статья намечает пункт назначения, то второй препринт измеряет текущее расстояние до него. “stable-worldmodel: A Platform for Reproducible World Modeling Research and Evaluation”, возглавляемый Лукасом Маесом из Mila и Университета Монреаля — снова с ЛеКуном и Балестриером среди двенадцати авторов — это платформа с открытым исходным кодом для бенчмаркинга, опубликованная 20 мая.

Платформа была создана отчасти потому, что область исследований фрагментировалась до такой степени, что стала ненадежной. Как отмечается в статье, один часто используемый алгоритм планирования был независимо перереализован как минимум в пяти недавних работах, что является рецептом для необнаруженных ошибок и несравнимых результатов, подрывающих доверие к опубликованным бенчмаркам. Система stable-worldmodel, сокращенно swm, предоставляет общий набор сред, стандартизированный слой данных и набор контролируемых тестов на возмущения, которые позволяют исследователям наблюдать, что ломается при сдвиге визуальных, геометрических или физических условий.

Вердикт по текущим протестированным мировым моделям однозначен: они остаются хрупкими. В статье приводятся результаты по нескольким ведущим архитектурам, включая модели в линейке LeWorldModel наряду с базовыми моделями DINO-WM и PLDM. В стандартной задаче манипуляции Push-T — где симулированный агент должен толкнуть объект в целевое положение — одна протестированная модель показала уровень успеха около 50,8% в чистых условиях. Когда цвет агента менялся, успех падал примерно до 12%. Когда менялся цвет фона, он снижался примерно до 6%. Добавление квадратов-отвлекающих элементов в сцену приводило к квадратичному обвалу успеха по всем протестированным базовым моделям. Все цифры взяты из препринта и еще не были независимо воспроизведены.

Более глубокий вывод задевает сильнее, чем заголовки. В экспериментах swm ошибка предсказания сама по себе оказалась плохим прокси для успеха планирования при сдвиге распределения. Распределения ошибок планов, которые увенчались успехом, и планов, которые потерпели неудачу, сильно перекрывались даже при сильных возмущениях — это означает, что модель может точно предсказывать следующий кадр, при этом имея фундаментальное непонимание геометрии задачи. Стандартные бенчмарки могут присвоить модели высокие оценки, в то время как она ухватилась за цвет фона, а не за какое-либо стабильное свойство задачи.

Хрупкость мировых моделей: Почему режим данных связывает обе статьи

Прочитанные вместе, две статьи делают то, чего ни одна из них не может сделать в одиночку. Результат об идентифицируемости объясняет вероятный механизм того, что наблюдается в бенчмарке: целенаправленные обучающие данные дрейфуют именно в тот негауссовый режим, где гарантия идентифицируемости ослабевает. Модель, обученная на траекториях обучения с подкреплением, сгруппированных вокруг узкой целевой области, может изучить представления, которые кажутся точными во время обучения, но терпят неудачу при сдвигах визуального распределения, которые вводит набор swm. Связь между теорией и эмпирикой не заявлена явно ни в одной из статей — обе являются препринтами, и потребуется независимое воспроизведение — но вывод для дизайна исследований ясен. Стратегия исследования во время обучения — это не второстепенный вопрос; это может быть необходимым условием для осмысленного обучения мировой модели.

Команда swm отмечает, что для устранения разрыва в хрупкости, вероятно, потребуются как архитектурные усовершенствования, так и систематическое масштабирование — и, как подразумевает сопутствующая теоретическая статья, гораздо больше внимания к тому, как машинам вообще позволено наблюдать мир.

Что означают препринты ЛеКуна для AMI Labs?

ЛеКун покинул Meta* в ноябре 2025 года после двенадцати лет работы главным научным сотрудником по ИИ, сославшись на расхождение во взглядах на архитектурное направление. Посевное финансирование AMI Labs в размере $1,03 млрд, привлеченное в марте 2026 года при оценке до денег в $3,5 млрд — крупнейший посевной раунд в истории европейских стартапов — обеспечило институциональные деньги для тезиса JEPA, среди инвесторов были NVIDIA, Samsung и Bezos Expeditions. Генеральный директор Александр ЛеБрюн тогда заявил TechCrunch, что компания рассчитывает потратить около года на создание чего-то применимого к реальным продуктам, и что в первую очередь она нацелится на здравоохранение, робототехнику и промышленную автоматизацию.

Ни одна из статей не доказывает, что AMI Labs сможет создать развертываемые мировые модели в такие сроки. Результат об идентифицируемости формален, но условен; результат бенчмарка эмпиричен, но ограничен симулированными средами и набором существующих базовых моделей. Что эти две статьи делают вместе, так это уточняют исследовательскую цель. Теорема определяет условия сбора данных, при которых реальное обучение становится математически достижимым. Бенчмарк определяет сбои робастности распределения, которые необходимо устранить, прежде чем математическая достижимость станет практической надежностью. Это более строгая карта проблемы, чем та, что была у сообщества неделю назад.

ЛеКун годами утверждал, что индустрия ИИ карабкается не на ту гору. Эти два препринта — одни из самых точных обзоров того, насколько высокой оказывается правильная гора.


Часто задаваемые вопросы

В чем заключается тезис Яна ЛеКуна о мировых моделях и почему это важно?

ЛеКун утверждает, что большие языковые модели — которые предсказывают следующее слово в последовательности — архитектурно недостаточны для интеллекта реального мира, поскольку они не строят модель того, как физические события вызывают друг друга. Его альтернатива, мировые модели, построенные на Совместно-встраиваемой Предсказательной Архитектуре (JEPA), обучает системы ИИ предсказывать абстрактные представления будущих состояний на основе наблюдений с целью обеспечения причинно-следственного рассуждения и надежного планирования. AMI Labs, его парижский стартап, привлек $1,03 млрд в марте 2026 года для реализации этого подхода, нацеливаясь в первую очередь на робототехнику, здравоохранение и промышленную автоматизацию.

Что показывает доказательство идентифицируемости LeJEPA?

Формальное доказательство, поданное на arXiv 25 мая 2026 года, показывает, что LeJEPA может восстанавливать истинные скрытые переменные, лежащие в основе необработанных наблюдений — свойство, называемое линейной идентифицируемостью — когда эти переменные следуют Гауссову распределению и эволюционируют при стационарной динамике с аддитивным шумом. Результат также связан с планированием: при тех же условиях политика, оптимизированная в изученном латентном пространстве, дает те же решения, что и политика, оптимизированная в истинном пространстве. Доказательства формализованы в помощнике доказательств Lean 4, что придает им проверяемую машиной строгость, выходящую за рамки стандартной опубликованной статьи.

Почему современные мировые модели так плохо работают при небольших изменениях визуальных деталей?

Бенчмарк stable-worldmodel, опубликованный на arXiv 20 мая 2026 года, обнаружил, что каждая протестированная архитектура мировых моделей резко ухудшала показатели при незначительных возмущениях — изменение цвета агента или фона резко снижало показатели успеха, а добавление небольших визуальных отвлекающих факторов вызывало квадратичный обвал по всем базовым моделям. Модели, которые точно прогнозировали следующий кадр, все равно могли плохо планировать, потому что они научились полагаться на нерелевантные визуальные признаки, а не на геометрию задачи. Сопутствующая теоретическая работа подразумевает причину: целенаправленные обучающие данные недостаточно широко исследуют пространство состояний, чтобы удержать представления в режиме, где действуют гарантии идентифицируемости.

Какова связь между AMI Labs и этими научными статьями?

AMI Labs — это парижский стартап, соучредителем которого является ЛеКун в качестве исполнительного председателя, а генеральный директор Александр ЛеБрюн руководит повседневной деятельностью. Препринты за май 2026 года являются академическими результатами ЛеКуна и соавторов из Университета Брауна, Лаборатории Колд-Спринг-Харбор и Mila — а не анонсами продуктов от AMI Labs. Обе статьи являются препринтами, которые еще не прошли рецензирование. Они продвигают фундаментальную науку, от которой в конечном итоге будет зависеть коммерческая работа AMI Labs, но они представляют собой базовые исследования, а не инженерные вехи на пути к продукту.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: