GigaAI представила физическую «AGI»-систему «Dual Pyramid», нацеленную на преодоление барьера масштабирования воплощенного интеллекта

Agi Gigaai ии роботы модели мира Vla pandaily.com

На презентации 20 мая в Оптической долине Уханя GigaAI представила первую в мире архитектуру Физического AGI «Двойная пирамида» — двухтрековую структуру, решающую проблемы данных и алгоритмов, блокировавшие воплощенный ИИ от истинного масштабирования. — pandaily.com

На своем мероприятии, состоявшемся 20 мая в Оптической долине Уханя, компания GigaAI представила первую в мире архитектуру Физического AGI под названием «Двойная пирамида» — двухтрековую структуру, которая одновременно решает проблемы узких мест в данных и алгоритмах, мешавшие воплощенному ИИ достичь истинного масштабирования.

Область воплощенного интеллекта долгое время была разделена между двумя лагерями. Сторонники моделей мира — включая NVIDIA Cosmos и Google Genie — утверждают, что генеративные видеомодели могут масштабно расширить поставки данных. Адепты моделей действий, во главе с серией π от Physical Intelligence и исследователями Diffusion Policy, настаивают, что только крупномасштабные данные с реальных машин являются единственным путем к обобщаемым навыкам манипуляции. Каждый подход добился реального прогресса, но ни один не решил фундаментальный вопрос: какая архитектура данных и алгоритмов действительно может обеспечить Закон масштабирования для физического интеллекта?

Ответ GigaAI — двойная пирамида. На уровне данных компания объединяет три источника — данные с реальных машин для эталонной физики, интернет-видео для масштаба и ситуационной широты, а также симуляцию для неограниченного синтетического охвата — в единый конвейер обучения, который избегает недостатков любого отдельного источника. На уровне алгоритмов модели мира и VLA модели выстраиваются как взаимодополняющие столпы, где каждая компенсирует слепые зоны другой.

Наряду с архитектурой GigaAI анонсировала SeeLight, суббренд для домашних сценариев, и своего первого бытового человекоподобного робота общего назначения SeeLight S1. Партия из 100 устройств уже развернута в реальных домах Уханя, а массовые операции запланированы на третий квартал 2026 года. 12-месячная дорожная карта продукта включает три последовательных выпуска базовой модели — GigaBrain-1, GigaBrain-2 и GigaBrain-3 — кульминацией которых станет то, что GigaAI называет «моментом GPT-3» для Физического AGI.

Наиболее значимое философское следствие фреймворка «двойная пирамида» заключается в том, что он отвергает дихотомию «или/или», которая поляризовала отрасль, и предполагает, что модели мира и модели действий являются не конкурентами, а взаимонеобходимыми условиями для общего физического интеллекта. Если этот подход масштабируется так, как заявлено, он может изменить представление индустрии о курировании данных, архитектуре моделей и пути к роботам общего назначения.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: