Moxin Technology представляет серию VGGT: прорыв в 3D-восприятии для динамической высокоточной реконструкции

Agi 3d-восприятие мировые модели Vggt трансформеры реконструкция pandaily.com

Исследователи из Moxin Technology и Университета Тунцзи представили прорывы серии VGGT, обеспечивающие динамическую высокоточную 3D-реконструкцию для мировых моделей. — pandaily.com

По сообщению Machine Intelligence (机器之心), в стремлении к созданию общего искусственного интеллекта (AGI) мировые модели рассматриваются как ключ к тому, чтобы машины могли понимать физические законы и достигать пространственного интеллекта. Эффективная, надежная и точная возможность 3D-восприятия широко признана основным предварительным условием для мировых моделей.

В целом, зрелая мировая модель нуждается в трех основных возможностях: непрерывной памяти о длинных пространственно-временных последовательностях, причинно-следственном разделении сложной динамики и детальном восприятии физических деталей высокого разрешения.

Недавно компания Moxin Technology (魔芯科技, KOKONI 3D) совместно с рядом исследовательских групп, включая команду профессора Чжу Ланьюнь из Университета Тунцзи, представила четыре последовательных прорыва, основанных на архитектуре Visual Geometry Transformer (VGGT). Эта серия работ систематически решает проблемы, связанные с узкими местами в 3D-восприятии при потоковой обработке, динамической устойчивости и детальном восприятии, обеспечивая скачок от базовой реконструкции изображений к высокоточным 4D-мировым моделям.

Три основных ограничения в 3D-восприятии: длинные последовательности, сильная динамика и высокая точность — представляют собой системные узкие места в реальных промышленных сценариях. Когда увеличивается разрешение входных данных, сцены претерпевают динамические изменения, а форматы данных расширяются до видеопотоков, традиционные архитектуры сталкиваются со значительными проблемами в области вычислительной мощности, алгоритмов и системного проектирования.

Результаты серии VGGT от Moxin Technology демонстрируют, как визуальные геометрические трансформеры могут преодолеть эти проблемы, обеспечивая динамическую реконструкцию с беспрецедентной точностью в реальном времени.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: