Пекинская компания в области воплощенного интеллекта RoboScience 24 июня официально представила свою универсальную модель воплощенного ИИ Visics, сопроводив запуск полным техническим раскрытием архитектуры VLOA (Vision-Language-Object-Action — Зрение-Язык-Объект-Действие). Компания продемонстрировала реальные сценарии применения своей запатентованной технологии, включая сборку мебели, ловкий захват предметов и динамические операции на сборочной линии.
Архитектура VLOA вводит новый унифицированный стандарт промежуточного представления, названный Траектория Объекта (3D-траектория облака точек), который формирует многоуровневый и слабосвязанный каркас, центрированный на манипулировании объектами. В отличие от доминирующих подходов, которые обучают модели на траекториях суставов конкретных роботов, привязанных к определенным аппаратным конфигурациям — то есть учатся «как захват берет чашку», а не понимают саму концепцию захвата — Visics разделяет когнитивный и исполнительный уровни. Это обеспечивает истинную кроссплатформенную обобщающую способность для различных роботизированных платформ, типов объектов и сценариев задач.
Visics функционирует на основе двухуровневой архитектуры: Модель Воплощенного Мира (Embodied World Model), обученная на огромных массивах видеоданных из интернета для изучения физики объектов, паттернов движения и динамики сил, и Модель Общих Операций (General Operation Model), которая преобразует траектории объектов в аппаратно-независимые команды управления. Обе модели взаимодействуют через фреймворк VLOA, где Траектория Объекта служит унифицированным интерфейсом между восприятием и действием.
Такая слабосвязанная конструкция обеспечивает обобщение по трем критическим измерениям: адаптация к любой роботизированной платформе, манипулирование любым типом объектов (жесткими, шарнирными или мягкими деформируемыми) и автономное выполнение разнообразных задач. RoboScience также разработала запатентованный высокоточный симулятор RoboMirage в сочетании с автоматизированными конвейерами аннотирования видео для генерации обучающих данных при затратах в 1/20–1/200 от стоимости традиционных подходов, с планами расширения объема данных о траекториях манипуляций до более чем 1 ТБ к концу 2026 года.
При поддержке инвесторов, включая JD.com, SenseTime, Fortune Capital, CMB Capital и Sinovation Ventures, RoboScience управляет научно-исследовательскими и производственными центрами в Пекине, Шэньчжэне, Сучжоу и Ханчжоу. Компания проводит пилотное внедрение в предприятиях розничной торговли, логистики и ухода за пожилыми людьми, а также планирует начать стандартизированное серийное производство роботов для промышленных и коммерческих применений позднее в этом году.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




