Alibaba и ByteDance делают ставку на «Embodied AI»: что интернет-гиганты привнесут в робототехнику

Alibaba Bytedance ии робототехника Qwen-Robot Llm pandaily.com

Alibaba запускает серию воплощенных моделей ИИ Qwen-Robot, а ByteDance повышает статус робототехники до основного направления бизнеса. Интернет-гиганты используют данные, ИИ-мозги и собственные сценарии для преобразования робототехнической индустрии Китая. — pandaily.com

16 июня компания Alibaba представила Qwen-Robot — свое первое полноценное семейство воплощенных (embodied) моделей ИИ в рамках серии больших языковых моделей Qwen. Семейство включает Qwen-RobotManip для манипуляций, Qwen-RobotNav для навигации и Qwen-RobotWorld в качестве модели мира. Этот запуск сигнализирует об углублении приверженности Alibaba воплощенному интеллекту, в то время как ByteDance реорганизует свои робототехнические усилия в рамках основной структуры бизнеса.

Серия Qwen-Robot знаменует собой поворотный момент: вместо того чтобы конкурировать на аппаратном уровне, Alibaba позиционирует себя как поставщика «интеллектуального мозга» для разнообразных форм роботов. Три модели могут развертываться независимо или скоординированно, наделяя роботов ловкими руками, навигационными возможностями и способностью к рассуждению соответственно, что позволяет различным типам роботов выполнять сложные задачи в реальном мире.

ByteDance действует не менее агрессивно. Компания подняла воплощенный ИИ до статуса основного направления бизнеса, а ее руководитель по мультимодальным системам Чжоу Чан (Zhou Chang) дополнительно расширил надзор, поскольку Seed Robotics теперь подчиняется ему. ByteDance уже выпустила более 1000 роботов, в основном колесных логистических роботов для транспортировки на складах и производственных площадках, и привлекла внешних клиентов, включая SF Express и BYD Electronics.

Интернет-гиганты привносят в робототехнику три явных преимущества: общий интеллект, обеспечиваемый большими моделями, огромные объемы реальных данных для обучения и встроенные сценарии развертывания. Традиционным роботам требуются инженеры для написания пользовательских программ управления для каждой задачи, что занимает недели для адаптации к новым сценариям. Подходы на основе больших моделей могут сократить это время до нескольких дней благодаря координации моделей «зрение-язык-движение» (vision-language-motion).

Данные — это критически важное топливо. Сеть экспресс-доставки Meituan генерирует миллионы ежедневных взаимодействий по планированию маршрутов. Склады JD Logistics накапливают массивные данные по обработке материалов. Операции ByteDance охватывают все: от складской логистики электронной коммерции до производства контента.

Возможно, самое главное, интернет-гиганты обладают собственными сценариями развертывания. Логистические роботы JD впервые прошли проверку на собственных складах «Asia No.1» перед внешним коммерческим внедрением. Автономные мобильные роботы ByteDance выполняют реальные маршруты до того, как будут проданы клиентам. Этот встроенный «первый заказчик» значительно сокращает путь от лаборатории до массового развертывания.

Однако аппаратные узкие места остаются серьезным препятствием. Основные компоненты, сложность цепочки поставок и производственные затраты не решаются автоматически за счет программного преимущества. Традиционная производственная ДНК робототехнической отрасли означает, что даже самый способный мозг ИИ все еще требует высококачественного «тела» для работы в физическом мире.

«Интернет-компании могут ускорить итерации общецелевых интеллектуальных мозгов, — отметил отраслевой аналитик, — но воплощенный ИИ остается аппаратно-интенсивным треком хард-технологий, где проблемы с основными компонентами и коммерческая прибыльность не исчезают только потому, что в игру вступает техгигант».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: