AI-агенты для написания кода могут автономно управлять обучением роботов

ии робототехника Nvidia Enpire обучение агенты arstechnica.com

Программа самосовершенствования роботов NVIDIA задействует команды ИИ-агентов для кодирования, которые с помощью платформы ENPIRE автономно обучают роботов сложным задачам, достигая высокой точности. — arstechnica.com

Что произойдет, если предоставить ИИ-агентам для кодирования лабораторию, полную роботизированных манипуляторов, некоторые вычислительные ресурсы и «щедрый бюджет токенов» для обучения роботов различным задачам? Похоже, агенты могут разработать режим обучения, который научит роботов успешно разрезать пластиковые стяжки и даже вставлять графические процессоры в тонкие разъемы на материнских платах.

Этот взгляд на то, как ИИ может действовать полностью автономно для автоматизации обучения роботов, стал возможен благодаря новой платформе для агентов — программному обеспечению, которое оборачивает модели ИИ, чтобы обеспечить их использование различных инструментов, одновременно предоставляя такие возможности, как память, контекст, ограничения и циклы обратной связи. Эта агентская платформа, называемая ENPIRE, была разработана исследователями робототехники в лаборатории NVIDIA GEAR (Generalist Embodied Agent Research) совместно с сотрудниками Университета Карнеги — Меллона в Питтсбурге и Калифорнийского университета в Беркли.

«Часть нашей лаборатории NVIDIA GEAR теперь неустанно самосовершенствуется в течение ночи», — написал Джим Фан, директор по ИИ в NVIDIA, в посте в LinkedIn. «Мы просто читаем отчеты утром».

Фан также в шутку описал цель такого обучения роботов под управлением ИИ, заявив: «Мы все уходим в отпуск, и Дженсен даже не заметит», ссылаясь на основателя и генерального директора Nvidia Дженсена Хуана. Но выгоду могут получить не только исследователи робототехники из Nvidia — Фан сообщил, что команда сделает все с открытым исходным кодом, чтобы любой мог организовать собственную «самостоятельно работающую лабораторию роботов дома».

Платформа ENPIRE состоит из четырех модулей, которые позволяют ИИ-агентам для кодирования выполнять автоматический сброс и верификацию задач, уточнять политики, управляющие поведением роботов, оценивать такие политики на нескольких физических роботах, работающих параллельно, и устранять сбои путем анализа журналов, изучения исследовательских статей и улучшения инфраструктуры обучения и кода алгоритмов. Более подробная техническая информация доступна в исследовательской статье, загруженной 16 июня 2026 года.

Платформа была протестирована с тремя различными ИИ-агентами для кодирования, включая Codex от OpenAI с GPT-5.5, Claude Code от Anthropic с Opus 4.7 и Kimi Code от Moonshot AI с Kimi K2.6. Команды агентов для кодирования независимо разработали различные алгоритмические подходы к обучению роботов, протестировали их в реальных экспериментах, а затем сохранили все изменения, которые помогли повысить общую частоту успеха в ходе повторяющихся циклов самостоятельного тестирования.

Успех и пределы обучения роботов под управлением ИИ

Оснащенные ENPIRE, ИИ-агенты для кодирования разработали стратегии роботизированного самосовершенствования, которые достигли 99-процентного успеха в ряде задач манипулирования, включая стандартную задачу «Push-T», которая требует от роботов переместить Т-образный блок в целевое положение на столе. Другие задачи включали сортировку штифтов в коробке для штифтов, завязывание и разрезание пластиковых стяжек, а также установку графического процессора в материнскую плату с последующим отключением видеокарты для сброса перед следующим испытанием.

Наиболее многообещающий результат, возможно, был получен в задаче по вставке и сортировке штифтов. В этом сценарии обучения роботов ИИ-агенты для кодирования достигли почти 100-процентного успеха быстрее, чем «передовой метод с участием человека», разработанный многими из тех же исследователей-людей.

Такие эксперименты также показали, как большие команды из восьми ИИ-агентов для кодирования могут быстрее достигать высоких показателей успеха в обучении роботов, чем небольшие команды из четырех агентов или одиночные агенты, работающие самостоятельно. Например, команда из восьми агентов достигла 99-процентного успеха в задаче Push-T за два часа исследовательского времени, по сравнению с тремя часами, потребовавшимися команде из четырех агентов, и почти пятью часами для команды из одного агента.

Однако исследователи-люди также обнаружили некоторые критические ограничения при использовании ИИ-агентов для кодирования в качестве автономных тренеров роботов. Роботы часто простаивали, пока агенты для кодирования были заняты «чтением журналов, написанием кода, отладкой или ожиданием базовой языковой модели». Более крупные команды агентов для кодирования также тратили больше времени на обобщение идей друг друга и меньше времени на фактическое использование роботов, а агенты для кодирования иногда не могли в полной мере использовать доступные вычислительные ресурсы при запуске параллельных сеансов обучения.

Более высокие показатели успеха, достигнутые благодаря совместной работе большего числа агентов и роботов, также обернулись более высоким потреблением токенов — это заслуживает внимания в то время, когда разработчики ИИ, такие как Anthropic, рассматривают изменения в ценообразовании, которые значительно увеличат связанные с токенами затраты на использование услуг ИИ.

На фоне притока средств от бума ИИ компания NVIDIA активно продвигает свое видение физического ИИ через многочисленные инициативы в области робототехники. 31 мая компания объявила о партнерстве с ведущей китайской робототехнической компанией Unitree для предоставления «Эталонного гуманоидного робота» для исследовательских лабораторий, разрабатывающих универсальные роботы на базе ИИ.

Во время интенсивного тура по Южной Корее в начале июня основатель и генеральный директор NVIDIA Дженсен Хуан также встретился с председателем исполнительного совета Hyundai Motor Чон И Суном, чтобы обсудить масштабирование массового производства роботов на базе ИИ. Hyundai Motor Group владеет американской робототехнической компанией Boston Dynamics, которая уже хорошо известна своей четвероногой «робособакой» Spot и работает над коммерциализацией своего гуманоидного робота Atlas.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: