Команда основателей ByteDance представляет GR-RL: VLA-модели осваивают долгосрочные ловкие манипуляции

GR‑RL,Vision-Language-Action,робототехника,обучение с подкреплением,ByteDance

Команда Seed от ByteDance анонсировала прорыв GR‑RL — новую систему обучения с подкреплением для VLA‑моделей, позволяющую роботам выполнять длительные точные манипуляции. Робот впервые проделал полный шнурок через обувь за один цикл, повышая успех задачи с 45,7 % до 83,3 % и сократив неудачи почти на 70 %.

Команда Seed компании ByteDance представила свой последний исследовательский прорыв GR‑RL, направленный на расширение возможностей моделей «зрение‑язык‑действие» (VLA) в длительных, детализированных манипуляциях роботами. GR‑RL вводит рамки обучения с подкреплением, охватывающие фильтрацию данных офлайн и онлайн‑тонкую настройку в реальном мире, и добилась отраслевого первого: робот может продеть весь шнурок через полностью обувь в одной непрерывной последовательности.

По сравнению с предыдущей моделью с учителем GR‑3, GR‑RL повышает коэффициент успешного выполнения задачи продевания шнурка с 45,7 % до 83,3 %, сократив количество неудач почти на 70 %.

Самое просматриваемое: