Команда Seed компании ByteDance представила свой последний исследовательский прорыв GR‑RL, направленный на расширение возможностей моделей «зрение‑язык‑действие» (VLA) в длительных, детализированных манипуляциях роботами. GR‑RL вводит рамки обучения с подкреплением, охватывающие фильтрацию данных офлайн и онлайн‑тонкую настройку в реальном мире, и добилась отраслевого первого: робот может продеть весь шнурок через полностью обувь в одной непрерывной последовательности.
По сравнению с предыдущей моделью с учителем GR‑3, GR‑RL повышает коэффициент успешного выполнения задачи продевания шнурка с 45,7 % до 83,3 %, сократив количество неудач почти на 70 %.
Автор – Pandaily




