Раздел: обучение с подкреплением
Команда основателей ByteDance представляет GR-RL: VLA-модели осваивают долгосрочные ловкие манипуляции
Команда Seed от ByteDance анонсировала прорыв GR‑RL — новую систему обучения с подкреплением для VLA‑моделей, позволяющую роботам выполнять длительные точные манипуляции. Робот впервые проделал полный шнурок через обувь за один цикл, повышая успех задачи с 45,7 % до 83,3 % и сократив неудачи почти на 70 %.
