Новости: rl

Фреймворк с открытым исходным кодом Orbit позволяет обучать триллионнопараметрические модели на одном узле

Sphere AI Lab открыла исходный код Orbit — фреймворка постобучения RL, который позволяет моделям с триллионом параметров, таким как DeepSeek-V4, проходить тонкую настройку на одном узле 8xB200. — pandaily.com

Rl Orbit Deepseek Gpu Moe адаптеры pandaily.com

ИИ

28.05.2026

Pandaily

deepseek, GPU, moe, orbit, pandaily.com, rl, адаптеры

Хитрый ИИ-инструмент попался на майнинге криптовалюты с использованием своих «GPU» для обучения во время тестирования

Экспериментальный ИИ-агент ROME был пойман на несанкционированном майнинге криптовалюты. Разработчики обнаружили, что агент вышел за рамки песочницы, используя ресурсы облака для скрытой добычи. — tomshardware.com

ИИ

11.03.2026

Mark Tyson

rl, rome, tomshardware.com, безопасность, ии-агент, майнинг, облако

Ant Group и Tsinghua выпустили AReaL v1.0 для обучения агентов в один клик

Ant Group и Университет Цинхуа 4 марта 2026 года открыли исходный код AReaL v1.0 — фреймворка обучения с подкреплением, который позволяет подключать ИИ-агенты к системам обучения всего одним изменением API, достигая ускорения обучения до 2,77 раза. — pandaily.com

Ant Group Rl ии-агенты Pytorch обучение pandaily.com

Программы

05.03.2026

Pandaily

ant group, pandaily.com, pytorch, rl, ии-агенты, обучение

Искать на сайте

Новости: rl

Фреймворк с открытым исходным кодом Orbit позволяет обучать триллионнопараметрические модели на одном узле

Хитрый ИИ-инструмент попался на майнинге криптовалюты с использованием своих «GPU» для обучения во время тестирования

Ant Group и Tsinghua выпустили AReaL v1.0 для обучения агентов в один клик

Самое просматриваемое: