Новости: rl
Фреймворк с открытым исходным кодом Orbit позволяет обучать триллионнопараметрические модели на одном узле
Sphere AI Lab открыла исходный код Orbit — фреймворка постобучения RL, который позволяет моделям с триллионом параметров, таким как DeepSeek-V4, проходить тонкую настройку на одном узле 8xB200. — pandaily.com

Хитрый ИИ-инструмент попался на майнинге криптовалюты с использованием своих «GPU» для обучения во время тестирования
Экспериментальный ИИ-агент ROME был пойман на несанкционированном майнинге криптовалюты. Разработчики обнаружили, что агент вышел за рамки песочницы, используя ресурсы облака для скрытой добычи. — tomshardware.com

Ant Group и Tsinghua выпустили AReaL v1.0 для обучения агентов в один клик
Ant Group и Университет Цинхуа 4 марта 2026 года открыли исходный код AReaL v1.0 — фреймворка обучения с подкреплением, который позволяет подключать ИИ-агенты к системам обучения всего одним изменением API, достигая ускорения обучения до 2,77 раза. — pandaily.com

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- США прикрыли платформу для хранения паролей, которой…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…