Nvidia анонсирует новые открытые ИИ-модели и инструменты для исследований в области беспилотного вождения

Nvidia,физический ИИ,автономное вождение,визуальная языковая модель,Cosmos Cookbook

Nvidia усиливает позиции в области физического ИИ, выпустив новую визуальную языковую модель Alpamayo‑R1 и набор инструментов Cosmos Cookbook. Технологии объединяют анализ изображений и текста, открывают путь к уровню 4 автономии и доступны на GitHub и Hugging Face.

Полупроводниковый гигант объявил о выпуске Alpamayo‑R1, модели открытого визуального языкового анализа для исследований автономного вождения на конференции NeurIPS AI в Сан‑Диего, Калифорния. Компания заявляет, что это первая модель визуального языка, ориентированная на автономное вождение. Визуальные языковые модели способны одновременно обрабатывать текст и изображения, позволяя транспортным средствам «видеть» своё окружение и принимать решения на основе восприятия.

Эта новая модель построена на основе модели Nvidia Cosmos Reason, модели рассуждения, которая обдумывает решения перед тем, как ответить. Семейство моделей Cosmos было впервые представлено Nvidia в январе 2025 года. В августе были выпущены дополнительные модели.

Технологии вроде Alpamayo‑R1 критически важны для компаний, стремящихся достичь уровня 4 автономного вождения, что подразумевает полную автономию в заданной зоне и при определённых условиях, о чём говорится в посте в блоге Nvidia.

Nvidia надеется, что такие модели рассуждения предоставят автономным транспортным средствам «здравый смысл», позволяя им принимать нюансированные решения за рулём, как это делает человек.

Эта новая модель доступна на GitHub и Hugging Face.

Вместе с новой моделью зрения Nvidia также разместила на GitHub пошаговые руководства, ресурсы для инференса и рабочие процессы пост‑тренировки — в совокупности называемые Cosmos Cookbook — чтобы разработчики могли лучше использовать и обучать модели Cosmos для своих задач. Руководство охватывает подбор данных, создание синтетических данных и оценку модели.

Эти анонсы происходят в то время, когда компания активно продвигает физический ИИ как новое направление для своих продвинутых AI‑GPU.

Со‑основатель и генеральный директор Nvidia Дженсен Хуанг неоднократно заявлял, что следующая волна ИИ — это физический ИИ.

Главный ученый Nvidia Билл Далли поддержал эту точку зрения в интервью TechCrunch летом, подчеркнув роль физического ИИ в робототехнике.

«Я считаю, что в конечном счёте роботы станут огромным игроком в мире, и мы хотим по сути стать мозгом всех роботов», — сказал Далли. «Для этого нужно начинать разрабатывать ключевые технологии».

Самое просматриваемое: