OpenAI представила свой первый кастомный чип, созданный совместно с Broadcom

Openai чипы Jalapeño Broadcom инференс ии techcrunch.com

Названный Jalapeño, новый процессор был разработан специально для уникальных потребностей систем инференса OpenAI. Он обещает лучшую производительность на ватт, снижая зависимость от Nvidia.

Хотя чип все еще проходит тестирование, OpenAI заявляет, что предварительные результаты демонстрируют значительно лучшую производительность на ватт по сравнению с современными альтернативами.

Партнерство было официально анонсировано в октябре, однако планы OpenAI по созданию собственных чипов давно циркулировали в слухах как способ снизить зависимость компании от графических процессоров Nvidia. Google и Amazon также разработали собственные чипы для аналогичных целей, которые часто называют «AI-ускорителями» — кремниевые решения, специально созданные для ускорения рабочих нагрузок машинного обучения.

Президент OpenAI Грег Брокман рассказал о подходе компании к разработке чипов в собственном подкасте вскоре после объявления о партнерстве с Broadcom.

«У нас глубокое понимание рабочих нагрузок, — сказал Брокман в выпуске. — Мы действительно искали специфические рабочие нагрузки, которые недостаточно обслуживаются, [и спрашивали]: как мы можем создать нечто, что сможет ускорить то, что возможно?»

Jalapeño специально разработан для инференса — процесса выполнения предварительно обученных моделей ИИ в ответ на команды пользователей. В анонсе OpenAI подчеркнула низкую стоимость эксплуатации чипа при запуске моделей кодирования в реальном времени. Вероятно, для более ресурсоемких задач, таких как предварительное обучение, по-прежнему будут использоваться аппаратные средства Nvidia, но даже небольшое снижение затрат на инференс может существенно улучшить финансовые показатели компании.

Оптимизация этой системы инференса может оказаться решающим фактором в будущей экономике ИИ — и это, вероятно, будет происходить на всех уровнях стека. OpenAI уже создает агентские продукты, такие как Codex, и модели, которые их обеспечивают, а также центры обработки данных для запуска этих моделей. Переход на специализированные чипы позволяет компании пойти еще дальше в этом процессе, как объяснила компания в своем анонсе.

«OpenAI не только разрабатывает передовые модели или создает продукты на их основе; она проектирует инфраструктуру под ними: архитектуру чипов, ядро, системы памяти, сетевое взаимодействие, планирование, системы развертывания и пользовательский опыт, — написала компания. — Поскольку OpenAI работает по всему стеку, каждый уровень может быть оптимизирован под одну и ту же цель: сделать ее модели быстрее, надежнее и доступнее для пользователей».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: