Хотя чип все еще проходит тестирование, OpenAI заявляет, что предварительные результаты демонстрируют значительно лучшую производительность на ватт по сравнению с современными альтернативами.
Партнерство было официально анонсировано в октябре, однако планы OpenAI по созданию собственных чипов давно циркулировали в слухах как способ снизить зависимость компании от графических процессоров Nvidia. Google и Amazon также разработали собственные чипы для аналогичных целей, которые часто называют «AI-ускорителями» — кремниевые решения, специально созданные для ускорения рабочих нагрузок машинного обучения.
Президент OpenAI Грег Брокман рассказал о подходе компании к разработке чипов в собственном подкасте вскоре после объявления о партнерстве с Broadcom.
«У нас глубокое понимание рабочих нагрузок, — сказал Брокман в выпуске. — Мы действительно искали специфические рабочие нагрузки, которые недостаточно обслуживаются, [и спрашивали]: как мы можем создать нечто, что сможет ускорить то, что возможно?»
Jalapeño специально разработан для инференса — процесса выполнения предварительно обученных моделей ИИ в ответ на команды пользователей. В анонсе OpenAI подчеркнула низкую стоимость эксплуатации чипа при запуске моделей кодирования в реальном времени. Вероятно, для более ресурсоемких задач, таких как предварительное обучение, по-прежнему будут использоваться аппаратные средства Nvidia, но даже небольшое снижение затрат на инференс может существенно улучшить финансовые показатели компании.
Оптимизация этой системы инференса может оказаться решающим фактором в будущей экономике ИИ — и это, вероятно, будет происходить на всех уровнях стека. OpenAI уже создает агентские продукты, такие как Codex, и модели, которые их обеспечивают, а также центры обработки данных для запуска этих моделей. Переход на специализированные чипы позволяет компании пойти еще дальше в этом процессе, как объяснила компания в своем анонсе.
«OpenAI не только разрабатывает передовые модели или создает продукты на их основе; она проектирует инфраструктуру под ними: архитектуру чипов, ядро, системы памяти, сетевое взаимодействие, планирование, системы развертывания и пользовательский опыт, — написала компания. — Поскольку OpenAI работает по всему стеку, каждый уровень может быть оптимизирован под одну и ту же цель: сделать ее модели быстрее, надежнее и доступнее для пользователей».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Russell Brandom




