Microsoft анонсировала новый мощный чип для инференса AI

Microsoft ии Maia чип инференс Gpu

Microsoft представила новый чип Maia 200, разработанный для масштабирования инференса ИИ. Этот процессор, пришедший на смену Maia 100, обеспечивает более высокую скорость и эффективность при работе с большими моделями, стремясь снизить зависимость от сторонних решений и оптимизировать операционные расходы.

Чип 200-й серии, который последовал за моделью Maia 100, выпущенной в 2023 году, технически оснащен для запуска мощных моделей искусственного интеллекта на более высоких скоростях и с большей эффективностью, как заявила компания. Maia оснащена более чем 100 миллиардами транзисторов, обеспечивая более 10 петафлопс при 4-битной точности и приблизительно 5 петафлопс при 8-битной производительности — это существенный скачок по сравнению с предшественником.

Инференс (вывод) — это вычислительный процесс запуска модели, в отличие от вычислений, необходимых для её обучения. По мере развития компаний в сфере ИИ, затраты на инференс становятся всё более значимой частью их общих операционных расходов, что вызывает возобновление интереса к способам оптимизации этого процесса.

Microsoft надеется, что Maia 200 сможет стать частью этой оптимизации, позволяя бизнесам, связанным с ИИ, работать с меньшими перебоями и сниженным энергопотреблением. «На практике один узел Maia 200 без труда справляется с крупнейшими современными моделями, имея значительный запас мощности для ещё более крупных моделей в будущем», — говорится в заявлении компании.

Новый чип Microsoft также вписывается в растущую тенденцию, когда технологические гиганты обращаются к разработке собственных чипов, чтобы уменьшить зависимость от NVIDIA, чьи передовые графические процессоры (GPU) становятся всё более ключевыми для успеха компаний в области ИИ. Например, у Google есть TPU (тензорные процессоры), которые продаются не как физические чипы, а в виде вычислительной мощности, доступной через облако. Затем есть Amazon Trainium — собственный ускоритель ИИ гиганта электронной коммерции, чья последняя версия, Trainium3, была запущена в декабре. Во всех этих случаях TPU могут использоваться для снятия части нагрузки по вычислениям, которая в противном случае была бы возложена на GPU NVIDIA, тем самым снижая общие аппаратные затраты.

С Maia Microsoft позиционирует себя как конкурента этим альтернативам. В пресс-релизе в понедельник компания отметила, что Maia обеспечивает в 3 раза большую производительность FP4 по сравнению с чипами Amazon Trainium третьего поколения и превосходит производительность FP8 по сравнению с TPU седьмого поколения от Google.

Microsoft заявляет, что Maia уже активно используется для поддержки моделей ИИ компании из команды Superintelligence. Он также обеспечивал работу Copilot, их чат-бота. По состоянию на понедельник компания сообщила, что пригласила различные стороны — включая разработчиков, учёных и передовые ИИ-лаборатории — для использования своего комплекта для разработки программного обеспечения Maia 200 в своих рабочих процессах.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: