Чип 200-й серии, который последовал за моделью Maia 100, выпущенной в 2023 году, технически оснащен для запуска мощных моделей искусственного интеллекта на более высоких скоростях и с большей эффективностью, как заявила компания. Maia оснащена более чем 100 миллиардами транзисторов, обеспечивая более 10 петафлопс при 4-битной точности и приблизительно 5 петафлопс при 8-битной производительности — это существенный скачок по сравнению с предшественником.
Инференс (вывод) — это вычислительный процесс запуска модели, в отличие от вычислений, необходимых для её обучения. По мере развития компаний в сфере ИИ, затраты на инференс становятся всё более значимой частью их общих операционных расходов, что вызывает возобновление интереса к способам оптимизации этого процесса.
Microsoft надеется, что Maia 200 сможет стать частью этой оптимизации, позволяя бизнесам, связанным с ИИ, работать с меньшими перебоями и сниженным энергопотреблением. «На практике один узел Maia 200 без труда справляется с крупнейшими современными моделями, имея значительный запас мощности для ещё более крупных моделей в будущем», — говорится в заявлении компании.
Новый чип Microsoft также вписывается в растущую тенденцию, когда технологические гиганты обращаются к разработке собственных чипов, чтобы уменьшить зависимость от NVIDIA, чьи передовые графические процессоры (GPU) становятся всё более ключевыми для успеха компаний в области ИИ. Например, у Google есть TPU (тензорные процессоры), которые продаются не как физические чипы, а в виде вычислительной мощности, доступной через облако. Затем есть Amazon Trainium — собственный ускоритель ИИ гиганта электронной коммерции, чья последняя версия, Trainium3, была запущена в декабре. Во всех этих случаях TPU могут использоваться для снятия части нагрузки по вычислениям, которая в противном случае была бы возложена на GPU NVIDIA, тем самым снижая общие аппаратные затраты.
С Maia Microsoft позиционирует себя как конкурента этим альтернативам. В пресс-релизе в понедельник компания отметила, что Maia обеспечивает в 3 раза большую производительность FP4 по сравнению с чипами Amazon Trainium третьего поколения и превосходит производительность FP8 по сравнению с TPU седьмого поколения от Google.
Microsoft заявляет, что Maia уже активно используется для поддержки моделей ИИ компании из команды Superintelligence. Он также обеспечивал работу Copilot, их чат-бота. По состоянию на понедельник компания сообщила, что пригласила различные стороны — включая разработчиков, учёных и передовые ИИ-лаборатории — для использования своего комплекта для разработки программного обеспечения Maia 200 в своих рабочих процессах.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Lucas Ropek




