Китайская компания Moxin, специализирующаяся на технологиях разреженных вычислений (sparse computing) для ИИ-чипов, завершила раунд финансирования Серии C на сумму около 1 миллиарда юаней (примерно 140 миллионов долларов США). Раунд возглавили Shenzhen Capital Group, Greater Bay Area Homeland Investments, Lidings Capital и Yunsheng Capital при участии существующих инвесторов, включая K2VC, Shengjing Jiacheng и Rockhill Technology.
Основанная в 2018 году выпускниками Университета Карнеги — Меллона, Moxin использует дифференцированный подход к вычислениям в области ИИ, разрабатывая чипы на основе принципов разреженных вычислений. В отличие от традиционных плотных вычислений, которые обрабатывают все параметры равномерно, разреженные вычисления определяют и пропускают избыточные расчеты, фокусируясь только на эффективных параметрах. Такой подход значительно снижает энергопотребление и затраты на инференс на токен.
Фирменный алгоритм двойной разреженности Moxin сочетает разреженность весов с разреженностью активации, что, по утверждению компании, обеспечивает значительно более низкие затраты на генерацию токенов по сравнению с основными конкурентами. Вычислительная карта S30 компании три раза подряд возглавляла эталонный тест MLPerf для инференса, подтверждая технологическое преимущество.
Компания развернула кластеры инференса в четырех основных регионах Китая: Северо-Западный Китай (умное производство и безопасность на производстве), Юго-Западный Китай (вычисления для «зеленой» энергетики), Восточный Китай (биоинформатика и здравоохранение) и Северный Китай (городское управление). Эти развертывания охватывают реальные сценарии в производстве электроники, производстве потребительских товаров и секвенировании генома.
Новое финансирование будет направлено преимущественно на массовое производство и коммерциализацию вычислительной карты SparsePrime следующего поколения от Moxin, а также на расширение национальной вычислительной сети. Поскольку отрасль ИИ переходит от парадигмы, ориентированной на обучение, к парадигме, ориентированной на инференс, подход Moxin, направленный на снижение затрат на генерацию токенов, ставит компанию в авангарде усилий по повышению доступности ИИ.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




