Inspur выпустила новый AI-сервер, заявляя о снижении стоимости логического вывода до 14 центов за миллион токенов.

Pandaily

26.12.2025

ai-сервер,inspur,yuannao hc1000,искусственный интеллект,большие модели,машинное обучение

Inspur Information представила YuanNao HC1000, гипермасштабируемый AI-сервер, снижающий затраты на вывод больших моделей до 0,14$ за миллион токенов. Это позволит масштабировать развертывание AI-агентов, благодаря оптимизации GPU и новой архитектуре DirectCom.

Компания Inspur Information представила свой гипермасштабируемый AI-сервер YuanNao HC1000, заявив о снижении затрат на вывод больших моделей до 1 юаня (около 0,14 доллара США) за миллион токенов. По словам компании, это важная веха, устраняющая ключевое препятствие для масштабного развертывания AI-агентов.

По словам директора по стратегии AI Inspur Лю Цзюня, использование GPU во время вывода обычно достигает лишь 5–10%, что значительно ниже 50%+ использования, наблюдаемого в задачах обучения. HC1000 решает эту неэффективность благодаря полностью симметричной сверхскоростной архитектуре DirectCom и гипермасштабируемой конструкции, которая разделяет вычислительные рабочие процессы и оптимизирует распределение ресурсов.

Лю заявил, что новая архитектура может увеличить MFU (Model FLOPs Utilization) одной карты до 5,7 раз, что значительно снижает затраты на вывод. Он подчеркнул, что по мере экспоненциального роста потребления токенов, постепенной оптимизации затрат будет недостаточно. Необходимы фундаментальные изменения в вычислительных архитектурах, и экономическая эффективность станет “лицензией на выживание” для AI-компаний в грядущую эпоху.

Источник: liangziwei

Всегда имейте в виду, что редакции некоторых изданий могут придерживаться предвзятых взглядов в освещении новостей.
8/6

Автор – Pandaily

Оригинал статьи

В тренде:

ai-сервер, inspur, yuannao hc1000, большие модели, Искусственный интеллект, машинное обучение

ChatGPT представляет подведение итогов года в духе Spotify Wrapped
22.12.2025
OpenAI представляет функцию «Ваш год с ChatGPT» — интерактивный обзор вашей активности в чат-боте. Опыт включает персональные награды, стихи и изображения, отражающие вашу историю использования ChatGPT.
Что же такое пузырь вокруг искусственного интеллекта?
15.12.2025
Аналитический материал о текущем ажиотаже вокруг искусственного интеллекта. Эксперты и лидеры отрасли обсуждают, является ли текущий бум ИИ пузырем, сравнивая его с пузырем доткомов. Рассматриваются причины перегрева рынка, риски для инвесторов и компаний, а также потенциальные последствия.
OpenAI устанавливает для бесплатных пользователей по умолчанию наиболее дешёвую модель, чтобы сократить расходы.
16.12.2025
OpenAI изменила настройки ChatGPT для бесплатных пользователей и подписчиков Go, теперь они по умолчанию используют более дешевую модель GPT-5.2 Instant. Возможность выбора более мощной модели Thinking осталась, но требует ручного переключения. Это решение может сократить расходы компании, но потенциально снизить…
По словам директора Logitech, производители ИИ-гаджетов гонятся за несуществующими проблемами. Он также раскрыл детали стратегии ценообразования и работы с цепочками поставок.
05.12.2025
CEO Logitech Хе́ннеке Фа́бер в интервью Bloomberg подвергла сомнению спешку с автономными AI-устройствами, подчеркнув, что многие из них не решают задач, которые уже выполняют смартфоны и ПК. Анализ рынка AI-hardware от экспертов Logitech.

Inspur выпустила новый AI-сервер, заявляя о снижении стоимости логического вывода до 14 центов за миллион токенов.

В тренде:

ChatGPT представляет подведение итогов года в духе Spotify Wrapped

Что же такое пузырь вокруг искусственного интеллекта?

OpenAI устанавливает для бесплатных пользователей по умолчанию наиболее дешёвую модель, чтобы сократить расходы.