Новости: инференс

Дефицит мощностей для ИИ в Китае: настоящая проблема не в перепроизводстве, а в чем-то куда более опасном

Несмотря на заявления о 80% простаивающих дата-центров, ландшафт вычислительных мощностей ИИ в Китае сталкивается со структурным несоответствием, когда фактическая мощность значительно отстает от заявленной.

ИИ

02.07.2026

Pandaily

CUDA, GPU, pandaily.com, дата-центры, ИИ, инференс, облачные вычисления

Alibaba Cloud выходит на зарубежный рынок «вычислительных мощностей» для ИИ

Alibaba Cloud ускоряет глобальную экспансию, открывая новые дата-центры в Париже и Джохоре, используя рост спроса на инференс ИИ для конкуренции с AWS и Azure на международных рынках.

ИИ

02.07.2026

Pandaily

Alibaba Cloud, pandaily.com, дата-центры, ИИ, инференс, облачные вычисления, экспансия

Официальная версия DeepSeek V4 выйдет в середине июля: цены на API в часы пик удвоятся

DeepSeek анонсирует официальный релиз V4 в середине июля, вводя пиковое ценообразование API в 2 раза выше стандартных тарифов с 9:00 до 12:00 и с 14:00 до 18:00, что сравнивают с тарифами на электроэнергию по времени суток.

ИИ

30.06.2026

Pandaily

API, deepseek, pandaily.com, v4, ИИ, инференс, ценообразование

DeepSeek DSpark получил редкое признание от ключевого разработчика PyTorch в детальном техническом разборе

Система инференса DSpark от DeepSeek и Пекинского университета получила всесторонний технический анализ от основного мейнтейнера PyTorch Дмитрия Джулгакова, который выделил ее полупараллельное черчение и инженерную проработку для продакшена.

Deepseek Dspark Llm инференс Pytorch оптимизация pandaily.com

ИИ

29.06.2026

Pandaily

deepseek, dspark, LLM, pandaily.com, pytorch, инференс, оптимизация

Инференс выходит на первый план: DeepSeek DSpark ускоряет генерацию на 80%

Фреймворк спекулятивного декодирования DSpark от DeepSeek знаменует собой стратегический сдвиг, поскольку конкуренция в сфере ИИ переходит от масштабов обучения к эффективности инференса и реальному развертыванию.

ИИ

28.06.2026

Pandaily

deepseek, dspark, pandaily.com, ИИ, инференс, оптимизация, спекулятивное декодирование

DeepSeek DSpark ускоряет генерацию на 85% в первом исследовании после привлечения инвестиций

DeepSeek выпускает фреймворк спекулятивного декодирования DSpark, ускоряющий генерацию на 85% в первой статье Ляна Вэньфэна после раунда финансирования компании на $7 млрд.

Deepseek Dspark декодирование инференс оптимизация pandaily.com

ИИ

28.06.2026

Pandaily

deepseek, dspark, pandaily.com, декодирование, инференс, оптимизация

Бывший глава ИИ-направления Databricks уверен, что сможет сократить энергопотребление нейросетей в 1000 раз

Un0 — это инструмент для генерации изображений, который впервые показывает, как технология компании может воспроизводить возможности традиционных систем ИИ.

ИИ

25.06.2026

Russell Brandom

techcrunch.com, unconventional ai, ИИ, инференс, осцилляторы, Энергоэффективность

Первый кастомный чип OpenAI горяч, как халапеньо: компания называет его «лучшей inference-платформой» для LLM

OpenAI анонсировала свой первый специализированный чип Jalapeño для инференса ИИ, созданный в партнерстве с Broadcom. Этот чип, представленный Сэмом Альтманом и Хоком Таном, знаменует начало стратегии компании по созданию собственных ИИ-ускорителей для эпохи агентного ИИ.

Openai Jalapeño ии-чип Broadcom инференс Asic wccftech.com

Железо

24.06.2026

Hassan Mujtaba

asic, Broadcom, jalapeño, OpenAI, wccftech.com, ии-чип, инференс

OpenAI представила свой первый кастомный чип, созданный совместно с Broadcom

Названный Jalapeño, новый процессор был разработан специально для уникальных потребностей систем инференса OpenAI. Он обещает лучшую производительность на ватт, снижая зависимость от Nvidia.

ИИ

24.06.2026

Russell Brandom

Broadcom, jalapeño, OpenAI, techcrunch.com, ИИ, инференс, чипы

20-кратный рост токена за полгода: как работает «фабрика токенов» с ИИ внутри

Платформа Agentic MaaS от Infinigence демонстрирует скачок объема вызовов токенов более чем в 20 раз, поскольку расходы на инференс превышают расходы на обучение; компания позиционирует себя как нейтральный инфраструктурный уровень между чипами и моделями. — pandaily.com

ИИ

20.06.2026

Pandaily

infinigence, LLM, pandaily.com, ИИ, инференс, инфраструктура, токены

Искать на сайте

Новости: инференс

Дефицит мощностей для ИИ в Китае: настоящая проблема не в перепроизводстве, а в чем-то куда более опасном

Alibaba Cloud выходит на зарубежный рынок «вычислительных мощностей» для ИИ

Официальная версия DeepSeek V4 выйдет в середине июля: цены на API в часы пик удвоятся

DeepSeek DSpark получил редкое признание от ключевого разработчика PyTorch в детальном техническом разборе

Инференс выходит на первый план: DeepSeek DSpark ускоряет генерацию на 80%

DeepSeek DSpark ускоряет генерацию на 85% в первом исследовании после привлечения инвестиций

Бывший глава ИИ-направления Databricks уверен, что сможет сократить энергопотребление нейросетей в 1000 раз

Первый кастомный чип OpenAI горяч, как халапеньо: компания называет его «лучшей inference-платформой» для LLM

OpenAI представила свой первый кастомный чип, созданный совместно с Broadcom

20-кратный рост токена за полгода: как работает «фабрика токенов» с ИИ внутри

Самое просматриваемое: