Официальная версия DeepSeek V4 выйдет в середине июля: цены на API в часы пик удвоятся

Pandaily

30.06.2026

DeepSeek анонсирует официальный релиз V4 в середине июля, вводя пиковое ценообразование API в 2 раза выше стандартных тарифов с 9:00 до 12:00 и с 14:00 до 18:00, что сравнивают с тарифами на электроэнергию по времени суток.

Компания DeepSeek объявила о том, что официальный релиз DeepSeek V4 состоится в середине июля. Обновление принесет новые функции и оптимизацию производительности, а также существенное изменение в модели ценообразования API. Согласно уведомлениям об обновлении, разосланным пользователям, в рамках апгрейда будет введено ценообразование по времени суток, которое удвоит стоимость API в часы пиковой нагрузки.

Согласно новой структуре, цены на модели DeepSeek V4 Pro и V4 Flash останутся неизменными в периоды вне пиковой нагрузки, но удвоятся в часы пик, которые определены как ежедневно с 9:00 до 12:00 и с 14:00 до 18:00. Для V4 Pro стоимость ввода данных с попаданием в кэш в часы пик составит 0,05 юаня за миллион токенов, ввода без попадания в кэш — 6 юаней за миллион токенов, а вывода — 12 юаней за миллион токенов. Для V4 Flash тарифы в часы пик составят 0,04 юаня за ввод с попаданием в кэш, 2 юаня за ввод без попадания в кэш и 4 юаня за миллион токенов для вывода.

Этот шаг знаменует собой заметную эволюцию в стратегии ценообразования ИИ, вызывая сравнения с тарифами на электроэнергию по времени суток, используемыми коммунальными службами. Один из пользователей отметил, что «токены становятся похожи на электричество — ресурс, который стоит дороже в периоды высокого потребления и дешевле во времена низкого спроса». Такой подход направлен на сглаживание пиков спроса и обеспечение стабильности сервиса путем стимулирования пользователей переносить несрочные задачи инференса на часы вне пиковой нагрузки.

DeepSeek V4 был первоначально выпущен в предварительной версии в апреле с окнами контекста в миллион токенов, расширенными возможностями агентов, а также знаниями и производительностью в области рассуждений мирового уровня. Модель представлена в двух размерах: V4-Pro и V4-Flash, причем последняя, согласно данным OpenRouter, является самой вызываемой через API моделью в мире на протяжении шести недель подряд.

Официальный релиз V4 представляет новый механизм внимания, работающий на уровне сжатия токенов, в сочетании с технологией DeepSeek Sparse Attention (DSA), что обеспечивает лидирующие в мире возможности работы с длинным контекстом при значительном снижении вычислительных затрат и требований к памяти по сравнению с традиционными подходами. DeepSeek обязалась, что окна контекста в 1 миллион токенов станут стандартом для всех официальных сервисов в дальнейшем.

Хотя некоторые пользователи выразили удивление по поводу многоуровневой модели ценообразования, аналитики отрасли отмечают, что по мере того, как инференс ИИ становится все более ресурсоемким, переменное ценообразование в зависимости от спроса является естественной эволюцией рынка — аналогично тому, как провайдеры облачных вычислений устанавливают разные цены для зарезервированных и инстансов по требованию.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

В тренде:

API, deepseek, pandaily.com, v4, ИИ, инференс, ценообразование

Искать на сайте

Официальная версия DeepSeek V4 выйдет в середине июля: цены на API в часы пик удвоятся

В тренде:

Похожие новости:

Официальная версия DeepSeek V4 выйдет в середине июля: цены на API в часы пик удвоятся

В тренде:

Похожие новости:

Дело не только в смартфонах: из-за дефицита чипов дорожают даже

Споры о влиянии ИИ на рынок труда разгорелись с новой

Платформа для «vibe coding» Base44 запустила собственную модель на фоне

Саймон говорит: берите эту штуковину — механическую клавиатуру от OpenAI