Компания DeepSeek объявила о том, что официальный релиз DeepSeek V4 состоится в середине июля. Обновление принесет новые функции и оптимизацию производительности, а также существенное изменение в модели ценообразования API. Согласно уведомлениям об обновлении, разосланным пользователям, в рамках апгрейда будет введено ценообразование по времени суток, которое удвоит стоимость API в часы пиковой нагрузки.
Согласно новой структуре, цены на модели DeepSeek V4 Pro и V4 Flash останутся неизменными в периоды вне пиковой нагрузки, но удвоятся в часы пик, которые определены как ежедневно с 9:00 до 12:00 и с 14:00 до 18:00. Для V4 Pro стоимость ввода данных с попаданием в кэш в часы пик составит 0,05 юаня за миллион токенов, ввода без попадания в кэш — 6 юаней за миллион токенов, а вывода — 12 юаней за миллион токенов. Для V4 Flash тарифы в часы пик составят 0,04 юаня за ввод с попаданием в кэш, 2 юаня за ввод без попадания в кэш и 4 юаня за миллион токенов для вывода.
Этот шаг знаменует собой заметную эволюцию в стратегии ценообразования ИИ, вызывая сравнения с тарифами на электроэнергию по времени суток, используемыми коммунальными службами. Один из пользователей отметил, что «токены становятся похожи на электричество — ресурс, который стоит дороже в периоды высокого потребления и дешевле во времена низкого спроса». Такой подход направлен на сглаживание пиков спроса и обеспечение стабильности сервиса путем стимулирования пользователей переносить несрочные задачи инференса на часы вне пиковой нагрузки.
DeepSeek V4 был первоначально выпущен в предварительной версии в апреле с окнами контекста в миллион токенов, расширенными возможностями агентов, а также знаниями и производительностью в области рассуждений мирового уровня. Модель представлена в двух размерах: V4-Pro и V4-Flash, причем последняя, согласно данным OpenRouter, является самой вызываемой через API моделью в мире на протяжении шести недель подряд.
Официальный релиз V4 представляет новый механизм внимания, работающий на уровне сжатия токенов, в сочетании с технологией DeepSeek Sparse Attention (DSA), что обеспечивает лидирующие в мире возможности работы с длинным контекстом при значительном снижении вычислительных затрат и требований к памяти по сравнению с традиционными подходами. DeepSeek обязалась, что окна контекста в 1 миллион токенов станут стандартом для всех официальных сервисов в дальнейшем.
Хотя некоторые пользователи выразили удивление по поводу многоуровневой модели ценообразования, аналитики отрасли отмечают, что по мере того, как инференс ИИ становится все более ресурсоемким, переменное ценообразование в зависимости от спроса является естественной эволюцией рынка — аналогично тому, как провайдеры облачных вычислений устанавливают разные цены для зарезервированных и инстансов по требованию.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




