Платформа искусственного интеллекта Volcano Engine от ByteDance достигла возможности массового производства моделей, сопоставимых по качеству с Opus 4.6 от Anthropic, но при значительно меньших затратах, что знаменует новый этап в гонке за инфраструктуру ИИ в Китае.
На конференции FORCE президент Volcano Engine Тан Тэ (Tan Te) одновременно представил пять основных моделей: Doubao 2.1 Pro, Seedance 2.5 для генерации видео, Seedream 5.0 Pro для генерации изображений и модель генерации аудио 1.0. Модель Doubao 2.1 Pro, доступная потребителям через Doubao Pro по цене всего 68 юаней в месяц, демонстрирует возможности, конкурирующие с моделями, которые за рубежом стоят значительно дороже.
Ценовое преимущество является структурным, а не рекламным. Тан Тэ заявил, что полная стоимость эксплуатации Doubao 2.1 Pro составляет всего 20% от стоимости Claude Opus 4.6, что достигается за счет комбинации квантования, дистилляции, оптимизации планирования инференса и разработки собственных чипов. При цене 68 юаней подписка, вероятно, обеспечивает положительную маржу — это устойчивое ценообразование, а не работа в убыток.
Результаты бенчмарков помещают Doubao 2.1 Pro в первый мировой эшелон по ряду категорий. В тестах Terminal Bench 2.1, SWE-Pro и SciCode она входит в число лучших моделей в мире. В задачах агентов и мультимодальных задачах на OSWorld, MobileWorld и MMMU-Pro она также занимает лидирующие позиции. В практическом тестировании модель выполнила полный рабочий процесс проектирования RTL-чипа — охватывающий симуляцию, тестирование и верификацию синтеза — за девять итераций в течение 18 часов непрерывной работы.
Скорость вывода на рынок не менее примечательна. В отличие от конкурентов, которые анонсируют модели за месяцы до их развертывания, ByteDance выпустила Seed 2.1 в своих потребительских продуктах — приложении Doubao и TRAE IDE — в тот же день. Доступ по API был открыт одновременно через Volcano Ark. Анонс модели генерации аудио 1.0 сопровождался немедленными обязательствами по интеграции в CapCut, Jimeng и Fanqie Novel.
Seedance 2.5, запуск которой запланирован на июль 2026 года, поддерживает нативную генерацию видео длиной до 30 секунд в одном сегменте и совместную генерацию из до 50 мультимодальных активов. Seedream 5.0 Pro, также запущенная одновременно, поддерживает послойное редактирование и точный многоязычный рендеринг текста на 14 языках.
Движущей силой такого объема производства является масштаб операций ByteDance в области ИИ. Ежедневное потребление токенов Volcano Ark превысило 180 триллионов, увеличившись более чем в десять раз за последний год. Это создает положительный цикл: модели запускаются для сотен миллионов реальных пользователей, их взаимодействие генерирует данные обратной связи, которые ускоряют следующую итерацию, а инженерная команда сокращает путь от лаборатории до продукта до нескольких дней.
Наблюдатели отрасли отмечают, что истинное конкурентное преимущество выходит за рамки ценообразования и включает интеграцию рабочих процессов. Экосистема ByteDance охватывает Feishu для корпоративного сотрудничества, CapCut для редактирования видео, Fanqie для контента и TRAE для разработки. Пользователи, встраивающие свои рабочие процессы в эту экосистему, сталкиваются с издержками переключения. Однако конкуренты сокращают разрыв. JD.com открыла исходный код JoyAI-VL-Interaction, а Baidu выпустила Unlimited-OCR, демонстрируя сближение отечественных инженерных возможностей.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




