Модель SkyReels-V4 от Kunlun Tech заняла первое место в мире в категории «текст в видео (со звуком)» в бенчмарке Artificial Analysis, обойдя такие модели, как Kling 3.0, Google Veo 3.1 и OpenAI Sora 2.
Ранее модель занимала второе место после своего предварительного выпуска в феврале.
Последнее обновление включает два ключевых технических улучшения. Во-первых, фреймворк обучения с подкреплением полной модальности интегрирует семантическую модель вознаграждения с обучением по программе (curriculum learning), что позволяет системе генерировать 15-секундные видео в разрешении 1080p с сохранением логической связности в развитии сцены.
Во-вторых, модель получила возможности визуальной привязки на основе ключевых кадров и сетки, позволяя пользователям загружать до девяти изображений. Это обеспечивает более сильную согласованность во внешнем виде персонажей и стиле сцены в сгенерированных последовательностях.
После выхода на первое место в рейтинге SkyReels-V4 открыла доступ к API, поддерживая генерацию видео по тексту, видео по изображению, мультимодальную генерацию, а также редактирование и восстановление видео.
Источник:QbitAI
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




