Новая модель генерации видео на основе искусственного интеллекта Seedance 2.0 недавно стала вирусной как в китайских, так и в международных онлайн-сообществах. Согласно официальной информации, Seedance 2.0 разработана ByteDance и способна генерировать видео кинематографического качества по текстовым запросам или изображениям.
Модель использует двухпоточную архитектуру трансформера диффузии, что позволяет ей генерировать видео и аудио одновременно. С подробным запросом или одним загруженным изображением Seedance 2.0 может создать многокадровую последовательность видео с оригинальным звуком менее чем за 60 секунд.
Одной из ее выдающихся особенностей является генерация многокадровых повествований. Из одного запроса модель может автоматически создавать несколько взаимосвязанных сцен, сохраняя при этом единообразных персонажей, визуальный стиль и атмосферу между переходами сцен, без необходимости ручного редактирования. ByteDance описывает модель как «идеальную для создания полных повествовательных последовательностей от начала до кульминации, с профессиональной связностью».
После выпуска большое количество пользователей быстро начало экспериментировать с Seedance 2.0, получая визуально впечатляющие результаты, которые широко распространялись в сети.
В то же время обзорное видео от популярного китайского создателя контента в сфере технологий и науки MediaStorm еще больше ускорило рост популярности Seedance 2.0. В обзоре подчеркивались сильные стороны модели в крупномасштабном движении, композиции кадра и аудиовизуальной синхронизации. В частности, рецензент отметил ее способность выполнять четкие смены ракурса камеры, «постоянно перепозиционируя камеру, как настоящий режиссер».

Несколько инвестиционных компаний также положительно отозвались о модели в недавних аналитических отчетах. Open Source Securities назвала Seedance 2.0 «впечатляющей», отметив прорывы в самонаправленном движении камеры, оркестровке многокадровых сцен, полноспектральном мультимодальном рассуждении, синхронизированной аудио-видео генерации и многосценарном повествовании. Компания отметила, что Seedance 2.0 предлагает пользователям «точность управления на уровне режиссера» и может представлять собой потенциальный «момент сингулярности» для сгенерированного ИИ кино и видео.
Генерация видео с помощью ИИ сама по себе не нова. Только в прошлом месяце модель генерации видео на основе ИИ от Kuaishou, Kling, получила значительное внимание за рубежом, а ее функция Motion Control позволила создавать контент, которым активно делились. Kling ненадолго возглавляла чарты загрузок приложений для графики и дизайна на таких рынках, как Южная Корея и Сингапур, а также способствовала росту доходов на рынке США.
По данным ByteDance, Seedance 2.0 генерирует видео в разрешении 2K примерно на 30 % быстрее конкурентов, таких как Kling. В то время как OpenAI Sora делает акцент на физической реалистичности, а Kling — на управлении движением, Seedance 2.0 отличается тем, что отдает приоритет связному многокадровому повествованию с оригинальным звуком.
Orient Securities отметила, что с выпуском этих новейших моделей технический потолок китайской индустрии генерации видео продолжает расти, выводя сектор в фазу конкуренции, сравнимую с большими языковыми моделями примерно в 2025 году. Поскольку базовые возможности сходятся на высоком уровне, будущая дифференциация, вероятно, будет зависеть от конкретных сценариев применения и путей коммерциализации.
Компания также отметила, что генерация видео вступает в эру точного управления в стиле «приборной панели», где более низкие технические барьеры способствуют расширению пользовательской базы как на потребительском, так и на корпоративном рынках.
С инвестиционной точки зрения аналитики полагают, что Seedance 2.0 может получить раннее широкомасштабное применение в производстве ИИ-комиксов, ИИ-анимации и коротких сериалов, значительно снижая затраты, повышая эффективность и открывая новые источники контента. Наибольшую выгоду ожидается получить от компаний с сильными запасами интеллектуальной собственности и преимуществами в трафике платформ.
Кроме того, инвесторам рекомендуется уделять пристальное внимание вертикальным мультимодальным ИИ-приложениям, поскольку текущие технические прорывы и снижение затрат ускоряют отраслевую динамику, стимулируют рост пользовательской базы, увеличивают платный охват и продвигают коммерциализацию. Компании с зарубежными стратегиями экспансии для мультимодальных ИИ-продуктов могут продемонстрировать особенно быстрый рост.
Источник: AI Daily
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




