SenseTime запускает SenseNova U1: курс на эру универсальных моделей понимания и генерации

Sensetime Sensenova U1 ии мультимодальность Neo-Unify pandaily.com

SenseTime открывает исходный код SenseNova U1 — унифицированной мультимодальной модели, построенной на архитектуре NEO-unify, которая объединяет понимание и генерацию в единую структуру. — pandaily.com

29 апреля 2026 года — SenseTime официально выпустила и открыла исходный код серии SenseNova U1 — нативной унифицированной модели, объединяющей возможности понимания и генерации.

Модель построена на собственной архитектуре SenseTime под названием NEO-unify, представленной в марте этого года. Эта архитектура унифицирует мультимодальное понимание, рассуждение и генерацию в рамках единой модельной структуры.

В отличие от распространенных «стековых» конструкций, NEO-unify отказывается от использования отдельных энкодеров зрения (VE) и вариационных автоэнкодеров (VAE). Вместо этого она реконструирует единое пространство представлений, глубоко встроенное в каждый вычислительный слой, что знаменует собой переход от интеграции модальностей к нативной унификации.

Серия SenseNova U1 рассматривает языковые и визуальные входные данные как единое целое, обеспечивая эффективное межмодальное взаимодействие. Такая конструкция одновременно улучшает как возможности понимания, так и генерации, сохраняя семантическую насыщенность при поддержании точности визуализации на уровне пикселей.

В таких областях, как логическое рассуждение и пространственный интеллект, модель демонстрирует высокие способности к пониманию сложных макетов физического мира и тонких взаимосвязей. В перспективе ожидается, что она послужит основополагающим «воплощенным мозгом» для робототехники, обеспечивая замкнутую систему, где восприятие, рассуждение и выполнение задач осуществляются в рамках одной унифицированной модели.

Текущий релиз с открытым исходным кодом включает облегченную серию SenseNova U1 Lite, которая состоит из двух вариантов:

  • SenseNova-U1-8B-MoT: построен на плотной базовой архитектуре
  • SenseNova-U1-A3B-MoT: построен на базовой архитектуре Mixture-of-Experts (MoE)

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: