29 апреля 2026 года — SenseTime официально выпустила и открыла исходный код серии SenseNova U1 — нативной унифицированной модели, объединяющей возможности понимания и генерации.
Модель построена на собственной архитектуре SenseTime под названием NEO-unify, представленной в марте этого года. Эта архитектура унифицирует мультимодальное понимание, рассуждение и генерацию в рамках единой модельной структуры.
В отличие от распространенных «стековых» конструкций, NEO-unify отказывается от использования отдельных энкодеров зрения (VE) и вариационных автоэнкодеров (VAE). Вместо этого она реконструирует единое пространство представлений, глубоко встроенное в каждый вычислительный слой, что знаменует собой переход от интеграции модальностей к нативной унификации.
Серия SenseNova U1 рассматривает языковые и визуальные входные данные как единое целое, обеспечивая эффективное межмодальное взаимодействие. Такая конструкция одновременно улучшает как возможности понимания, так и генерации, сохраняя семантическую насыщенность при поддержании точности визуализации на уровне пикселей.
В таких областях, как логическое рассуждение и пространственный интеллект, модель демонстрирует высокие способности к пониманию сложных макетов физического мира и тонких взаимосвязей. В перспективе ожидается, что она послужит основополагающим «воплощенным мозгом» для робототехники, обеспечивая замкнутую систему, где восприятие, рассуждение и выполнение задач осуществляются в рамках одной унифицированной модели.
Текущий релиз с открытым исходным кодом включает облегченную серию SenseNova U1 Lite, которая состоит из двух вариантов:
- SenseNova-U1-8B-MoT: построен на плотной базовой архитектуре
- SenseNova-U1-A3B-MoT: построен на базовой архитектуре Mixture-of-Experts (MoE)
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pandaily




