Прорыв в пространственном интеллекте: ByteDance Seed представляет SpatialTree на конференции CVPR 2026

Pandaily

22.06.2026

ByteDance Seed и академические партнеры предлагают SpatialTree — иерархическую структуру, переопределяющую то, как мультимодальные LLM понимают пространство и рассуждают о нем.

Совместная исследовательская группа из Чжэцзянского университета, ByteDance Seed и Пекинского университета Цзяотун представила SpatialTree — новую структуру, принятую на CVPR 2026, которая систематически переопределяет подход мультимодальных больших языковых моделей (MLLM) к пространственному интеллекту.

Хотя современные MLLM могут описывать изображения и понимать видео, истинное пространственное понимание — оценка расстояния, определение размера, понимание многоракурсных взаимосвязей и планирование маршрутов навигации — остается фундаментальной проблемой.

SpatialTree организует возможности в четыре уровня: Восприятие (базовое расстояние, размер, форма, движение, направление), Ментальное картирование (преобразование пространственной информации в язык и память), Ментальное моделирование (пространственное рассуждение перед действием, например, планирование маршрута) и Агентная компетентность (преобразование восприятия в действия, такие как навигация в игре или манипуляции робота).

Команда создала SpatialTree-Bench, охватывающий 27 пространственных подвозможностей. Результаты показывают, что даже лучшая модель — Gemini 3 Flash — набирает в среднем всего 57,8 балла, что демонстрирует нерешенность проблемы пространственного интеллекта. Модель Seed 1.8 от ByteDance достигла 50,3 в высшем уровне.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

В тренде:

ByteDance, cvpr 2026, mllm, pandaily.com, spatialtree, ИИ, пространственный интеллект

Искать на сайте

Прорыв в пространственном интеллекте: ByteDance Seed представляет SpatialTree на конференции CVPR 2026

В тренде:

Похожие новости:

Прорыв в пространственном интеллекте: ByteDance Seed представляет SpatialTree на конференции CVPR 2026

В тренде:

Похожие новости:

Новый GPT-5.5-Cyber от OpenAI обошел Claude Mythos 5 в бенчмарке

«Пять глаз» предупреждают ИБ-директоров: пора менять стратегию кибербезопасности под угрозой

OpenAI запускает новую инициативу для поиска и исправления багов в

Интернет-гиганты захватывают рынок AI-здравоохранения: ByteDance, Tencent, JD Health и Ant