98% Harness от Claude Code: четыре команды создали идентичные AI-агенты, раскрывая секрет «AI moat»

ии обвязка Claude Code архитектура безопасность techtimes.com

Команда исследователей из Университета искусственного интеллекта имени Мохаммеда бин Зайда опубликовала результат, привлекший внимание инженеров. Проанализировав Claude Code v2.1.88, команда VILA-Lab разобрала 1884 файла и около 512 000 строк кода. — techtimes.com

Исследовательская группа Университета искусственного интеллекта имени Мохаммеда бин Зайда опубликовала в апреле 2026 года результат, который привлек внимание в инженерных кругах по причинам, выходящим за рамки его заглавной цифры. Проанализировав Claude Code v2.1.88 — версию, которая 31 марта 2026 года на короткое время раскрыла свой полный исходный код на TypeScript после того, как Anthropic случайно включила в выпуск для npm файл карты исходного кода размером 59,8 мегабайта, — команда из четырех авторов из VILA-Lab разобрала 1884 файла и приблизительно 512 000 строк кода. Их классификация: около 1,6 процента составляет логика принятия решений ИИ; оставшиеся 98,4 процента — это то, что в этой области теперь называют «обвязкой» (harness) — конвейер разрешений, система управления контекстом, уровень песочницы, маршрутизатор инструментов и инфраструктура восстановления, окружающая модель со всех сторон.

Цифра в 1,6 процента имеет методологическую сноску. Она отражает собственную классификацию исследователей по количеству строк в утечке, содержащей сгенерированный код и артефакты минификации. Авторы статьи MBZUAI — Цзячэн Лю, Сяохань Чжао, Синьи Шан и Чжицян Шэнь — не представляют ее как универсальный аудит. Они утверждают, и их архитектурный анализ независимо подтверждает это, качественное утверждение, четко изложенное в аннотации к статье: ядро системы представляет собой простой цикл, который вызывает модель, запускает инструменты и повторяется, — но большая часть кода находится в системах, построенных вокруг этого цикла.

К этому качественному выводу независимо пришли и другие. Каран Прасад из Obvix Labs потратил 72 часа после утечки карты исходного кода на создание пятиэтапного конвейера извлечения данных по той же кодовой базе, подготовив 82 аналитических документа и 16 архитектурных диаграмм. Его вывод: «Модель взаимозаменяема — обвязка нет».

Конвергенция среди конкурирующих команд

Более глубокий сигнал в статье MBZUAI — это архитектурная конвергенция. Claude Code построен на TypeScript с использованием Bun. Codex CLI изначально был на TypeScript, но претерпел почти полную переработку на Rust, и теперь этот язык составляет примерно 95 процентов активной кодовой базы. Инструмент с открытым исходным кодом Aider, написанный на Python, и OpenClaw, независимая система агентов с открытым исходным кодом, которую исследователи MBZUAI использовали в качестве прямого архитектурного сравнения, были созданы совершенно разными командами с разными коммерческими интересами.

Все четыре команды сошлись на одном и том же структурном скелете: внешний цикл вызова модели, выполнения инструментов и сбора результатов; примитивный набор инструментов, включающий около дюжины возможностей, охватывающих чтение, запись, редактирование файлов, выполнение команд оболочки, поиск и получение данных из Интернета; и многоступенчатый конвейер разрешений, который проверяет каждый вызов инструмента последовательными проверками перед выполнением. Когда конкурирующие команды независимо изобретают одну и ту же архитектуру, эта конвергенция является одним из самых сильных инженерных сигналов того, что данный шаблон — это не предпочтение, а ограничение, налагаемое самой задачей.

В статье MBZUAI обвязка Claude Code отображена в семи компонентах: пользовательский интерфейс, агентный цикл, система разрешений, уровень инструментов, состояние и сохранение данных, среда выполнения и расширяемость. Только система разрешений охватывает семь режимов и включает классификатор машинного обучения, который оценивает вызовы инструментов в два этапа — быстрое бинарное решение на 64 токена, за которым, при необходимости, следует полный проход рассуждений до 4096 токенов. Управление контекстом использует пятиуровневый конвейер сжатия, который пытается сохранить кэшированные префиксы промптов при большинстве событий сжатия, что, согласно анализу Obvix Labs, связано с экономикой кэша промптов: сохранение кэшированной части промпта снижает затраты на API примерно на 76 процентов при повторных обращениях.

Контраргумент создателя модели заслуживает внимания

Человек, создавший Claude Code, не согласен с концепцией «рва», и его несогласие стоит воспринять всерьез. Борис Черный, создавший Claude Code и ныне возглавляющий его в Anthropic, заявил в подкасте Latent Space, что обвязка — это «самая тонкая возможная обертка поверх модели», и что компания «буквально не могла построить ничего более минимального». Его прямое утверждение: «Вся секретная изюминка — она вся в модели».

Эта позиция частично подтверждается сторонним бенчмаркингом. Оценки METR показали, что Claude Code и Codex CLI не всегда превосходят базовый каркас в определенных задачах. Данные SWE-Atlas от Scale AI показали, что для некоторых моделей выбор обвязки приводил к различиям в производительности в пределах погрешности. Исследователь OpenAI Ноам Браун утверждал, что по мере улучшения моделей рассуждений каркас вокруг них будет все чаще заменяться самой возможностью модели — та же динамика, которая сделала громоздкий каркас избыточным, когда впервые появились модели рассуждений.

Честное прочтение ситуации таково, что сторонники «Большой Модели» и «Большой Обвязки» продают что-то свое. Черный продает модель. Исследователи обвязки продают фреймворки обвязки. То, что независимые архитектурные доказательства — из MBZUAI, из Obvix Labs и из архитектурных решений, видимых в каждом конкурирующем CLI-агенте, — на самом деле подтверждают, это более узкое утверждение: инженерия обвязки имеет реальную и нетривиальную ценность, даже если это не единственная ценность, а шаблон независимой конвергенции предполагает, что решения по обвязке накапливаются в поколениях моделей способами, которые простые замены моделей не могут автоматически исправить.

Уязвимости безопасности скрывались в компонентах обвязки

Запись CVE для Claude Code добавляет практическое измерение в архитектурные дебаты. Check Point Research раскрыла CVE-2025-59536 — уязвимость внедрения кода с оценкой CVSS 8.7, которая позволяла автоматически выполнять произвольные команды оболочки, когда разработчик запускал Claude Code в злонамеренном репозитории. Путь эксплуатации проходил через механизм хуков — компонент обвязки — и не требовал от пользователя никаких действий, кроме клонирования репозитория. Вторая уязвимость, CVE-2026-21852, позволяла злонамеренному репозиторию эксфильтровать API-ключи Anthropic до появления запроса подтверждения доверия. Обе были исправлены: первая в октябре 2025 года, вторая в январе 2026 года. Adversa AI впоследствии выявила дополнительные векторы злоупотребления конфигурацией, включая обход песочницы TrustFall, раскрытый в мае 2026 года, который также был исправлен.

Эта закономерность примечательна в контексте дебатов об обвязке: уязвимости, которые привели к реальному раскрытию данных разработчиков, заключались не в логике вывода модели. Они были в конвейере разрешений, системе хуков и песочнице — именно в тех компонентах, которые исследователи MBZUAI классифицируют как обвязку. То, что одна и та же инфраструктура является одновременно структурным дифференциатором и основной поверхностью атаки, не является совпадением. Более выразительная обвязка увеличивает поверхность для манипуляций вредоносными входными данными.

Ставка Карпати и рекурсивный цикл

Вывод об обвязке появляется на фоне, который придает ему иную окраску, чем могла бы дать одна только статья MBZUAI. Андрей Карпати, один из основателей OpenAI, возглавлявший программу Autopilot в Tesla и придумавший термин «vibe coding» в феврале 2025 года, прежде чем покинуть свою образовательную стартап Eureka Labs, объявил 19 мая 2026 года, что он присоединился к команде предварительного обучения Anthropic. Его мандат конкретен: работать под руководством руководителя команды предварительного обучения Ника Джозефа над созданием новой группы, которая использует Claude для ускорения собственных исследований предварительного обучения Claude. Ставка заключается в том, что наука с помощью ИИ может сжать цикл обучения, который производит будущие модели, быстрее, чем это может сделать чистое расходование вычислительных ресурсов.

Эта ставка — это ставка на «Большую Модель» в терминах дебатов об обвязке. Карпати не присоединяется к команде инфраструктуры Claude Code. Он присоединяется к команде, которая производит модель, которую оборачивает обвязка. Его присутствие в Anthropic усиливает аргумент о том, что качество модели остается основным рычагом, — но это не решает вопроса о том, усугубляет ли обвязка вокруг этой модели или подрывает преимущество по мере перехода агентов от прототипа к производству.

Черный подтвердил в марте 2026 года, что 100 процентов собственной кодовой базы Claude Code теперь написано самим Claude Code — обратная связь между моделью и обвязкой полностью замкнута. Будет ли это означать, что обвязка является основным «рвом» или модель является основным «рвом», зависит от того, что вы считаете более сложным для репликации: инфраструктуру, которая ограничивает и обеспечивает поведение модели в продакшене, или модель, ради которой стоит строить инфраструктуру.

Практический вывод для разработчиков

Для разработчиков, создающих агентные системы в 2026 году, статья MBZUAI и доказательства конвергенции предполагают конкретный вопрос о распределении ресурсов: сколько инженерного времени уходит на компоненты обвязки — конвейеры разрешений, сжатие контекста, песочницу, маршрутизацию инструментов — по сравнению с выбором модели и инженерией промптов? Независимая конвергенция четырех конкурирующих команд на почти идентичных скелетах обвязки подразумевает, что решения по обвязке не являются произвольными и что их неправильное принятие влечет за собой производственные издержки, которые не исправляются автоматически обновлениями модели.

Протокол контекста модели (Model Context Protocol), открытый стандарт, выпущенный Anthropic в ноябре 2024 года, который с тех пор набрал более 97 миллионов ежемесячных загрузок SDK и более 10 000 зарегистрированных серверов, расширяет логику обвязки на сеть. По сути, это тот же примитив вызова-ответа JSON-RPC, который CLI предоставляет локально, проецируемый наружу на внешние инструменты и сервисы. Codex CLI поставляется с режимом, который позволяет бинарному файлу выступать в роли сервера Model Context Protocol, а также клиента, что означает, что внешние агенты могут управлять Codex так же, как Codex управляет своими собственными инструментами — один инфраструктурный стандарт соединяет все.

Конкурентная черта в агентном ИИ в ближайшие 12–18 месяцев, вероятно, будет пролегать как по качеству модели, так и по защищенности обвязки. CLI-агент, поставляемый с работающим многоступенчатым конвейером разрешений, песочницей на уровне ОС, структурированным хранилищем сессий и небольшим набором примитивных инструментов, больше не является прототипом. Вопрос, который поднимает статья MBZUAI — и на который контраргумент Бориса Черного не дает полного ответа, — заключается в том, сложнее ли воспроизвести эту инфраструктуру, однажды построенную и прошедшую боевое крещение в миллионах сессий разработчиков, чем модель, которую она оборачивает.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: