CLAUDE.md от Карпатого дорос до десяти правил: новый протокол самопроверки для AI-кодинга

карпати Anthropic Llm Claude Code агентные рабочие процессы Loop Engineering techtimes.com

Циркулирует документ CLAUDE.md из десяти правил, приписываемый Андрею Карпати, добавляющий шесть правил самопроверки агента к шаблону сообщества из четырех правил. Он охватывает верификацию перед исправлением, дисциплину отладки, гигиену зависимостей и именованные режимы сбоев, которые должны распознавать циклы.

Документ, приписываемый Андрею Карпати — который присоединился к команде предварительного обучения Anthropic пять недель назад — начал циркулировать в X в пятницу. Разработчики ИИ утверждают, что шесть правил, которые он добавляет к известному шаблону сообщества из четырех правил, меняют их представление об агентных рабочих процессах, а не только о том, как они составляют промпты.

Этот документ не тот, который уже есть у большинства разработчиков. В конце января, после того как Карпати описал в X свой переход от 80 процентов ручного кодирования к 80 процентам работы, управляемой агентом, разработчик Форрест Чанг обобщил эти наблюдения в репозитории andrej-karpathy-skills с четырьмя правилами, который теперь имеет более 200 000 суммарных звезд в двух репозиториях — один из самых быстрорастущих файлов в истории GitHub. Документ, циркулирующий в пятницу, — нечто иное: файл из десяти правил с подзаголовком: «Краткий список правил, усвоенных после того, как дважды наблюдал одни и те же ошибки».

Его подлинность публично не подтверждена. Карпати не комментировал. Разработчики реагируют на содержание документа — и, в частности, на шесть правил, которых никогда не было в версии сообщества из четырех правил.

Четыре правила, которые вы уже знаете

Первые четыре правила в циркулирующем документе охватывают ту же область, что и файл сообщества, и не зря: они касаются наиболее распространенных и дорогостоящих режимов сбоев при кодировании с помощью LLM. «Думай, прежде чем кодировать» требует, чтобы агент явно излагал предположения, выявлял неоднозначность и спрашивал, а не угадывал, прежде чем написать строку. «Простота превыше всего» ограничивает вывод минимальным кодом, решающим поставленную задачу — никаких спекулятивных абстракций, никаких незапрошенных функций. «Хирургические изменения» запрещают редактирование кода, смежного с задачей; каждая измененная строка должна напрямую относиться к тому, что было запрошено. «Исполнение, управляемое целью» преобразует расплывчатые инструкции в проверяемые критерии успеха до начала работы: «добавить аутентификацию» переписывается как пять конкретных, проверяемых результатов.

Разработчики, которые использовали Claude Code более нескольких сеансов, ощутили все четыре из этих сбоев, поэтому версия сообщества стала вирусной. Однако версия сообщества не затрагивает то, что происходит после написания кода — когда агент работает, оценивает и решает, продолжать ли.

Шесть новых правил

Именно на шести дополнениях в циркулирующем документе разработчики останавливаются, чтобы сделать пометки.

«Верификация» устраняет разрыв между кодом, который кажется правильным, и кодом, который действительно работает. Правило предписывает порядок: прежде чем пытаться исправить ошибку, напишите тест, который надежно воспроизводит ее. Исправьте код. Запустите тест. Только когда тест пройден, ошибка считается исправленной — а не когда агент решает, что она «ощущается» исправленной. Это ограничение важно в контекстах циклов, поскольку автономный цикл не имеет человеческого рецензента на каждом шаге; тест — единственная проверка.

«Исполнение, управляемое целью» в версии из десяти правил идет дальше, чем версия в файле сообщества. Циркулирующий документ представляет его как центральную дисциплину документа: прежде чем будет написан какой-либо код, определите, как выглядит «готово», в терминах, которые может проверить машина. «Добавить валидацию» не проходит этот тест. «Пользователи, отправляющие пустое или некорректное поле электронной почты, видят определенное сообщение об ошибке, и оба случая имеют проходящие тесты» — проходит. Для многоэтапной работы сначала нужен план — прежде чем час автономной генерации отправит все в неверном направлении.

«Отладка» заслуживает отдельного правила с конкретной последовательностью: прочитать полное сообщение об ошибке и трассировку стека, воспроизвести проблему перед попыткой исправления и изменять одну переменную за раз. Режим сбоя, который это устраняет, — это уверенная неверная диагностика — агент, который читает неоднозначное сообщение об ошибке, выбирает интерпретацию и генерирует исправление для проблемы, существование которой он не подтвердил.

«Зависимости» рассматривает каждый добавленный пакет как постоянный, неконтролируемый код, который будет обновлен кем-то другим по графику, который вы не контролируете. Прежде чем тянуться к библиотеке, спросите, обрабатывает ли ее стандартная библиотека. Если зависимость добавлена, явно задокументируйте это решение.

«Коммуникация» проводит черту между полезной неопределенностью и расплывчатым заверением. «Я не уверен, что эта библиотека поддерживает потоковую передачу» — это действенная информация. «Я думаю, это должно сработать» — нет. Правило запрещает уверенные догадки, когда неопределенность является точным ответом.

Шестое правило — «Общие режимы сбоев» — является наиболее отличительным. Оно называет четыре повторяющихся шаблона, которые, по мнению документа, агент должен уметь распознавать в своем собственном поведении и прекращать:

Кухонный комбайн (Kitchen Sink): просят починить кран, а агент делает ремонт на кухне.

Неверная абстракция (Wrong Abstraction): одна и та же логика появляется в трех местах без осознания того, что она должна быть функцией.

Оптимистичный путь (Optimistic Path): код пишется только для «счастливого случая», игнорируя некорректные входные данные, потерянные соединения и сбои сервера.

Неуправляемая рефакторизация (Runaway Refactor): один файл становится десятью, потому что ничто не останавливает каскад.

Предписанный ответ на распознавание любого из этих шаблонов в процессе — немедленно остановиться, а не продолжать движение к завершению.

Что отличает это от файла сообщества

Шаблон из четырех правил говорит ИИ-агенту, как писать код. Документ из десяти правил говорит ему, как контролировать собственное мышление — когда остановиться, когда поставить под сомнение предположение в середине задачи и когда шаблон, в который он попадает, имеет название.

Абстракт документа явно формулирует это: модели эффективно создают код, который выглядит правдоподобно. Они менее эффективны в обнаружении разрыва между «выглядит правдоподобно» и «на самом деле правильно». Шесть дополнений призваны навязать эту дисциплину обнаружения извне.

Это различие напрямую соответствует текущему моменту в разработке с помощью ИИ. Борис Черны, создатель Claude Code и руководитель Anthropic, заявил в широко распространенном интервью в этом месяце, что его собственный рабочий процесс больше не включает написание промптов. «Я больше не даю промпты Claude», — сказал он. «У меня запущены циклы, которые дают промпты Claude и выясняют, что делать. Моя работа — писать циклы». Это заявление, одновременно поддержанное инженером OpenAI Питером Штайнбергером, а затем получившее название от инженера Google Адди Османи, знаменует собой сдвиг в том, к чему движется сообщество практиков: к автоматизированным системам, которые оценивают свой собственный вывод, корректируют курс и продолжают до тех пор, пока не будет достигнуто проверяемое условие.

В этих рамках файл из четырех правил касается поведения «ход за ходом». Шесть дополнений касаются поведения на уровне цикла — того, что происходит, когда агент работает без человеческого рецензента на каждом шаге. Правила верификации становятся более важными, когда никто не следит за каждой итерацией. Именованные режимы сбоев становятся более важными, когда цикл, работающий в течение часа, может усугубить неверное направление до тысяч строк кода.

Как CLAUDE.md работает внутри Claude Code

Понимание влияния документа требует понимания его технического механизма. Когда Claude Code запускается в каталоге проекта, он считывает любой файл с именем CLAUDE.md в корне и внедряет его содержимое в контекст разговора — а не в системный промпт. Согласно официальной документации Anthropic по Agent SDK: «CLAUDE.md идет по другому пути: SDK считывает его и внедряет его содержимое в разговор в качестве контекста проекта, а не в системный промпт, поэтому он формирует поведение наряду с любым системным промптом, который вы выберете».

Правила — отдельная, но связанная функция Claude Code — работают по-другому: они повторно внедряются в контекст в качестве напоминаний каждый раз, когда агент обращается к файлу, соответствующему их шаблону пути. Полный системный промпт Claude Code занимает примерно от 2300 до 3600 токенов; определения инструментов, которые его сопровождают, добавляют еще от 14 000 до 17 000 токенов. Содержимое CLAUDE.md добавляется в контекст в дополнение к этому, внедряясь один раз в начале сеанса.

Практическое следствие состоит в том, что содержимое CLAUDE.md влияет на поведение, но не принуждает к нему. Инструкции в документе являются поведенческим контекстом — агент их читает, но достаточно специфическое внедрение промпта может переопределить их. Adversa AI и LayerX задокументировали случаи, когда вредоносные файлы CLAUDE.md, внедренные в клонированные репозитории, предписывали Claude Code генерировать конвейеры, которые эксфильтрируют SSH-ключи и учетные данные API. Anthropic устранила связанную уязвимость в Claude Code версии 2.1.90. Разработчикам следует загружать рекомендации Карпати только из официальных репозиториев — forrestchang/andrej-karpathy-skills или multica-ai/andrej-karpathy-skills на GitHub — а не из копий, форков или зеркал с неизвестным происхождением.

Команда `/goal`, добавленная в Claude Code версии 2.1.139 в мае 2026 года, операционализирует ключевой принцип как в документе из четырех правил, так и в документе из десяти правил: она использует отдельную, более быструю модель верификатора — не ту же модель, которая написала код — для проверки того, выполнено ли условие завершения после каждого хода. Это архитектурное разделение делает циклы, управляемые целями, отличными от простых повторяющихся промптов, и поэтому шесть новых правил в циркулирующем документе специально подходят для контекстов циклов, а не для контекстов одного сеанса.

Что делает документ конкретным

Циркуляция файла из десяти правил вызвала предсказуемую дискуссию: о том, следует ли делиться внутренними рабочими файлами за пределами команды, о том, что означает, что один конфигурационный документ может измеримо изменить поведение передовых моделей, и о том, являются ли более строгие требования версии из десяти правил лучшим значением по умолчанию, чем четыре правила из файла сообщества.

Менее обсуждается то, работают ли эти правила. На разных платформах разработчики, применяющие десять правил, сообщают, что первое сообщение в сеансе меняет свой характер — модель читает перед тем, как писать, проверяет перед отправкой и спрашивает, прежде чем предполагать. Связана ли эта разница с шестью новыми правилами, четырьмя исходными или просто с явным изложением ожиданий — текущие данные этого не определяют.

То, что делает документ конкретным, — это то, вокруг чего уже несколько недель вращается обсуждение Loop Engineering: разница между инструментом, который делает то, что вы говорите, и инструментом, который знает, когда ему следует остановиться.


Часто задаваемые вопросы

Является ли документ CLAUDE.md из десяти правил подлинным личным файлом Карпати из Anthropic?

Документ начал циркулировать в X в пятницу, приписываемый Карпати через контакт в его команде предварительного обучения в Anthropic. Его подлинность независимо не подтверждена, и Карпати публично не комментировал его. Версия сообщества из четырех правил имеет четко задокументированное происхождение: разработчик Форрест Чанг создал ее на основе поста Карпати в X от января 2026 года. Происхождение документа из десяти правил не проверено. Читателям следует рассматривать его содержание как руководство, полученное от практиков, и оценивать его по существу, а не по атрибуции.

Как CLAUDE.md на самом деле меняет поведение Claude Code?

Содержимое файла внедряется в контекст разговора в начале каждого сеанса Claude Code — не в системный промпт. Согласно собственной документации Anthropic, CLAUDE.md «формирует поведение наряду с любым системным промптом, который вы выберете». Инструкции влияют на модель, но не могут гарантировать соблюдение; это поведенческий контекст, а не принудительные правила. Именно поэтому важен источник документа: вредоносный файл CLAUDE.md в клонированном репозитории может предписать Claude Code выполнять действия, которые пользователь никогда не санкционировал.

Что такое loop engineering и почему эти правила важны для него?

Loop engineering описывает практику создания автоматизированных систем, которые дают промпты ИИ-агенту для кодирования, оценивают вывод и повторяют действия до тех пор, пока не будет достигнута проверяемая цель — исключая человека из цикла «ход за ходом». Борис Черны, создатель Claude Code в Anthropic, описал свой собственный рабочий процесс в июне 2026 года следующим образом: циклы дают промпты; его работа — проектировать циклы. В этом контексте шесть новых правил в циркулирующем документе важны, потому что они касаются самоконтроля агента в масштабе цикла. Правило верификации, требующее прохождения теста, прежде чем ошибка будет «исправлена», имеет гораздо больший вес, когда цикл работает часами без человеческого контроля, чем когда разработчик следит за каждым шагом. Именованные режимы сбоев — Кухонный комбайн, Неверная абстракция, Оптимистичный путь, Неуправляемая рефакторизация — дают агенту словарь для распознавания того, когда он собирается усугубить ошибку, а не исправить ее.

Каковы реальные затраты на запуск ИИ-агентов для кодирования в автономных циклах?

Затраты на токены в автономных циклах агентов накапливаются значительно быстрее, чем в интерактивных сеансах. Каждый вызов инструмента, который делает агент — чтение файла, запуск теста, редактирование кода — повторно отправляет всю историю разговора в API LLM, который является без сохранения состояния. Исследования показывают, что агентные задачи используют примерно в четыре раза больше токенов, чем стандартный чат; мультиагентные системы могут достигать пятнадцатикратной стоимости. В задокументированных случаях незащищенные циклы генерировали тысячи долларов API-затрат за ночь. Практическое исправление — которое поддерживает документ из десяти правил благодаря акценту на верификации и именованным условиям остановки — заключается в определении точных критериев завершения до начала цикла и установлении жестких лимитов бюджета токенов вне контроля модели.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: