Anthropic дает Claude Code больше свободы, но держит его на коротком поводке

Anthropic ии Claude Code автоматизация безопасность techcrunch.com

Новый автоматический режим Anthropic для Claude Code позволяет ИИ выполнять задачи с меньшим количеством одобрений, отражая более широкий сдвиг в сторону более автономных инструментов, которые балансируют скорость и безопасность с помощью встроенных защитных механизмов. — techcrunch.com

Этот шаг отражает более широкий сдвиг в отрасли, поскольку инструменты на базе ИИ все чаще разрабатываются для работы без ожидания одобрения человека. Задача состоит в том, чтобы найти баланс между скоростью и контролем: слишком много ограничений замедляет работу, в то время как их недостаток может сделать системы рискованными и непредсказуемыми. Новый «автоматический режим» от Anthropic, который сейчас находится в стадии предварительного исследования (то есть доступен для тестирования, но еще не является готовым продуктом), — это последняя попытка компании найти эту золотую середину. 

Автоматический режим использует средства защиты ИИ для проверки каждого действия перед его выполнением, отслеживая рискованное поведение, которое не запрашивал пользователь, и признаки внедрения промптов (prompt injection) — типа атаки, при которой вредоносные инструкции скрываются в контенте, обрабатываемом ИИ, заставляя его совершать непреднамеренные действия. Все безопасные действия будут выполняться автоматически, а рискованные — блокироваться.

По сути, это расширение существующей команды Claude Code «dangerously-skip-permissions», которая передает все принятие решений на усмотрение ИИ, но с добавлением уровня безопасности поверх.

Эта функция опирается на волну автономных инструментов для кодирования от таких компаний, как GitHub и OpenAI, которые могут выполнять задачи от имени разработчика. Но она идет на шаг дальше, передавая принятие решения о том, когда запрашивать разрешение, от пользователя самому ИИ. 

Anthropic не раскрыла конкретных критериев, которые использует ее уровень безопасности для различения безопасных и рискованных действий, — это то, что разработчики, вероятно, захотят понять лучше, прежде чем широко внедрять эту функцию. (TechCrunch обратился в компанию за дополнительной информацией по этому вопросу.)

Автоматический режим выходит вслед за запуском Anthropic инструмента Claude Code Review, предназначенного для автоматической проверки кода и выявления ошибок до их попадания в кодовую базу, а также Dispatch for Cowork, который позволяет пользователям отправлять задачи агентам ИИ для выполнения работы от их имени.  

Автоматический режим будет развернут для корпоративных пользователей и пользователей API в ближайшие дни. Компания заявляет, что в настоящее время он работает только с Claude Sonnet 4.6 и Opus 4.6, и рекомендует использовать новую функцию в «изолированных средах» — песочницах, отделенных от производственных систем, что ограничивает потенциальный ущерб в случае возникновения проблем.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: