«Являются ли циклы следующим хайпом, — спросил задавший вопрос, — или это нечто реальное?»
Ответ Черни был решительным: «Да, это реально», — сказал он.
«Два года назад мы писали исходный код вручную. Мы начали переходить к тому, что код пишут агенты. А теперь мы переходим к тому, что агенты дают указания другим агентам, которые затем пишут код», — продолжил он. «Насколько большим был скачок от исходного кода к агентам, настолько же важны и велики циклы».
Позже в своем выступлении (примерно на отметке 32:00 в видео на YouTube, размещенном выше) Черни более подробно рассказал о циклах, которые он постоянно запускает в своей работе. Один агент непрерывно ищет способы улучшения архитектуры кода, в то время как другой ищет дублирующиеся абстракции, которые можно унифицировать. Они отправляют pull request, как и любые другие кодеры, и поскольку код постоянно меняется, они никогда не прекращают работу.
Это мощная идея, особенно с учетом того, что за ней стоит такая значимая фигура, как Черни. При переходе к агентному ИИ основное внимание большинства пользователей было сосредоточено на максимально эффективном управлении своими агентами: постановке четких целей, проверке дискретных единиц прогресса и недопущении их слишком сильного отклонения от промпта. Циклы выводят это на новый уровень, разрешая рою агентов работать непрерывно в фоновом режиме, бесконечно. Это большое доверие к ИИ, но по мере быстрого совершенствования моделей это может стать следующим шагом в деле поручения ИИ выполнения реальной работы.
Первое, что нужно понять, это то, что это не является чем-то совершенно новым. Рекурсивные циклы — функции, вызывающие сами себя для повторения действия при наличии условия остановки, — являются основой вводных курсов по информатике. Эти циклы следуют недетерминированной логике — то есть, именно суб-агент решает, когда остановить цикл, а не четкое условие, — но используется тот же базовый подход. Как только программисты начали использовать ИИ для выполнения задач, какая-либо версия рекурсивного цикла с ИИ, контролирующим ИИ, была неизбежна.
В отличие от классических вычислений, агентные циклы могут быть до боли простыми. Один из самых популярных приемов — цикл Ральфа (названный в честь Ральфа Виггума), который, по сути, суммирует всю проделанную моделью работу и спрашивает, достигнута ли цель. Это способ справиться с потерей ориентации моделей ИИ при слишком длительной работе — по сути, модель «отскакивает» туда-сюда, пока задача не будет выполнена.
Другой способ взглянуть на циклы — это часть общего стремления к увеличению вычислительных ресурсов во время тестирования. Как заметил исследователь OpenAI Ноам Браун ранее в этом месяце, современные модели могут решить практически любую проблему, если направить на нее достаточно вычислительных ресурсов. Это означает, что один из способов гарантировать решение проблемы — просто продолжать направлять на нее вычисления, пока она не будет завершена. Это особенно верно для задач типа «восхождения на холм», таких как улучшение кодовой базы, где модель может продолжать вносить инкрементальные улучшения до достижения заданного порога. Или, как в примере Черни, она может просто продолжать вносить инкрементальные улучшения, пока есть вычислительные ресурсы для этого.
Если это звучит дорого, то так оно и есть. Как и агентный ИИ до него, циклы ИИ сжигают токены намного быстрее, чем простые чат-боты для Q&A, — и поскольку цель состоит в том, чтобы цикл работал постоянно, нет потолка тому, сколько можно потратить. Это нормально для Anthropic, которая в конечном итоге занимается продажей токенов, но для всех остальных это может оказаться дорогостоящим способом работы.
Тем не менее, в зависимости от задачи, которую пытается решить агентный цикл, и правильной настройки, позволяющей контролировать расход токенов, дрейф и другие классические проблемы ИИ, выгоды могут быть настолько ошеломляющими, что перевесят затраты.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Russell Brandom




