Как OpenAI с помощью GPT-5 Codex совершенствует аппаратную часть самого инструмента ИИ

codex,openai,ии-агент,разработка по,программирование,искусственный интеллект

“Подавляющее большинство Codex создано самим Codex”, — заявили в OpenAI о своем новом ИИ-агенте для написания кода. Компания активно использует собственный инструмент для его совершенствования, демонстрируя новый уровень саморазвития ИИ.

На этой неделе в интервью Ars Technica сотрудники OpenAI раскрыли, в какой степени компания теперь полагается на свой собственный ИИ-агент для написания кода, Codex, для создания и улучшения инструмента разработки. «Я думаю, что подавляющее большинство Codex создано самим Codex, так что он почти полностью используется для самосовершенствования», — сказал Александр Эмбирикос, руководитель продукта Codex в OpenAI, во вторник. Codex, который OpenAI запустила в своем современном воплощении в качестве предварительного просмотра для исследований в мае 2025 года, действует как облачный агент программной инженерии, способный выполнять такие задачи, как написание функций, исправление ошибок и предложение запросов на слияние. Инструмент работает в изолированных средах, связанных с репозиторием кода пользователя, и может выполнять несколько задач параллельно. OpenAI предлагает Codex через веб-интерфейс ChatGPT, интерфейс командной строки (CLI) и расширения IDE для VS Code, Cursor и Windsurf.

Само название «Codex» восходит к модели OpenAI 2021 года на базе GPT-3, которая обеспечивала функцию автодополнения в GitHub Copilot. Эмбирикос сказал, что среди сотрудников ходят слухи, что название является сокращением от «code execution» (выполнение кода). OpenAI хотела связать нового агента с тем ранним моментом, который был частично создан некоторыми людьми, покинувшими компанию. «Для многих людей эта модель, лежащая в основе GitHub Copilot, стала первым моментом «вау» для ИИ», — сказал Эмбирикос. «Она показала людям потенциал того, что может означать, когда ИИ способен понимать ваш контекст и то, что вы пытаетесь сделать, и ускорять вас в этом».

Не секрет, что текущая версия Codex для командной строки имеет некоторое сходство с Claude Code, агентским инструментом для написания кода от Anthropic, который был запущен в феврале 2025 года. На вопрос, повлиял ли Claude Code на дизайн Codex, Эмбирикос уклонился от ответа, но признал конкурентную динамику. «Это интересный рынок для работы, потому что там циркулирует множество отличных идей», — сказал он. Он отметил, что OpenAI разрабатывала веб-функции Codex внутри компании до выпуска версии CLI, которая появилась после инструмента Anthropic.

Клиенты OpenAI, похоже, любят версию для командной строки. Эмбирикос сказал, что использование Codex внешними разработчиками подскочило в 20 раз после того, как OpenAI выпустила интерактивное расширение CLI вместе с GPT-5 в августе 2025 года. 15 сентября OpenAI выпустила GPT-5 Codex, специализированную версию GPT-5, оптимизированную для агентного кодирования, что еще больше ускорило внедрение.

Инструмент приняли не только во внешнем мире. Эмбирикос сказал, что подавляющее большинство инженеров OpenAI теперь регулярно используют Codex. Компания использует ту же версию CLI с открытым исходным кодом, которую внешние разработчики могут свободно загружать, предлагать дополнения и модифицировать самостоятельно. «Мне очень нравится это в нашей команде», — сказал Эмбирикос. «Версия Codex, которую мы используем, — это буквально репозиторий с открытым исходным кодом. У нас нет другого репозитория, куда бы поступали новые функции».

Рекурсивный характер разработки Codex выходит за рамки простого генерации кода. Эмбирикос описал сценарии, когда Codex отслеживает собственные циклы обучения и обрабатывает отзывы пользователей, чтобы «решить», что создавать дальше. «У нас есть места, где мы просим Codex изучить отзывы, а затем решить, что делать», — сказал он. «Codex пишет большую часть исследовательского инструментария для собственных циклов обучения, и мы экспериментируем с тем, чтобы Codex отслеживал свои собственные циклы обучения». Сотрудники OpenAI также могут подать заявку в Codex через инструменты управления проектами, такие как Linear, назначая ему задачи так же, как они назначали бы работу человеку-коллеге.

Этот вид рекурсивного цикла, использования инструментов для создания лучших инструментов, имеет глубокие корни в истории вычислений. Инженеры проектировали первые интегральные схемы вручную на кальке и бумаге в 1960-х годах, а затем изготавливали физические чипы по этим чертежам. Эти чипы питались компьютерами, на которых работало первое программное обеспечение для автоматизации проектирования электроники (EDA), что, в свою очередь, позволяло инженерам проектировать схемы, слишком сложные для ручного черчения человеком. Современные процессоры содержат миллиарды транзисторов, расположенных в схемах, которые существуют только потому, что их создало программное обеспечение. Использование OpenAI Codex для создания Codex, похоже, следует той же схеме: каждое поколение инструмента создает возможности, которые питают следующее.

Но описание того, что на самом деле делает Codex, представляет собой своего рода лингвистическую проблему. В Ars Technica мы стараемся максимально снизить антропоморфизм при обсуждении моделей ИИ, одновременно описывая, что делают эти системы, используя аналогии, понятные широкой аудитории. Люди могут общаться с Codex как с человеком, поэтому естественно использовать человеческие термины для описания взаимодействия с ним, даже несмотря на то, что он не является человеком и имитирует человеческую личность посредством статистического моделирования.

Система автономно запускает множество процессов, обрабатывает отзывы, создает и управляет дочерними процессами, а также генерирует код, который используется в реальных продуктах. Сотрудники OpenAI называют его «коллегой» и назначают ему задачи через те же инструменты, которые они используют для людей-коллег. Конструктивно ли задачи, которые выполняет Codex, «решениями» или сложной условной логикой, пропущенной через нейронную сеть, зависит от определений, которые до сих пор обсуждают ученые-компьютерщики и философы. Мы можем сказать, что существует полуавтономный цикл обратной связи: Codex генерирует код под руководством человека, этот код становится частью Codex, и следующая версия Codex генерирует другой код в результате.

Согласно нашим интервью, наиболее драматичным примером внутреннего влияния Codex стало создание OpenAI приложения Sora для Android. По словам Эмбирикоса, инструмент разработки позволил компании создать приложение в рекордно короткие сроки. «Приложение Sora для Android было выпущено четырьмя инженерами с нуля», — сказал Эмбирикос Ars. «На его создание ушло 18 дней, а затем мы выпустили его в магазин приложений за 28 дней», — сказал он. У инженеров уже были готовые приложения для iOS и серверные компоненты, поэтому они сосредоточились на создании клиента для Android. Они использовали Codex для помощи в планировании архитектуры, генерации подпланов для различных компонентов и реализации этих компонентов.

Эд Бейес, дизайнер команды Codex, описал, как инструмент изменил его собственный рабочий процесс. Бейес сказал, что Codex теперь интегрируется с инструментами управления проектами, такими как Linear, и платформами связи, такими как Slack, позволяя членам команды напрямую назначать задачи по написанию кода ИИ-агенту. «Вы можете добавить Codex, и вы можете назначать ему задачи», — сказал Бейес Ars. «Codex — это буквально коллега в вашем рабочем пространстве». Эта интеграция означает, что когда кто-то публикует отзыв в канале Slack, он может пометить Codex и попросить его исправить проблему. Агент создаст запрос на слияние, а члены команды смогут просмотреть и доработать изменения в той же ветке. «Он фактически имитирует такого коллегу и появляется везде, где вы работаете», — сказал Бейес. Для Бейеса, который занимается визуальным дизайном и паттернами взаимодействия для интерфейсов Codex, инструмент позволил ему напрямую вносить вклад в код, а не передавать спецификации инженерам. «Это дает вам больше возможностей. Это позволяет вам работать над всем стеком и, по сути, делать больше вещей», — сказал он. Он отметил, что дизайнеры в OpenAI теперь создают прототипы функций, создавая их напрямую, используя Codex для обработки деталей реализации.

Подход OpenAI рассматривает Codex как «младшего разработчика», по словам Бейеса, который, как надеется компания, со временем вырастет до старшего разработчика. «Если бы вы принимали на работу младшего разработчика, как бы вы его приняли? Вы даете ему учетную запись Slack, вы даете ему учетную запись Linear», — сказал Бейес. «Это не просто инструмент, к которому вы обращаетесь в терминале, а нечто, что приходит к вам и находится в вашей команде».

Учитывая такой подход к командной работе, останется ли что-то для людей? На вопрос об этом Эмбирикос провел различие между «вибовым кодированием» (vibe coding), когда разработчики принимают сгенерированный ИИ код без тщательной проверки, и тем, что исследователь ИИ Саймон Уиллсон называет «вибовым инжинирингом» (vibe engineering), когда люди остаются вовлеченными. «Мы видим гораздо больше вибового инжиниринга в нашей кодовой базе», — сказал он. «Вы просите Codex поработать над этим, возможно, сначала попросите план. Обменивайтесь мнениями, дорабатывайте план, и тогда вы будете взаимодействовать с моделью и тщательно проверять ее код». Он добавил, что вибовое кодирование по-прежнему имеет свое место для прототипов и временных инструментов. «Я думаю, вибовое кодирование — это здорово», — сказал он. «Теперь у вас есть свобода как у человека решать, сколько внимания вы хотите уделить коду».

За последний год «монолитные» большие языковые модели (LLM), такие как GPT-4.5, по-видимому, стали своего рода тупиком с точки зрения прогресса в пограничных бенчмарках, поскольку ИИ-компании переходят к моделям имитации рассуждений, а также к агентным системам, построенным из нескольких параллельно работающих ИИ-моделей. Мы спросили Эмбирикоса, представляют ли такие агенты, как Codex, лучший путь вперед для извлечения пользы из существующей технологии LLM. Он отверг опасения, что возможности ИИ достигли плато. «Я думаю, мы очень далеки от плато», — сказал он. «Если посмотреть на скорость работы исследовательской команды здесь, мы выпускаем модели почти каждую неделю или раз в две недели». Он указал на недавние улучшения, когда GPT-5-Codex, по сообщениям, выполняет задачи на 30% быстрее своего предшественника при том же уровне интеллекта. Во время тестирования компания наблюдала, как модель самостоятельно работает над сложными задачами в течение 24 часов.

OpenAI сталкивается с конкуренцией с разных сторон на рынке ИИ-кодирования. Claude Code от Anthropic и Gemini CLI от Google предлагают аналогичный опыт агентного кодирования на основе терминала. На этой неделе Mistral AI выпустила Devstral 2 вместе с инструментом CLI под названием Mistral Vibe. Тем временем стартапы, такие как Cursor, создали специализированные IDE для ИИ-кодирования, сообщив о годовом доходе в размере 300 миллионов долларов.

Учитывая известные проблемы с конфабуляцией в моделях ИИ, когда люди пытаются использовать их в качестве фактических ресурсов, может ли кодирование стать «killer app» для LLM? Нас интересовало, заметила ли OpenAI, что кодирование является явным бизнес-сценарием для современных моделей ИИ с меньшими рисками, чем, скажем, использование языковых моделей ИИ для письма или в качестве эмоциональных компаньонов. «Мы абсолютно заметили, что кодирование — это область, где агенты будут развиваться очень быстро, и существует большая экономическая ценность», — сказал Эмбирикос. «Мы считаем, что сосредоточение на Codex соответствует нашей миссии. Мы можем предоставить большую ценность разработчикам. Кроме того, разработчики создают вещи для других людей, поэтому мы, по сути, масштабируемся через них».

Но не угрожают ли такие инструменты, как Codex, рабочим местам разработчиков программного обеспечения? Бейес признал опасения, но сказал, что Codex не сократил штат в OpenAI, и «всегда есть человек, который может прочитать код». Аналогично, оба мужчины не прогнозируют будущего, в котором Codex будет работать самостоятельно без какой-либо формы человеческого надзора. Они считают, что инструмент усиливает человеческий потенциал, а не заменяет его.

Практическое применение таких агентов, как Codex, выходит за пределы стен OpenAI. Эмбирикос сказал, что долгосрочное видение компании заключается в том, чтобы сделать агентов кодирования полезными для людей, не имеющих опыта программирования. «Вся человеческая раса не откроет IDE и даже не узнает, что такое терминал», — сказал он. «Мы сейчас создаем агента для кодирования, предназначенного только для инженеров-программистов, но мы думаем о том, что мы строим, как о чем-то, что будет полезно как более общий агент».