OpenAI отвечает Google моделью GPT-5.2 после объявления «красного кода».

gpt-5.2,openai,gemini 3,ии,искусственный интеллект,разработка ии

OpenAI представила GPT-5.2, передовую модель для разработчиков и профессионалов, улучшающую показатели в области рассуждений и программирования. Новинка конкурирует с Gemini 3 от Google, сталкиваясь с проблемами вычислительных затрат и отсутствием генератора изображений.

GPT-5.2 от OpenAI выходит для платных пользователей ChatGPT и разработчиков через API в трех вариантах: Instant, оптимизированная по скорости модель для рутинных запросов, таких как поиск информации, написание текстов и перевод; Thinking, которая превосходно справляется со сложными структурированными задачами, такими как написание кода, анализ длинных документов, математика и планирование; и Pro, топовая модель, нацеленная на максимальную точность и надежность при решении сложных проблем.

«Мы разработали 5.2, чтобы раскрыть еще большую экономическую ценность для людей», — заявила Фиджи Симо, директор по продуктам OpenAI, в четверг во время брифинга для журналистов. «Она лучше создает электронные таблицы, строит презентации, пишет код, воспринимает изображения, понимает длинный контекст, использует инструменты, а затем связывает сложные многошаговые проекты».

GPT-5.2 выходит на фоне гонки вооружений с Gemini 3 от Google, которая лидирует в рейтинге LMArena по большинству тестов (за исключением программирования — здесь Anthropic’s Claude Opus-4.5 по-прежнему удерживает первенство).

В начале этого месяца The Information сообщило, что генеральный директор Сэм Альтман разослал сотрудникам внутреннюю служебную записку «code red» на фоне снижения трафика ChatGPT и опасений, что компания теряет долю на потребительском рынке в пользу Google. «Code red» призывал к изменению приоритетов, включая отказ от таких обязательств, как запуск рекламы, и сосредоточение на создании лучшего пользовательского опыта ChatGPT.

GPT-5.2 — это попытка OpenAI вернуть лидерство, даже несмотря на то, что некоторые сотрудники сообщили, что просили отложить выпуск модели, чтобы у компании было больше времени на ее улучшение. И, несмотря на намеки на то, что OpenAI сосредоточится на потребительских сценариях использования, добавив больше персонализации и кастомизации в ChatGPT, выпуск GPT-5.2 выглядит как усиление позиций на корпоративном рынке.

Компания нацелена в первую очередь на разработчиков и экосистему инструментов, стремясь стать стандартной платформой для создания приложений на базе ИИ. Ранее на этой неделе OpenAI опубликовала новые данные, показывающие, что использование корпоративных инструментов ИИ компанией резко возросло за последний год.

Это происходит на фоне того, как Gemini 3 тесно интегрирован в экосистему продуктов и облачных сервисов Google для мультимодальных и агентских рабочих процессов. На этой неделе Google запустила управляемые серверы MCP, которые упрощают подключение сервисов Google и Cloud, таких как Maps и BigQuery, для агентов. (MCP — это соединители между системами ИИ и данными/инструментами).

OpenAI утверждает, что GPT-5.2 устанавливает новые рекорды в области программирования, математики, науки, визуализации, обработки длинного контекста и использования инструментов, что, по заявлению компании, может привести к «более надежным агентским рабочим процессам, производственному коду и сложным системам, работающим в больших контекстах и с реальными данными».

Эти возможности ставят ее в прямую конкуренцию с режимом Deep Think от Gemini 3, который позиционируется как значительный прорыв в области рассуждений, нацеленный на математику, логику и науку. На собственной диаграмме тестов OpenAI модель GPT-5.2 Thinking превосходит Gemini 3 и Claude Opus 4.5 от Anthropic почти во всех перечисленных тестах на рассуждение, от реальных задач программной инженерии (SWE-Bench Pro) и научных знаний на уровне докторантуры (GPQA Diamond) до абстрактного мышления и обнаружения закономерностей (наборы тестов ARC-AGI).

Руководитель отдела исследований Адайн Кларк заявил, что более высокие оценки по математике — это не просто решение уравнений. Математическое мышление, пояснил он, является показателем того, может ли модель следовать многошаговой логике, поддерживать согласованность чисел во времени и избегать тонких ошибок, которые могут накапливаться со временем.

«Все это свойства, которые действительно важны для широкого спектра различных рабочих нагрузок», — сказал Кларк. «Таких как финансовое моделирование, прогнозирование, анализ данных».

На брифинге руководитель отдела продуктов OpenAI Макс Шварцер заявил, что GPT-5.2 «вносит существенные улучшения в генерацию и отладку кода» и может пошагово разбирать сложную математику и логику. По его словам, стартапы в области программирования, такие как Windsurf и CharlieCode, сообщают о «передовых результатах в области агентского программирования» и измеримых успехах в сложных многошаговых рабочих процессах.

Помимо программирования, Шварцер отметил, что ответы GPT-5.2 Thinking содержат на 38% меньше ошибок, чем у предшественника, что делает модель более надежной для повседневного принятия решений, исследований и написания текстов.

GPT-5.2 выглядит скорее как консолидация последних двух обновлений OpenAI, чем как полное переосмысление. GPT-5, выпущенный в августе, стал перезапуском, заложившим основу для унифицированной системы с маршрутизатором, который переключает модель между быстрой стандартной моделью и более глубоким режимом «Thinking». Ноябрьский GPT-5.1 был сосредоточен на том, чтобы сделать эту систему более «теплой», разговорной и лучше подходящей для агентских задач и программирования. Последняя модель, GPT-5.2, похоже, усиливает все эти усовершенствования, делая ее более надежной основой для производственного использования.

Для OpenAI ставки никогда не были так высоки. Компания взяла на себя обязательства по созданию инфраструктуры ИИ на сумму 1,4 триллиона долларов в течение следующих нескольких лет для поддержки своего роста — обязательства, которые она взяла, когда еще имела преимущество первопроходца среди компаний, занимающихся ИИ. Но теперь, когда Google, отстававшая вначале, выходит вперед, эта ставка может быть причиной «code red» Альтмана.

Возобновленное внимание OpenAI к моделям рассуждения также является рискованным шагом. Системы, лежащие в основе ее режимов Thinking и Deep Research, дороже в эксплуатации, чем стандартные чат-боты, поскольку они потребляют больше вычислительных ресурсов. Удваивая ставку на такие модели с GPT-5.2, OpenAI может попасть в порочный круг: тратить больше на вычисления, чтобы выиграть в рейтинге, а затем тратить еще больше, чтобы поддерживать работу этих дорогостоящих моделей в масштабе.

По имеющимся данным, OpenAI уже тратит на вычислительные мощности больше, чем сообщала ранее. Как недавно сообщил TechCrunch, большая часть расходов OpenAI на инференс — деньги, которые компания тратит на вычислительные мощности для запуска обученной модели ИИ — оплачивается наличными, а не облачными кредитами, что указывает на то, что затраты на вычислительные мощности компании выросли за пределы того, что могут субсидировать партнерства и кредиты.

Несмотря на все внимание к рассуждениям, одной из отсутствующих функций сегодняшнего запуска является новый генератор изображений. Альтман, как сообщается, заявил в своей служебной записке «code red», что генерация изображений будет приоритетом в будущем, особенно после того, как Nano Banana от Google (кодовое название модели Gemini 2.5 Flash Image от Google) стала вирусной после своего выпуска в августе.

В прошлом месяце Google выпустила Nano Banana Pro (также известную как Gemini 3 Pro Image), обновленную версию с еще лучшим рендерингом текста, знанием мира и жутковатым, реалистичным, неотредактированным ощущением от своих фотографий. Она также лучше интегрируется в продукты Google, что продемонстрировало на прошлой неделе, когда она появилась в таких инструментах и рабочих процессах, как Google Labs Mixboard для автоматической генерации презентаций.

По сообщениям, OpenAI планирует выпустить еще одну новую модель в январе с улучшенными изображениями, повышенной скоростью и лучшей «личностью», хотя компания не подтвердила эти планы в четверг.

OpenAI также заявила в четверг, что внедряет новые меры безопасности, касающиеся использования в области психического здоровья и проверки возраста для подростков, но не уделила много времени на презентации этих изменений.