Новая модель под названием GPT Image 1.5 доступна с сегодняшнего дня всем пользователям ChatGPT, а также через API. Это очередная ступень в эскалации соперничества с Gemini от Google после того, как в прошлом месяце генеральный директор OpenAI Сэм Альтман объявил «красный код» во внутреннем служебном письме. В документе подробно излагались планы OpenAI по восстановлению своего лидерства в области ИИ после того, как Google начал отвоевывать долю рынка после выпуска Gemini 3, своей последней флагманской модели, и Nano Banana Pro, новейшей версии вирусного генератора изображений Google — обе модели заняли верхние строчки рейтинга LMArena по множеству тестов.
Google сохраняет свое лидерство даже после того, как на прошлой неделе OpenAI отреагировала на его успех выпуском GPT-5.2, представив его как свою самую передовую модель для разработчиков и повседневного профессионального использования. По сообщениям, OpenAI планировала выпустить новый генератор изображений в начале января, но ускорила эти планы объявлением на этой неделе. Последний выпуск модели изображений — GPT Image 1 — состоялся в апреле.
GPT Image 1.5 выходит на рынок в то время, когда генераторы изображений и видео выходят за рамки прототипов и приобретают все больше производственных возможностей. Подобно Nano Banana Pro, ChatGPT Image предлагает функции постобработки, обеспечивая более детальный контроль над редактированием для поддержания визуальной согласованности, такой как сходство черт лица, освещение, композиция и цветовой тон при внесении изменений.

Большинство инструментов для генерации изображений на базе ИИ плохо справляются с итеративным процессом, поэтому это стало бы огромным шагом вперед. При запросе конкретного изменения, например, «скорректировать выражение лица» или «сделать освещение более холодным», модели часто переосмысливают все изображение, что приводит к отсутствию согласованности.
Обновление касается не только новых функций. Изображения ChatGPT теперь будут доступны через специальный вход в боковой панели ChatGPT, который работает «больше как творческая студия», написала Фиджи Симо, генеральный директор по приложениям OpenAI, во вторник в своем блоге.
«Новые экраны просмотра и редактирования изображений упрощают создание изображений, соответствующих вашему видению, или получение вдохновения от популярных запросов и предустановленных фильтров», — написала Симо.
Помимо нового генератора изображений, OpenAI внедряет новые способы улучшения взаимодействия с ChatGPT с помощью большего количества визуальных элементов. План состоит в том, чтобы поисковые запросы отображали больше визуальных материалов с четкими источниками, что может быть полезно для таких задач, как преобразование единиц измерения или проверка спортивных результатов, согласно Симо.
«Когда вы создаете, вы должны иметь возможность видеть и формировать то, что вы создаете. Когда визуальные образы рассказывают историю лучше, чем слова, ChatGPT должен их включать», — написала Симо. «Когда вам нужен быстрый ответ или следующий шаг находится в другом инструменте, он должен быть прямо здесь. Делая это, мы можем продолжать сокращать разрыв между тем, что у вас в голове, и вашей способностью воплотить это в жизнь».
Автор – Rebecca Bellan




