В начале 2025 года OpenAI представила для ChatGPT крупное обновление генерации изображений с новой моделью, которая быстро стала вирусной. Модель оказалась большим успехом для компании и, по сообщениям, помогла привлечь миллионы новых пользователей в ChatGPT.
Позже, в апреле 2025 года, OpenAI предоставила эту же технологию генерации изображений разработчикам через API gpt-image-1. Затем, в декабре 2025 года, компания выпустила gpt-image-1.5, которая внесла значительные улучшения по сравнению с предыдущей версией.
С другой стороны, Google с сентября прошлого года выпускает серию моделей генерации изображений Gemini Nano Banana. Ранее в этом году компания анонсировала Nano Banana 2, также известную как Gemini 3.1 Flash Image, — передовую модель изображений, которая обеспечивает качество изображений уровня Nano Banana Pro со значительными улучшениями.
Чтобы составить конкуренцию Gemini Nano Banana 2, сегодня OpenAI представила ChatGPT Images 2. Во время прямой трансляции генеральный директор OpenAI Сэм Альтман и другие продемонстрировали возможности новой модели. OpenAI заявила, что ChatGPT Images 2 значительно лучше генерирует изображения, содержащие текст. Например, пользователи теперь могут создавать изображения окна рабочего стола macOS или интерфейса чата с гораздо более точным отображением текста по всему изображению.
OpenAI сообщила, что Images 2.0 может генерировать изображения, более точно следуя инструкциям, сохраняя запрошенные детали и точно отображая тонкие элементы, такие как мелкий текст, иконографию, компоненты пользовательского интерфейса (UI), плотные композиции и тонкие стилистические ограничения. Новая модель также может создавать изображения с разрешением до 2K в диапазоне соотношений сторон, от широких 3:1 до высоких 1:3.
Будет две версии модели Images 2.0:
- ChatGPT Images 2.0 instant
- ChatGPT Images 2.0 thinking
При выборе модели thinking или Pro в ChatGPT, Images 2.0 может обращаться к сети для получения информации в реальном времени, связанной с запросом, а затем генерировать более точные изображения. Она также может создавать несколько различных изображений по одному запросу и самостоятельно проверять свои результаты.
Наконец, Images 2.0 обладает более сильным мультиязычным пониманием и теперь намного лучше отображает нелатинские тексты, включая японский, корейский, китайский, хинди и бенгальский.
Модель gpt-image-2 доступна через API для разработчиков по следующим ценам:
- $8.00 за ввод
- $2.00 за кэшированный ввод
- $30.00 за вывод
Модель ChatGPT Images 2.0 instant теперь доступна всем пользователям ChatGPT и Codex, в то время как модель ChatGPT Images 2.0 thinking зарезервирована для пользователей ChatGPT Plus, Pro и Business.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Pradeep Viswanathan




