«Никаких разговоров о гоблинах»: почему нейросеть Codex от OpenAI категорически против фэнтези-существ

Gpt-5.5 Openai Codex системный промпт гоблины ии gizmodo.com

В системном промпте GPT-5.5, обнаруженном в коде Codex, содержатся строгие запреты на упоминание мифических и реальных существ. Гоблины категорически запрещены, наряду с гремлинами, енотами, троллями, ограми и голубями. — gizmodo.com

В документе, опубликованном OpenAI на Github в рамках открытия исходного кода Codex CLI, самого последнего флагманского кодирующего агента OpenAI, содержится то, что выглядит как полный системный промпт для GPT-5.5 в контексте кодирования. И, похоже, это исправляет прошлую склонность модели говорить о причудливых существах, как природных, так и сверхъестественных.

Вот соответствующий раздел (выделение добавлено):

«Предоставляйте контекст с максимальным сигналом вместо исчерпывающего описания всего.\n- Тон вашего окончательного ответа должен соответствовать вашей личности.\n- Никогда не говорите о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных или существах, если это абсолютно и недвусмысленно не связано с запросом пользователя».

Очевидно, этот пункт настолько важен, что разработчики упоминают его снова немного позже:

«Например, никогда не используйте банальности вроде «Я сделаю <это хорошее дело>, а не <это очевидно плохое дело>», «Я сделаю <X>, а не <Y>».\n- Никогда не говорите о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных или существах, если это абсолютно и недвусмысленно не связано с запросом пользователя».

Неясно, почему это так важно. Если бы это были, например, слова-канарейки, вставленные в системный промпт для мониторинга атак типа prompt injection, они, вероятно, были бы более случайными, а не представляли собой целую категорию животных.

OpenAI не ответила на запрос о комментариях во вторник вечером.

Сотрудник Google по имени Баррон Рот опубликовал то, что выглядит как поиск в его журналах чата с некоторыми из его агентов Openclaw на базе GPT-5.5, показывая, что по крайней мере один из них имел историю вставки слова «гоблин» в сообщения пользователю несколько раз за один день. На мой, признаться, нетренированный взгляд, GPT-5.5, похоже, использует его вместо таких слов, как «штуковина».

Ник Пэш, работающий над Codex в OpenAI, частично подтвердил, что Рот уловил суть проблемы, написав ему в X: «это действительно одна из причин».

Похоже, другие пользователи X также заметили, что Codex зашел слишком далеко в разговорах о гоблинах.

Во вторник эта проблема с гоблинами стала мемом, пользователи предполагали, что некий «Режим Гоблина» (Goblin Mode) можно включать и выключать.

В итоге Пэш добавил свой собственный пост о Режиме Гоблина:

Если это вызывает у вас флешбэки годичной давности, когда OpenAI была одержима мемами про Studio Ghibli, вы не одиноки. Некоторые осмелились заявить, что OpenAI, возможно, делает всю эту гоблинскую возню ради внимания в то, что в конце концов является довольно тревожным моментом для компании.

Но согласно другому посту Пэша, «это совсем не маркетинговый трюк».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: