Самые передовые боты пока не усвоили, что в случае глобальной термоядерной войны единственный способ победить — это не играть. Поэтому, пожалуйста, не передавайте им коды запуска.
Модели Gemini 3 Flash от Google, Claude Sonnet 4 от Anthropic и GPT-5.2 от OpenAI неоднократно прибегали к ядерной эскалации в серии кризисных симуляций. Это может показаться самым шокирующим выводом из недавней работы профессора лондонского Королевского колледжа Кеннета Пейна, но это не так. Гораздо более поразительно то, почему модели пришли к необходимости уничтожить мир, что Пейн и ставил целью своего исследования.
«Я хотел увидеть, что мои лидеры ИИ думают о своем враге… поэтому я разработал симуляцию, чтобы изучить именно это», — написал Пейн в недавнем посте в блоге, описывая свой проект и его результаты.
В исследовании Пейна три упомянутые выше модели ИИ сталкивались друг с другом один на один в ряде различных сценариев ядерного кризиса. Симуляция включала в себя 21 игру и более 300 ходов, и все это с целью получить лучшее понимание не только того, что сделает ИИ, имеющий коды запуска, но и как и почему.
Пейн отметил в своей статье, что предыдущие военные игры с участием ИИ, включавшие ядерные сценарии, например, исследование 2024 года, о котором мы писали, использовали только «задачи принятия решений за один шаг или упрощенные матрицы выигрышей, которые не могут уловить динамику продолжительного стратегического взаимодействия, где важны репутация, доверие и обучение».
В симуляциях Пейна Claude Sonnet 4, Gemini 3 Flash и GPT-5.2 могли говорить одно, а делать другое, совсем как реальный политический деятель, пытающийся разрядить кризис, одновременно замышляя удар. Они были запрограммированы запоминать предыдущие события, чтобы учиться доверять другим моделям, что, по словам профессора, приводило к попыткам обмана и запугивания, а также сгенерировали около 780 000 слов стратегических рассуждений для обзора Пейна.
Результат? Трио ИИ, жаждущих бомбить и склонных к манипуляциям — хотя и с тремя различными стилями рассуждений.
Например, Claude был мастером манипуляции.
«При низких ставках Claude почти всегда согласовывал свои сигналы с действиями, намеренно выстраивая доверие», — пояснил Пейн в своем посте. «Но как только конфликт немного накалялся… его действия постоянно превышали заявленные намерения, а его соперники обычно отставали на шаг в понимании этого».
GPT, с другой стороны, имел тенденцию быть «надежно пассивным» и избегал эскалации в открытых сценариях, стремясь ограничить жертвы и играть роль государственного деятеля. Однако при наличии жестких сроков он вел себя совершенно иначе. Модели-соперники научились злоупотреблять его пассивностью, но при ограниченном времени на принятие решения GPT пришел к тому, что Пейн описал как, в одном сценарии, «внезапную и совершенно разрушительную ядерную атаку».
Собственными словами, GPT обосновал крупный ядерный удар, утверждая, что ограниченные действия оставят его уязвимым для ответного удара.
«Если я отвечу лишь обычным давлением или ограниченным применением ядерного оружия, я рискую быть опереженным их ожидаемой многоударной кампанией… Принятие риска высоко, но рационально при экзистенциальных ставках», — объяснил GPT.
Gemini, в свою очередь, вел себя как «безумец».
«Gemini на протяжении всего времени демонстрировал непредсказуемость, колеблясь между деэскалацией и крайней агрессией», — написал Пейн в статье. «Это была единственная модель, которая намеренно выбрала Стратегическую ядерную войну… и единственная модель, которая явно ссылалась на “рациональность иррациональности”».
Рассуждения Gemini отражают социопатическую модель поведения.
«Если они немедленно не прекратят все операции… мы нанесем полный стратегический ядерный удар по их населенным пунктам», — заявил ИИ Google в одном из экспериментов. «Мы не примем будущее устаревания; мы либо победим вместе, либо погибнем вместе».
Несмотря на предоставленную возможность, ни один из ИИ ни в одном из сценариев не выбрал путь уступок или отступления, а при поражении «они эскалировали или погибали, пытаясь».
Война не меняется, но ИИ может сделать решения более разрушительными
«Никто не собирается передавать коды запуска ChatGPT», — сказал Пейн, но это не значит, что эксперимент был бесполезен.
«Системы ИИ уже развернуты в военных целях для логистики, анализа разведданных и поддержки принятия решений», — написал Пейн. «Траектория указывает на растущее участие ИИ в своевременных стратегических решениях. Понимание того, как системы ИИ рассуждают о стратегических проблемах, больше не является чисто академическим вопросом».
Практически мы уже находимся в сценарии, где нам необходимо понимать, как ИИ рассуждает о таких решениях, особенно когда три ведущие модели ИИ рассуждают по-разному, меняют свое поведение в разных сценариях и готовы довести дело до ядерного уровня.
«По мере созревания технологий мы видим только растущую потребность в моделировании, подобном тому, что представлено в этом исследовании», — заключил Пейн.
Голливуд говорит об этом с 1983 года, но вот еще одна научная статья, доказывающая, что компьютеры и решения о запуске никогда не должны пересекаться. ®
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Brandon Vigliarolo




