Давайте быстро рассмотрим гипотетическую ситуацию: допустим, вы — компания, занимающаяся искусственным интеллектом, которая сделала своей визитной карточкой безопасность, и вы ведете переговоры об использовании ваших технологий с военными, которые пригрозили наказать ваш бизнес, если вы не откажетесь от своих принципов. Вы хотели бы сохранить свою позицию как компании, заботящейся о безопасности в сфере ИИ, что принесло вам значительную общественную поддержку, пока вы сопротивляетесь давлению правительства. Подходит ли сейчас время объявить о сворачивании некоторых ваших протоколов безопасности и сообщить Пентагону, что вы не против того, чтобы ИИ запускал ракеты при определенных обстоятельствах?
Похоже, Anthropic так считает. Во вторник компания объявила об обновлении своей Политики ответственного масштабирования (Responsible Scaling Policy, RSP) — структуры, которую она впервые представила в 2023 году с целью смягчения катастрофических рисков, связанных с системами ИИ. Компания позиционировала эту политику как фактор, отличающий ее от конкурентов, как обещание ставить безопасность на первое место, даже рискуя отстать от других передовых моделей, которые проявляют меньшую осторожность.
Ранее, как гласила RSP Anthropic: «Мы не будем обучать или развертывать модели, способные нанести катастрофический вред, если мы не внедрим меры безопасности и защиты, которые удержат риски ниже приемлемого уровня». Теперь компания заявляет, что не уверена, стоит ли это того, если это означает потерю позиций. «Мы посчитали, что для нас будет бесполезно прекращать обучение моделей ИИ», — заявил TIME Джаред Каплан, главный научный сотрудник Anthropic. «Мы не чувствовали, что с быстрым развитием ИИ для нас имеет смысл брать на себя односторонние обязательства… если конкуренты уходят далеко вперед».
Anthropic отдает должное своей первоначальной RSP за то, что она стимулировала разработку более надежных мер защиты для их модели, но по сути заявляет, что поскольку другие компании не приняли аналогичных ограничений, ей нужна большая гибкость, которую «красные линии» не обеспечивают. «Политика ответственного масштабирования всегда планировалась как живой документ: политика, обладающая гибкостью для изменений по мере того, как модели ИИ становятся более мощными», — сообщила компания в своем блоге. Anthropic заявила, что продолжит публиковать отчеты о рисках, но будет придерживаться «необязательных, но публично заявленных» целей в области безопасности вместо жестких внутренних стандартов. Щедрая трактовка этого — приверженность общественной подотчетности. Менее благосклонная трактовка может заключаться в том, что компания знает, что у общественности нет реальных рычагов для обеспечения соблюдения этих стандартов, так зачем же себя сдерживать?
Anthropic сообщила The Wall Street Journal, что изменение в их RSP не связано с продолжающимися переговорами с Пентагоном, который только вчера поставил компании ультиматум: ослабить свои меры безопасности, чтобы военные могли использовать ее модели по своему усмотрению, или столкнуться с последствиями. Но трудно не рассматривать это изменение именно в таком свете.
Anthropic сохраняла две основные красные линии в отношении использования своих технологий для военных операций: она не позволит использовать свои модели для массового внутреннего наблюдения или для разработки полностью автономного оружия, которое будет действовать без участия человека. Министр обороны Пит Хегсет, похоже, не готов это принять, и пригрозил расторгнуть государственные контракты с Anthropic, объявить Anthropic «риском для цепочки поставок» и/или применить Закон о производственной деятельности в оборонных целях (Defense Production Act), чтобы заставить компанию создать модель для нужд военных.
Но похоже, что компания уже ведет переговоры о лазейках, которые не совсем пересекают красную линию. В среду Semafor сообщила, что Пентагон в декабре спрашивал Anthropic, разрешит ли она использовать свою модель для автономного запуска ракет для перехвата других ракет. По сообщениям, Anthropic ответила, что Пентагон должен обратиться за разрешением, прежде чем переходить к такому сценарию использования, — хотя Semafor также сообщил, что Anthropic была и продолжает быть готова предусмотреть исключение для противоракетной обороны в своих политиках.
Возможно, даже вероятно, что Anthropic в любом случае собиралась ослабить наложенные на себя ограничения. Также возможно, что это изменение должно было произойти на этой неделе, независимо от противостояния с Министерством обороны по поводу мер безопасности ИИ. Но, учитывая положение, в котором оказалась Anthropic, трудно не рассматривать эту ситуацию как начало компромисса компании со своими принципами.
Gizmodo обратился к Anthropic за дополнительной информацией, но компания не предоставила комментариев до публикации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – AJ Dellinger




