Испугавшись «Mythos», Трамп внезапно осознал пользу тестирования безопасности ИИ в «hardware»

ии трамп Caisi тестирование регулирование безопасность arstechnica.com

Трамп вынужден признать правоту Байдена в вопросе тестирования безопасности ИИ. Эксперты сомневаются в способности CAISI проводить адекватные проверки. — arstechnica.com

На этой неделе администрация Трампа пошла на попятную и подписала соглашения с Google DeepMind, Microsoft и xAI о проведении государственных проверок безопасности передовых моделей ИИ этих компаний до и после их выпуска.

Ранее Дональд Трамп упорно отвергал политику эпохи Байдена, заявляя, что добровольные проверки безопасности — это излишнее регулирование, блокирующее беспрепятственные инновации. Вскоре после вступления в должность он пошел дальше и переименовал Институт безопасности ИИ США в Центр стандартов и инноваций в области ИИ (CAISI), убрав слово «безопасность» из названия в качестве явного укола в адрес Джо Байдена.

Но после того, как Anthropic объявила, что выпускать ее новейшую модель Claude Mythos будет слишком рискованно из-за опасений, что злоумышленники могут использовать ее передовые возможности кибербезопасности, Трамп внезапно озаботился безопасностью ИИ. По сообщению Fortune, ссылающегося на директора Национального экономического совета Белого дома Кевина Хассетта, Трамп может вскоре издать указ, предписывающий государственное тестирование передовых систем ИИ до их выпуска.

В пресс-релизе CAISI центр признает, что добровольные соглашения, подписанные Google, Microsoft и xAI, «основаны на» политике Байдена. Приветствуя новые партнерства, директор CAISI Крис Фалл не упомянул Mythos, но пообещал, что «расширенное отраслевое сотрудничество» поможет CAISI масштабировать свою работу «в общественных интересах в критический момент».

«Независимые, строгие измерительные науки необходимы для понимания передового ИИ и его последствий для национальной безопасности», — заявил Фалл.

На сегодняшний день CAISI сообщила о завершении около 40 оценок, включая те, что касались еще не выпущенных передовых моделей. При проведении тестов CAISI часто получает доступ к моделям с «ослабленными или удаленными мерами защиты», что, по словам CAISI, позволяет им более «тщательно оценивать возможности и риски, связанные с национальной безопасностью».

CAISI также заявила, что посредством этих оценок правительство получит лучшее представление о возможностях моделей. А для обеспечения того, чтобы оценщики понимали основные проблемы национальной безопасности по мере их возникновения в различных ведомствах, CAISI сообщила о создании целевой группы из «группы межведомственных экспертов», «сосредоточенной на проблемах национальной безопасности в области ИИ».

,

Некоторые компании, подписавшие соглашения, продемонстрировали уверенность в планах CAISI по тестированию. В LinkedIn Том Лю, вице-президент Google DeepMind по глобальным вопросам, связанным с передовым ИИ, заявил, что он «удовлетворен» планами тестирования CAISI. В блоге Microsoft заявила, что «тестирование на предмет рисков для национальной безопасности и крупномасштабной общественной безопасности по необходимости должно быть совместным начинанием с правительствами», отметив при этом «уникальные знания, которыми обладают такие учреждения, как CAISI» для проведения такого тестирования. xAI, которая в настоящее время судится с OpenAI по поводу того, чьи лидеры больше заботятся о безопасности ИИ, не сразу ответила на запрос Ars о комментарии.

Однако критики не убеждены в плане правительства по проверке моделей и все больше сомневаются в компаниях, чьи конструкции моделей ИИ в значительной степени остаются секретными.

Критики предположили, что CAISI может не хватать финансирования или опыта для оценки передовых моделей ИИ. И, как, по-видимому, подозревает Трамп, поиск добровольных обязательств со стороны фирм, занимающихся ИИ, может не обеспечить той повседневной прозрачности, которая нужна общественности в отношении рисков передового ИИ, предупреждают критики. Более того, любая политизация процесса оценки — например, противодействие выпуску моделей, результаты которых неблагоприятны для политических взглядов определенной администрации — может подорвать доверие к ИИ. В таком случае это в конечном итоге может отпугнуть компании от подписания соглашений, поскольку повышение доверия, как предполагается, является ключевым мотивом, движущим последней попыткой государственного сотрудничества.

Никто не знает, что значит «безопасно»

В спешке объявить о своих партнерах CAISI не уточнил стандарты тестирования, которые будут использоваться для оценок.

Это может стать проблемой, согласно посту в LinkedIn Девина Линча, бывшего директора по киберполитике и реализации стратегии в Управлении национального директора по кибербезопасности Белого дома:

«Предварительные оценки с передовыми лабораториями — это именно то государственно-частное сотрудничество, которое необходимо для обеспечения доверия, безопасности и защищенности ИИ. Более сложный вопрос заключается в том, что на самом деле означает «оценка» на передовом рубеже. Оценка возможностей хороша настолько, насколько хороши лежащие в ее основе модели угроз. Наше исследование технологического стека ИИ показывает, что уровень управления — стандарты, аудиты, рамки ответственности — остается наименее зрелым, но наиболее важным. CAISI необходимо будет определить и опубликовать, что именно он тестирует, а не только с кем он тестирует».

В заявлении, предоставленном Ars, Сара Крепс, директор Института технологической политики Корнеллского университета, заявила, что фирмам, занимающимся ИИ, следует налаживать более тесные связи с правительством по мере развития ИИ. Однако, по ее словам, «определение „безопасного“ является спорным», и «как только вы создаете государственный процесс проверки технологий, вы получаете и хорошее, и плохое».

,

Без определения стандартов «процесс может быть политизирован», — сказала Крепс. Это грозит созданием системы, в которой «кто бы ни обладал властью, тот и будет определять, как работает проверка».

По словам Крепс, ни администрациям Байдена, ни Трампа пока не удалось избежать этого.

Опасения по поводу контроля правительством результатов работы ИИ

В блоге Microsoft говорилось, что «CAISI, Microsoft и NIST будут сотрудничать в улучшении методологий для состязательных оценок», что предполагает разработку этих стандартов на ходу. По данным Microsoft, «тестирование систем ИИ способами, которые исследуют неожиданное поведение, пути неправомерного использования и режимы отказа», «очень похоже на стресс-тестирование того, насколько эффективно и надежно работают подушки безопасности, ремни безопасности и тормозные системы в критических сценариях вождения».

Но Грегори Фалько, доцент кафедры машиностроения и аэрокосмической техники Корнеллского университета и эксперт по отслеживанию управления ИИ, настаивает на том, что есть лучший путь.

«Государственный надзор за ИИ не должен просто означать политический обзор результатов работы моделей, и он не должен становиться механизмом для определения того, говорит ли модель благоприятные или неблагоприятные вещи о президенте или администрации», — сказал Фалько.

Вместо того чтобы полагаться на политизированное правительство, использующее оценки для контроля систем ИИ, которыми пользуется общественность, США могли бы создать «некую форму независимого аудита», — сказал Фалько.

Представьте, предполагает Фалько, если бы фирмы, занимающиеся ИИ, знали, что их модели могут быть проверены в любой момент, насколько большей подотчетности и дисциплины могла бы создать такая система? Работая аналогично Налоговой службе (IRS), строгая система аудита ИИ могла бы создать «реальные последствия за безрассудное развертывание», — сказал Фалько. По мнению Фалько, для фирм ИИ, сталкивающихся с такими последствиями, возникло бы давление с целью активизировать внутреннее тестирование безопасности ИИ.

Это кажется «единственным жизнеспособным путем», — сказал Фалько, поскольку «федеральное правительство в настоящее время не обладает собственными техническими знаниями, инфраструктурой или повседневным пониманием, необходимым для прямой оценки этих систем самостоятельно».

,

Румман Чоудхури, консультант по управлению ИИ и основатель Humane Intelligence, аналогичным образом раскритиковала готовность CAISI. Чоудхури заявила Fortune, что «нынешние усилия Белого дома по предложению „разумного надзора“ за передовыми моделями ИИ могут звучать хорошо, но дьявол кроется в деталях».

«Это зависит от их интерпретации этих слов», — сказала Чоудхури. «Оценки — это политический инструмент, они не основаны на данных. Моя озабоченность заключается в том, что это еще один политический инструмент, которым хочет владеть и который хочет использовать администрация».

CAISI может не хватать финансирования

Что касается финансирования, Конгресс в январе одобрил до 10 миллионов долларов на расширение CAISI, сообщила Fortune. Однако консервативный аналитический центр America First Policy Institute провел недавний анализ, в котором говорится, что «CAISI по-прежнему недофинансирован по сравнению с аналогичными институтами на международном уровне и ему не хватает „соответствующего финансирования“».

По мнению критиков, план тестирования CAISI может быть недостаточным для защиты общественности от наиболее непредвиденных рисков ИИ. Фалько утверждает, что только независимые аудиты могут избавить общественность от наихудших последствий.

«Опасность заключается в том, что государственный надзор станет политическим, показным или захваченным компаниями, которые он должен оценивать», — сказал Фалько. «Возможность состоит в том, чтобы создать практическую систему аудита, которая позволит США оставаться мировым лидером в области ИИ, одновременно создавая реальную подотчетность в отношении наиболее значимых рисков».

Для Линча, возможно, более важным испытанием будет то, добьется ли план Трампа успеха в своей миссии по уклонению от рисков и стимулированию большего доверия к системам ИИ, сохраняя при этом легкое регулирование, чтобы избежать чрезмерного регулирования фирм.

CAISI «строит здесь что-то важное», — сказал Линч. «Испытанием будет то, зажгут ли эти сотрудничества инновации, защитят ли национальную безопасность и приведут ли к созданию ИИ, который будет одновременно заслуживающим доверия и надежным».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: