Новости: безопасность ИИ
Утечка через поиск в M365 Copilot: ваша поверхность атак через “prompt injection” стала еще больше
Недавняя атака SearchLeak на Microsoft M365 Copilot Enterprise выявила угрозу prompt injection, основанную на использовании параметра URL для внедрения команд ИИ. Атака позволяла утекать конфиденциальные корпоративные данные через специально созданные ссылки. — csoonline.com

Злоумышленники могут превратить «guardrails» ИИ-агентов в инструменты для «denial-of-service» атак
Злоумышленники могут превратить механизмы защиты ИИ-агентов в оружие для атак типа «отказ в обслуживании» (DoS), согласно новому исследованию. Ученые обнаружили, что один отравленный документ может существенно замедлить общие рабочие процессы ИИ-агентов, загнав системы безопасности, основанные на логическом выводе, в длительные циклы размышлений. «Механизмы защиты, основанные на логическом выводе, создают новую поверхность для атак, где сами механизмы безопасности становятся мишенью», — написали исследователи из Университета […] — csoonline.com

5 «runtime» сигналов для выявления скомпрометированного AI-агента
В июне 2025 года Саймон Уиллсон, инженер, придумавший термин «инъекция промптов», опубликовал предупреждение о «смертельной триаде» — трех возможностях ИИ-агента (доступ к данным, недоверенный контент, внешние коммуникации), создающих путь к эксплуатации через косвенную инъекцию промптов. — csoonline.com

«Промпт-инъекции» — главная угроза современным ИИ-агентам: результаты исследования
Новое исследование StakeBench показало, что веб-агенты на базе GPT-5 и Gemini не имеют надежной защиты от инъекций промптов. Атаки достигают успеха, нанося вред третьим сторонам, даже если задача пользователя выполняется. — csoonline.com

Два лауреата премии Тьюринга бросают вызов теоретической «черной дыре» в создании AGI на конференции BAAI
Уитфилд Диффи и Эндрю Барто, два лауреата премии Тьюринга, выступили с программными речами на 8-й конференции BAAI в Пекине, сойдясь на общей озабоченности: фундаментальных теоретических проблемах обеспечения безопасности и согласованности AGI. — pandaily.com

Google DeepMind опасается последствий массового взаимодействия миллионов ИИ-агентов
Google DeepMind финансирует исследования потенциальных опасностей взаимодействия миллионов ИИ-агентов в сети. По мнению экспертов, массовое появление автономных агентов создает новый класс рисков, требующий срочной разработки мер безопасности в новой области — безопасности мультиагентных систем. — technologyreview.com

xAI уволила инженера, бившего тревогу по поводу безопасности Grok, говорится в новом иске
Бывший инженер xAI подает в суд на компанию и SpaceX, утверждая, что его уволили за то, что он поднял вопросы безопасности ИИ в отношении Grok за несколько дней до исторического IPO SpaceX. — techcrunch.com

Grok, IPO, SpaceX, techcrunch.com, XAI, безопасность ИИ, иск
ИИ-модели оказались куда уязвимее перед итеративными атаками, чем заявляли разработчики
CISO, полагающиеся на механизмы защиты LLM и официальные оценки безопасности, рискуют: исследование Cisco показало, что передовые модели ИИ имеют худшие профили рисков при многоходовых атаках по сравнению с одиночными запросами. — csoonline.com

Безопасность ИИ требует перехода от моделей к системам, утверждают исследователи
Исследователи утверждают, что для защиты ИИ-агентов в предприятиях необходимо внедрять системные средства контроля, а не полагаться на повышение надежности моделей. Традиционные подходы к безопасности ИИ не соответствуют работе автономных агентов. — csoonline.com

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- США прикрыли платформу для хранения паролей, которой…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…
