Новости: безопасность ИИ
Примерно 12% американских подростков обращаются к ИИ за эмоциональной поддержкой или советом
Универсальные инструменты, такие как ChatGPT, Claude и Grok, не предназначены для такого использования, что вызывает опасения у специалистов по психическому здоровью. Подростки используют ИИ для общения и поддержки, что вызывает тревогу у родителей и экспертов. — techcrunch.com

OpenAI расформировывает команду по обеспечению соответствия миссии, которая фокусировалась на разработке «safe» и «trustworthy» AI.
Руководитель команды OpenAI по согласованию ИИ получил новую должность главного футуролога, в то время как остальные члены команды переведены в другие отделы компании. — techcrunch.com

Три уязвимости в Anthropic Git MCP Server позволяют злоумышленникам манипулировать ответами LLM
Исследователи Cyata обнаружили три критические уязвимости в официальном Git MCP-сервере Anthropic, которые могут быть использованы через prompt injection для компрометации LLM. Уязвимости позволяют выполнять произвольный код и изменять данные. Рекомендуется срочное обновление до версии 2025.12.18 и аудит совместной работы с Filesystem MCP.

Уязвимости во фреймворке для разработки ИИ Chainlit позволяют скомпрометировать серверы
Критические уязвимости в популярном фреймворке для разработки ИИ Chainlit позволяют злоумышленникам читать произвольные файлы и данные из баз данных серверов. Неустраненные недостатки могут привести к утечке ключей API и токенов, облегчая горизонтальное перемещение в инфраструктуре. Уязвимости исправлены в версии 2.9.4.

Исследователи AI изучили структуру моделей, чтобы изгнать из них личность «демона»
Исследователи Anthropic картировали нейронные активации LLM, выявив «Ось Ассистента» — ключевую область для стабилизации поведения ИИ. Удержание моделей в этой зоне помогает противостоять джейлбрейкам и нежелательным персонам.

Anthropic тайно устранила уязвимости в своем Git MCP-сервере, которые позволяли выполнять произвольный код удаленно.
Исследователи выявили и помогли устранить три критические уязвимости в Git MCP сервере Anthropic, которые позволяли удаленно выполнять код. Проблемы возникали при цепочке с другими MCP инструментами и эксплуатации уязвимостей, связанных с внедрением подсказок (prompt injection).

Уязвимость в Google Gemini открывает новые риски внедрения вредоносных промтов для корпоративного сектора
Обнаружена новая уязвимость в Google Gemini: хакеры могут использовать приглашения в календарь для внедрения вредоносных инструкций, что подчёркивает риски безопасности при интеграции генеративного ИИ в корпоративные рабочие процессы. Эксперты призывают к Zero Trust и ограничению привилегий ИИ.

Агенты-изгои и теневой AI: почему венчурные капиталисты делают ставку на AI security
Стартап Witness AI привлек $58 млн для решения проблем безопасности ИИ, связанных с несогласованными агентами. Компания отслеживает использование ИИ на предприятиях, блокирует атаки и обеспечивает комплаенс, стремясь стать независимым лидером на рынке, который, по прогнозам, достигнет $1,2 трлн.

Самое просматриваемое:
- Bitcoin Depot оштрафован на $18,5 млн – сталкивается…
- WatchGuard бьёт тревогу: критическая уязвимость…
- Как настроить ComfyUI для генерации изображений ИИ…
- ECARX берет управление бизнесом Flyme OS в свои руки…
- США прикрыли платформу для хранения паролей, которой…
- Результаты еженедельного опроса: Samsung Galaxy Z…
- Тим Суини из Epic: «нечестность» и «грубое…
- Исследователи из MIT возродили 40-летнюю концепцию…
- Новейший датчик присутствия от Aqara определяет,…
- Представитель сервисного центра Google сообщил…

