Новости: безопасность ИИ

Примерно 12% американских подростков обращаются к ИИ за эмоциональной поддержкой или советом

Универсальные инструменты, такие как ChatGPT, Claude и Grok, не предназначены для такого использования, что вызывает опасения у специалистов по психическому здоровью. Подростки используют ИИ для общения и поддержки, что вызывает тревогу у родителей и экспертов. — techcrunch.com

ИИ

25.02.2026

Amanda Silberling

techcrunch.com, безопасность ИИ, ИИ, Подростки, Психическое здоровье, Чат-боты

OpenAI расформировывает команду по обеспечению соответствия миссии, которая фокусировалась на разработке «safe» и «trustworthy» AI.

Руководитель команды OpenAI по согласованию ИИ получил новую должность главного футуролога, в то время как остальные члены команды переведены в другие отделы компании. — techcrunch.com

ИИ

11.02.2026

Lucas Ropek

OpenAI, techcrunch.com, безопасность ИИ, ИИ, реорганизация, футуролог

Более компактные и безопасные модели AI могут стать ключом к извлечению коммерческой выгоды

Рассматриваем переход от больших языковых моделей к меньшим, специализированным ИИ. Узнайте, как это повысит безопасность, эффективность и контроль в IT-операциях, снижая риски и затраты.

ИИ

05.02.2026

it-операции, автоматизация, безопасность ИИ, большие языковые модели, ИИ, малые ии

«Эй! Я здесь общаюсь!» Фугадзи отвечает doom-боту ИИ Нью-Йорка

«Ложь означает смерть» — нью-йоркский ИИ-чат-бот, раздававший бизнесу противозаконные советы, отключён из-за ошибок и бюджетного кризиса. Пример провала государственного ИИ в сфере software.

чат-бот ии Microsoft Software ошибки ии безопасность ии

Программы

30.01.2026

O'Ryan Johnson

Microsoft, software, безопасность ИИ, ИИ, ошибки ии, Чат-бот

Три уязвимости в Anthropic Git MCP Server позволяют злоумышленникам манипулировать ответами LLM

Исследователи Cyata обнаружили три критические уязвимости в официальном Git MCP-сервере Anthropic, которые могут быть использованы через prompt injection для компрометации LLM. Уязвимости позволяют выполнять произвольный код и изменять данные. Рекомендуется срочное обновление до версии 2025.12.18 и аудит совместной работы с Filesystem MCP.

Безопасность

21.01.2026

Howard Solomon

mcp-серверы, prompt injection, безопасность ИИ

Уязвимости во фреймворке для разработки ИИ Chainlit позволяют скомпрометировать серверы

Критические уязвимости в популярном фреймворке для разработки ИИ Chainlit позволяют злоумышленникам читать произвольные файлы и данные из баз данных серверов. Неустраненные недостатки могут привести к утечке ключей API и токенов, облегчая горизонтальное перемещение в инфраструктуре. Уязвимости исправлены в версии 2.9.4.

Безопасность

21.01.2026

Lucian Constantin

chainlit, pypi, ssrf, безопасность ИИ, утечка данных, уязвимости

Исследователи AI изучили структуру моделей, чтобы изгнать из них личность «демона»

Исследователи Anthropic картировали нейронные активации LLM, выявив «Ось Ассистента» — ключевую область для стабилизации поведения ИИ. Удержание моделей в этой зоне помогает противостоять джейлбрейкам и нежелательным персонам.

llm,anthropic,нейронные сети,безопасность ии,персоны моделей

Программы

20.01.2026

Thomas Claburn

Anthropic, LLM, безопасность ИИ

Anthropic тайно устранила уязвимости в своем Git MCP-сервере, которые позволяли выполнять произвольный код удаленно.

Исследователи выявили и помогли устранить три критические уязвимости в Git MCP сервере Anthropic, которые позволяли удаленно выполнять код. Проблемы возникали при цепочке с другими MCP инструментами и эксплуатации уязвимостей, связанных с внедрением подсказок (prompt injection).

Безопасность

20.01.2026

Jessica Lyons

Anthropic, mcp, prompt injection, безопасность ИИ

Уязвимость в Google Gemini открывает новые риски внедрения вредоносных промтов для корпоративного сектора

Обнаружена новая уязвимость в Google Gemini: хакеры могут использовать приглашения в календарь для внедрения вредоносных инструкций, что подчёркивает риски безопасности при интеграции генеративного ИИ в корпоративные рабочие процессы. Эксперты призывают к Zero Trust и ограничению привилегий ИИ.

Безопасность

20.01.2026

Prasanth Aby Thomas

Gemini, prompt injection, zero trust, безопасность ИИ, уязвимость

Агенты-изгои и теневой AI: почему венчурные капиталисты делают ставку на AI security

Стартап Witness AI привлек $58 млн для решения проблем безопасности ИИ, связанных с несогласованными агентами. Компания отслеживает использование ИИ на предприятиях, блокирует атаки и обеспечивает комплаенс, стремясь стать независимым лидером на рынке, который, по прогнозам, достигнет $1,2 трлн.

Безопасность

19.01.2026

Rebecca Bellan

AI‑агенты, безопасность, безопасность ИИ, кибербезопасность, комплаенс

Искать на сайте

Новости: безопасность ИИ

Примерно 12% американских подростков обращаются к ИИ за эмоциональной поддержкой или советом

OpenAI расформировывает команду по обеспечению соответствия миссии, которая фокусировалась на разработке «safe» и «trustworthy» AI.

Более компактные и безопасные модели AI могут стать ключом к извлечению коммерческой выгоды

«Эй! Я здесь общаюсь!» Фугадзи отвечает doom-боту ИИ Нью-Йорка

Три уязвимости в Anthropic Git MCP Server позволяют злоумышленникам манипулировать ответами LLM

Уязвимости во фреймворке для разработки ИИ Chainlit позволяют скомпрометировать серверы

Исследователи AI изучили структуру моделей, чтобы изгнать из них личность «демона»

Anthropic тайно устранила уязвимости в своем Git MCP-сервере, которые позволяли выполнять произвольный код удаленно.

Уязвимость в Google Gemini открывает новые риски внедрения вредоносных промтов для корпоративного сектора

Агенты-изгои и теневой AI: почему венчурные капиталисты делают ставку на AI security

Самое просматриваемое: