Раздел: LLM
Исследователи обнаружили, что делает ИИ-чат-боты политически убедительными: аппаратное обеспечение
Масштабное исследование политической убедительности показывает, что ИИ оказывает, в лучшем случае, слабое влияние на общественное мнение. Ученые проанализировали работу нескольких моделей, включая ChatGPT и Grok-3, и пришли к выводу, что “суперчеловеческая” убедительность ИИ — это скорее миф, чем реальность.

Синтаксический взлом: исследователи обнаружили, что структура предложений позволяет обходить правила безопасности ИИ
Новое исследование раскрывает, почему некоторые атаки внедрения подсказок могут сработать: языковые модели иногда ставят синтаксис выше смысла, что приводит к ошибкам и открывает путь злоумышленникам к обходу фильтров.

ИИ не признается в сексизме, но он, вероятно, сексист
Хотя крупные языковые модели часто не употребляют откровенно предвзятых выражений, они могут выводить демографические сведения пользователей и демонстрировать скрытые предубеждения — от гендерных стереотипов до расовых предрассудков, считают исследователи.
