Раздел: AI безопасность
Синтаксический взлом: исследователи обнаружили, что структура предложений позволяет обходить правила безопасности ИИ
Новое исследование раскрывает, почему некоторые атаки внедрения подсказок могут сработать: языковые модели иногда ставят синтаксис выше смысла, что приводит к ошибкам и открывает путь злоумышленникам к обходу фильтров.
