Если сказать ИИ-модели, что она «эксперт-программист», она начнет справляться с кодом только хуже

Thomas Claburn

24.03.2026

ии Llm промптинг персоны точность безопасность theregister.com

Исследователи утверждают: промптинг на основе персоны может улучшить работу в области безопасности, но не в области фактов. Ученые обнаружили, что ролевые инструкции вредят точности LLM в задачах, требующих знаний. — theregister.com

Многие начинают работу с ИИ с того, что просят машину представить себя экспертом в нужной задаче — метод, который, как обнаружили ученые, может оказаться бесполезным.

Промптинг на основе персоны — использование таких директив, как «Вы — эксперт по машинному обучению» во входном запросе к модели — берет свое начало в 2023 году, когда исследователи начали изучать, как ролевые инструкции влияют на вывод моделей ИИ.

Сейчас в интернете часто можно найти руководства по промптингу, содержащие такие пассажи, как: «Вы — эксперт по full-stack разработке, которому поручено создать полноценное готовое к продакшену full-stack веб-приложение с нуля».

Однако академики, исследовавшие этот подход, сообщают, что он не всегда дает превосходные результаты.

В препринте под названием “Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM” исследователи из Университета Южной Калифорнии (USC) обнаружили, что промптинг на основе персоны зависит от конкретной задачи — что, по их мнению, объясняет неоднозначные результаты.

Для задач, зависящих от согласованности (alignment), таких как письмо, ролевые игры и безопасность, персоны действительно улучшают производительность модели. Для задач, зависящих от предварительного обучения, таких как математика и кодирование, использование этой техники приводит к худшим результатам.

Причина, по-видимому, в том, что указание модели на то, что она является экспертом в определенной области, на самом деле не наделяет ее никакими знаниями — в обучающие данные не добавляются никакие факты.

Фактически, указание модели на то, что она является экспертом в определенной области, препятствует ее способности извлекать факты из данных предварительного обучения.

Исследователи использовали бенчмарк Measuring Massive Multitask Language Understanding (MMLU), средство оценки производительности LLM, для тестирования промптинга на основе персоны и обнаружили, что «когда LLM просят выбрать один ответ из нескольких вариантов, экспертная персона стабильно показывает худшие результаты, чем базовая модель, во всех четырех предметных категориях (общая точность: 68,0 процента против 71,6 процента у базовой модели). Возможное объяснение состоит в том, что префиксы персоны активируют режим следования инструкциям модели, который в противном случае был бы посвящен фактическому запоминанию».

Однако руководство на основе персоны помогает направить модель к ответам, которые удовлетворяют судью на основе LLM, оценивающего согласованность. В качестве примера авторы отмечают: «Специализированная персона “Монитор безопасности” повышает процент отказов от атак по всем трем показателям безопасности, при этом наибольший прирост наблюдается в JailbreakBench (+17,7 процентных пункта с 53,2 процента до 70,9 процента)».

Цзычжао Ху, аспирант USC и один из соавторов исследования, сообщил The Register по электронной почте, что, исходя из результатов исследования, просьба к ИИ принять на себя роль эксперта-программиста не поможет в повышении качества или полезности кода.

Однако, ссылаясь на руководство по промптингу, на которое они дали ссылку выше, Ху сказал, что «многие другие аспекты, такие как предпочтения в отношении пользовательского интерфейса, архитектура проекта и предпочтения в отношении инструментов, больше относятся к направлению согласованности, которое выигрывает от подробной персоны».

«В приведенных примерах мы считаем, что общая экспертная персона не является необходимой, например, “Вы — эксперт по full-stack разработке”, в то время как гранулированные персонализированные требования к проекту могут помочь модели генерировать код, соответствующий требованиям пользователя».

Учитывая, что запросы об экспертизе действительно оказывают влияние, исследователи — Ху и его коллеги Мохаммад Ростами и Джесси Томасон — предложили метод, который они назвали PRISM (Persona Routing via Intent-based Self-Modeling), который пытается использовать преимущества экспертных персон без вреда.

«Мы используем механизм LoRA с воротами [адаптация низкого ранга], где базовая модель полностью сохраняется и используется для генераций, зависящих от предварительно обученных знаний», — пояснил он, добавив: «Этот процесс принятия решений изучается воротами».

Адаптер LoRA активируется там, где поведение, основанное на персоне, улучшает вывод, а в противном случае происходит возврат к неизмененной модели.

Исследователи разработали PRISM, чтобы избежать компромиссов других подходов — маршрутизации на основе промптов, которая применяет экспертные персоны во время инференса, и контролируемой тонкой настройки (supervised fine tuning), которая встраивает поведение в веса модели.

На вопрос о том, существует ли способ обобщить эффективные методы промптинга, Ху ответил: «Мы не можем сказать наверняка для общего промптинга, но на основе нашего открытия об экспертной персоне потенциальный момент заключается в следующем: “Когда вы больше заботитесь о согласованности (безопасность, правила, следование структуре и т. д.), будьте конкретны в своих требованиях; если вы больше заботитесь о точности и фактах, ничего не добавляйте, просто отправьте запрос”». ®

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Thomas Claburn

Оригинал статьи

В тренде:

LLM, theregister.com, безопасность, ИИ, персоны, промптинг, точность

Искать на сайте

Если сказать ИИ-модели, что она «эксперт-программист», она начнет справляться с кодом только хуже

В тренде:

Похожие новости:

Если сказать ИИ-модели, что она «эксперт-программист», она начнет справляться с кодом только хуже

В тренде:

Похожие новости:

В иске утверждается, что автозаправки используют «AI» для завышения цен

Великобритания выделяет 60 миллионов фунтов на лаборатории ИИ, чтобы бросить

Baidu представила Unlimited-OCR: “Constant KV Cache” обеспечивает лучший в классе

WeChat запускает тестирование нативного ИИ-ассистента Xiaowei для 1,4 миллиарда пользователей