Anthropic обучила последнюю версию своего чат-бота Claude быть более честной, чем её предшественники. И честно говоря? Не всем это по душе.
Представленная в четверг модель Claude Opus 4.8 была охарактеризована компанией как модель, «с большей вероятностью отмечающая неопределенность в своей работе и с меньшей вероятностью делающая необоснованные заявления». Claude, как и все чат-боты, по-прежнему склонен к галлюцинациям, но идея этого нового «апгрейда честности» состоит в том, чтобы добавить больше прозрачности в ответы, чтобы пользователи знали, когда и где их могут ввести в заблуждение. Вместо того чтобы искажать правду или генерировать откровенную ложь при неполной информации, новая модель должна быть прямолинейной и признавать, когда она не знает ответа на запрос пользователя.
Кажется, это похвально. В конце концов, в последние годы компании, занимающиеся разработкой ИИ, подвергались острой критике за то, что их модели не всегда придерживаются истины. Создание чат-ботов, которые постоянно говорят пользователям то, что они хотят услышать — даже в ущерб точности — может повысить вовлеченность, но это также может иметь довольно уродливые последствия (например, распространение вредоносных теорий заговора или подпитка заблуждений у уязвимых пользователей). Поэтому разработчикам, таким как Anthropic, OpenAI и Google, приходится находить тонкий баланс между обучением своих чат-ботов быть дружелюбными и вовлекающими, но не настолько, чтобы они становились манипулятивными.
Claude “I get what you want but no” pic.twitter.com/KJRcsqaGHr
— L i a m (@LiamCristiano) May 30, 2026
Однако в первые дни после выпуска Opus 4.8 некоторые пользователи Claude начали жаловаться на новообретенную добросовестность чат-бота.
Новая модель «слишком честная», — написал один пользователь Reddit в сабреддите r/ClaudeAI в пятницу, — «брат не пропустит ничего… каждый ответ теперь сопровождается маленькой звездочкой. Маленькое “просто чтобы ты знал”. Маленькое “я хочу это отметить”. Я скучаю по временам, когда он просто иногда ошибался и не говорил мне об этом».
Другой пользователь Reddit написал в отдельной ветке на выходных, что Opus 4.8 «похож на Клода под кокаином: он очень настойчивый и многословный, но это какая-то горячая чушь».
Общий консенсус среди критиков, похоже, заключается в том, что стиль общения Claude стал чрезмерно честным, и что он тратит время, запутываясь в попытках найти самый правдивый путь через каждый вопрос, подобно обсессивно-компульсивному человеку, который не может выйти из своей квартиры, потому что слишком занят, убеждаясь, что все книги на его полках стоят идеально ровно.
Однако это не похоже на мнение большинства; другие пользователи также похвалили Opus 4.8. «Мы всегда должны двигаться к максимальной правде», — написал один пользователь Reddit в пятницу.
Ранняя критика обновленного Claude не означает, что гиперчестность в чат-ботах обязательно является чем-то плохим. Скорее, это напоминание о том, что у пользователей будут свои особые предпочтения, и разработчики никогда не смогут угодить всем. Вспомните также небольшую группу пользователей ChatGPT (например, этого), которые сетовали, когда OpenAI сделала чат-бота менее угодливым.
Некоторые люди предпочтут, чтобы ИИ говорил им то, что они хотят услышать, даже если это означает, что им лгут, в то время как другие захотят использовать только чат-боты, обученные быть максимально правдивыми. Вероятно, мы увидим растущее стремление разработчиков к персонализации: предоставлению пользователям возможности настраивать тон, манеру и «личность» разговорного стиля чат-ботов. Возможно, вы не сможете угодить всем, но, по крайней мере, вы можете позволить им установить свои собственные границы.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Webb Wright




