Ученые нашли лучший способ распознать «AI slop» на изображениях

ии дипфейки распознавание обучение Pnas gizmodo.com

Ученые из Австралии утверждают, что, сосредоточившись на шести характеристиках, можно достичь «почти идеальной точности» в обнаружении дипфейков ИИ.

Ученые полагают, что обнаружили гораздо лучший способ определить, был ли увиденный вами снимок сгенерирован искусственным интеллектом, и нет, это не с помощью программного обеспечения для обнаружения ИИ.

В исследовании, опубликованном сегодня в журнале Proceedings of the National Academy of Sciences (PNAS), исследователи из Австралийского национального университета утверждают, что использовали специальный метод для успешного обучения группы участников распознаванию лиц, сгенерированных ИИ, в некоторых случаях с «почти идеальной точностью».

За последний год дипфейки, созданные ИИ, резко возросли как в популярности, так и в технических возможностях. В период с 2023 по 2025 год объем дипфейков в сети взорвался, демонстрируя ежегодный рост около 900% по мере совершенствования генераторов изображений на базе ИИ. То, что когда-то было смехотворно легко идентифицировать, теперь стало сложнее отличить ИИ-контент от реального. Предыдущие исследования показали, что общая точность людей в определении контента, сгенерированного ИИ, была практически подбрасыванием монеты, причем шансы были еще хуже при различении лиц, сгенерированных ИИ, от реальных человеческих лиц.

Последствия этого пугают некоторых, особенно тех, кто стал жертвой мошенничества, дезинформации или сексуальных дипфейков без согласия, связанных с ИИ.

Предыдущие методы обнаружения дипфейков, созданных ИИ, в основном основывались на поиске визуальных ошибок: искаженные фоны, анатомические сбои или явные промахи, такие как отсутствие пальцев. Но по мере того, как генераторы изображений ИИ становились точнее, эти признаки становились гораздо менее надежными. Коммерческие инструменты для обнаружения ИИ также не являются идеальной заменой. Они могут давать ложноположительные срабатывания, а поскольку многие из них сами управляются ИИ, обоснование их выводов часто скрыто от пользователя, что затрудняет понимание того, когда следует доверять результату.

«В отсутствие ответа ИИ на проблему дипфейков нам срочно необходимо улучшить возможности людей по обнаружению ИИ», — пишут исследователи из Лаборатории эмоций и лиц Австралийского национального университета в статье PNAS.

По мнению исследователей, способ сделать это — сместить фокус с деталей на общую картину, на то, что они называют глобальными впечатлениями. В частности, исследователи утверждают, что лучше всего сосредоточиться на этих шести ключевых характеристиках: симметрия, пропорциональность, привлекательность, выразительность, отличительность и запоминаемость.

Генеративный ИИ не создает изображения из ниоткуда. Эти инструменты обучаются на огромных массивах данных, которые питают создаваемый ими вывод. Когда генераторы изображений ИИ создают изображение лица, они полагаются на «математическое среднее из десятков тысяч лиц, на которых они обучались», — говорится в исследовании. Таким образом, когда эти генераторы изображений создают человеческое лицо, эта опора на математическое среднее делает лицо «более типичным по внешнему виду, чем реальные человеческие лица».

Согласно исследованию, люди, по-видимому, обладают интуитивной, бессознательной чувствительностью к широким лицевым различиям между реальными и сгенерированными ИИ изображениями, даже если они не могут надежно преобразовать это осознание в точное обнаружение дипфейков.

«Люди автоматически обнаруживают эти различия, оценивая лица ИИ как более симметричные, пропорциональные и привлекательные, чем человеческие лица, но менее отличительные, запоминающиеся и выразительные», — пишут исследователи.

Исследователи утверждают, что эту чувствительность можно использовать для обучения людей лучше распознавать дипфейки ИИ. Но ключ не просто в том, чтобы сказать людям обращать внимание на симметрию или запоминаемость; ключ в том, чтобы научить их выяснять это самостоятельно, что и стремились сделать исследователи в своем исследовании.

На первом этапе исследования исследователи показали 45 участникам серию лиц (некоторые принадлежали реальным людям, а другие были сгенерированы ИИ) и попросили их определить, было ли оно сгенерировано ИИ.

Затем, вместо того чтобы говорить участникам обращать внимание на эти шесть качеств, исследователи обучали их с помощью шести тренировочных блоков, каждый из которых состоял из 96 заданий. Для каждого задания участникам показывали изображения человеческих лиц и сообщали, было ли каждое из них реальным или сгенерированным ИИ. Затем их просили оценить каждое лицо на основе набора широких визуальных качеств. Например, участники оценивали, насколько привлекательным или симметричным они считали каждое лицо. В среднем участники оценивали лица ИИ выше по симметрии, пропорциональности и привлекательности, в то время как человеческие лица считались более выразительными, отличительными и запоминающимися.

После завершения обучения исследователи попросили участников вернуться к определению того, было ли каждое лицо сгенерировано ИИ. На этот раз средняя точность участников «почти удвоилась», при этом лучшие кандидаты даже достигли «почти идеальной точности», как утверждается в исследовании.

«Мы предполагаем, что, направляя внимание на глобальные впечатления, наше обучение позволило участникам настроиться на то, как эти целостные качества отличают лица ИИ от человеческих», — пишут исследователи.

Исследователи говорят, что метод обучения достаточно быстр и прост для прохождения онлайн, чтобы его можно было успешно внедрить среди большего числа людей, хотя, вероятно, нереалистично ожидать его универсального масштабирования. Результаты исследования также ограничены генераторами изображений ИИ, поэтому пока неясно, сможет ли обучение успешно перенестись на обнаружение аудио- или видеодипфейков.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: