Искусственный интеллект будет проверять публикации Science на предмет фальсификации изображений

Опубликовал
Андрей Русанов

Известный научный журнал Science объявил, что все его издания будут использовать коммерческое программное обеспечение, автоматизирующее процесс обнаружения подозрительных изображений. В своё время переход к цифровым данным и публикациям значительно облегчил мошенничество в исследованиях с помощью подделки изображений.

Хотя ПО имеет определенные ограничения, оно позволит найти значительную часть манипуляций с изображениями. Большое количество мошенничеств с изображениями вызвано несоответствием реальных экспериментов теоретическим выводам и догадкам. Часто эксперименты дают данные, которые практически невозможно отличить от контрольных. Для неэтичных людей это не представляет проблемы – никто не знает, какие изображения соответствуют тем или иным образцам. Относительно просто внести тенденциозное искажение.

Изображения образцов одних экспериментов комбинируют с другими, фабрикуя «доказательства». Это можно делать с графиками, фотографиями и с любыми графическими данными. Одни и те же элементы в разных графических образцах, пусть даже несколько измененные в редакторах, относительно просто увидеть, если о них знать, но без этого они практически незаметны.

Не слишком тщательный подлог изображений довольно распространен, автоматические средства его распознавания на основе ИИ прекрасно выполняют свою задачу. Это послужило причиной, почему Science обратился к сервису Proofig для облегчения обнаружения фальшивок.

Онлайн-курс "Project Manager" від Laba.
Станьте проджектом, що вміє передбачати ризики наперед і доводити проєкт до результату, який хочуть замовники. Поділиться досвідом Павло Харіков, former Head of PMO в Kyivstar.
Програма курсу і реєстрація

Система использует сочетание сравнительных алгоритмов, нейросетей и ИИ для поиска в текстах фальсифицированных изображений, похожих элементов на различных изображениях, комбинированных изображений и отдельных их частей. Как это обычно происходит с ИИ, иногда система «не знает» критериев, по которым происходит идентификация.

Независимо от того, как все сделано, конечным результатом становится отчет, демонстрирующий потенциальное сходство в разных рисунках и степень совпадения. Далее уже редакторы решают, что делать с полученными данными.

В Science редакторы будут сначала проверять, есть ли проблема вообще. Во многих случаях части изображения увеличиваются и обрезаются, чтобы обеспечить детальный просмотр ключевых особенностей. Если очевидного объяснения дублирования частей изображений нет, редакторы Science попросят авторов статьи объяснить проблему. Несмотря на то, что цифры не приводятся, Science указала, что в течение испытательного периода большинство авторов давали объяснения по проблемам и вносили поправки перед публикацией – но не все. «Были обнаружены статьи, которые не следует публиковать», — говорит Холден Торп, главный редактор журналов Science.

Если возникают серьезные проблемы, это может свидетельствовать о случаях более масштабных нарушений в исследованиях, которые могут выходить за рамки одной публикации. Science планирует обращаться в учреждения, в которых работают исследователи, в случаях серьезных манипуляций с изображениями. Издательство ведет учет всей переписки, связанной с рукописями, представленными в научные журналы и будет контролировать дальнейшую деятельность в Science «проблемных» авторов.

Нужно заметить, что Proofig не выявит проблем, не предполагающих дублирование данных. Например, одна недавняя статья о высокотемпературной сверхпроводимости была отозвана, поскольку исследователь не мог объяснить математические преобразования, которые выполнялись с данными перед построением графика.

У того же исследователя была отозвана другая статья, поскольку один из графиков был скопирован с его дипломной работы, где возник вследствие несвязанного эксперимента. Для выявления подобного нужно было бы создать базу данных со всеми изображениями всех научных публикаций – это практически невозможно. И даже это не помогло бы с самым простым обходным путем: если кто-нибудь собирается фальсифицировать данные, для этого можно использовать неопубликованные нигде изображения.

Новая система распознавания фальсификаций не станет панацеей от них, но, по крайней мере, поможет уменьшить их количество.

Источник: Ars Technica

Disqus Comments Loading...