Искусственный интеллект научился воссоздавать лицо человека по ДНК

Опубликовал Олександр Федоткін

Исследователи из Китайской академии наук разработали новый инструмент на базе ИИ, способный воспроизводить лицо реального человека лишь по фрагменту ДНК.

Инструмент под названием Difface способен воссоздать трехмерное изображение лица реального человека только по фрагменту ДНК. Технология была создана на базе многолетних исследований связи между генетикой и чертами лица, в частности, формой носа, скулами, челюстями. 

«Удивительно, но Difface может генерировать трехмерные изображения лиц людей исключительно на основе данных их ДНК, прогнозируя их внешность в разном возрасте», — отмечает старший научный сотрудник группы исследователей Луонан Чен.

Difface работает по принципу использования современных методов генерации изображений и машинного обучения, создавая точные 3D-изображения лиц на базе однонуклеотидных полиморфизмовразличия последовательности ДНК размером в один нуклеотид в геноме (или в другой сравниваемой последовательности) представителей одного вида или между гомологичными участками гомологичных хромосом. При этом используется инструмент для трансформации изображений и спиральная сверточная нейросеть для сопоставления однонуклеотидных полиморфизмов с трехмерным облаком точек лица для генерации общих черт лица конкретного человека. 

Передовая наука

ИИ обучали на базе данных лиц 9 тыс 674 человек из представителей народности хань. Каждый из них предоставил результаты секвенирования генома и 3D-изображение собственного лица высокого разрешения. После обучения ИИ оказался способным воспроизводить такие тонкие черты лица, как углубление на кончике носа, или формы скул.

Кроме того, модель учитывает дополнительные фенотипические данные, такие как возраст, пол и индекс массы тела, что позволяет прогнозировать изменения лица с возрастом. Difface достигла точности воспроизведения лица в 3,33% по ближайшему совпадению. В более ранних моделях Mahdi и Sero эти показатели составляли 2,48% и 3,00%. Средняя ошибка воспроизведения составляла всего 3,52 мм по евклидовому расстоянию между реальными и сгенерированными изображениями. Евклидово расстояние представляет, насколько похожи две точки данных, предполагая, что некоторая кластеризация на основе других данных уже была выполнена. Когда модели была предоставлена дополнительная информация — возраст, пол и индекс массы тела — ошибка сократилась еще больше, до 2,93 мм.

Передовая наука

Эта модель ИИ может получить применение в криминалистике, позволяя следователям воссоздать лицо преступника с помощью фрагментов ДНК, случайно оставленных на месте преступления. Однако некоторые черты лица все еще могут быть неточными, если предоставлен неполный набор генетических данных. Когда модель обрабатывала варианты с менее чем 70% данных однонуклеотидных полиморфизмов, воспроизводимые ею лица в основном теряли индивидуальные черты. 

Сейчас наибольшее беспокойство вызывает то, что использование технологии Difface может подорвать конфиденциальность данных, которые хранятся компаниями, проводящими ДНК-тесты. Это также может привести к злоупотреблениям в сферах наблюдения, охраны правопорядка и маркетинга. В США правоохранительные органы уже использовали фенотипирование ДНК для создания портретов подозреваемых. В Китае власти составили базы данных этнических меньшинств на основе ДНК.

Расширение модели для точной работы в различных этнических группах потребует огромных новых наборов данных и поднимет еще больше этических вопросов. Однако разработчики готовятся к этому.

«Проверка Difface с помощью наборов данных из нескольких этнических групп и изучение того, необходимы ли дополнительные генетические локусы для определенных черт лица, станут ключевыми шагами», — подчеркивают разработчики. 

Результаты исследования были опубликованы в журнале Advanced Science

Источник: ZMEScience