Кінець епохи анонімності: ШІ легко ідентифікує людей за їхніми акаунтами в інтернеті

Олександр Федоткін

Кінець епохи анонімності: ШІ легко ідентифікує людей за їхніми акаунтами в інтернеті
У новому дослідженні науковці демонструють, що ШІ вже легко ідентифікує людей в інтернеті за їхніми акаунтами, що ставить під сумнів будь-яку анонімність у мережі.


Широко поширена думка, що встановити особу людини за її акаунтом можливо, однак це потребує значних зусиль та ресурсів, тому без крайньої потреби ніхто не буде цим займатись. Однак результати дослідження підтверджують, що LLM вже здатні робити це у великих масштабах і це відносно недорого.

Команда дослідників розробила автоматизовану систему, що імітує процес прийняття рішень людиною, яка проводить слідчі дії. Спочатку ШІ аналізує історію повідомлень типового користувача Reddit або Hacker News та вивчає неструктурований текст. Ця необроблена інформація, що включає коментарі, жарти, дані про освіту та непомітні, на перший погляд, особливості стилю викладення, перетворюється штучним інтелектом у математичний образ профілю людини. Потім ШІ шукає відповідні збіги серед мільйонів інших профілів в інтернеті та на окремих сайтах, як от LinkedIn.

Після виявлення збігів система оцінює аргументи на користь того, що кілька профілів належать одній людині. Далі ШІ присвоює прогнозованому збігу оцінку вірогідності. Якщо такої впевненості в нього не має, він нічого не вказує аби запобігти необґрунтованим припущенням.


Дослідники випробували власну систему на майже 1000 профілях у LinkedIn та перевірили, чи зможе вона порівняти їх з обліковими записами на Hacker News. Власники профілів були відомі дослідникам, які умисно видалили імена, посилання та інші очевидні фактори, які спрощують ідентифікацію.

Система на базі ШІ успішно пов’язувала облікові записи з точністю до 67% за еталонного показника 90%. Водночас інші методи без використання штучного інтелекту майже не досягали успіху. Система навіть порівнювала користувачів з різних спільнот Reddit, навіть якщо ті були активні під різними обліковими записами у різний час. Окрім цього дослідники встановили, що вартість ідентифікації особи з використанням ШІ коштує усього від $1 до $4.

“Практична непрозорість, яка довгий час захищала користувачів, що використовують псевдоніми… більше не зберігається. Псевдонім не забезпечує надійного захисту в інтернеті. Користувачі, які публікують повідомлення під постійними іменами, повинні виходити з того, що зловмисники можуть пов’язати їхні облікові записи з реальними особистостями або один з одним, і що ймовірність цього зростає з кожними опублікованими ними мікроданими”, — попереджають дослідники.

Результати вказують на те, що інструменти на базі ШІ для ідентифікації осіб в інтернеті надалі зможуть використовуватись правоохоронними органами та спеціалістами з кібербезпеки. Епоха анонімності в інтернеті добігає кінця, роблять висновок автори дослідження.

Раніше ми писали, що додатки Smart TV непомітно збирають веб-дані користувачів для навчання ШІ. Водночас сервіс ШІ знаходить користувачів YouTube за коментарями.

Результати дослідження опубліковані на сервері препринтів ArXiv

Джерело: TechXplore

