ШІ-браузер Atlas OpenAI надав повний текст статті з MIT Technology Review, доступної лише для передплатників. Скриншот: Columbia Journalism Review
Журналісти виявили, що нові ШІ-браузери, на кшталт Atlas від OpenAI та Comet від Perplexity, з легкістю обходять пейволи — сторінки на сайтах, доступні читачам лише за платним доступом.
Для цього не потрібно використовувати жодних додаткових інструментів, достатньо просто попросити ШІ-браузер надати повний зміст статті. В експерименті Columbia Journalism Review, браузери Atlas та Comet на запит журналістів запросто представили ексклюзивний для передплатників текст на 9 тисяч слів від MIT Technology Review. Тоді як в стандартних інтерфейсах ChatGPT та Perplexity, чатботи відповіли, що не можуть отримати доступ, оскільки їхні сканери заблоковані там.
Річ у тім, що для сайтів Atlas та Comet не відрізняються від людини, яка використовує стандартний браузер Chrome. Звичайні автоматизовані системи, такі як краулери та парсери, проявляють себе за допомогою цифрового ідентифікатора, який повідомляє сайту, яке програмне забезпечення робить запит і яка його мета. Видавці можуть вибірково блокувати певні сканери за допомогою протоколу виключення ботів (Robots Exclusion Protocol).
“Оскільки браузери зі штучним інтелектом, такі як Comet та Atlas, відображаються в журналах сайту як звичайні сеанси Chrome, їх блокування також може перешкодити легітимним користувачам-людям отримати доступ до сайту. Це значно ускладнює для видавців виявлення, блокування або моніторинг цих агентів штучного інтелекту”, — пишуть автори дослідження.
У випадку MIT Technology Review, доступ вдалось отримати через те, що сайт використовує так званий “клієнтський пейвол” — текст завантажується на сторінку, але прихований за банером, який просить читача підписатися або зареєструватися. Хоча цей контент невидимий для людей, агенти штучного інтелекту, такі як Atlas та Comet, все ще можуть його прочитати. Водночас інші видання, на кшталт Wall Street Journal та Bloomberg, використовують “серверний пейвол”, який відображає повний текст лише після входу та оплати — в цьому випадку ШІ-браузери не зможуть отримати доступ до статті без авторизації.
Цікаво, що автори Columbia Journalism Review виявили, що Atlas уникає читання текстів тих медіакомпаній, які подали до суду на OpenAI. Comet, для порівняння, подібної поведінки не проявляв.
“Коли ми попросили Atlas підсумувати статтю з PCMag, материнська компанія якої Ziff Davis подала до суду на OpenAI за порушення авторських прав у квітні, агент створив зведений підсумок, спираючись на твіти про статтю, цитати в інших виданнях тощо. Експерт з онлайн-досліджень Хенк ван Есс вперше задокументував цю поведінку в липні, зазначивши, що агенти ШІ можуть провести зворотний інжиніринг статті, використовуючи “цифрові крихти”.
Подібне сталося, коли журналісти попросили Atlas підсумувати статтю з New York Times, яка також подає до суду на OpenAI. ШІ-браузер представив короткий виклад на основі повідомлень чотирьох альтернативних видань — The Guardian, Washington Post, Reuters та Associated Press, три з яких мають ліцензійні угоди з OpenAI.
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.