Новости ИИ 03.11.2025 comment views icon

ИИ-браузеры обходят пейволлы на сайтах без вспомогательных инструментов

author avatar

Катерина Даньшина

Редактор новостей

ШІ-браузери обходять пейволи на сайтах без жодних допоміжних інструментів

Журналисты обнаружили, что новые ИИ-браузеры, вроде Atlas от OpenAI и Comet от Perplexity, с легкостью обходят пейволлы — страницы на сайтах, доступные читателям только по платному доступу.

Для этого не нужно использовать никаких дополнительных инструментов, достаточно просто попросить ИИ-браузер предоставить полное содержание статьи. В эксперименте Columbia Journalism Review, браузеры Atlas и Comet на запрос журналистов запросто представили эксклюзивный для подписчиков текст на 9 тысяч слов от MIT Technology Review. Тогда как в стандартных интерфейсах ChatGPT и Perplexity, чат-боты ответили, что не могут получить доступ, поскольку их сканеры заблокированы там.

Дело в том, что для сайтов Atlas и Comet не отличаются от человека, который использует стандартный браузер Chrome. Обычные автоматизированные системы, такие как краулеры и парсеры, проявляют себя с помощью цифрового идентификатора, который сообщает сайту, какое программное обеспечение делает запрос и какова его цель. Издатели могут выборочно блокировать определенные сканеры с помощью протокола исключения ботов (Robots Exclusion Protocol).

«Поскольку браузеры с искусственным интеллектом, такие как Comet и Atlas, отображаются в журналах сайта как обычные сеансы Chrome, их блокировка также может помешать легитимным пользователям-людям получить доступ к сайту. Это значительно усложняет для издателей обнаружение, блокирование или мониторинг этих агентов искусственного интеллекта», — пишут авторы исследования.

В случае MIT Technology Review, доступ удалось получить из-за того, что сайт использует так называемый «клиентский пейволл» — текст загружается на страницу, но скрыт за баннером, который просит читателя подписаться или зарегистрироваться. Хотя этот контент невидим для людей, агенты искусственного интеллекта, такие как Atlas и Comet, все еще могут его прочитать. В то же время другие издания, такие как Wall Street Journal и Bloomberg, используют «серверный пейволл», который отображает полный текст только после входа и оплаты — в этом случае ИИ-браузеры не смогут получить доступ к статье без авторизации.

ШІ-браузери обходять пейволи на сайтах без жодних допоміжних інструментів
Atlas представил заблокированную статью PCMag, собрав информацию из трех разных источников — владелец сайта ранее подал в суд на OpenAI. Скриншот: Columbia Journalism Review

Интересно, что авторы Columbia Journalism Review обнаружили, что Atlas избегает чтения текстов тех медиакомпаний, которые подали в суд на OpenAI. Comet, для сравнения, подобного поведения не проявлял.

«Когда мы попросили Atlas подытожить статью из PCMag, материнская компания которой Ziff Davis подала в суд на OpenAI за нарушение авторских прав в апреле, агент создал сводный итог, опираясь на твиты о статье, цитаты в других изданиях и тому подобное. Эксперт по онлайн-исследованиям Хэнк ван Эсс впервые задокументировал это поведение в июле, отметив, что агенты ИИ могут провести обратный инжиниринг статьи, используя «цифровые крошки».

ШІ-браузери обходять пейволи на сайтах без жодних допоміжних інструментів
Atlas обходит тексты New York Times и взамен генерирует контент по теме из других изданий. Газета также ранее подала в суд на OpenAI. Скриншот: Columbia Journalism Review

Подобное произошло, когда журналисты попросили Atlas подытожить статью из New York Times, которая также подает в суд на OpenAI. ИИ-браузер представил краткое изложение на основе сообщений четырех альтернативных изданий — The Guardian, Washington Post, Reuters и Associated Press, три из которых имеют лицензионные соглашения с OpenAI.

Пошук на базі штучного інтелекту обирає маловідомі джерела замість популярних, — дослідження

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: