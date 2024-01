Разработчик ChatGPT пытается привлечь медиа к подписанию лицензионных соглашений, которые упростят обучение ИИ и помогут избежать проблем с авторским правом.

По данным The Information, OpenAI предлагает от $1 до $5 млн в год за лицензирование защищенных авторским правом новостных статей для обучения моделей ИИ. Другой отчет сообщал ранее, что Apple готова платить медиакомпаниями по меньшей мере $50 млн за «многолетнее» использование подобных материалов.

Между тем цифры OpenAI несколько схожи с другими лицензионными соглашениями, не связанными с искусственным интеллектом. Meta, при запуске вкладки «Новости» в Facebook (которую недавно убрала в Европе), якобы предлагала до $3 млн в год за лицензирование новостей, заголовков и предварительных просмотров.

Неизвестно, достигала ли общая цифра таких показателей, как, например, у Google, которая в 2020 году объявила, что инвестирует $1 млрд в партнерство с новостными организациями. Под давлением нового закона компания также недавно согласилась платить канадским издателям в общей сложности $100 миллионов долларов в год в обмен на ссылки на их статьи.

Современные большие языковые модели, насколько сейчас известно, в большинстве своем учатся на информации, взятой из интернета. Цены на наборы данных разнятся, но есть и бесплатные, например LAION, которые использует Stable Diffusion (правда, его временно изъяли из-за наличия материалов с сексуальным насилием над детьми).

Разработчики ИИ также используют веб-сканеры, собирающие информацию для обучения из интернета, и нанимают людей для ее проверки и обозначения (а это часто достаточно высокие затраты). В то же время некоторые медиа, такие как The New York Times и материнская компания The Verge, Vox Media, заблокировали доступ к данным GPT-сканеру OpenAI.

С другой стороны, несколько организаций утверждают, что обучение на их данных является нарушением авторских прав. The New York Times, среди прочего, подала в суд на OpenAI и Microsoft, утверждая, что ChatGPT и Microsoft Copilot могут генерировать ответы, почти дословно цитирующие их работы.

Тем временем Axel Springer (материнская компания Politico и Business Insider) и The Associated Press уже заключили соглашения с OpenAI по лицензированию статей для обучения таких моделей, как GPT-4, и разработке технологий для сбора новостей.