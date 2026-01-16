В четверг Фонд Wikimedia Enterprise объявил о подписании платных лицензионных соглашений с Microsoft, Meta, Amazon, Perplexity и Mistral AI. Это расширяет взимание платы с крупных технологических компаний за использование контента Википедии для обучения моделей ИИ, которые лежат в основе ассистентов вроде Microsoft Copilot и ChatGPT.

Хотя ранее эти же компании без разрешения массово собирали данные из Wikipedia, новые соглашения означают, что большинство ведущих разработчиков ИИ теперь присоединились к программе Wikimedia Enterprise — коммерческой дочерней структуры фонда, которая продает доступ к API с 65 миллионами статей Wikipedia на более высоких скоростях и в больших объемах, чем бесплатные публичные API. Фонд не раскрыл финансовые условия сделок.

Новые партнеры присоединились к Google, который подписал соглашение с Wikimedia Enterprise еще в 2022 году, а также к меньшим компаниям, в частности Ecosia, Nomic, Pleias, ProRata и Reef Media. Полученные доходы помогают компенсировать инфраструктурные расходы неприбыльной организации, которая в противном случае полагается на небольшие публичные пожертвования, наблюдая, как ее контент становится базовыми учебными данными для моделей ИИ.

«Wikipedia является критически важной составляющей работы этих технологических компаний, и им нужно найти способ финансово ее поддерживать. Нам понадобилось некоторое время, чтобы понять, какой набор функций и возможностей стоит предложить, чтобы перевести эти компании с бесплатной платформы на коммерческую, но все наши партнеры из Big Tech четко осознают необходимость взять на себя обязательства по поддержке работы Wikipedia», — сказал президент Wikimedia Enterprise Лейн Бекер в комментарии Reuters.

Переход к платному лицензированию произошел после многих лет роста инфраструктурных расходов, вызванных тем, что компании из сферы ИИ массово собирали контент Википедии в промышленных масштабах. В апреле 2025 года фонд сообщил, что объем пропускной способности, использованной для загрузки мультимедийного контента, вырос на 50% по сравнению с январем 2024 года. При этом боты обеспечивали 65% самых дорогих запросов к базовой инфраструктуре, хотя составляли лишь 35% от общего количества просмотров страниц.

В октябре Фонд Викимедиа раскрыл, что после обновления систем обнаружения ботов человеческий трафик на Wikipedia снизился примерно на 8% в годовом измерении. Выяснилось, что значительная часть посещений, которые ранее считались человеческими, на самом деле была автоматизированными сборщиками данных, созданными для обхода детекции. Падение трафика грозит разрушить цикл обратной связи, который поддерживал Wikipedia в течение четверти века: читатели заходят на сайт, часть из них становится редакторами или донорами, и контент постепенно улучшается.

Сейчас же многие чат-боты и поисковые сводки отвечают на вопросы, используя контент Wikipedia, не приводя пользователей непосредственно на сайт. Основатель Wikipedia Джимми Уэйлс в комментарии Associated Press заявил, что он в целом приветствует обучение моделей ИИ на данных Wikipedia.

«Лично я очень рад, что модели ИИ обучаются на данных Wikipedia, потому что они курируются людьми. Я бы не очень хотел пользоваться ИИ, который учился только на X — это был бы, знаете, очень злой ИИ. Но есть предел бесплатного доступа. Компаниям, вероятно, стоит скинуться и заплатить свою справедливую долю расходов, которые на нас возлагают», — сказал Уэйлс.

Тем временем собственные эксперименты фонда с генеративным ИИ столкнулись с сопротивлением со стороны волонтеров-редакторов, которые поддерживают работу сайта. В июне Wikipedia приостановила пилотную программу по созданию ИИ-сгенерированных резюме статей после того, как редакторы назвали ее «ужасной идеей» и предупредили, что она может подорвать доверие к платформе.

Источник: Arstecnica.com