Один автор при помощи программы-бота создал 2,7 млн статей для «Википедии»

Один автор при помощи программы-бота создал 2,7 млн статей для «Википедии»

Сверкер Йоханссон (Sverker Johansson) из Швеции создал для интернет-энциклопедии «Википедии» около 2,7 млн статей. Это составляет, примерно, 8,5% от общего количества статей.

Такого результата удалось достичь не личными усилиями, а при помощи компьютерной программы Lsjbot. Она анализирует большие базы данных и другие цифровые источники информации, а затем трансформирует информацию в материал в соответствии с требованиями для статей «Википедии». Благодаря такому подходу иногда за один день удается добавить до 10 тыс статей. Программа отлично справляется с большими объемами структурированных данных. Благодаря использованию бота, Сверкер Йоханссон стал автором большого количества статей о малоизвестных видах животных, включая бабочек и жуков. Также многие его материалы посвящены городам на Филиппинах. Треть созданных статей написаны на шведском языке, остальные материалы — на двух версиях филиппинского языка. Один из этих языков является родным для жены Сверкера Йоханссона.

На создание программы Lsjbot Сверкер Йоханссон потратил несколько месяцев. Но теперь она позволяет существенно экономить время при создании новых материалов. Сам автор полагает, что когда-то «Википедия» должна стать способной рассказать пользователям обо всем. И программа Lsjbot позволяет приблизить этот момент.

Однако у подхода, применяемого Сверкером Йоханссоном, имеются противники. Они полагают, что программа вытесняет творчество. Кроме того, высказывается мнение, что в погоне за количеством материалов было значительно ухудшено их качество. В результате становится практически невозможно пользоваться статьями, написанными ботом. Например, такие материалы содержат лишь более или менее корректную классифицированную информацию, но совершенно не передают описания животных или прочих важных данных. Сам Сверкер Йоханссон соглашается, что статьи, созданные при помощи Lsjbot, могут быть скучными. Тем не менее, они представляют собой ценность.

Следует отметить, что программа Lsjbot не всегда работает идеально. Как оказалось, она может обрабатывать далеко не все данные, а лишь информацию, написанную при помощи латинского алфавита. В результате, когда возникла необходимость найти фотографии птиц, бот обратился к русской версии Wikimedia Commons, после чего он начал выдавать ошибки. Позже эта проблема была устранена.

Источник: The Wall Street Journal