На Flickr появится каталог из 14 млн исторических изображений

_77246573_c6bd70aa-3771-4e86-84a7-9e5b6a2fbe8e

По данным источника, американский академик Калев Литару создает поисковую базу данных из 14 млн исторических изображений. Изображения датируются с 1500 до 1922 года – период, на который не распространяются ограничения в связи с авторским правом.

_77246627_fa4891a6-ccf8-4c8f-9e32-f1a80cdcdf4c

Господин Литару уже загрузил 2,6 млн из запланированных 14 млн фотографий на один из самых известных сервисов хранения и обмена фотографиями Flickr, где их можно легко отыскать благодаря автоматически добавленным тегам. Фотографии и рисунки были взяты из 600 млн страниц библиотечных книг, отсканированных некоммерческой организацией Internet Archive. До сих пор получить доступ к этим изображениям было достаточно непросто. По словам Калева Литару в большинстве проектов по оцифровке старых книг все внимание отводилось тексту, тогда как фотографии попросту игнорировались.

«На протяжении многих лет все библиотеки оцифровывали свои книги, но конвертировали их в PDF-файлы или текстовые документы» – рассказывает Калев Литару о своем проекте BBC. – «Они сосредоточились на книгах как на наборе слов. Этот проект меняет такой подход».

Господин Литару начал работать над проектом, исследуя коммуникационные технологии в джорджтаунском университете в Вашингтоне, в рамках гранта от компании Yahoo, являющейся владельцем сервиса Flickr. Для достижения поставленной цели была разработана программа для автоматического извлечения иллюстраций из миллионов книг в процессе OCR-сканирования, которое сейчас осуществляет Internet Archive.

_77246571_1215fbe6-7fa4-4fce-ace3-38ad5e55aa16
Один из древнейших рисунков в коллекции, датированный 1502 годом.

Написанный господином Литару алгоритм не только позволил вернуться к ранним этапам сканирования и сохранить в формате JPEG те области страниц, которые были проигнорированы в процессе OCR-сканирования, но и добавить под каждым изображением подпись и часть текста, размещенного до и после изображения. После этого каждое изображение в формате JPEG с сопровождающим текстом из книги было размещено на новой странице Flickr, предоставляя общественности возможность исследовать огромный каталог древних иллюстраций с помощью встроенных инструментов поиска.

«Я думаю, что путешествие во времени через фотографии – одна из величайших возможностей, которой воспользуются пользователи» – сказал Калев Литару.

_77246629_335ddf11-c70c-44cb-905b-0f5b080b5421

Каталог исторических изображений, который состоит из разнообразных пейзажей, иллюстраций по кулинарному делу, старых карт и разнообразных фотографий, от животных и транспортных средств до скульптур и зданий в различных городах, позволяет посмотреть с как менялось восприятие тех или иных вещей на временном отрезке продолжительностью 500 лет. Достаточно ввести в поиск термин, к котором у пользователя имеет определенный интерес и можно посмотреть, как та или иная вещь выглядела раньше.

«Наберите в поиск, к примеру, слово телефон, и вы увидите, что все картинки – это изображение бизнесменов, преимущественно мужчин» – объясняет Калев Литару. – «Затем вы увидите, как он превращается в инструмент, соединяющий семьи».

_77246575_186eb67e-d5f6-47b2-ab39-0e65f8143d90

По словам Калева Литару, большинства иллюстраций, размещенных в книгах, нет ни в одной художественной галерее мира, а их оригиналы давно утеряны.

В рамках проекта оцифровано уже 600 млн страниц. Ожидается, что проект будет завершен в следующем году. Американский академик Калев Литару не скрывает своего желания связать его с известной интернет-энциклопедией Wikipedia.

Источник: BBC и Internet Archive


  • Kirill Dnepropetrovets-Ts

    В то время, как некоторые воюют, люди в цивилизованных странах сохраняют для потомков историю и занимаются полезной деятельностью. Контраст отнюдь не хилый.

    • Fletch

      Не хилый не слово!

    • Roman Dovzhenko

      Но чтобы войти в эту самую историю нужно убить побольше людей. Желательно новыми необычными способами.
      И Путин отчаянно пытается сделать это до того как помрёт.

  • Roman Dovzhenko

    А там есть карты на которых зафиксировано название Украина. И что её территория равна территории Russia?