Новости Технологии 01.09.2014 в 15:21 comment

На Flickr появится каталог из 14 млн исторических изображений

author avatar
https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/vova-96x96.jpeg

Володимир Скрипін

Заместитель главного редактора, руководитель отдела новостей

Раздел Технологии выходит при поддержке Favbet Tech

_77246573_c6bd70aa-3771-4e86-84a7-9e5b6a2fbe8e

По данным источника, американский академик Калев Литару создает поисковую базу данных из 14 млн исторических изображений. Изображения датируются с 1500 до 1922 года – период, на который не распространяются ограничения в связи с авторским правом.

_77246627_fa4891a6-ccf8-4c8f-9e32-f1a80cdcdf4c

Господин Литару уже загрузил 2,6 млн из запланированных 14 млн фотографий на один из самых известных сервисов хранения и обмена фотографиями Flickr, где их можно легко отыскать благодаря автоматически добавленным тегам. Фотографии и рисунки были взяты из 600 млн страниц библиотечных книг, отсканированных некоммерческой организацией Internet Archive. До сих пор получить доступ к этим изображениям было достаточно непросто. По словам Калева Литару в большинстве проектов по оцифровке старых книг все внимание отводилось тексту, тогда как фотографии попросту игнорировались.

«На протяжении многих лет все библиотеки оцифровывали свои книги, но конвертировали их в PDF-файлы или текстовые документы» – рассказывает Калев Литару о своем проекте BBC. – «Они сосредоточились на книгах как на наборе слов. Этот проект меняет такой подход».

Господин Литару начал работать над проектом, исследуя коммуникационные технологии в джорджтаунском университете в Вашингтоне, в рамках гранта от компании Yahoo, являющейся владельцем сервиса Flickr. Для достижения поставленной цели была разработана программа для автоматического извлечения иллюстраций из миллионов книг в процессе OCR-сканирования, которое сейчас осуществляет Internet Archive.

Курс Розмовної англійської від Englishdom.
Після цього курсу ви зможете спілкуватись з іноземцями і цікаво розкажете про себе.
Приєднатися
_77246571_1215fbe6-7fa4-4fce-ace3-38ad5e55aa16
Один из древнейших рисунков в коллекции, датированный 1502 годом.

Написанный господином Литару алгоритм не только позволил вернуться к ранним этапам сканирования и сохранить в формате JPEG те области страниц, которые были проигнорированы в процессе OCR-сканирования, но и добавить под каждым изображением подпись и часть текста, размещенного до и после изображения. После этого каждое изображение в формате JPEG с сопровождающим текстом из книги было размещено на новой странице Flickr, предоставляя общественности возможность исследовать огромный каталог древних иллюстраций с помощью встроенных инструментов поиска.

«Я думаю, что путешествие во времени через фотографии – одна из величайших возможностей, которой воспользуются пользователи» — сказал Калев Литару.

_77246629_335ddf11-c70c-44cb-905b-0f5b080b5421

Каталог исторических изображений, который состоит из разнообразных пейзажей, иллюстраций по кулинарному делу, старых карт и разнообразных фотографий, от животных и транспортных средств до скульптур и зданий в различных городах, позволяет посмотреть с как менялось восприятие тех или иных вещей на временном отрезке продолжительностью 500 лет. Достаточно ввести в поиск термин, к котором у пользователя имеет определенный интерес и можно посмотреть, как та или иная вещь выглядела раньше.

«Наберите в поиск, к примеру, слово телефон, и вы увидите, что все картинки – это изображение бизнесменов, преимущественно мужчин» — объясняет Калев Литару. – «Затем вы увидите, как он превращается в инструмент, соединяющий семьи».

Курс Розмовної англійської від Englishdom.
Після цього курсу ви зможете спілкуватись з іноземцями і цікаво розкажете про себе.
Приєднатися

_77246575_186eb67e-d5f6-47b2-ab39-0e65f8143d90

По словам Калева Литару, большинства иллюстраций, размещенных в книгах, нет ни в одной художественной галерее мира, а их оригиналы давно утеряны.

В рамках проекта оцифровано уже 600 млн страниц. Ожидается, что проект будет завершен в следующем году. Американский академик Калев Литару не скрывает своего желания связать его с известной интернет-энциклопедией Wikipedia.

Источник: BBC и Internet Archive

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: