Новости Новости 22.06.2010 в 14:54 comment

В Google Docs добавили распознавание PDF и изображений

author avatar
https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

ITC.UA

автор

В Google Docs добавили новую возможность распознавания текста на некоторых типах документов. Функция работает с PDF файлами или обычными изображениями.

Пока при распознавании наблюдаются некоторые проблемы с точностью, а особенно с форматированием, в случае если на странице используются колонки, переносы и другие элементы оформления. Важно, что функция работает не только с английским языком. Точный список уточнить пока не удалось, но по крайней мере русский язык точно поддерживается.

В Google Docs добавили распознавание PDF и изображений

Функция распознавания находится на экране загрузки новых документов. Если отметить соответствующий пункт, то при открытии нового документа он будет загружен уже в редактируемом варианте.

Новая система скорее всего использует код проекта Ocropus, разрабатываемого с 2007 года и спонсируемого Google. На данный момент доступна альфа-версия Ocropus 0.4.3 для Linux и Mac OS X и в перспективе проект должен развиться в полноценное приложение для всех основных операционных систем, а сейчас  используется, к примеру, в Google Book Search.

Напомним, что ABBYY также запустила онлайновый сервис FineReader Online для распознавания документов, однако он работает c ограничением (50 страниц в день).


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: