Новости Новости 22.06.2010 в 14:54 comment

В Google Docs добавили распознавание PDF и изображений

author avatar
https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

ITC.UA

автор

В Google Docs добавили новую возможность распознавания текста на некоторых типах документов. Функция работает с PDF файлами или обычными изображениями.

Пока при распознавании наблюдаются некоторые проблемы с точностью, а особенно с форматированием, в случае если на странице используются колонки, переносы и другие элементы оформления. Важно, что функция работает не только с английским языком. Точный список уточнить пока не удалось, но по крайней мере русский язык точно поддерживается.

В Google Docs добавили распознавание PDF и изображений

Функция распознавания находится на экране загрузки новых документов. Если отметить соответствующий пункт, то при открытии нового документа он будет загружен уже в редактируемом варианте.

Новая система скорее всего использует код проекта Ocropus, разрабатываемого с 2007 года и спонсируемого Google. На данный момент доступна альфа-версия Ocropus 0.4.3 для Linux и Mac OS X и в перспективе проект должен развиться в полноценное приложение для всех основных операционных систем, а сейчас  используется, к примеру, в Google Book Search.

Напомним, что ABBYY также запустила онлайновый сервис FineReader Online для распознавания документов, однако он работает c ограничением (50 страниц в день).

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: