06.09.2006 в 13:19 comment

Google предложила OCR-программу Tesseract с открытым кодом

author avatar
https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

ITC.UA

автор

Google выпустила версию с открытым кодом ПО для распознавания текста (optical Character Recognition, OCR) Tesseract.

Эта программа была создана и совершенствовалась компанией Hewlett Packard с 1985 по 1995 гг., причем в 1995 г. вошла в первую тройку OCR-пакетов, победивших в соревновании, организованном Университетом Лас-Вегаса (University of Las Vegas, UNLV).

После прекращения работ над Tesseract HP передала эту технологию в Information Science Research Institute при UNLV для продолжения развития проекта на общественных началах.

Специалисты компании Google приняли активное участие в исправлении ряда недоработок ПО и несколько месяцев назад решили, что Tesseract OCR приобрело достаточную стабильность для его повторного релиза.

В своем современном виде программа поддерживает только английский язык и не включает модуля анализа компоновки страницы. Не устранены проблемы, связанные с распознаванием малоконтрастных и цветных текстов, тем не менее, по заявлению Google, Tesseract обеспечивает наилучшую точность среди всех доступных средств OCR с открытым кодом.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: