Рубрики Обзоры

FineReader 6.0: OCR вне конкуренции

Опубликовал
ITC.UA



Пожалуй, не найти человека, знакомого с компьютерами, которому не была бы известна марка FineReader. На сегодня эта система распознавания текста заслуженно считается одной из лучших в мире, а в нашей стране, где важнее всего качественный ввод кириллицы, она и вовсе не имеет конкурентов.

FineReader 6.0 Professional

Освоение версии 6.0 Professional, демо-образец которой можно найти на "ДПК-CD",
не вызовет никаких сложностей у тех, кто уже видел в работе предыдущие релизы
программы, — удачная структура пользовательского интерфейса осталась неизменной,
только пиктограммы на кнопках перерисованы в современном стиле. Рабочее пространство
разбито на четыре панели: последовательности отсканированных страниц ("пакета"),
изображения текущей страницы, просмотра ее фрагмента в увеличенном масштабе и
распознанного текста. Над ними расположена панель инструментов с крупными кнопками
для выполнения самых распространенных операций сканирования и обработки текста,
а еще выше — стандартная линейка с остальными органами управления. В отличие
от предыдущей версии FineReader, здесь мы можем произвольно выбрать состав кнопок,
которые должны на ней находиться.
Онлайн-курс "QA Automation" від robot_dreams.
Це 70% практики, 30% теорії та проєкт у портфоліо.Навчіться запускати перевірку сотень опцій одночасно, натиснувши лише одну кнопку.
Детальніше про курс
FineReader 6.0 Professional
Цена — 697 грн
Разработчик ABBYY
Web-сайт www.abbyy.com.ua

Продукт предоставлен компанией ABBYY, www.abbyy.com.ua
+ Отличное качество распознавания;
большой выбор языков; удобный интерфейс; возможность отображения макета документа;
корректная работа с PDF
Нет
! Лучшая OCR-программа для работы с кирилличными
текстами

Распознанный текст отображается с сохранением форматирования. Таким образом, отпадает
необходимость в загрузке документа, нуждающегося лишь в минимальной правке и распечатке,
в "большой" текстовый редактор.

Однако самые важные изменения произошли "внутри" программы и касаются алгоритмов распознавания текста. В первую очередь FineReader 6.0 обзавелся собственными средствами определения яркости и контрастности отсканированного изображения. Ранее эти параметры задавались пользователем или автоматикой TWAIN-модуля и были едиными для всей страницы. Теперь же рекомендуется вводить в ПК страницу в цвете или в оттенках серого, а FineReader самостоятельно подберет для отдельных ее участков значения яркости и контрастности и преобразует картинку в монохромный режим так, чтобы литеры текста были различимы максимально четко. В результате существенно повышается качество распознавания документов, имеющих дефектные области с недостаточной яркостью или контрастностью (факсы, ксерокопии, тексты, отпечатанные через копирку), или фоновых рисунков. Последние, в частности, представляли собой практически неразрешимую проблему для OCR-программ.

FineReader 6.0 значительно лучше, чем предыдущая версия, работает с форматом PDF — пожалуй, оптимальным на сегодняшний день для хранения электронных архивов иллюстрированных документов. Во-первых, он умеет считывать тексты из таких файлов (программами, обычно имеющимися на домашнем ПК, этого сделать нельзя), хотя и весьма любопытным способом: страница преобразуется в формат BMP, а затем распознается как обычный графический файл. Во-вторых (и это, наверное, даже важнее), система корректно сохраняет документы с кириллицей, даже если не были специально установлены и сконфигурированы шрифты Type 1. Так что смело доставайте подшивки старых журналов и оцифровывайте их в формат PDF — теперь это проще простого, а на дисках CD-R бесценные архивы займут куда меньше места, чем в кладовке.


FineReader 6.0 "знает" 177 языков (включая несколько синтетических,
например эсперанто, а также языки программирования) и может "читать"
тексты на любом из них. Нет необходимости инсталлировать на ПК всю эту громадину:
при установке пользователь волен отметить любое количество языков, а впоследствии
добавить недостающие.

Хотим предупредить читателя, что для алгоритма подбора яркости нужен более мощный компьютер для того, чтобы обеспечить такой же темп распознавания, как у предыдущих версий FineReader. Однако данную проблему нельзя назвать критичной, так как вычислительных способностей среднего современного ПК хватит для этого с лихвой. Важнее, пожалуй, другое: для FineReader 6.0 лучше сканировать не в монохромном режиме, а в оттенках серого, а это предъявляет более жесткие требования к производительности сканера. При его выборе желательно ориентироваться на быстрые модели, по возможности снабженные интерфейсом USB 2.0 или FireWire.

Disqus Comments Loading...