|
Распознанный текст отображается с сохранением форматирования. Таким образом, отпадает
необходимость в загрузке документа, нуждающегося лишь в минимальной правке и распечатке,
в "большой" текстовый редактор.
Однако самые важные изменения произошли "внутри" программы и касаются алгоритмов распознавания текста. В первую очередь FineReader 6.0 обзавелся собственными средствами определения яркости и контрастности отсканированного изображения. Ранее эти параметры задавались пользователем или автоматикой TWAIN-модуля и были едиными для всей страницы. Теперь же рекомендуется вводить в ПК страницу в цвете или в оттенках серого, а FineReader самостоятельно подберет для отдельных ее участков значения яркости и контрастности и преобразует картинку в монохромный режим так, чтобы литеры текста были различимы максимально четко. В результате существенно повышается качество распознавания документов, имеющих дефектные области с недостаточной яркостью или контрастностью (факсы, ксерокопии, тексты, отпечатанные через копирку), или фоновых рисунков. Последние, в частности, представляли собой практически неразрешимую проблему для OCR-программ.
FineReader 6.0 значительно лучше, чем предыдущая версия, работает с форматом PDF — пожалуй, оптимальным на сегодняшний день для хранения электронных архивов иллюстрированных документов. Во-первых, он умеет считывать тексты из таких файлов (программами, обычно имеющимися на домашнем ПК, этого сделать нельзя), хотя и весьма любопытным способом: страница преобразуется в формат BMP, а затем распознается как обычный графический файл. Во-вторых (и это, наверное, даже важнее), система корректно сохраняет документы с кириллицей, даже если не были специально установлены и сконфигурированы шрифты Type 1. Так что смело доставайте подшивки старых журналов и оцифровывайте их в формат PDF — теперь это проще простого, а на дисках CD-R бесценные архивы займут куда меньше места, чем в кладовке.
FineReader 6.0 "знает" 177 языков (включая несколько синтетических,
например эсперанто, а также языки программирования) и может "читать"
тексты на любом из них. Нет необходимости инсталлировать на ПК всю эту громадину:
при установке пользователь волен отметить любое количество языков, а впоследствии
добавить недостающие.
Хотим предупредить читателя, что для алгоритма подбора яркости нужен более мощный компьютер для того, чтобы обеспечить такой же темп распознавания, как у предыдущих версий FineReader. Однако данную проблему нельзя назвать критичной, так как вычислительных способностей среднего современного ПК хватит для этого с лихвой. Важнее, пожалуй, другое: для FineReader 6.0 лучше сканировать не в монохромном режиме, а в оттенках серого, а это предъявляет более жесткие требования к производительности сканера. При его выборе желательно ориентироваться на быстрые модели, по возможности снабженные интерфейсом USB 2.0 или FireWire.