ABBYY FineReader вряд ли нуждается в особом представлении – это не только один из немногих доступных сегодня OCR-пакетов, но и практически единственный, обеспечивающий действительно качественную поддержку кириллицы. Тем не менее разработчики не почивают на лаврах, а постоянно находят новые способы совершенствования своего продукта.
Традиционно считается, что современные OCR-системы демонстрируют уверенное распознавание при использовании оригиналов с разрешением 300 dpi – большее не требуется, меньшее ставит под сомнение качество результата. Сейчас уже трудно вспомнить, откуда точно взялся такой критерий, но, вероятно, это был некий компромисс: с одной стороны, 300 dpi обеспечивали даже довольно старые сканеры, в том числе и рассчитанные на домашнее применение, с другой – не нужно было разрабатывать слишком уж хитроумные алгоритмы. Так или иначе, все современные OCR-системы уверенно справляются с текстом в таком разрешении, а основная конкуренция развернулась в области вспомогательных функций: распознавание штрихкодов, выделение гиперссылок, поддержки новых форматов, обеспечение полнотекстового поиска и пр.
Однако сканер – далеко не единственное устройство, предоставляющее текстовую информацию в графическом виде. Скажем, факс – весьма распространенное средство коммуникаций, но качество полученных с его помощью оригиналов оставляет желать лучшего. А в последнее время все больше пользователей хотят осуществлять ввод документов с помощью цифровой фотокамеры. В связи с этим у поставщиков OCR-систем появился новый ориентир – добиться лучшей работы своих продуктов с исходными материалами низкого качества, в частности с невысоким разрешением.
Указанные тенденции сполна проявились в FineReader 8.0. Отныне минимальное разрешение для уверенного распознавания – 200 dpi, новая версия программы обрабатывает такие оригиналы в среднем на 15% лучше, а факсы – на все 30% (эти показатели приводит сама ABBYY). Цифровым фотографиям вообще уделено особое внимание. Качество их распознавания повышено на 40%, причем допускается использование даже 2-мегапиксельных камер. Однако, как несложно подсчитать, снять страницу формата А4 (8,27×11,29 дюймов) с тем самым разрешением в 200 dpi позволяют 4-мегапиксельные аппараты, но и в этом случае результат будет зависеть от множества дополнительных факторов, в связи с чем значительная часть руководства по FineReader 8.0 посвящена именно описанию того, как с помощью фотокамеры подготовить наиболее удачные исходные материалы.
FineReader 8 очень неплохо справляется с цифровыми фотографиями, причем никакой специальной их подготовки не требуется |
Безусловно, съемку документов лучше производить в условиях хорошего, предпочтительно дневного освещения, применяя штатив и настроив баланс белого по цвету бумаги. Однако даже при соблюдении всех этих (и ряда других) условий фотографиям присущ ряд характерных недостатков: дисторсия (искривление изображения на краях кадра), неравномерная освещенность, цифровые шумы (особенно при использовании повышенной светочувствительности) – все это, естественно, приводит к более низкому качеству распознавания. Поэтому в FineReader 8.0 предусмотрен ряд дополнительных функций по улучшению оригиналов: исправление разрешения, выравнивание строк, обрезание изображения (в частности его краев, где концентрируется «мусор»), удаление шумов. Более того, во многих случаях программа сама способна догадаться, что имеет дело именно с фотографиями, и применить некоторые вспомогательные алгоритмы. Впрочем, все это требует дополнительного времени, поэтому при работе с небольшими документами иногда удобнее внести правки вручную.
Мы провели ряд тестов и самолично убедились, что во многих случаях цифровая камера действительно с успехом способна заменить сканер. В частности, при распознавании снимков страниц «Компьютерного Обозрения», выполненного 4-мегапиксельным аппаратом (причем в совершенно «полевых» условиях, т. е. без штатива и специального освещения), программа делала всего три-четыре ошибки, и сосредоточены они были в самых «проблемных» областях – колонтитулах, сносках. В ряде случаев качество даже удавалось повысить благодаря некоторым специальным мерам, например отказу от формата JPEG в пользу TIF/RAW.
Сценарии помогут пользователю избавиться от рутины |
Общее совершенствование алгоритмов распознавания также позволяет иногда существенно экономить время. Так, если оригиналы имеют довольно высокое качество и не содержат сложных элементов, можно воспользоваться новой функцией быстрого распознавания, которая ускоряет обработку в 2–2,5 раза. Во многих случаях, особенно когда речь идет о многостраничных документах, также удобно выполнять распознавание в фоновом режиме.
Если же стандартные инструменты и приемы не дают желаемого качества, весьма кстати придется предлагаемая FineReader процедура распознавания с обучением. Она также актуальна, если в документе используются вычурные шрифты, лигатуры или специфические для какой-либо предметной области символы. В таком случае сначала в специальном режиме производится распознавание нескольких страниц текста, в ходе чего (с участием пользователя) создаются эталоны вызывающих затруднение фрагментов. Затем накопленные таким образом «знания» используются при автоматической обработке остального массива текста, а сохранив комплект эталонов, его можно применять и в будущем.
FineReader традиционно был полиглотом, и сейчас в пакете поддерживается 179 языков, из них 36 снабжены соответствующими словарями. При необходимости теперь можно подключать собственные дополнительные словари, например созданные в Microsoft Word. Более того, FineReader позволяет даже формировать свои «языки», описав их алфавит из набора доступных символов, указав допустимые знаки препинания, специальные обозначения и прочие характеристики.
Для автоматизации процесса обработки больших массивов документов по одной схеме в новой версии FineReader предусмотрено специальное средство – стандартные и пользовательские сценарии. Наряду с обычными этапами обработки (получения и анализа изображения, распознавания текста и проверки результатов) они могут передавать данные во внешнее приложение или папку, сохранять в многостраничном документе, отправлять по электронной почте.
Дополнением к собственно FineReader является утилита Screenshot Reader, предназначенная для копирования любой части экрана и распознавания содержащегося в нем текста. Хотя на первый взгляд она не кажется особенно востребованной, в некоторых случаях ей, несомненно, найдется разумное применение. Скажем, с помощью Screenshot Reader можно легко извлечь текст из flash-презентации или оперативно распознать сообщение об ошибке и отправить его в службу технического сопровождения.
Полученные тексты допускается сохранять в нескольких новых форматах, в частности в LIT, используемом в Microsoft Reader. Внимание к владельцам КПК проявилось и в поддержке специальных тегов в PDF, благодаря которым документы автоматически переформатируются под конкретный размер экрана. Дополнительно создаваемые PDF-файлы можно защищать паролем либо шифровать (одним из трех способов). Специальный новый блок настроек для RTF/DOC/Word XML позволит максимально сохранить исходное оформление, кроме того, появилась возможность заполнения свойств (ключевые слова, автор и пр.) документов распространенных типов, что в дальнейшем поможет более эффективно использовать современные поисковые системы.
Наряду с персональной компания ABBYY предлагает и корпоративную версию FineReader 8. В нее, помимо описанных выше возможностей, включены специальные средства централизованного управления и поддержки сетевых функций. Основной интерес представляет новая утилита Hot Folder & Scheduling, которая автоматически осуществляет мониторинг локальных и удаленных папок и обработку обнаруженных в них документов в соответствии с составленным расписанием. Это не только исключает потребность в отдельном операторе, но и позволяет максимально эффективно задействовать доступные вычислительные ресурсы (скажем, назначив задание на ночное время).
Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.
Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.