Обзоры
ABBYY FineReader 7.0: гений распознавания!
0

ABBYY FineReader 7.0: гений распознавания!


Новая версия самого популярного пакета для распознавания текста (который, заметим, вытеснив всех своих конкурентов, остался фактически в гордом одиночестве), FineReader 7.0, поставляется в двух изданиях — Corporate Edition и Professional Edition. Основное отличие — Professional-версия рассчитана на персональное использование, а Corporate — на работу в сети. Для этого в последнюю включены специальные средства поддержки сетевых функций и централизованного управления.


ABBYY FineReader 7.0 Professional Edition

Начнем, пожалуй, с самого главного. Улучшен механизм распознавания — декларируется 25%-ный прирост точности. Однако он достижим лишь в наиболее благоприятных для FineReader случаях. В остальном же количество ошибок уменьшилось в среднем на 10—15% (справедливости ради заметим, что такие данные получены не в результате длительных тестов, а путем анализа 12—15 отсканированных страниц разного содержания). Следует отметить, что повышение качества распознавания никак не сказалось на скорости работы пакета.

ABBYY FineReader 7.0 Professional Edition 
Цена — 697 грн

А вот качество обработки таблиц действительно возросло существенно — сложные таблицы с окрашенными ячейками и скрытыми разделителями теперь не являются для пакета серьезной проблемой — правда, для получения абсолютно достоверного результата многие процедуры по-прежнему необходимо выполнять вручную.

Список английских и немецких словарей был пополнен специальными модулями, содержащими распространенные юридические и медицинские термины, что призвано существенно улучшить качество распознавания текстов с такими словами.

Новая версия FineReader намного плодотворнее сотрудничает с Microsoft Word. Теперь FineReader вызывается прямо из текстового редактора с помощью отдельного макроса — при этом распознанный фрагмент будет помещен в документ Word в том месте, где находился курсор до вызова FineReader. Однако в полной мере оценить преимущества такой интеграции можно лишь при наличии Microsoft Word версии 2003. FineReader 7.0 поддерживает экспорт в формат MSWord XML — во время редактирования такого файла текущий текстовый фрагмент отображается в отдельной панели Zoom FineReader в том виде, в каком он существовал в исходном, нераспознанном документе. Таким образом, в MS Word XML наряду с текстовыми данными сохраняется еще и preview-изображение отсканированного оригинала.

Кроме того, последнее издание пакета от ABBYY содержит оптимизированные функции обработки PDF-файлов. Теперь, помимо растрирования (с помощью утилиты PDF2BMP) и дальнейшего распознавания обычными средствами, FineReader "научился", по мере возможности, находить текстовые фрагменты непосредственно в документе PDF и затем, сопоставляя результаты, обеспечивать распознавание с вероятностью почти 99%.

Не остались без внимания и другие традиционные форматы — MSWord Doc и HTML. В настройках добавилась опция установки требуемого разрешения изображений. Для Doc увеличилось количество различных разделителей (постраничных, поблочных и т. п.), а при сохранении в HTML FineReader пытается придать файлу вид исходной верстки, разделив картинку со сложным текстовым обтеканием на несколько частей.

К обширному списку поддерживаемых форматов прибавился также еще один — Microsoft PowerPoint. Среди появившихся новых графических форматов следует отметить стремительно набирающий популярность JPEG 2000.

Персональное издание FineReader (Professional) пополнилось некоторыми возможностями, ранее доступными лишь пользователям корпоративной версии. Среди них — модули распознавания штрихкодов, разбиения отсканированного изображения на несколько страниц, содержащих однотипные блоки (например, визитные карточки), а также поддержка индексации пакета распознанных документов и морфологического полнотекстового поиска.

Конечно, многие усовершенствования, например различные обновления пользовательского интерфейса или детальные настройки форматирования, остались, что называется, "за бортом" данного обзора по причине его ограниченного объема. Но те, кому понадобится более детальная информация, могут обратиться на сайт разработчиков www.abbyy.ru.


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: