Обзоры Обзоры 24.11.2003 в 22:00 comment

ABBYY FineReader 7.0: гений распознавания!

author avatar
https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

ITC.UA

автор


Новая версия самого популярного пакета для распознавания текста (который, заметим, вытеснив всех своих конкурентов, остался фактически в гордом одиночестве), FineReader 7.0, поставляется в двух изданиях — Corporate Edition и Professional Edition. Основное отличие — Professional-версия рассчитана на персональное использование, а Corporate — на работу в сети. Для этого в последнюю включены специальные средства поддержки сетевых функций и централизованного управления.


ABBYY FineReader 7.0 Professional Edition

Начнем, пожалуй, с самого главного. Улучшен механизм распознавания — декларируется 25%-ный прирост точности. Однако он достижим лишь в наиболее благоприятных для FineReader случаях. В остальном же количество ошибок уменьшилось в среднем на 10—15% (справедливости ради заметим, что такие данные получены не в результате длительных тестов, а путем анализа 12—15 отсканированных страниц разного содержания). Следует отметить, что повышение качества распознавания никак не сказалось на скорости работы пакета.

ABBYY FineReader 7.0 Professional Edition 
ABBYY FineReader 7.0: гений распознавания!
ABBYY FineReader 7.0: гений распознавания!
Цена — 697 грн
ABBYY FineReader 7.0: гений распознавания!
ABBYY FineReader 7.0: гений распознавания!ABBYY FineReader 7.0: гений распознавания!ABBYY FineReader 7.0: гений распознавания!ABBYY FineReader 7.0: гений распознавания!ABBYY FineReader 7.0: гений распознавания!

А вот качество обработки таблиц действительно возросло существенно — сложные таблицы с окрашенными ячейками и скрытыми разделителями теперь не являются для пакета серьезной проблемой — правда, для получения абсолютно достоверного результата многие процедуры по-прежнему необходимо выполнять вручную.

Список английских и немецких словарей был пополнен специальными модулями, содержащими распространенные юридические и медицинские термины, что призвано существенно улучшить качество распознавания текстов с такими словами.

Новая версия FineReader намного плодотворнее сотрудничает с Microsoft Word. Теперь FineReader вызывается прямо из текстового редактора с помощью отдельного макроса — при этом распознанный фрагмент будет помещен в документ Word в том месте, где находился курсор до вызова FineReader. Однако в полной мере оценить преимущества такой интеграции можно лишь при наличии Microsoft Word версии 2003. FineReader 7.0 поддерживает экспорт в формат MSWord XML — во время редактирования такого файла текущий текстовый фрагмент отображается в отдельной панели Zoom FineReader в том виде, в каком он существовал в исходном, нераспознанном документе. Таким образом, в MS Word XML наряду с текстовыми данными сохраняется еще и preview-изображение отсканированного оригинала.

Кроме того, последнее издание пакета от ABBYY содержит оптимизированные функции обработки PDF-файлов. Теперь, помимо растрирования (с помощью утилиты PDF2BMP) и дальнейшего распознавания обычными средствами, FineReader "научился", по мере возможности, находить текстовые фрагменты непосредственно в документе PDF и затем, сопоставляя результаты, обеспечивать распознавание с вероятностью почти 99%.

Онлайн-курс Frontend-разробник від Powercode academy.
Курс на якому ти напишеш свій чистий код на JavaScript, попрацюєш із різними видами верстки, а також адаптаціями проектів під будь-які екрани. .
Зарееструватися

Не остались без внимания и другие традиционные форматы — MSWord Doc и HTML. В настройках добавилась опция установки требуемого разрешения изображений. Для Doc увеличилось количество различных разделителей (постраничных, поблочных и т. п.), а при сохранении в HTML FineReader пытается придать файлу вид исходной верстки, разделив картинку со сложным текстовым обтеканием на несколько частей.

К обширному списку поддерживаемых форматов прибавился также еще один — Microsoft PowerPoint. Среди появившихся новых графических форматов следует отметить стремительно набирающий популярность JPEG 2000.

ABBYY FineReader 7.0: гений распознавания! Персональное издание FineReader (Professional) пополнилось некоторыми возможностями, ранее доступными лишь пользователям корпоративной версии. Среди них — модули распознавания штрихкодов, разбиения отсканированного изображения на несколько страниц, содержащих однотипные блоки (например, визитные карточки), а также поддержка индексации пакета распознанных документов и морфологического полнотекстового поиска.

Конечно, многие усовершенствования, например различные обновления пользовательского интерфейса или детальные настройки форматирования, остались, что называется, "за бортом" данного обзора по причине его ограниченного объема. Но те, кому понадобится более детальная информация, могут обратиться на сайт разработчиков www.abbyy.ru.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: