Xerox революционизирует текстовый поиск

Ученые научно-исследовательского центра корпорации Xerox, расположенного в Гренобле (Франция), создали принципиально новый механизм интеллектуального текстового поиска — FactSpotter. Разработка обеспечивает на порядок более высокий уровень релевантности результатов по сравнению с традиционными алгоритмами.

В отличие от большинства поисковых систем, которые ориентированы на механическое отслеживание в тексте символов, составляющих т.н. «ключевые слова» поиска, разработка Xerox использует новейшие достижения лингвистики для глубокого контекстного анализа как запроса пользователя, так и обрабатываемого документа. Данный механизм может работать практически с любым текстом, независимо от его формата и типа.

Например, FactSpotter способен отслеживать замену существительных местоимениями: если в документе ищется упоминание Анджелины Джоли, в числе результатов будут присутствовать фразы, в которых слово «она» используется вместо полного имени актрисы. Иными словами, благодаря использованию лингвистического анализа поиск ведется не по набору символов, но по смыслу поискового запроса.

FactSpotter дополнит растущий ассортимент услуг по организации документооборота, предоставляемых корпорацией Xerox. Наибольший интерес, по мнению разработчиков, новый поисковый механизм вызовет у потребителей, деятельность которых связана с обработкой больших объемов текстовой информации — в частности, предприятий финансовой сферы, юридических агентств, фармацевтических компаний и т.д.