«Лаборатория Касперского» запатентовала новую технологию защиты от спама

«Лаборатория Касперского» сообщила об успешном патентовании новой технологии в области борьбы со спамом. Технология, запатентованная в России, как сообщают в компании, обеспечивает быстроту и высокий уровень детектирования нежелательных сообщений в изображениях.

Современные системы фильтрации спама легко детектируют текстовый спам. Поэтому спамеры часто используют метод сокрытия текстов нежелательных сообщений в изображениях. Задача фильтрации графического спама значительно сложнее, чем текстового – в данном случае антиспам-система должна не только установить, является ли текст спамом, но и предварительно зафиксировать наличие самого текста в изображении.

Большинство методов выявления текста в изображениях основаны на машинном распознавании графических образов. Однако качественное машинное распознавание требует единообразия размеров, стилей и расположения считываемых символов. Данное ограничение используется спамерами, которые намеренно искажают и зашумливают изображения в целях затруднения и замедления процесса детектирования текстов.

Технология «Лаборатории Касперского» предназначена для эффективного обнаружения текстов и спама в растровых изображениях без необходимости машинного распознавания графических образов. Такой подход обеспечивает высокую скорость детектирования и позволяет находить тексты практически на любом языке.

Новая антиспам-технология «Лаборатории Касперского» разработана Евгением Смирновым. Выдача патента на нее одобрена Федеральной службой по интеллектуальной собственности, патентам и товарным знакам 13 января 2009 года.

В основе запатентованной технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Наличие специальных фильтров обеспечивает устойчивость системы к шумовым элементам и разбиению текста рамками и линиями, а использование особого способа выявления строк – к таким встречающимся в графическом спаме искажениям, как повороты текста и написание его волной.