Обзоры Обзоры 19.06.2009 в 08:00 comment

Что такое спам и чем он грозит?

author avatar
https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://secure.gravatar.com/avatar/2f8d57cddfeb455ba418faa11ee01bb0?s=96&r=g&d=https://itc.ua/wp-content/uploads/2023/06/no-avatar.png *** https://itc.ua/wp-content/themes/ITC_6.0/images/no-avatar.svg

ITC.UA

автор

Если вы когда-либо работали с электронной почтой, вам знакомо такое неприятное явление, как спам – массовая рассылка рекламных сообщений, проводящаяся без согласия получателя. Обычно она осуществляется не централизованно, с одного сервера, а с помощью так называемой спамерской сети, одновременно со множества компьютеров, подключенных к Интернету. Причем владельцу подобного ПК совершенно необязательно знать, что его рабочая станция является распространителем спама. Многие пользователи не придают нежелательной почте особого значения: подумаешь, пришло рекламное письмо, удаляем – и готово.

Что такое спам и чем он грозит?
Веб-интерфейс Gmail. С помощью кнопки Report Spam можно добавить письмо в базу антиспам-фильтра, одновременно переместив его в специальную папку

Однако не все так просто, как кажется. Во-первых, подобные письма часто содержат вирусы (обычно это так называемые боты, которые включают ваш компьютер в существующую спамерскую сеть, что, в свою очередь, может привести к его попаданию в черный список). Во-вторых, спам-рассылки генерируют огромный трафик, создавая таким образом весьма серьезную нагрузку на сетевые ресурсы. Казалось бы, размер одного письма невелик, однако представьте, что подобные послания рассылаются миллионами экземпляров, а это уже серьезно тормозит работу Интернета и вынуждает оплачивать лишний трафик, особенно если ваш компьютер является ботом в спамерской сети. В-третьих, в спам-рассылках часто встречаются мошеннические письма. Среди них выделяют два самых распространенных типа – «нигерийские письма» и фишинг. Первый так назван по причине большого распространения в Нигерии и других государствах африканского континента. Обычно в этих письмах адресата просят помочь в осуществлении многомиллионной операции, например получении наследства от богатого дядюшки, ссылаясь на различные трудности в родной стране. От вас же требуется всего ничего – дать небольшую взятку чиновнику или открыть счет в банке и положить на него определенную сумму и тому подобные вещи. Разумеется, в любом случае обещанных денег жертва не увидит, поскольку их попросту нет. Название второго типа мошенничества – фишинг – произошло от английского fishing, т. е. «рыбалка». Его цель – выманить у пользователей конфиденциальную информацию о банковских счетах, номерах кредитных карт, паролях и т. д. Работает это следующим образом: вам приходит письмо якобы от администрации банка с просьбой в ближайшее время подтвердить свои данные, иначе ваш счет может быть заблокирован. Также в нем приводится адрес ресурса, где нужно заполнить некую онлайн-форму, в которой, среди прочих, есть и поля, необходимые мошенникам. Его оформление часто бывает выполнено в стиле реального сайта вашего банка, а адрес (название домена) может отличаться всего одной-двумя буквами. Так что при получении подобной корреспонденции следует быть предельно внимательным.

Базы адресов и как туда не попасть

Что такое спам и чем он грозит?
Настройки антиспам-модуля в популярном почтовике Thunderbird

Понятное дело, чтобы отправить письмо, спамер должен знать адрес вашей электронной почты. Однако это не такая уж и сложная задача, как кажется. Основной способ – использование так называемых краулеров (интернет-ботов), наподобие тех, что применяются поисковыми системами. Они автоматически просматривают веб-страницы, переходя по встречающимся на них ссылкам, и ищут находящиеся в тексте адреса. А поскольку очень многие посещают различные блоги, форумы или же просто имеют домашние странички, где указывают свой e-mail в открытом виде, то их адрес с большой вероятностью попадет в спамерскую базу, которая к тому же может быть впоследствии несколько раз перепродана. В результате вы будете все чаще и чаще получать ценные предложения обрести наследство в Нигерии, купить оптом таблетки на все случаи жизни, посетить очень нужные семинары «Гербалайф», увеличить пенис и скачать все порно из Интернета. Чтобы этого не произошло, существуют маленькие хитрости. Во-первых, не всегда обязательно указывать свой основной адрес, если вам, к примеру, необходимо получить на него лишь пару писем: можно создать почтовый ящик на бесплатном сервисе, благо их сейчас хватает, или же воспользоваться временным почтовым ящиком, коих тоже предостаточно. Если же вам позарез нужно оставить именно свой основной адрес, его легко зашифровать. Как правило, краулеры ищут в текстах веб-страниц конструкции типа [email protected], и если его немного изменить (например, на myname(а)mydomain.com), то есть вероятность, что бот его пропустит. Для надежности можно попробовать более существенно переделать адрес, чтобы в результате получить нечто наподобие myname[песик]mydomain[тчк]com. Человек без труда «расшифрует» e-mail, а вот не слишком умный бот – вряд ли. Если же очень хочется, чтобы адрес все-таки выглядел правильно, но при этом не был распознан ботом, можно воспользоваться заменой текста с e-mail на рисунок с ним же, однако здесь есть небольшое неудобство – адрес нельзя будет скопировать в буфер обмена и придется вводить вручную. В принципе несложный JavaScript способен решить и такую проблему, однако углубляться в эту тему мы не станем, к тому же существует множество сервисов, помогающих создавать как картинки с адресом, так и «безопасные ссылки» на них. Однако иногда спамерам вовсе не нужно знать ваш e-mail: письма просто рассылаются по автоматически сгенерированным адресам популярных почтовых служб (например, [имя]@gmail.com) или крупных компаний ([имя]@microsoft.com). В этом случае [имя] является сгенерированным набором символов, одним из которых может оказаться и реальный адрес. И еще – многие спамерские сети будут очень рады получить от вас ответ типа «отстаньте от меня наконец…», тогда адрес пометят как «активный» и поток спама с большой вероятностью сильно увеличится, поэтому писать спамерам не стоит.

Как избежать спамерских рассылок

Что такое спам и чем он грозит?
Веб-интерфейс для настроек фильтра Байеса, реализованный в виде дополнения к почтовому клиенту

Перво-наперво не следует оставлять свой адрес электронной почты на различного рода публичных ресурсах или хотя бы пользоваться советами из предыдущего раздела. Если уж на ваш адрес начала приходить нежелательная корреспонденция, то на помощь придут спам-фильтры. Это программы, или же модули, входящие в состав почтовых клиентов, которые по тем или иным признакам выявляют спамерские письма и поступают с ними согласно заданным правилам. Для определения «спам/не спам» используются три основных способа. Самый распространенный – это анализ содержимого письма и сравнение его с известным спамом. Разумеется, для успешной работы такого фильтра нужно иметь заранее собранную коллекцию спамерского «творчества», и чем эта коллекция больше, тем лучше, эффективнее будет работать фильтр. Подобная система применяется популярной службой Gmail, которая ежедневно обрабатывает миллионы различных сообщений, и каждый раз, когда пользователь нажимает кнопку Пожаловаться на спам, нежелательное послание попадает в базу фильтра. Учитывая огромную клиентскую базу Gmail, недостатка в «обучающих материалах» она не испытывает. Следующий по популярности способ – анализ IP-адреса компьютера, с которого получено письмо, и сравнение его с черным списком. Информацию об этом можно получить через службу DNS (Domain Name Service), отсюда и название подобных списков – DNSBL (DNS Black List). К сожалению, данный метод не особо эффективен, так как спамеры находят новые серверы для своих целей быстрее, чем их успевают заносить в черные списки. Кроме черных, существуют еще и так называемые серые списки. Они составляются на основе анализа «поведения» ПО, предназначенного для рассылки спама, поскольку поведение почтовых серверов отличается от такового у спам-серверов (к примеру, подобные программы не отправляют повторно сообщение при возникновении ошибки). Обычно все ранее неизвестные SMTP-серверы считаются серыми. Почта с них не принимается, но и не отклоняется окончательно – им возвращается код временной ошибки. В случае если отправитель повторяет попытку через определенный период, сервер вносится в белый список. Таким образом, нормальные письма не теряются, а лишь доставляются с некоторой задержкой. Этот метод в настоящее время достаточно эффективен, причем риск потерять важную почту минимален. Однако его тоже нельзя назвать безупречным. Третий способ отсеивания спама заключается в получении подтверждений от отправителя. То есть по приходу письма с определенного адреса в ответ высылается запрос с просьбой подтвердить отправку. Затем, если сервер получает подтверждение, адрес заносится в белый список и в дальнейшем не проверяется. Основной недостаток данного способа заключается в невозможности работать полностью автоматически, без участия человека, к тому же он резко снижает оперативность доставки писем и создает определенные неудобства отправителям. Кроме вышеописанных основных методов, есть множество других: отказ в приеме корреспонденции с неправильным обратным адресом (письма из несуществующих доменов), анализ заголовков письма, системы определения признаков массовости сообщения и прочие. К сожалению, на данный момент нет программ, которые бы позволяли фильтровать спам со 100%-ной точностью.

И напоследок

Хотя электронная почта в настоящий момент является основным источником спама, в последнее время все большую популярность приобретают рекламные рассылки с помощью систем обмена мгновенными сообщениями, в первую очередь ICQ, а также рекламные сообщения на различных форумах и блогах. Возможно, вскоре мы подробнее расскажем и об этом виде недобросовестной рекламы и как с ним бороться.

Происхождение термина СПАМ

Само название «спам» (англ. SPAM) произошло от мясных консервов компании Hormel Foods «SPiced hAM» («острая ветчина») – острого колбасного фарша из свинины. По одной из версий, после Второй мировой войны остались огромные запасы таких консервов, предназначенных для американских солдат. Чтобы сбыть свою продукцию не первой свежести, фирма Hormel Foods провела первую в своем роде рекламную кампанию. Слово SPAM было повсюду: на витринах магазинов, автобусах и трамваях, фасадах домов и газетных страницах. Реклама консервов SPAM непрерывно транслировалась по радио. В общем, от нее не было возможности скрыться – она везде бросалась в глаза и звучала из всех приемников. По другой версии, термин «спам» ведет свое происхождение от старого (1972 года) скетча английской комик-группы Monty Python, в котором посетители ресторанчика при попытке сделать заказ вынуждены слушать хор викингов, воспевающий эти мясные консервы.

Фильтр Байеса

Английский математик Томас Байес жил в XVIII веке и понятия не имел об электронной почте, однако он сформулировал одну из основополагающих в элементарной теории вероятности теорему, которая и используется в наиболее эффективном алгоритме анализа содержимого письма. Формула, описывающая теорему, довольно сложна, но ее суть заключается в том, что вероятность события может быть довольно точно вычислена, если собрана статистика его совершения в прошлом. То есть если из 10 писем 8 содержали фразу «продам помидоры оптом» и являлись спамом, то и следующее с этими словами с большой долей вероятности окажется таковым. Но как оценить эту долю? Для начала нам надо иметь набор «плохих» писем и «хороших». Затем проанализировать их и выяснить, какие слова и словосочетания попадаются в «хороших» письмах и насколько часто, аналогично поступив со спамом. И в тех и в других примерно с одинаковой частотой встречаются общеупотребительные слова, наличие которых ни о чем нам не говорит. Присвоим им нейтральную оценку «уровня спама», например 0,5. Далее мы видим, что фраза «продам помидоры оптом» была замечена в 8 письмах из 10, и присваиваем ей оценку 0,8, а фраза «Привет, дружище» – в 9 из 10 хороших писем и 1 раз в спаме, значит, ее оценка 0,1. Затем с помощью специальной формулы вычисляется суммарный рейтинг каждого нового письма, и на основе пользовательских настроек отсекается поток писем, оценка которых превышает заданную величину, например 0,9. На сегодняшний день фильтрация спама байесовскими фильтрами выглядит наиболее привлекательной по сравнению с другими имеющимися методами. В частности, они включены в такие популярные почтовые клиенты, как The Bat! и Thunderbird.

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: