Technologia kontra spam

Dodatkowa ochrona

Opisana metoda działa w przypadku większości spamów, ale niestety nie zawsze. Pozostają jeszcze te, które są rozsyłane poprzez serwery typu open-relay lub prawdziwe serwery pocztowe. Z takim spamem trzeba sobie poradzić inaczej.

W sieci są dostępne programy wykrywające spam na podstawie analizy jego treści. Jednym z bardziej popularnych jest SpamAssassin, rozpowszechniany na zasadach GPL, oparty na kilkuset testach, które są wykonywane na nagłówku i treści listu. Program bada, czy list nie przeszedł przez serwery znajdujące się na czarnych listach, w treści listu nie znajdują się charakterystyczne fragmenty tekstów wskazujące na spam, list nie jest odpowiedzią na nasz list bądź czy z konkretnym nadawcą nie była uprzednio prowadzona korespondencja. Ten ostatni test wskazuje, że niezależnie od treści list raczej spamem nie jest, a oferta może być przez nas wyczekiwana.

Tutaj istotna uwaga - o ile mechanizmy szarych list gwarantują (przy założeniu elementarnej poprawności systemu wysyłającego), że każdy e-mail niebędący spamem dotrze do adresata, o tyle zasada działania SpamAssassin dopuszcza pomyłki. W przypadku automatycznej klasyfikacji jest oceniane jedynie prawdopodobieństwo, że dany list jest spamem.

Listy elektroniczne mogą być jednak przedmiotem zadziwiająco dobrych obliczeń statystycznych wg analizy bayesowskiej. Wystarczy pokazać programowi kilkaset swoich listów i tyleż spamów. Każdy list jest dzielony na leksemy, z grubsza odpowiadające słowom, po czym każdemu z nich jest przypisywana częstotliwość wystąpień w listach z obu grup. Po zbudowaniu statystyki program będzie mógł oceniać prawdopodobieństwo, że list należy do danej kategorii. Każdorazowa klasyfikacja kolejnego listu przez samego użytkownika poprawia dokładność działania tego mechanizmu.

Z moich doświadczeń wynika, że SpamAssassin+Bayes rozróżnia listy niemal 100-proc. Praktycznie nie zdarza się, by zwykły list został uznany za spam.

Niestety, współczesne programy pocztowe często poprawiają nagłówki listów i zmieniają ich treść, np. kolejność załączników.

Taki list jest niezmiernie trudny do analizy. Więcej informacji o metodzie znajduje się pod adresem:http://www.spamassassin.org

Skutki spamu

1,2% - utrata produktywności przez jednego pracownika

13,3 - przeciętna liczba spamów otrzymywanych przez pracownika każdego dnia

6,5 minuty - czas spędzony każdego dnia roboczego na czytaniu i usuwaniu spamu

Źródło: Nucleus Research

Krzysztof Leszczyński jest wiceprezesem Polskiej Grupy Użytkowników Linuxa. Jego niewielka firma ma przykry zwyczaj przynoszenia strat podczas rozwijania nietypowych rozwiązań informatycznych oraz - na szczęście - trochę zysków przy zupełnie prozaicznych usługach administracyjno-sieciowych.


TOP 200