Spam kontra antyspam

Efekt skali

Spam ma tę własność, że jest rozsyłany masowo, zatem można wykorzystać efekt skali. Spamerzy stosują randomizację (statystyczną modyfikację zawartości) obrazków, która gwarantuje im unikatowość każdego pliku lub grupy kilku plików. Wobec takich działań wszelkie testy bazujące na prostej sumie kontrolnej pliku są całkowicie nieskuteczne. Mimo to efekt skali występuje także tutaj. Wolumin rozsyłanego spamu przez jeden gang spamerski charakteryzuje się tym, że pomimo wprowadzenia elementów losowych, pewne elementy obrazu są stałe. Spamerzy stosują dość szeroki arsenał modyfikacji obrazu, ale najbardziej typowe przekształcenia to skrzywienie w formie fali, deformacja niektórych obszarów przez skalowanie lub rozmycie, obrót obszarów rysunku, wprowadzenie animacji w rysunkach GIF, dodawanie losowego szumu, a także losowe kadrowanie i skalowanie tego samego obrazu.

Technika wykorzystująca deduplikację podobnych elementów działa dobrze w połączeniu z tradycyjnymi elementami ochrony antyspamowej, takimi jak adre-sy-pułapki czy listy RBL. Obrazek zweryfikowany jako spam za pomocą tradycyjnych metod staje się wtedy wzorcem, do którego za pomocą pewnych technik są porównywane obrazy dostarczane na serwer. Tego typu mechanizmy są badane m.in. w ramach projektu prowadzonego na Uniwersytecie w Princeton, gdzie opracowywane są metody analizy za pomocą kombinacji metod tradycyjnych i analizy obrazów. Obecne wyniki są zachęcające, zaś analiza obrazu za pomocą bardzo zaawansowanych, ale jednocześnie stosunkowo szybkich algorytmów pozwala na znaczącą poprawę skuteczności.

Publikacje dotyczące spamu i mechanizmów przeciwdziałania mu:

Publikacja poświęcona szybkiemu rozpoznawaniu spam-ham przy użyciu prostych filtrów probabilistycznych bazujących na własnościach obrazka:

www.seas.upenn.edu/~mdredze/publications/image_spam_ceas07.pdf

Analiza matematyczna elementów obrazu jako źródło danych dla decyzji:

www.ceas.cc/2007/papers/paper-66.pdf

Badania nad detekcją spamu za pomocą efektu skali - wykrywanie podobnych obrazów rozsyłanych masowo:

www.ceas.cc/2007/papers/paper-35.pdf

Detekcja zniekształceń obrazu stosowanych przez spamerów:

www.ceas.cc/2007/papers/paper-40.pdf

Gotowe narzędzie FuzzyOcr będące wtyczką do Spam-Assassina:

fuzzyocr.own-hero.net/ (istnieje także podręcznik instalacji w systemie Debian Linux oraz FreeBSD)

Materiał z Securecon 2007 poświęcony walce ze spamem:

securecon.pl/materialy/dzien2/spam_czy_wojna_jest_przegrana/spam.pdf


TOP 200