Jak wyciszyć blogowy spam

Zasypywanie forów dyskusyjnych i portali spamem reklamowym stało się plagą. Trzeba z nim walczyć. Oto kilka rad, jak to zrobić.

Zasypywanie forów dyskusyjnych i portali spamem reklamowym stało się plagą. Trzeba z nim walczyć. Oto kilka rad, jak to zrobić.

Spam blogowy (Comment Spam, Comdexing Spam), czyli zjawisko spamujących komentarzy na forach, blogach czy księgach gości staje się coraz bardziej dokuczliwe. Jego istotą jest automatyczne umieszczanie przez spamerów losowych treści zawierających opisy lub linki do promowanych w ten sposób stron. Istnieje kilka metod walki z tym zjawiskiem, z których najpopularniejszymi są: limity komentarzy, blokowanie wpisów zawierających określone słowa, odwrotny test Turinga, usuwanie linków z wpisów, podejścia dystrybuowane, monitorowanie kanałów RSS oraz specjalizowane narzędzia usuwające wpisy. Dodatkowo używa się opcji nofollow (albo nopagerank) i przekierowań, by już umieszczone komentarze nie powodowały podwyższenia rankingu strony w wyszukiwarkach. Mimo wszystko nie ma metody jednolitej, 100-proc. pewnej i przyjaznej użytkownikom.

Odczytaj i przepisz

Najskuteczniejszym narzędziem jest odwrotny test Turinga, który polega na przedstawieniu zadania łatwego do wykonania przez człowieka, ale trudnego do automatyzacji przy użyciu algorytmów komputerowych. Oprócz prostych pytań, często stosuje się zniekształcone obrazki (CAPTCHA) zawierające tekst, który należy odczytać i wpisać. Obrazki CAPTCHA są na tyle skuteczne, że odsiewają olbrzymią większość spamujących wpisów, ale są dokuczliwe dla wielu komentujących. Niemal wszystkie serwisy blogowe oferują taką funkcjonalność, jej zalety doceniła także Wikipedia, zabezpieczając w ten sposób wpisy z zewnętrznymi hiperłączami. Problemem, oprócz dokuczliwości, jest utrudnienie dostępu dla ludzi niewidomych, korzystających z czytnika treści. Strony wielu instytucji publicznych muszą być dostępne także dla takich użytkowników Internetu.

Słowa i adresy na czarnej liście

Ważnym orężem jest blokowanie postów zawierających konkretne słowa i wyrażenia. Ponieważ spamerzy muszą napisać je wprost, aby podnieść ranking promowanych stron, sztuczki takie jak zamiana znaków (np. V1@gra, C1ali$) nie mają sensu. Jest to najlepsze długoterminowe podejście, niemniej wymaga dobrze dopracowanego słownika czarnej listy i mechanizmów zapewniających obejście ograniczeń. Przykładem może być przekierowanie na stronę z obrazkami CAPTCHA w przypadku wykrycia wpisu zawierającego blokowane słowa. Kolejnym z rozwiązań jest limitowanie częstotliwości wpisów oraz monitorowanie komentarzy z jednego adresu IP. Podobne ograniczenia wdrożono np. w serwisie blogowym blox.pl, wychodząc słusznie z założenia, że czytelnicy rzadko odpowiadają na swój komentarz.

Blokowanie hurtowników

Podejście dystrybuowane umożliwia przeprowadzenie rankingu wpisów oraz wykorzystanie efektu skali. Jeśli w tym samym czasie z tego samego adresu IP wpisywane są masowo komentarze na różnych stronach z tego samego serwisu promujące ten sam link, oznacza to działanie automatu spamerskiego. Odpowiednie narzędzie analityczne może automatycznie zablokować na pewien czas dany adres, a także usunąć spamujące wpisy. Do tego celu może posłużyć także monitorowanie kanałów RSS, pod kątem potencjalnego wykorzystania ich dla celów spamerskich.

Zmniejszyć opłacalność spamu

Niektóre podejścia mają na celu nie tyle samo blokowanie wpisów, ale sprawienie, aby atakowanie konkretnych portali lub platform nie miało sensu dla spamerów. Dla nich liczy się głównie ranking strony, zatem bardzo skutecznym ograniczeniem „zysku” z publikacji postów jest dodanie opcji nopagerank albo nofollow. Sprawia ona, że wyszukiwarka (Google) nie bierze pod uwagę takich postów przy wyznaczaniu rankingu strony. Chociaż nie chroni ona przed kolejnymi wpisami i linki takie nadal będą mogły być klikane przez czytelników strony, nie powoduje ona wykorzystania opublikowanych postów do promocji spamerskiej strony w rankingu wyszukiwań.

Zamknięte fora

Zjawisko spamu blogowego było jednym z powodów całkowitego zamknięcia dostępu do anonimowego pisania na forach dyskusyjnych. Obecnie mało które forum publiczne (najczęściej wykorzystujące popularne oprogramowanie phBB) umożliwia anonimowe wpisy, niemal wszystkie wymagają przedtem rejestracji ze sprawdzeniem poprawności adresu e-mail włącznie. Było to bardzo skuteczne podejście. Dzięki identyfikacji użytkownika przez jego adres e-mail oraz wprowadzeniu mechanizmów CAPTCHA przy rejestracji, spam blogowy na forach bazujących na phBB praktycznie przestał istnieć.

Usunięcie linków

Najbardziej radykalną z metod jest całkowite usuwanie linków z treści postów. Automaty spamerskie najczęściej testują docelowy serwis, umieszczając bezsensowny post z przypadkowym linkiem. Dopiero gdy test się powiedzie i witryna umieszcza linki w komentarzach, wstawiany jest ten właściwy. Platforma publikacji usuwająca obce linki będzie w takim przypadku jedynie zaśmiecana bezsensownymi komentarzami, które trzeba usuwać ręcznie.

Gotowe rozwiązania

Websense, dostawca rozwiązań z dziedziny bezpieczeństwa serwisów webowych, zakupił niedawno firmę Defensio. Rozwiązanie rozwijane przez tę firmę służy właśnie do usuwania komentarzy zawierających spam, może monitorować wskazaną stronę i analizować wpisy. Technologia ta łączy podejście dystrybuowane z analizą zawartości. Wtyczki Defensio mogą być użyte w niektórych platformach blogowych (np. WordPress, Aintablog), portalach CMS (Drupal), mogą być także zintegrowane z aplikacjami napisanymi w środowiskach PHP, Ruby on Rails, Java, Perl i .NET. Sieć tej usługi obejmuje ponad 10 tysięcy blogów.

Metody zapobiegania spamowi blogowemu:

1. limity komentarzy,

2. blokowanie wpisów zawierających określone słowa,

3. obrazki CAPTCHA,

4. usuwanie linków,

5. obowiązek rejestracji na forach,

6. specjalizowane narzędzia usuwające wpisy,

7. wpływ na ranking promowanych przez spamerów stron.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200