Interdyscyplinarne blokowanie spamu

Nina Balcan - specjalistka z Georgia Institute of Technology - opracowała nową metodę wykrywania i blokowania spamu. Stworzone przez nią rozwiązanie wykorzystuje technologie z zakresu uczenia się maszyn oraz teorii gier.

System opracowany przez Balcan może posłużyć do tworzenia spersonalizowanych, profilowanych pod kątem konkretnych użytkowników, systemów antyspamowych, które będą w stanie samodzielnie i trafnie klasyfikować wiadomości. Technologię tę docenił Microsoft - Nina Balcan została niedawno stypendystką programu Microsoft Research Faculty (na kontynuowanie swoich prac z zakresu zwalczania spamu dostała 200 tys. USD).

Zdaniem specjalistki, rezultaty jej prac mogą przydać się nie tylko przy walce ze spamem - opracowana przez nią technologia znajdzie również zastosowanie w data miningu. Jej celem było nauczenie komputera podejmowania trafnych decyzji co do tego, czy dana wiadomość jest pożądana, czy nie. "Można to zrobić na kilka sposobów - jednym z nich jest tzw. nadzorowane uczenie, w którym komputerowi przedstawia się różne wiadomości i pokazuje, które z nich są spamem, a które nie. Ta metoda ma jednak poważne ograniczenia - jednym z najważniejszych jest to, że aby zadziałała, użytkownik musi wcześniej samodzielnie oznaczyć dużą pulę wiadomości e-mail" - tłumaczy Balcan.

Lepszą metodą jest według niej "aktywna nauka" - w tym przypadku komputer sam analizuje bazę niezidentyfikowanych wiadomości, a decyzje podejmuje na podstawie odpowiedzi na "pytania pomocnicze", sporadycznie zadawane użytkownikowi. Zastosowanie takiego rozwiązania zmniejsza zaangażowanie człowieka, a dodatkowo sprawia, że komputer szybciej uczy się rozpoznawania typowych cech spamu.

"Aktywna nauka jest zdecydowanie lepszym rozwiązaniem niż nadzorowana - daje lepsze rezultaty. Oczywiście, rozwiązanie to ma również swoje wady, jedną z najważniejszych jest wysoka podatność na błędy wynikające z błędnej klasyfikacji wiadomości. Chodzi o to, że jedna błędnie uznana za spam wiadomość może poważnie zakłócić proceks uczenia się komputera" - mówi Balcan.

Specjalistka tłumaczy, że jej celem jest opracowanie systemu, który będzie w stanie szybko i trafnie stwierdzić, jaka metoda wykrywania spamu optymalnie sprawdzi się w danym przypadku. "Moje badania łączą zagadnienia z zakresu uczenia się maszyn, teorii gier, ekonomii oraz optymalizacji" - wyjasnia Nina Balcan.

W czasie swoich prac specjalista współpracowała m.in. ze ekspertami z zakresu statystyki, teorii gier, teorii informatyki oraz biotechnologii. Przyznane jest stypendium na zostać przeznaczone na kontynuowanie tych prac oraz najróżniejsze badania interdyscyplinarne oraz na zatrudnienie dodatkowych asystentów.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200