Odkrywanie elektronicznej wiedzy

Dynamicznie rozwijający się rynek eksploracji danych oferuje wiele interesujących produktów, za pomocą których można realizować wymienione zadania. Najpopularniejsze z nich to: Intelligent Miner (IBM), Mine Set (Silicon Graphics), Data Mining Solution (SAS), Clementine (Integral Solutions), Data Mining Suite (Information Discovery). Ich głównymi właściwościami są m.in. obsługa dostępu do ważniejszych systemów baz danych, obsługa różnorodnych metod eksploracji danych, przejrzystość reprezentacji i łatwość późniejszego wdrażania odkrywanej wiedzy, w tym także jej wizualizacja. Niestety, nieodłączną cechą tej klasy produktów jest również relatywnie wysoka cena (dziesiątki tysięcy USD). Aby efektywnie wykorzystywać zaawansowane narzędzia do eksploracji danych, ich użytkownik powinien dysponować podstawową wiedzą z zakresu baz danych, uczenia maszynowego i sztucznej inteligencji.

Kilka przykładów

Dotychczasowe doświadczenia dowodzą zaskakująco wysokiej przydatności eksploracji danych do celów marketingu i zarządzania. American Express dzięki analizowaniu profilu swoich klientów i wykorzystaniu odkrytych cech do marketingu kierunkowego podniósł o 10-15% liczbę transakcji z użyciem kart płatniczych. BBC za pomocą systemu eksploracji danych przewiduje profil widowni programów telewizyjnych w celu wyboru optymalnych pór ich nadawania. Reuters stosuje techniki eksploracji danych do weryfikacji popraw-ności i wykrywania prawdopodobnych przekłamań w wysokości publikowanych kursów wymiany walut.

Wiele banków szacuje ryzyko kredytowe dla swoich nowych klientów na podstawie eksploracji baz danych o kredytach udzielanych w przeszłości. Powszechne stają się również systemy wczesnego wykrywania kradzieży kart płatniczych, automatycznej segmentacji rynku, przewidywania poziomu sprzedaży, automatycznego wykrywania włamań do systemów komputerowych, wykrywania oszustw ubezpieczeniowych itd. W ubiegłym roku The Wall Street Journal opisał zastosowanie wiedzy odkrytej w bazach danych o rozgrywkach NBA dla doboru optymalnego składu osobowego drużyny koszykarskiej.

Eksploracja danych, jako dziedzina bardzo młoda, rozwija się w imponującym tempie. Wśród prowadzonych obecnie prac najważniejsze to te związane z nieustającą optymalizacją obecnych algorytmów automatycznego odkrywania wiedzy i ekspansją metod eksploracji danych w kierunku obiektowych i multimedialnych baz danych. Wydaje się, że za kilka lat metody eksploracji danych będą dostępne w ramach standardowej funkcjonalności systemów zarządzania bazą danych, umożliwiając w ten sposób integrację aplikacji służących do wprowadzania i wyszukiwania danych z narzędziami do ich analizy i wspomagania podejmowania decyzji.

<hr size=1 noshade>Maciej Zakrzewicz jest doktorantem w Instytucie Informatyki Politechniki Poznańskiej. Współpracuje z firmą Oracle.


TOP 200