Odpowiedzi zamiast pytań

Dla analiz różnej maści

O ile w biznesie nie stosuje się na ogół tak bardzo złożonych metod data mining jak w nauce, o tyle znacznie istotniejsza jest nawet najmniejsza poprawa efektywności, osiągnięta dzięki podjęciu decyzji na podstawie informacji uzyskanych dzięki analizie zgromadzonych danych. W praktyce stosuje się uproszczone rozwiązania, na ogół przy standardowo ustalanej konfiguracji (co świadczy o małym wyrafinowaniu użytkowników tego rodzaju systemów). Praktyczna data mining jest zazwyczaj prowadzona na potrzeby działu marketingu, sprzedaży typu cross-selling czy up-selling (na podstawie łączenia danych o klientach w obrębie grupy firm działających wspólnie np. w ramach holdingu), jak również do segmentacji rynku (np. tworzenia charakterystyk typowych klientów) czy prowadzenia analizy kosztów (określenia, na których usługach i na których klientach zarabia się najwięcej). W przypadku, gdy w firmie takich analiz jest wykonywanych kilkaset w ciągu miesiąca, potrzebne są zaawansowane rozwiązania data mining.

Ogromna różnorodność dostępnych technik data mining obnaża zarazem słaby punkt tej dziedziny. Posłużenie się różnymi technikami może przynieść różne wyniki! Trudno więc o jednoznaczność wniosków, o to, by maszyna dawała konkretne odpowiedzi. Potrzebny jest analityk znający konkretną dziedzinę, do której obszaru należą analizowane dane, i potrafiący zdecydować, które wyniki są wiarygodne. Techniki data mining pozwalają bowiem jedynie udzielić podpowiedzi, nie dają gotowych recept. Czasem podpowiedzi te mogą być mylące. Wszystko to sprawia, że działania specjalistów od data mining w firmie mogą być postrzegane jako pewnego rodzaju zabawa. Obudowanie algorytmów data mining systemami o konkretnym przeznaczeniu (np. CRM) sprawia, że przestaje to być tak widoczne. O pożytku z wykorzystania takich systemów decyduje więc merytoryczne przygotowanie użytkownika.

Analiza plików log

Całkowicie nowym obszarem do stosowania zaawansowanych analiz data mining są ogromne zbiory danych pochodzących z agregacji plików log, w których jest rejestrowane przemieszczanie się użytkowników na stronach portali internetowych. To najmłodszy fragment rynku zastosowań data mining. Informacje, jakie można wydobyć z tych baz, mają pozwolić na określenie wzorców faktycznego wykorzystania serwisów internetowych przez użytkowników. Może to pomóc w poprawie ich struktury czy dostarczeniu charakterystyki typowych klientów dla ogłoszeniodawców. Oczywiście również tutaj obowiązuje ogólnoinformatyczna zasada, że nie można z systemu otrzymać więcej niż się doń włoży. Z analizy plików log nie wydobędzie się danych, których serwery internetowe nie rejestrują. Data mining pozwala na wykrycie różnych zależności między danymi, ale jedynie w obrębie tych danych, które się w systemie znajdują.

Po stronie wytwórców narzędzi data mining największy nacisk obecnie jest położony na zaniedbaną warstwę komunikacji między użytkownikiem a systemem. Użytkownik nie chce programować. Chciałby mieć do dyspozycji interaktywny interfejs graficzny. Narzędzia data mining muszą być wyposażone w interfejsy, które pozwolą na ich dowolne łączenie, a przez to traktowanie jak modułów, z których składa się złożoną maszynę analityczną.

Drążenie danych w kraju

W Polsce data mining wciąż znajduje się we wstępnej fazie praktycznego zastosowania. Budowane w Polsce duże hurtownie danych dopiero teraz zaczynają osiągać wystarczającą dojrzałość, by korzystający z nich mogli posłużyć się technikami data mining. Stąd brakuje dobrych referencji. Problemy sprawia także trudność w przełożeniu stosowanych w krajach zachodnich modeli analitycznych, często nie przystają one bowiem do specyfiki naszego rynku (np. dane w systemach billingowych operatorów komórkowych mają odmienne charakterystyki).

Pod względem zaplecza naukowego najbardziej zaawansowane prace nad data mining są prowadzone w Akademii Ekonomicznej w Poznaniu, Politechnice Wrocławskiej, Akademii Górniczo-Hutniczej, Politechnice Warszawskiej i Wojskowej Akademii Technicznej.


TOP 200