Drążenie danych w praktyce

Nie należy zbyt dużo oczekiwać od narzędzi do dogłębnej analizy danych.

Nie należy zbyt dużo oczekiwać od narzędzi do dogłębnej analizy danych.

Nadal wiele narzędzi do prowadzenia dogłębnych analiz danych wymaga solidnej, ogólnej wiedzy matematycznej i specjalistycznego szkolenia w zakresie statystyki.

Jeszcze nie tak dawno, bo zaledwie pięć lat temu, dogłębna analiza danych, zwana inaczej drążeniem danych (data mining) - uważana za technologię pozwalającą na otrzymanie odpowiedzi na nie zadane pytania oraz wykrycie nieoczekiwanych skojarzeń, tendencji i wzorców z danych - była używana i praktykowana jedynie przez naukowców i wybitnych specjalistów zajmujących się statystyką. Mimo znacznego postępu w udostępnieniu tych narzędzi szerszemu ogółowi matematyków, informatyków, analityków finansowych i pracownikom marketingu, nadal wiele narzędzi do prowadzenia dogłębnych analiz danych wymaga solidnej, ogólnej wiedzy matematycznej i specjalistycznego szkolenia w zakresie statystyki.

Obecnie wiele firm oferuje narzędzia do dogłębnej analizy danych, zwłaszcza że rośnie zapotrzebowanie na takie produkty ze strony operatorów telekomunikacyjnych, dużych domów towarowych i supermarketów, banków, instytucji ubezpieczeniowych i innych. Pionierzy stosowania nowoczesnych technik analizy danych dość szybko przekonują się, że pozwalają im one na utrzymanie klienta, prowadzenie dobrze nakierowanej polityki marketingowej, obniżenie kosztów itp. Najpopularniejsze zastosowanie techniki dogłębnej analizy danych to badanie wyników kampanii marketingowych.

Rynek produktów do dogłębnej analizy danych nie jest na razie duży: Meta Group podaje, że sprzedaż oprogramowania w 1996 r. wyniosła ok. 50 mln USD, zaś całkowity rynek usług, oprogramowania i spec- jalistycznego sprzętu wymaganego dla takich systemów wyniósł w 1996 r. - według oceny IDC - ok. 3 mld USD.

Dla specjalisty

Pierwsze, najpotężniejsze i najbardziej wyrafinowane narzędzia do analizy danych powstały na uczelniach amerykańskich i dość szybko stały się produktami komercyjnymi, a ich twórcy nadal zachowują ścisłe powiązania z nauką. Klasycznymi przykładami takich produktów są pakiety statystyczne SAS firmy Inc. i SPSS - SPSS Inc. Do efektywnego użycia wymagają wiedzy na poziomie doktoratu z matematyki ze specjalizacją w statystyce, chociaż ich nowsze wcielenia dają wiele również osobom o mniejszej wiedzy matematycznej. Nie ma natomiast wątpliwości, że są one mało przydatne przeciętnemu pracownikowi marketingu czy działu sprzedaży.

Argumentuje się przy tym, że trudno jest osiągnąć dobre wyniki za pomocą prostych narzędzi; dogłębnej analizy nie da się wbudować w wizarda typowej aplikacji biurowej. Jak dowodzi praktyka, najlepsze wyniki z kampanii marketingowych osiągają te firmy, które do ich analizowania zatrudniają wysoko kwalifikowanych analityków, nie zmuszając szefów jednostek biznesowych do zajmowania się czynnościami analitycznymi - oni powinni tylko wykorzystać umiejętnie ich wyniki.

Analiza prawie dla każdego

Druga tendencja rozwoju narzędzi do dogłębnej analizy danych napędzana jest przekonaniem, że powinny one służyć "przeciętnemu użytkownikowi PC ze znajomością matematyki na poziomie szkoły średniej". W szczególności każdy szef przedsiębiorstwa, działu marketingu czy księgowy powinien móc posłużyć się nimi z korzyścią dla przedsiębiorstwa, jeżeli potrafi zadawać pytania związane z jego działalnością.

W takim kierunku zmierza również rozwój nowych produktów do analizy danych, przeznaczonych dla osób z dobrą znajomoś- cią realiów biznesowych, po krótkim przeszkoleniu w zakresie używania narzędzia analitycznego. Wprawdzie narzędzia analityczne wciąż pozostają stosunkowo trudne do używania, ale nie trzeba już zatrudniać zespołu programistów piszących skomplikowane zapytania z użyciem wszystkich możliwości narzędzia. Obecnie są one dostępne poprzez graficzny interfejs użytkowy i coraz częściej dostarczają gotowe wzorce zapytań, dostosowane do specy- fiki konkretnej działalności gospodarczej - marketingu, analizy finansowej, wykrywania oszustw ubezpieczeniowych, analizy ryzyka kredytowego, sprzedaży, wykrywania oszustw za pomocą kart kredytowych, billingu telefonicznego i in.

Przykładem specjalistycznego narzędzia analitycznego jest produkt IBM SurfAid, który pojawi się w połowie br., przeznaczony do analizy sposobów korzystania przez webmastera z zasobów węzła sieci Web, nie wymagający od niego pogłębionej wiedzy matematycznej.

Nie przeceniać możliwości

Narzędzia do dogłębnej analizy danych mogą wyświadczyć nieocenione usługi przedsiębiorstwom, które wiedzą co będą analizować, jakich wyników się spodziewają (!) oraz zamierzają wykorzystywać wyniki analiz w codziennej działalności. Wszystkie te narzędzia są stosunkowo drogie (koszt liczy się w dziesiątkach lub nawet setkach tysięcy dolarów), często wymagają zatrudnienia analityka znającego doskonale specyfikę działania przedsiębiorstwa, a także ustanowienia hurtowni danych, z których pobierają dane do analizy.

Natomiast nie należy oczekiwać cudów. Żadne narzędzie samo nie sformułuje sensownych zapytań: może jedynie pogłębić analizę zapytań przygotowanych przez analityka i zasugerować kierunki dalszych badań. Nie należy również spodziewać się, że można je uruchomić na danych z hurtowni i spokojnie oczekiwać, iż narzędzie samo będzie alarmować o każdym niepokojącym zjawisku.

Dostawcy

Na świecie jest obecnie ponad 50 dostawców narzędzi zaliczanych do kategorii data mining. Niektórzy z nich mają w Polsce przedstawicielstwa (SAS Institute, Oracle, NCR, IBM, Sybase) lub działają przez partnerów handlowych (Business Objects, Cognos, MathSoft, SPSS, Silicon Graphics).


TOP 200