Drążenie danych

Segmentacja klientów. Masowy marketing kierowany do wszystkich potencjalnych klientów rzadko przynosi dobre wyniki. Znacznie taniej jest kierować ofertę do określonych grup klientów: nie warto wysyłać nawet najbardziej interesującej oferty rowerów górskich do emerytów, natomiast zapewne zainteresują się nią rodzice dzieci w wieku szkolnym. Jeżeli więc mamy w bazie odpowiednie dane i potrafimy je wydobyć, można prawidłowo skierować ofertę.

Pokaż, co masz w bazie

Drążenie danych sprowadza się do próby uzyskania odpowiedzi na pytanie, co właściwie mamy w bazie. Prosta metoda uzyskania odpowiedzi to uruchomienie odpowiedniego programu i sprawdzanie uzyskanych wyników. Stosowane są metody polegające na grupowaniu wyników analizy w pewne powtarzające się wzorce. W drążeniu danych także stosuje się badania tego typu, wykorzystując do tego m.in. metody i narzędzia sieci neuronowych.

Wzorce. Jest bardziej prawdopodobne, że osoba kupująca narty w styczniu zajrzy do działu sportowego przed wakacjami niż osoba, która nigdy nie kupiła żadnego sprzętu rekreacyjnego. Podobnie, osoba wydająca miesięcznie 2 tys. zł na zakupy spożywcze będzie częściej zaglądać do działu towarów luksusowych niż osoba wydająca 200 zł. Osoby młode i lepiej sytuowane chętniej kupują produkty "modne" niż tradycyjne. Istnieje wiele wzorców zakupów, ale ich stworzenie wymaga możliwości skorelowania danych osobowych z koszykiem zakupów.

Metody sprzedaży stosowane w Polsce niezbyt nadają się do tworzenia wzorców sprzedaży, gdyż nie pozwalają na skorelowanie danych personalnych osoby z jej zwyczajami, sposobami zakupu czy przyzwyczajeniami. Płacenie za pomocą kart kredytowych nie jest w Polsce powszechne; nieliczne sklepy wydają imienne karty stałego klienta, a jeśli już, nie czynią tego bezpłatnie lub nie oferują znaczącej obniżki ceny towarów przy zakupie z kartą. Tak więc nawet duże magazyny (z nielicznymi wyjątkami) nie znają swych klientów.

Asocjacje. Prawie każdy nabywca farby do drewna kupi także przy okazji pędzel, a osoba kupująca pastę do zębów często kupuje szczoteczkę. Nabywca eleganckiego garnituru zapewne kupi również kilka koszul i krawat. Są to najprostsze przykłady asocjacji. Dobry program analityczny jest w stanie przeliczyć miliony możliwości, jakie powstają przy zakupach, i stworzyć wiele istotnych asocjacji. Co to znaczy istotnych? Takich, które pozwolą na lepszą organizację obszaru sprzedaży, ustawienie towaru na półkach czy podjęcie decyzji o promocjach. Decyzję czy asocjacja jest istotna musi podjąć człowiek, ale pokazać ją powinien program.

Drążenie danych w praktyce

Istnieje wiele metod klasyfikacji i analizy nadających się do dogłębnego drążenia danych. Dostępne są zaawansowane narzędzia analizujące dane w bazie operacyjnej lub w hurtowni danych, pozwalające na prowadzenie eksploracji danych w celu wykrycia wzorców, asocjacji, reguł lub zależności. Dobre narzędzia umożliwiają ponadto wizualizację wyników w sposób dogodny do interpretacji i szybkiego akceptowania lub odrzucania kolejnego wyniku analizy, modyfikowania reguł przeszukiwania danych i zadawania programowi dalszej pracy.

Jedną z firm o największym doświadczeniu w zakresie dogłębnej analizy danych jest IBM. Firma oferuje obszerne pakiety narzędziowe do analizy danych typu data mining: Data Explorer, Parallel Visual Explorer i narzędzie do eksploracyjnej analizy danych, oparte na analizie fraktalnej danych - Diamond.

Drążenie danych w praktyce

Drążenie danych nie jest procesem prostym. Nawet najlepsze narzędzia nie podejmą decyzji za analityka lub szefa firmy, znającego doskonale specyfikę działania przedsiębiorstwa i cele, które mają być osiągnięte przez analizę danych.

IBM zdefiniował sześć kroków efektywnego drążenia danych:

1. Zrozumieć problem: cele, jakie się chce osiągnąć, i określenie danych, które mamy do dyspozycji. Zła definicja problemu nie może doprowadzić do dobrych wyników.

2. Właściwie wybrać dane do analizy. Większość algorytmów analizy wymaga obszernych zbiorów danych. Aby jednak uzyskać wiarygodne wyniki, także dane muszą być wiarygodne i nie zawierać błędów (co nie jest zjawiskiem rzadkim w dużych bazach danych).

3. Określić sposób prezentacji danych do algorytmów analizy. Wrzucić wszystkie ciasta i ciasteczka do jednego worka, czy rozdzielać na podgrupy? Liczyć wg wagi, wartości czy liczby sztuk?

4. Uruchomić odpowiedni zestaw algorytmów analitycznych. Często trzeba ten proces powtarzać, jeśli wyniki analizy są niezadowalające.

5. Dokonać oceny przydatności uzyskanych wyników. Musi to wykonać ekspert znający dokładnie specyfikę działalności i cel analizy. Wyniki muszą być przydatne osobom podejmującym decyzje, a nie tylko miarodajne z punktu widzenia teoretycznego.

6. Zaprezentować wyniki w postaci zrozumiałej dla osób podejmujących decyzje. Powinny one dać się zintegrować z procesami gospodarczymi w firmie.


TOP 200