Klubowa analiza

Narzędzia data mining pomogły Premium Club zbudować modele klientów i reguły rządzące zakupami na stacjach benzynowych Statoil.

Narzędzia data mining pomogły Premium Club zbudować modele klientów i reguły rządzące zakupami na stacjach benzynowych Statoil.

Po trzech latach zbierania informacji o transakcjach wykonywanych przez uczestników programu Premium Club, firmie przestała wystarczać dotychczasowa segmentacja klientów. Zgromadzone informacje wymagały zastosowania zaawansowanych metod i narzędzi analitycznych.

"Pomimo posiadania pewnej wiedzy na temat grup klientów, nie dysponowaliśmy możliwością budowania analitycznego modelu danych opisującego zachowania klientów dokonujących zakupów" - mówi Karol Michałowski, kierownik działu IT i baz danych w Premium Club.

Firma nie zdecydowała się jednak na natychmiastowe wdrożenie systemu analitycznego. Postanowiono najpierw przekonać się o wartości data miningu, korzystając z usług specjalizowanej firmy. Analizy danych zgromadzonych w bazach Premium Club mieli dokonać specjaliści warszawskiej spółki StatConsulting.

Modelowe cele

Klubowa analiza

Karol Michałowski

Premium Club to wielopartnerski program lojalnościowy, organizowany wspólnie przez sieć stacji Statoil, restauracje Pizza Hut i KFC, sieć salonów EMPiK, EMPiK Foto oraz Bank BPH. Dzięki systemowi kart PC, klienci zbierają punkty za dokonane zakupy, które następnie mogą być wymienione na upominki lub przekazane na szlachetny cel. Statoil to największy partner programu, co oznacza, że właśnie na stacjach benzynowych rejestrowana jest największa liczba transakcji z użyciem kart Premium Club. Dlatego zakupy dokonywane przez klientów stacji benzynowych miały posłużyć jako źródło budowy analitycznego modelu klientów.

Klienci Statoil, poza benzyną i olejem napędowym, nabywają także inne produkty oraz usługi: czasopisma, napoje i produkty żywnościowe, oleje, płyny do spryskiwaczy i korzystają z myjni. Wykonane analizy miały umożliwić rozpoznanie struktury dokonywanych zakupów. Zbudowanie tzw. reguł asocjacyjnych miało umożliwić stworzenie koszyka produktów kupowanych przez klientów, czyli ustalenie, jakie produkty dodatkowo kupuje klient, nabywający np. paliwo czy butelkę napoju gazowanego albo lody.

Miało to również na celu zdobycie informacji na temat preferencji klientów dotyczących typów odwiedzanych stacji. Sieć Statoil można podzielić na stacje miejskie, znajdujące się w obrębie dużych miast, stacje tranzytowe oraz inne, które nie kwalifikują się do żadnej z tych grup. Premium Club chciało wykryć typowe zachowania klientów poszczególnych stacji. Ostatecznie określenie modeli klientów i reguł asocjacyjnych miało pozwolić na stworzenie nowej segmentacji klientów. Cele znalazły odzwierciedlenie w tworzonych modelach analitycznych. Zdecydowano się na trzy modele: asocjacyjny (struktura zakupów), ekspercki klasyfikacyjny (klasyfikacja preferencji) oraz automatyczny segmentacyjny (grupowanie klientów według preferencji).

Kluczowy etap

Projekt - jak każdy projekt data mining - rozpoczął się od procedur związanych z przygotowywaniem danych. To właśnie "czyszczenie" danych zabiera zwykle najwięcej czasu. "Pochłania od 60 do 80% czasu realizacji całego projektu. Niemniej jest konieczne, żeby można było uzyskać wiarygodne wyniki" - mówi Peter Zvirinsky, dyrektor ds. marketingu w StatConsulting. Pierwszym zadaniem było wykonanie wstępnej analizy opisowej rozkładów i wykresów poszczególnych zmiennych. Następnie usunięto rekordy z brakami danych i błędami.

W Premium Club wykorzystywane są rozmaite mechanizmy pozwalające walidować dane wprowadzane do bazy. Przykładowo, walidowane są (w oparciu o specjalną listę) wszystkie imiona wprowadzane do systemu. W oparciu o bazę teleadresową walidowana jest także zgodność kodów pocztowych z ulicami, przy jakich zamieszkują klienci. Stosowane jest również słownikowanie danych.

Niemniej przygotowanie danych było konieczne. "Przykładowo, próbując ustalić spektrum wartości zamówień dla kilkuset tysięcy klientów, konieczne jest odrzucenie pewnego procenta danych skrajnych - bardzo dużych i bardzo małych transakcji - mogących zaburzać obraz, który nas interesuje. Dane muszą też zostać zagregowane" - mówi Karol Michałowski. Dane zagregowano tak, by jeden rekord opisywał jedną kartę.

Procedury związane z przygotowywaniem danych trwały półtora miesiąca. Dopiero po okresie przygotowawczym rozpoczęto tworzenie reguł asocjacyjnych i budowanie koszyka zakupowego.

Efekty marketingowe

W efekcie StatConsulting przygotował wiele reguł określających zachowania klientów. Wiadomo m.in., jaki procent klientów kupujących napoje gazowane kupuje także gazetę. Reguły pozwalają np. na ocenę skuteczności podejmowanych działań marketingowych. Przykładowo pozwala to określić, czy promocja punktowa (w ramach której klient otrzymuje dodatkową liczbę punktów Premium Club na swoje konto, jeśli zakupi określony produkt), jest skuteczna. Możliwe jest również prowadzenie promocji tylko na niektórych stacjach tego samego typu, a na innych nie.

W oparciu m.in. o analizę histogramów, wykresów i tabel danych dokonano także podziału klientów na grupy. Brano pod uwagę częstotliwość odwiedzin na poszczególnych typach stacji oraz ilość wydawanych pieniędzy. Pozwoliło to wyróżnić trzy odrębne grupy klientów Statoil, które także ułatwiają prowadzenie programów marketingowych.

Wreszcie dzięki wykorzystaniu samoorganizujących się tzw. map Kohonena możliwe stało się stworzenie innego, automatycznego podziału klientów. Podobnie jak poprzednio także automatyczna segmentacja pozwoliła wyróżnić trzy grupy klientów. Porównanie wyników obu podziałów dało wyniki podobne z uzyskanymi w modelu klasyfikacyjnym. Okazał się on zgodny z automatyczną segmentacją średnio w ponad 79% (pomiędzy odpowiadającymi sobie grupami). Automatyczna segmentacja pozwoliła więc potwierdzić wyniki wcześniejszych analiz.

Przykładowe szkolenie

Kierownictwo Premium Club na tyle wysoko oceniło przydatność wykonanych analiz, że zdecydowano się na zakup wykorzystywanego do analiz przez StatConsulting systemu Górnik. Ma on być używany do prowadzenia dalszych analiz wykonywanych na potrzeby poszczególnych partnerów, jak również pozyskiwania informacji o wszystkich uczestnikach programu Premium Club.

Firma zdecydowała się na wybór specyficznego rodzaju szkolenia ze stosowania metod data mining, polegającego na uczestnictwie użytkowników systemu w projekcie prowadzonym przez konsultantów dostawcy.

"Po wdrożeniu oprogramowania Górnik rozpoczęliśmy konkretny projekt, który prowadzony jest przez doświadczonych specjalistów. Uznaliśmy, że właśnie w ten sposób nasi pracownicy nauczą się najwięcej" - mówi Karol Michałowski.

Data mining

Jak to działa?

Data mining to pewien podzbiór Business Intelligence, który obejmuje szeroką gamę technologii analitycznych. Narzędzia te, wykorzystywane często do modelowania predyktywnego, mogą także pomagać organizacji w lepszym zrozumieniu relacji zachodzących pomiędzy zmiennymi.

Kto skorzysta?

Firmy koncentrujące się na klientach, zajmujące się np. handlem detalicznym, które posiadają duże ilości informacji na temat aktualnych i potencjalnych klientów, to idealni kandydaci na użytkowników narzędzi data mining. Przykładowo, Wal-Mart słynie z tego, że wykorzystuje data mining do prowadzenia analizy "koszyków rynkowych" (market baskets), kombinacji produktów, które konsumenci kupują w ramach jednych zakupów. Producenci farmaceutyków wykorzystują technologię do śledzenia skutków stosowania ich leków, podczas gdy firmy z sektora finansowego stosują data mining do identyfikowania nowych możliwości współpracy z klientami.

Jakie korzyści odnosi marketing?

Narzędzia data mining pozwalają prowadzić dopasowane do potrzeb działania marketingowe na nowych rynkach. Przykładowo, amerykańska sieć sklepów ze sprzętem sportowym REI wykorzystuje oprogramowanie data mining do tzw. parowania danych zbieranych na stronie internetowej, przez direct mailing oraz w 78 sklepach na terenie USA. Kiedy REI rozważa możliwość otworzenia sklepu w nowym miejscu, analizuje dane w celu znalezienia miejsc dużej koncentracji klientów kupujących za pośrednictwem Internetu i katalogów sprzedaży wysyłkowej. W podobny sposób firma dopasowuje proporcje oferowanych grup produktów w poszczególnych sklepach w zależności od preferencji klientów na lokalnym rynku.

Kto to sprzedaje?

Największe firmy oferujące narzędzia data mining to m.in. SAS Institute, IBM czy Computer Associates. Na całym świecie istnieją także setki, a może nawet tysiące mniejszych firm oferujących takie produkty.

Czy można zacząć bez dużej inwestycji?

Odpowiedź brzmi: tak! Istnieją małe firmy, które oferują narzędzia analityczne jako usługi, współpracując z klientami przy rozwiązywaniu konkretnych problemów. Podejście takie pozwala na przetestowanie możliwości, jakie oferuje data mining na własnych danych. Po wdrożeniu oprogramowania Górnik rozpoczęliśmy konkretny projekt, który prowadzony jest przez doświadczonych specjalistów. Uznaliśmy, że właśnie w ten sposób nasi pracownicy nauczą się najwięcej" - mówi Karol Michałowski.

Więcej drążenia

W praktyce działalności polskich firm coraz częściej można spotkać przykłady ciekawych wdrożeń data mining, choć nadal są to zjawiska wyspowe. Stosuje się je w przypadku statystycznej kontroli procesów produkcyjnych (np. wdrożenie firmy Statsoft systemu kontroli jakości opakowań plastikowych PET w firmie GTX Hasnex Plastic), tworzenia oferty nowych usług przez Pionieer Pekao Towarzystwo Funduszy Inwestycyjnych SA na bazie m.in. posiadanych informacji o zachowaniach klientów, ich sposobach inwestowania i badaniach demograficznych (program SPSS AnswerTree), czy też w modelowaniu ekonometrycznym zjawisk mogących mieć wpływ na efekty działania i kondycję przedsiębiorstwa wzdłuż osi czasu (wdrożenie systemu prognozowania zrealizowane w Krajowym Depozycie Papierów Wartościowych z wykorzystaniem Statistica Data Miner).

(peg)

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200