Hurtownia wzorców, nie danych

Pattern Warehouse pozwala na przechowywanie zależności między danymi. Stanowi dodatek do hurtowni danych i jest zapełniana przez działające w tle narzędzia do eksploracji danych.

Pattern Warehouse pozwala na przechowywanie zależności między danymi. Stanowi dodatek do hurtowni danych i jest zapełniana przez działające w tle narzędzia do eksploracji danych.

Hurtownia danych pojawiła się w latach 80. jako repozytorium danych korporacyjnych. Celem było stworzenie centralnej składnicy, z której każda osoba w firmie mogła otrzymać potrzebne jej dane. Centralna składnica zapewniała wyższą jakość i spójność danych, gdyż wszystkie informacje pochodziły z jednego źródła. Idea zyskała tak powszechną akceptację, że praktycznie każda firma, zwłaszcza działająca w dziedzinie bankowości, ubezpieczeń czy innych usług finansowych, ma co najmniej jedną hurtownię danych.

Na początku lat 90. stało się jasne, że hurtownia nie jest idealnym rozwiązaniem, gdyż dane są zbyt "surowe" i trudno jest z nich uzyskać użyteczne informacje. Działalność gospodarcza wymaga danych lepiej przetworzonych. Co ważniejsze, użytkownicy hurtowni danych dość szybko zorientowali się, że bardziej od suchych danych potrzebne im są tendencje, wzorce i wiedza o biznesie. Uznanie zyskała koncepcja eksploracji danych (data mining), pozwalająca na uzyskanie danych w wysokim stopniu przetworzonych.

Użytkownicy programów do eksploracji danych z hurtowni natrafili jednak na trzy dość poważne przeszkody w efektywnym wykorzystaniu hurtowni:

  • narzędzia do eksploracji danych wymagają sporej wiedzy w zakresie sztucznej inteligencji, statystyki i zaawansowanych metod matematycznych; większej niż gotów jest to zaakceptować typowy pracownik biznesowy

  • cząstkowe analizy z hurtowni dają sprzeczne wyniki: 10 użytkowników korzystających z tych samych danych uzyskuje 8 różnych odpowiedzi

  • po uzyskaniu pierwszego przybliżenia wyniku, czas szczegółowej analizy danych z dużej hurtowni jest zbyt długi, a interpretacja wyników wymaga udziału specjalisty-analityka znającego dogłębnie nie tylko metody analityczne, lecz także specyfikę działalności przedsiębiorstwa.

    Hurtownia wzorców

    Firma Information Discovery proponuje dodatek do hurtowni danych, zwany hurtownią wzorców (Pattern Ware- house). Wzorzec to zależność między danymi, sposób zachowania klientów, tendencja zmian danych i wiele innych.

    Dla określenia co właściwie rozumie się przez hurtownię wzorców, warto przytoczyć prostą analogię. Jeżeli surowe dane to winogrona, wino odpowiada wiedzy. Hurtownia danych to tylko magazyn winogron, zaś hurtownia wzorców to piwnica win. Narzędzia do eksploracji danych odpowiadają więc oprzyrządowaniu i metodom produkcji wina. Wprawdzie każdy może zająć się samodzielnie produkcją wina, ale większość osób woli je kupić gotowe. Podobnie jest z wiedzą: można ją próbować wydobyć z surowych danych, ale wymaga to czasu i znajomości technik eksploracji danych.

    Hurtownia wzorców nie istnieje samodzielnie. Stanowi dodatek do hurtowni danych i jest zapełniana przez działające w tle narzędzia do eksploracji danych. Hurtownia danych przechowuje dane archiwalne; podobnie hurtownia wzorców przechowuje wzorce archiwalne, znalezione wcześniej i przechowywane przez długi czas, gotowe do bezpośredniego użycia przez użytkowników z działów marketingu, magazynu, produkcji, oddziału banku. Wzorce ważne z punktu widzenia biznesu aktualizuje okresowo, zależnie od zmian w napływających danych. Hurtownie danych wymagają do pamiętania informacji ogromnych dysków; z tego powodu często przechowuje się w nich jedynie ostatni - roczny, dwuletni - wycinek danych, a starsze się odrzuca. Natomiast wzorce są informacją dokładniej przetworzoną i zajmują na dysku znacznie mniej miejsca. Można więc w hurtowni wzorców mieć historię firmy w postaci użytecznej informacji do natychmiastowego użycia, gdyż wzorców nie trzeba wytwarzać na bieżąco - można po prostu do nich zajrzeć.

    Dostęp do wiedzy zamiast analizy danych

    W celu wydestylowania informacji z surowych danych trzeba przeprowadzić ich dogłębną analizę. Kluczowe pytanie brzmi: kiedy to czynić? W typowych systemach eksploracji danych dokonuje się tej operacji na bieżąco, na żądanie użytkownika. Model z hurtownią wzorców wymaga dokonania podstawowych analiz wcześniej i przechowywania wyników w hurtowni wzorców.

    Daje to istotne korzyści:

  • natychmiastowy dostęp do informacji;

  • spójność uzyskiwanych wyników: na takie samo zapytanie uzyskuje się tę samą, wcześniej przygotowaną odpowiedź z hurtowni wzorców;

  • lepszą jakość wyników;

  • w hurtowni danych często prowadzi się analizy na próbce lub niewielkim wyciągu z danych, podczas gdy wzorce tworzy się i aktualizuje z całości danych.

    Trzeba jednak pamiętać, że hurtownia wzorców nie jest bazą wiedzy. Bazy wiedzy zawierają informacje ulotne, znane ludziom, wprowadzone do komputera dla ułatwienia dostępu, na ogół o charakterze statycznym. Hurtownia wzorców zawiera informacje dynamiczne, regenerowane automatycznie przy każdym uzupełnianiu zawartości hurtowni danych.

    Dostęp do hurtowni wzorców

    Hurtownia przechowuje wzorce w tabelach wzorców w relacyjnej bazie danych. Jednak język zapytań do baz danych SQL nie kwalifikuje się do uzyskiwania wyników z hurtowni wzorców. Z tego powodu firma Information Discovery stworzyła specjalizowany język Pattern Query Language (PQL), oparty na konstrukcjach SQL, zapewniający dostęp do wzorców. Użytkownik nie musi jednak uczyć się tego języka, gdyż dostęp do hurtowni wzorców uzyskuje się z interfejsu graficznego programu użytkowego.

    Information Discovery uważa, że idea hurtowni wzorców najlepiej sprawdza się w zastosowaniach wąsko specjalizowanych: do analizy ryzyka kredytów, sprzedaży detalicznej, marketingu nakierowanego na konkretnego klienta, marketingu we właściwym czasie, kontroli jakości produkcji i wielu innych. Wynika to stąd, że łatwiej jest opracować zestawy wzorców do konkretnych zastosowań niż ogólne wzorce dla przedsiębiorstwa.

    Produkty

    Information Discovery oferuje dwa zestawy produktów do tworzenia, aktualizacji i używania hurtowni wzorców.

    Knowledge Access Suite zawiera narzędzia dostępu do hurtowni wzorców z sieci Web, generator opisowych dokumentów HTML wykorzystujących wzorce z hurtowni do przekazywania objaśnienia, uzasadnienia lub potwierdzenia danych oraz program do samoczynnego przekazywania użytkownikom zmian interesujących ich wzorców z hurtowni.

    Pakiet ten współpracuje z pakietem analitycznym dla hurtowni danych Data Mining Suite, analizującym w tle dane w hurtowni danych w celu stworzenia nowych lub aktualizacji używanych wzorców.

  • W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

    TOP 200