Aplikacje analityczne w hurtowniach danych

Możliwości analityczne typowych narzędzi do tworzenia raportów są ograniczone; czasem pozwalają na przesłanie wyników zapytania do Excela w celu przeprowadzenia analizy lokalnie na stacji klienta. Właściwość ta jest niezbyt przydatna, jeśli w wyniku zadania zapytania do bazy otrzymuje się więcej niż kilka tysięcy rekordów.

Typowe produkty do raportowania dostępne na polskim rynku to: Seagate Crystal Reports i Borland ReportSmith. Seagate Crystal Reports zostały zintegrowane z produktami OLAP firmy Oracle.

Narzędzia OLAP

Narzędzia analityczne OLAP znacznie różnią się od pakietów do raportowania. Narzędzia do raportowania posługują się (i dostarczają użytkownikowi) jedynie nie przetworzone rekordy lub pewne pola z rekordów bazy danych. Nie dokonują one żadnych analiz wyników zapytania, a jedynie ułatwiają dostęp do danych w bazie. Narzędzia OLAP powalają na stworzenie wielowymiarowej hierarchicznej struktury zagregowanych danych. Wielowymiarowość tej struktury ułatwia jej prezentację w formie przekrojów i rzutowań (slice and dice) z różnej perspektywy, istotnej dla rodzaju prowadzonej analizy.

Wielowymiarowa struktura danych jest ważną cechą narzędzi OLAP, zapewniającą intuicyjne opisy wymiarów. Typowe wymiary w strukturach OLAP dotyczą: produktów, regionów, czasu (z różnym stopniem agregacji, np. tygodnie, miesiące lub lata) itp.

Narzędzia OLAP zapewniają także dogodne nawigowanie po strukturze bazy i tworzenie przekrojów wg dowolnego ze definiowanych wymiarów oraz przemieszczanie ich w tabeli raportu (tworzenie tzw. tabel przestawnych) w dowolny sposób.

W celu przyspieszenia dostępu oraz odciążenia baz operacyjnych narzędzia OLAP przechowują dane zagregowane oddzielnie, poza bazami operacyjnymi. Zależnie od sposobu przechowywania danych do analizy, narzędzia OLAP dzielą się na cztery kategorie: wielowymiarowe bazy danych, OLAP relacyjny, bazodanowy OLAP i OLAP na biurku użytkownika.

Baza wielowymiarowa. Do zapamiętywania danych stosuje się specjalny serwer bazy danych, zoptymalizowany do przechowywania danych o strukturze wielowymiarowej (hipersześcian), w której wiele komórek jest pustych, a rozmiar danych zagregowanych często przekracza rozmiar danych pierwotnych. Z tego powodu serwer bazy danych Sybase IQ stosuje dynamiczne agregowanie danych w trakcie odczytywania z dysku. Najczęściej stosowanymi serwerami wielowymiarowych baz danych są Express Server firmy Oracle, Informix MetaCube i Essbase firmy Arbor Software.

Relacyjny OLAP. Dane są przechowywane w standardowym serwerze relacyjnych baz danych. Złożone wielowymiarowe zapytania do bazy są przekształcane na typowe zapytania SQL przez warstwę metadanych systemu, usytuowaną poniżej narzędzia do raportowania. Typowym produktem z tej kategorii jest Prodea Beacon firmy Platinum Technology.

Bazodanowy OLAP. Wielcy producenci baz danych zamierzają wkrótce zintegrować możliwości obsługi baz wielowymiarowych ze swymi standardowymi, relacyjnymi serwerami baz danych. Wynikiem jest produkt Sybase IQ, który - mimo że jest serwerem relacyjnej bazy danych - należy do kategorii baz wielowymiarowych ze względu na zastosowanie specjalnych technik indeksowania i agregowania dynamicznego.

OLAP na biurko. Narzędzia te posługują się lokalnymi serwerami wielowymiarowej bazy danych na stacji klienta z Windows. Rozmiar przechowywanych danych jest jednak ograniczony w stosunku do produktów z oddzielną wielowymiarową bazą danych na serwerze unixowym lub z Windows NT.

Typowymi przedstawicielami programów tej kategorii są: PowerPlay firmy Cognos, OLAP Commander firmy Comshare i Business Objects, produkt francuskiej firmy o tej samej nazwie.

Narzędzia OLAP są używane głównie do potwierdzania (lub odrzucania) hipotez za pomocą dobrze sprecyzowanych zapytań do bazy. Korzystając z analizy wielowymiarowej, można także odkrywać zależności i anomalie, wymagające dalszej analizy. Procesy te są jednak wykonywane "ręcznie" przez analityka i wymagają za każdym razem formułowania skomplikowanych zapytań. Im większa hurtownia danych, tym więcej czasu zajmuje ten proces. Narzędzia OLAP nie kwalifikują się do automatycznej analizy danych oraz wykrywania zależności i hipotez, które nie są ani oczywiste, ani łatwe do sformułowania w postaci zapytania do bazy.


TOP 200