Udany dostęp do danych

Wybór właściwych narzędzi do obsługi hurtowni danych powinien być oparty na solidnych podstawach.

Wybór właściwych narzędzi do obsługi hurtowni danych powinien być oparty na solidnych podstawach.

Hurtownia danych to najlepszy sposób przekazania informacji o działalności firmy wszystkim pracownikom, podejmującym decyzje na szczeblu operacyjnym. Jak dowodzą badania efektywności zarządzania, decyzje operacyjne mają znacznie większy wpływ na status finansowy i wyniki firmy niż decyzje podejmowane na szczeblu strategicznym. Z tego powodu hurtownia danych powinna być jak najszybciej dostępna dla każdego pracownika firmy, podejmującego decyzję. Wybór metody jej realizacji, narzędzi i architektury ma kluczowe znaczenie dla szybkiego uzyskania wyników, uzasadniających podjęty wysiłek.

Kilka mitów o dostępie do danych

Mit 1. Wystarczy utworzyć hurtownię. To nie wystarczy - trzeba dane z hurtowni udostępnić użytkownikom. Dla nich pojęcie hurtownia sprowadza się do narzędzia dostępu. To właśnie za pomocą narzędzi dostępu do danych użytkownik może je przejrzeć, wydrukować, dołączyć do dokumentu tekstowego, poddać wszechstronnej analizie, zaprezentować w postaci wykresu itp.

Mit 2. Wystarczą nam narzędzia dostarczone z bazą danych. Kiedy ostatnio otworzyłem sobie pakiet Windows Interactive (WISQL) do pobierania danych z bazy, okazało się, że zupełnie nie pamiętam składni zapytań SQL, nie wiem w jakich tabelach rezydują interesujące mnie dane, jak wykonać skomplikowane wielotablicowe zapytanie, jak pogrupować wynik itd. I to wszystko zaledwie w miesiąc po dokładnym przestudiowaniu podręcznika pakietu WISQL! Jaki pożytek może odnieść użytkownik z takiego narzędzia? Żaden.

Mit 3. Jak już zbudujemy hurtownię, użytkownicy się znajdą. Wiele istniejących hurtowni danych nie jest używanych z dwóch powodów: albo baza została zaprojektowana niewłaściwie i zapytania wykonują się za długo, jak na wytrzymałość użytkownika, albo użytkownik nie dysponuje właściwymi narzędziami dostępu do danych. Hurtownia danych powinna zapewnić użytkownikom lepsze narzędzia dostępu niż raporty, które do ich dyspozycji opracowali zakładowi informatycy.

Użytkownicy będą korzystać z dostępnych im metod zbierania danych, jeśli nie zapewni im się narzędzia lepszego, wygodniejszego w użyciu i prostszego. Stwierdzenie, że wgranie danych do hurtowni wystarczy aby pozyskać użytkowników, jest nieuzasadnione. Jednakże nawet przygotowanie znakomitego narzędzia bez właściwej dokumentacji, szkolenia i wspomagania nie gwarantuje sukcesu.

Wybieranie narzędzi

Nim wybierzemy właściwe narzędzia do przeglądania i wybierania danych, celowe jest zastanowienie się nad trzema sprawami:

- Co zamierzamy robić z hurtownią danych?

- Jaka jest baza naszych potencjalnych użytkowników?

- Jakie są możliwości funkcjonalne różnych narzędzi?

Co zamierzamy robić z hurtownią danych? Hurtownia danych najczęściej zastępuje raporty, które do tej pory były przygotowywane przez informatyków. Bardziej ambitny cel to dostarczenie narzędzi analitycznych, umożliwiających użytkownikom dostęp do zasobów hurtowni i prowadzenie analiz on-line.

Jaka jest baza naszych potencjalnych użytkowników? Nie wszyscy specjaliści od biznesu mają taką samą wiedzę i doświadczenie w używaniu komputerów, nie każdy też ma opanowane podstawy technik statystycznych i analitycznych. Nieprawdą też jest, że użytkownik biznesowy jest zainteresowany opracowaniem własnych raportów z bazy. Przed rozpoczęciem realizacji projektu należy podzielić użytkowników na grupy i określić ich wymagania oraz zapotrzebowanie na dostęp do danych z bazy.

Szef przedsiębiorstwa lub inna osoba ze ścisłego kierownictwa potrzebuje:

a) informacji na temat stanu przedsiębiorstwa;

b) dobrze wybranego zestawu raportów, do których sięgnie w razie potrzeby i będzie się mógł poruszać swobodnie w zakreślonych ramach;

c) graficznej prezentacji wyników;

d) dodatkowych informacji, które uzyska na życzenie od specjalisty analityka lub informatyka.

Użytkownik początkujący wymaga silnego wspomagania ze strony narzędzia, pokazującego mu możliwości nawigowania po danych oraz dostępu do zestawu gotowych raportów, związanych z jego stanowiskiem pracy.

Analityk chętnie skorzysta z zestawu gotowych raportów, w których będzie mógł zmieniać parametry i dostosowywać je do aktualnych potrzeb.

Specjalista od statystyki biznesowej lub matematyk obciąży bazę najbardziej, ponieważ nie tylko zbuduje własne raporty i zmodyfikuje istniejące, ale może też przygotować taki zestaw zapytań, które "powalą na kolana" dowolny system obsługi hurtowni. Podobny wpływ na funkcjonowanie hurtowni mają programiści przygotowujący raporty dla potrzeb innych użytkowników i testujący je na "żywym organizmie" hurtowni.

Hurtownia funkcjonuje najlepiej, wtedy gdy obsługuje niewielką grupę użytkowników o zbliżonym poziomie wymagań i potrzeb.

Architektura hurtowni

Podobnie jak inne aplikacje klient/serwer, hurtownia może być zrealizowana w architekturze jednowarstwowej (baza danych, motor analityczny i narzędzie dostępu działają na jednym komputerze). Jest to rozwiązanie praktycznie nie spotykane, gdyż nie daje możliwości obsługi dużych zasobów danych.

W architekturze dwuwarstwowej baza danych działa na jednym komputerze, użytkownik ma do dyspozycji komputer z interfejsem graficznym dostępu do danych; motor analityczny może działać na stacji klienta, ale częściej funkcjonuje na serwerze bazy danych.

Najkorzystniejsze w przypadku dużej hurtowni danych i dużej liczby użytkowników jest wydzielenie specjalnego serwera aplikacji (architektura trójwarstwowa), na którym będzie działać motor analityczny i narzędzia do uzupełniania danych w hurtowni, ściągające je z baz operacyjnych.

Narzędzia dostępu do danych

Narzędzia dostępu do danych dają się podzielić na dwie stosunkowo szerokie kategorie: narzędzia relacyjne do przetwarzania analitycznego (Relational OnLine Analytical Processing - ROLAP) i narzędzia oparte na wielowymiarowych bazach danych (Multidimensional DataBase - MDB). Podział ten wynika ze sposobu dostępu do analizowanych danych - z bazy relacyjnej lub ze specjalistycznej (na ogół ściśle związanej z narzędziem) bazy wielowymiarowej.

Jeżeli chodzi o właściwości funkcjonalne, to narzędzia można podzielić na kilka kategorii: programy do przygotowywania raportów i bezpośredniej kwerendy bazy oraz narzędzia do analizy wielowymiarowej.

Programy do przygotowywania raportów podają wyniki w formie tabelarycznej, mają duże możliwości formatowania wyników i zmiany formy raportu w celu zaprezentowania tych samych danych w innym przekroju. Często zawierają możliwości nieuwzględniania danych (oparte na centralnym repozytorium obiektów w bazie) przez zmianę nazw tabel i widoków z bazy na terminy zrozumiałe dla użytkownika. Najlepsze narzędzia z tej kategorii zawierają także moduły administracyjne, pozwalające na ścisłe określenie praw dostępu do poszczególnych obiektów bazy, niezależne od pakietu administracyjnego serwera bazy danych.

Programy do bezpośredniej kwerendy bazy to graficzne narzędzia typu ROLAP, pozwalające użytkownikowi na bezpośredni dostęp do tabel bazy, tworzenie zapytań SQL i tymczasowych tabel do dalszej analizy i duże możliwości manipulowania na wynikach. Na ogół wymagają znajomości języka SQL. Dostęp do centralnego repozytorium danych o danych i obiektach znacznie podnosi ich walory funkcjonalne.

Wyróżnikiem możliwości zaawansowanych narzędzi do wspomagania podejmowania decyzji jest tworzenie i operowanie na wielowymiarowych widokach bezpośrednio z bazy relacyjnej. Pozwala to na wykonywanie operacji "przecinania i obracania" (slice and dice) dla uzyskania różnych przekrojów tej samej bazy.

Specjalne narzędzia do analizy wielowymiarowej pracują na ogół na lokalnej lub centralnej wielowymiarowej bazie danych i służą do tworzenia wielu przekrojów danych według różnych wymiarów opisowych z hurtowni danych. Lokalna (na stacji klienta) baza wielowymiarowa ma ograniczone możliwości jeśli chodzi o rozmiar danych, na których może operować, ale wydajność i szybkość analizy nie jest zależna od obciążenia hurtowni przez innych użytkowników, gdyż do działania wymaga jedynie wczytania kopii danych z hurtowni.

Nie wystarcza jedno narzędzie

Różne kategorie użytkowników potrzebują różnych narzędzi dostępu do danych. Informatycy wymagają sprawnego pakietu programistycznego do wstępnego przygotowania zestawu raportów, pozwalającego na szybki rozruch hurtowni. Specjalista od polityki finansowej firmy potrzebuje zaawansowanego narzędzia analitycznego z obszernymi możliwościami statystycznymi. Analiza koszyka zakupów czy profilowanie sprzedaży i marketing wymagają narzędzi o dużych możliwościach analizy wielowymiarowej.

Zestaw narzędzi analitycznych dostępnych na rynku jest obszerny i wszystkie są produktami nowymi. Bezcelowym jest poszukiwanie firmy z dziesięcioletnim doświadczeniem w takiej działalności, bo ich po prostu nie ma. Warto jednak zobaczyć osobiście co najmniej jedno wdrożenie narzędzia, aby poznać jego rzeczywiste możliwości i ograniczenia.