Hurtownie danych Software AG

Wielkie transakcyjne bazy danych zawierają tak wiele informacji, że tylko niewiele wysoko wtajemniczonych osób w firmie jest w stanie zorientować się w ich zawartości, a dostęp do nich - dla podejmowania decyzji lub przeprowadzenia dokładniejszych badań tendencji czy wyszukania anomalii - wymaga na tyle specjalistycznej wiedzy, że nie bardzo przydają się do wspomagania kierownictwa w jego działaniach. Stąd rozwój hurtowni danych, czyli zbiorczych baz danych, wstępnie przetworzonych, wyposażonych w potężne narzędzia do tworzenia skomplikowanych zapytań, zainstalowanych w zasięgu ręki decydentów. Dzisiaj prezentujemy podejście do realizacji hurtowni danych, jakie Software AG (Darmstadt, RFN) zaprezentował na seminarium w Warszawie.

Wielkie transakcyjne bazy danych zawierają tak wiele informacji, że tylko niewiele wysoko wtajemniczonych osób w firmie jest w stanie zorientować się w ich zawartości, a dostęp do nich - dla podejmowania decyzji lub przeprowadzenia dokładniejszych badań tendencji czy wyszukania anomalii - wymaga na tyle specjalistycznej wiedzy, że nie bardzo przydają się do wspomagania kierownictwa w jego działaniach. Stąd rozwój hurtowni danych, czyli zbiorczych baz danych, wstępnie przetworzonych, wyposażonych w potężne narzędzia do tworzenia skomplikowanych zapytań, zainstalowanych w zasięgu ręki decydentów. Dzisiaj prezentujemy podejście do realizacji hurtowni danych, jakie Software AG (Darmstadt, RFN) zaprezentował na seminarium w Warszawie.

Co to jest hurtownia danych (data warehouse)? Jedna z definicji brzmi: "jest to repozytorium przeznaczone do zbierania, standaryzacji i agregowania kopii danych transakcyjnych, zawartych w operacyjnych lub produkcyjnych systemach informacyjnych firmy". Inna definicja zaś precyzuje: "jest to główne narzędzie do dostarczania informacji dla użytkownika podejmującego decyzje lub informującego kierownictwo". Obydwie te definicje są prawdziwe i jak widać niewiele mają wspólnego z typową hurtownią towarów.

Jeżeli zrealizuje się ją we właściwy sposób i z uzasadnionych powodów, hurtownia danych daje organizacji możliwość podejmowania lepszych decyzji. Im lepsze dane i narzędzia dostępu do nich, tym lepsze decyzje. Z biegiem czasu dynamiczna hurtownia danych - bo wiele osób powinno przez cały czas zastanawiać się, co jest potrzebne do trafnego podejmowania decyzji - da organizacji szansę uelastycznienia i uproszczenia procesu podejmowania decyzji.

Ewolucja

Komu właściwie jest potrzebna hurtownia danych? Od dawna informatycy w firmie usiłowali wykorzystać ten sam proces do dwóch celów: automatyzacji obsługi bieżącej działalności firmy i dostarczania informacji kierownictwu. Dawne metody dostarczania informacji polegały na generowaniu raportów z danych zawartych w systemach produkcyjnych. Jednakże nikt nie lubi, a obecnie nawet nie może czekać, aż biurokratyczna machina firmy dostarczy informacji.

Rozwiązanie problemu sprowadza się do znalezienia takiego centrum dystrybucji informacji, tak przygotowanych - oczyszczonych, zsumowanych, ujednoliconych - aby spełniały wymagania użytkowników. I tak właśnie powstała idea hurtowni danych.

Wymagania

Za ojca hurtowni danych jest uważany William H. Inmon, który określił wymagania, jakie hurtownia powinna spełniać:

- Problemowa - dane zapamiętuje się stosownie do ich typu, nie aplikacji, która z nich korzysta.

- Zintegrowana - ma służyć całej firmie, nie poszczególnym jej oddziałom.

- Nieulotna - informacje w hurtowni nie są zmieniane ani usuwane; dodaje się jedynie kolejne dane z systemów operacyjnych w ustalonych odstępach czasu.

- Uwarunkowana historycznie - dane zawierają także informacje o okresie ich pozyskiwania.

- Przeznaczona do podejmowania decyzji przez kierownictwo firmy.

Cztery fazy implementacji

Hurtowni danych nie kupuje się z półki. Każda hurtownia danych jest realizowana dla potrzeb konkretnej firmy. Jeżeli realizacja hurtowni danych ma się udać - nie można niczego zaniedbać. Firma Software AG określiła 4 etapy realizacji i utrzymania hurtowni danych.

Faza 1. Strategiczna analiza informacji. Zespół analityków musi przygotować model działania hurtowni, ściśle przystosowany do sposobu działania firmy. Wymaga to rozmawiania z każdą osobą podejmującą strategiczne decyzje - od szefa firmy po kierowników oddziałów i departamentów, dyrektora finansowego, głównego księgowego - w celu określenia ich potrzeb informacyjnych. Wynikiem ma być "biała księga" wymagań, pokazująca także jak realizować je za pomocą dostępnej technologii.

Faza 2. Planowanie i projekt. Wymaga dokładnego przeglądu dostępnych źródeł danych, oceny ich zawartości, formatów i lokalizacji, co pozwala określić wymagania na filtrację i sumowanie. Następnie należy określić początkowy model danych, najlepiej oparty na już istniejących modelach danych - hurtownia nie powinna wprowadzać rewolucji w obsłudze informacji w firmie. Projekt zaś ma określić wymagania sprzętowe, programowe i ich konfigurację do realizacji hurtowni.

Faza 3. Konstrukcja i implementacja. Potrzebna tu będzie analiza wydajności sieci w firmie w celu uniknięcia kłopotów z zapełnianiem hurtowni danymi i jej ewentualne "dostrojenie". Wybranie narzędzi do transformacji i oczyszczenia danych przed przesłaniem do hurtowni. W końcu zaś realizacja - najlepiej na początek niewielkiego projektu pilotowego, pozwalającego lepiej zorientować się w rzeczywistych potrzebach użytkowników. Wybranie narzędzi do uzyskiwania informacji z hurtowni, szkolenie w zakresie posługiwania się nimi. Opracowanie dokumentacji.

Faza 4. Utrzymanie sprawności operacyjnej hurtowni. Ta faza trwa najdłużej (całe życie hurtowni) i wymaga znacznie większego wysiłku i nakładu kosztów niż się początkowo sądzi. Jak pokazują doświadczenia firm, które już mają hurtownie danych, ciągłe zmiany w zakresie i zawartości dostępnych danych źródłowych - wynikające ze zmieniającej się działalności firmy - wymagają stałego modyfikowania, uaktualniania i konserwacji hurtowni danych.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200