Hurtownia dla początkujących

Systemy wspomagające podejmowanie decyzji i stanowiące ich fundament - hurtownie danych - można znaleźć w coraz większej liczbie firm.

Systemy wspomagające podejmowanie decyzji i stanowiące ich fundament - hurtownie danych - można znaleźć w coraz większej liczbie firm.

Takie są bowiem wymogi rynku. W niektórych branżach firma, która nie ma systemu wspomagania decyzji, znajduje się w niekorzystnej sytuacji konkurencyjnej. Informatyczny system wspomagania podejmowania decyzji ułatwia bowiem pracę kierownictwa firmy.

Powiększ

Systemy produkcyjne są tak skonstruowane, by mogły obsłużyć jak największą liczbę powtarzających się transakcji. W systemach tych dane są przechowywane w postaci znormalizowanej, nie nadają się jednak do bezpośredniego uzyskiwania danych pomocnych przy podejmowaniu decyzji. Informacje te mogą być przygotowane przez specjalistów z działu informatyki, którzy potrafią napisać zapytania do baz danych. Specjaliści ci otrzymują zamówienie od pracowników działów biznesowych firmy, uzyskują dane i tworzą raport. Takie rozwiązanie z oczywistych względów nie sprawdzi się na dłuższą metę - jest czasochłonne, wymaga angażowania cennych pracowników i nie zawsze daje oczekiwane rezultaty. Toteż, gdy kierownictwo potrzebuje uzyskania stałego analizowania danych ukrytych w systemach produkcyjnych, szuka sposobu na automatyzację procesu uzyskiwania danych.

Hurtownia danych, czyli budowa oddzielnego repozytorium zagregowanych danych, przechowywanych w postaci zdenormalizowanej, zasilanego z systemów produkcyjnych i dostępnego specjalizowanym narzędziom analitycznym, jest rozwiązaniem drogim i trudnym w realizacji. Dlatego zazwyczaj pojawia się pokusa pójścia na skróty, czyli pozyskiwania danych z baz za pomocą doraźnie uruchamianych skryptów, w których ukryte są zapytania do baz danych. Na początku rozwiązanie to funkcjonuje całkiem nieźle, ale w miarę wzrostu oczekiwań użytkowników (którzy chcą dostępu do coraz większej liczby raportów) skrypty rosną, aż ktokolwiek przestaje nad nimi panować.

Powiększ

Bardziej zaawansowane rozwiązania tego typu to tzw. wirtualna hurtownia danych. Dane otrzymuje się poprzez specjalizowane programy w czasie rzeczywistym z produkcyjnych baz danych. Nie trzeba wówczas budować osobnego repozytorium i dane są zawsze aktualne. Brzmi to interesująco, w praktyce takie podejście okazuje się utopią. Po pierwsze, w przypadku większych systemów dostęp nie będzie natychmiastowy, zaś dodatkowe obciążenie systemu może doprowadzić do zakłóceń w funkcjonowaniu baz produkcyjnych. Po drugie, zazwyczaj trzeba analizować także dane archiwalne, a nie tylko te aktualnie znajdujące się w systemach produkcyjnych. Dlatego nie da się uniknąć procesu ekstrakcji, ładowania i agregowania danych do hurtowni stanowiącej osobne ich repozytorium. Wówczas można dane oczyścić, czyli wyeliminować błędy zawarte w danych z systemów produkcyjnych. Błędy, które ujawniają się dopiero na etapie konsolidacji.

Pojawiają się wówczas wszelkie niespójności w bazie, powstałe w wyniku np. ręcznego poprawiania danych, błędów operatorów czy braku słowników. Każdy zespół, który prowadził wdrożenie hurtowni, zdaje sobie sprawę, jak wiele znaczą błędne zależności czasowe, zduplikowane atrybuty, błędne wyliczenia, zduplikowane klucze, błędne zakresy wartości, niestandardowe formaty, nieuzasadnione relacje... Toteż przy budowie hurtowni danych tak wiele zależy od jakości fundamentu, jakim są systemy produkcyjne i zawarte w nich dane.

Budowa hurtowni ujawnia zależności między danymi zgromadzonymi w tych systemach, pozwala ujednolicić definicje tych danych i przez to wprowadzić wspólne rozumienie poszczególnych wskaźników w przedsiębiorstwie. Dopiero wówczas wdrożenie hurtowni kończy się sukcesem, gdy użytkownicy - pracownicy działów merytorycznych - chcą z niej korzystać. A będą chcieli, gdyż przede wszystkim z hurtowni będą uzyskiwali dane aktualne, kompletne, prawidłowe i przede wszystko wiarygodne. n


TOP 200