Dynamika minihurtowni danych

Wiadomo że trzeba będzie zrealizować minihurtownię danych (data mart), ponieważ pracownicy firmy coraz głośniej się jej domagają. Problem nie polega więc na tym, czy budować minihurtownię - raczej chodzi o to, aby nie wrzucać danych w próżnię, z której nie otrzyma się nic w zamian.

Wiadomo że trzeba będzie zrealizować minihurtownię danych (data mart), ponieważ pracownicy firmy coraz głośniej się jej domagają. Problem nie polega więc na tym, czy budować minihurtownię - raczej chodzi o to, aby nie wrzucać danych w próżnię, z której nie otrzyma się nic w zamian.

Rozmawialiśmy z 6 analitykami, którzy podzielili się swymi uwagami z twórcami minihurtowni. Nim jednak dojdziemy do nich, trzeba odpowiedzieć na podstawowe pytanie: co to jest minihurtownia danych?

Niejako symbolizując różnorodność rynku, otrzymaliśmy sześć różnych definicji. W tym przypadku skorzystamy z następującej definicji: minihurtownia danych to zbiór baz danych i narzędzi koncentrujących się na specyficznym problemie biznesowym. Rozmiar hurtowni nie określa jej kategorii, chociaż minihurtownie są na ogół mniejsze niż regularne hurtownie danych, które zawierają dane z całego przedsiębiorstwa, dotyczące wielu aspektów jego działalności.

Równie trudne jak zdefiniowanie minihurtowni jest określenie wymagań i rozwiązań, które pozwolą na jej implementację. Analitycy wyrazili swoje zdanie na temat realizacji polegającej na wystartowaniu z regularnej hurtowni danych i segmentacji jej na minihurtownie; budowaniu hurtowni, poczynając od minihurtowni, kupowaniu produktów prawie gotowych minihurtowni oraz budowaniu własnej minihurtowni.

Z góry na dół czy z dołu do góry?

Istnieją niewielkie szanse, że dwa przedsiębiorstwa będą budować minihurtownię w taki sam sposób. Każdy przystępuje do pracy z zestawem własnych wymagań, co sprawia, że decyzja dotycząca sposobu budowy minihurtowni jest subiektywna.

Analitycy wspominali o dwóch dominujących metodach budowy minihurtowni: z góry na dół i z dołu do góry. Z góry na dół oznacza wystartowanie od regularnej hurtowni i wydzieleniu minihurtowni z tej centralnej składnicy danych. Z dołu do góry natomiast polega na rozpoczynaniu od minihurtowni, by dojść do dużej hurtowni.

„Analitycy raczej zalecali podejście z góry na dół. Daje ono elastyczną możliwość zmiany zawartości minihurtowni w miarę pojawiania się nowych okoliczności” - mówi Kevin Strange, analityk z Gartner Group. Stwierdza on, że moda na minihurtownie pojawia się i znika, podobnie jak moda na aplikacje.

Rozpoczynając od hurtowni, zawsze można usunąć minihurtownię i zastąpić ją inną. Dane wstępnie oczyszczone, przetransformowane i zagregowane czekają w hurtowni na użycie. Kevin Strange twierdzi, że „jedyne pewne wymaganie użytkownika jest takie, że może się ono zmienić”.

Ted Schadler, analityk z Forrester Research, uważa, że podejście z góry na dół daje nam ogólny pogląd na dane w przedsiębiorstwie. Mając hurtownię, wiemy, gdzie znajdują się dane wstępnie zagregowane. Formułując zapytanie, wiemy, gdzie znajdują się dane finansowe, a gdzie marketingowe.

Mimo iż analitycy uważają podejście z góry na dół za idealne, zgadzają się, że nie zawsze realizacja minihurtowni następuje w taki sposób. Przedsiębiorstwo może realizować minihurtownię z dołu do góry, jeśli potrzebuje jej do specyficznych celów i nie przewiduje rozwijania jej do rozmiaru pełnej hurtowni danych.

Niezależnie jednak od wybranej metody realizacji, najważniejsze jest upewnienie się, że minihurtownie mogą się komunikować. „Minihurtownie, które nie komunikują się ze sobą, to śmierć” - uważa Ted Schadler.

Jeżeli firma buduje minihurtownie niezależne od regularnej hurtowni, musi zapewnić spójność danych. „Wspólne dla całego przedsiębiorstwa metryki - reguły definiowania danych - są niezbędne do uniknięcia błędnych wyników uzyskanych na zapytanie zadane do minihurtowni” - mówi Bob Moran z Aberdeen Group.

Stworzenie tej spójności nie jest łatwe. „Próba zbudowania wielu minihurtowni do wspierania podejmowania strategicznych decyzji przypomina próbę zapędzenia kilku kotów w stado. Bardzo trudno jest je zmusić do poruszania się w tym samym kierunku” - mówi Kevin Strange.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200