Ewolucja składnicy danych

Operacyjna składnica danych to nowa koncepcja przechowywania danych w przedsiębiorstwie.

Operacyjna składnica danych to nowa koncepcja przechowywania danych w przedsiębiorstwie.

Operacyjna składnica danych ODS (Operational Data Store) ma na celu dostarczanie informacji o stanie przedsiębiorstwa, niezbędnych do podejmowania działań na najwyższym, taktycznym poziomie. Różni się zasadniczo od typowej hurtowni danych, służącej analitykom i kierownictwu średniego szczebla, podejmującym codzienne decyzje strategiczne, wymagających znajomości szczegółów działań transakcyjnych. Różni się też od tzw. ogólnej hurtowni danych dla całego przedsiębiorstwa, służącej jako centralne źródło oczyszczonych danych.

Hurtownie danych

Hurtownie danych i minihurtownie na ogół posługują się tabelami zdenormalizowanymi i hierarchicznymi strukturami gwiazdowymi, zapewniającymi szybkie uzyskiwanie odpowiedzi na skomplikowane zapytania analityczne, wymagające dostępu do danych i ich agregatów (sum cząstkowych). Zawierają dane archiwalne mocno zagregowane w wielu wymiarach, co pozwala na szybkie uzyskiwanie odpowiedzi na wiele zapytań "standardowych". Ogromne tabele "faktów" umożliwiają dostęp do szczegółowych danych transakcyjnych do "drążenia w głąb" i uzyskiwanie odpowiedzi na pytania coraz bardziej dociekliwe.

Natomiast hurtownia danych dla całego przedsiębiorstwa (EDW) ma inny cel niż typowe hurtownie danych. Służy do zapewnienia źródła danych ujednoliconych, oczyszczonych z błędów i niejednoznaczności, przeniesionych z systemów transakcyjnych. Potrzeba jej tworzenia pojawia się tylko tam, gdzie już istnieje co najmniej kilka hurtowni danych lub tematycznych oraz wiele źródeł danych transakcyjnych.

Centralna składnica danych archiwalnych umożliwia ujednolicenie terminologii biznesowej we wszystkich lokalnych i oddziałowych hurtowniach danych i stworzenie jednej składnicy metadanych (odniesienia definicji danych biznesowych do zestawu tabel i kolumn w centralnej hurtowni danych). Zmniejsza również obciążenie systemów transakcyjnych operacjami ładowania i czyszczenia danych do lokalnych hurtowni oddziałowych. W celu zapewnienia niezbędnej elastyczności w masowym dostarczaniu danych do hurtowni tematycznych schemat bazy może być znormalizowany, choć niekoniecznie tak ściśle jak w systemach transakcyjnych.

Składnica operacyjna

Operacyjna składnica danych (ODS) ma odzwierciedlać aktualny stan przedsiębiorstwa. Wymaga więc częstej aktualizacji zawartości bazy przez przenoszenie danych z bieżących transakcji do ODS przez lub często wykonywane operacje wsadowe. Ponadto musi umożliwiać szybki dostęp do danych, np. w celu uzyskiwania przez personel przedsiębiorstwa, a szczególnie osoby pierwszego kontaktu z klientem, aktualnych informacji o kliencie, np. bieżącym saldzie obrotów, stanie zadłużenia i przyznanych uprawnieniach kredytowych.

Baza ODS ma więc charakter zbliżony do bazy danych transakcyjnych. Jest ściśle znormalizowana w celu zapewnienia niezbędnej elastyczności dostępu do dowolnych danych. Zapytania do ODS są na ogół znacznie prostsze niż w przypadku hurtowni danych, nie wymagają łączenia tabel, pozwalają więc na uzyskanie odpowiedzi praktycznie natychmiast. Nie sięga się też do danych archiwalnych.

Również operacje wykonywane na ODS są zbliżone do operacji na bazach transakcyjnych i z tego powodu ODS jest często mylona z bazami transakcyjnych danych operacyjnych. Są to jednak zupełnie inne systemy, działające z wykorzystaniem innych danych.

Duże wymagania

Niewiele przedsiębiorstw może pozwolić sobie na instalację i jednoczesne utrzymywanie ogólnej hurtowni danych dla całego przedsiębiorstwa EDW oraz operacyjnej składnicy danych ODS. EDW jest przeznaczona głównie do wykonywania masowych operacji pobierania i eksportu danych, gdy ODS wymaga szybkich aktualizacji transakcyjnych i błyskawicznych odpowiedzi dla wielu użytkowników o diametralnie różnych wymaganiach. Z powodu sprzecznych wymagań nie ma prostej możliwości połączenia tych systemów w jedno wspólne rozwiązanie.

ODS wymaga obsługi dużych zasobów danych (mimo że nie zawiera danych archiwalnych) i krótkiego czasu odpowiedzi. Skutecznie może więc działać jedynie na komputerach równoległych SMP lub MPP i klastrach. ODS wymaga również wydajnego systemu zarządzania relacyjnymi bazami danych. Konieczność stałego dostępu do danych mogą zapewnić jedynie wyrafinowane systemy zarządzania, umożliwiające reorganizację bazy na bieżąco, bez konieczności odłączania tabel lub całej bazy od systemu.

Istniejące rozwiązania ODS bazują najczęściej na mainframe'ach i bazach DB2 oraz komputerach równoległych o właściwościach zbliżonych do mainframe: Tandem Himalaya z bazą NonStop SQL, komputerach unixowych Sun Starfire E10000 z bazami Informix i Oracle oraz IBM RS/6000 SP z bazami IBM, Oracle, Informix.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200