Hurtownia w cieniu budżetu

Jaka jest Pana wizja idealnego rozwiązania analitycznego?

W centrum tej wizji jest budżet i to on wyznacza kształt rozwiązania analitycznego. Rola budżetu i kontroli jego realizacji jest w zarządzaniu firmą naprawdę ogromna. Tak jest przynajmniej u nas, w Agorze. Analityka i budżetowanie to nierozerwalna całość. Rolą hurtowni jest dostarczenie wiarygodnej informacji - najpierw do opracowania budżetu, a później do kontroli jego wykonania. System analityczny musi odzwiercie- dlać zmiany zachodzące w organizacji oraz ofercie firmy i w odpowiedni sposób przenosić je do budżetu. Zmian jest bardzo dużo - z roku na rok architektura biznesowa budżetu ulega głębokim modyfikacjom i obowiązkiem systemów wspomagania zarządzania jest umożliwienie tych zmian.

Nie chcemy wdrażać rozwiązania, przy którym bez przerwy będzie musiało siedzieć kilku konsultantów. Sztuka polega na tym, aby zmian nie dokonywać ręcznie, lecz by bazy transakcyjne, korporacyjna hurtownia danych i system analityczno-budżetowy mogły być zarządzane razem i umiały automatycznie wymieniać informacje na temat zmian w swojej strukturze i słownikach. Jak się okazało, jest to wielkie wyzwanie dla dostawców. Kolejnym zagadnieniem wprawiającym ich w zakłopotanie jest szczegółowość danych. Wielu z nich starało się nas przekonać, że nikomu nie są potrzebne dane szczegółowe. System analityczny ma jednak sens tylko wtedy, gdy ludzie mu ufają. A ufać mogą tylko wtedy, jeżeli mają możliwość weryfikacji danych zagregowanych za pomocą danych najniższego poziomu.

Jakie widzi Pan rozwiązanie?

Na rynku funkcjonują dwie klasy rozwiązań w dziedzinie hurtowni danych - spec-jalizowane systemy baz danych klasy ROLAP, takie jak Teradata firmy NCR czy Sybase IQ, oraz bazy uniwersalne, które producenci reklamują jako równie dobre do pracy transakcyjnej i analitycznej.

Trzeba sobie uświadomić, że "zwykły" - transakcyjny silnik bazodanowy, używany do pracy analitycznej, posiada wiele zbędnych komponentów, niepotrzebnie obciążających serwer, jak choćby system ochrony transakcji czy wspomaganie wielowątkowych zapisów. Ten argument przemawiałby za rozwiązaniami specjalizowanymi, pozbawionymi tego balastu. Lecz wtedy wchodzi się w spec-jalistyczne, wymagające oddzielnych kwalifikacji, technologie, a to oczywiście ma cenę. Niemniej takie ideologie budowy systemów, jak niemal fizyczna równoległość pracy bazy Teradata czy pomysł na kolumnowe czytanie danych w Sybase IQ, dają tym systemom przewagę wydajności.

Drugie rozwiązanie to HOLAP (Hybrid OLAP). Polega ono na przechowywaniu danych zagregowanych w kostce OLAP wraz z odnośnikami do danych transakcyjnych. Jeżeli użytkownikowi nie wystarczają dane zagregowane z kostki, w tle wykonywane jest zapytanie SQL do bazy transakcyjnej. Pozwala to połączyć ogromną wydajność baz wielowymiarowych z pełną szczegółowością danych źródłowych. Jednak by taka idea mogła być zrealizowana, konieczne jest wspomaganie takiej hybrydy przez sam system. Komunikacja poszczególnych komponentów nie może być wynikiem działania skryptów napisanych z mozołem przez programistów, bo koszty późniejszej modyfikacji takiego systemu, a także koszt utrzymania jakości danych są zbyt duże. Modne ostatnio narzędzia ETL (Extract, Transform and Load) również nie umożliwiają zadowalającego rozwiązania tego problemu.

Wydaje się jednak, że wszyscy wielcy producenci baz danych zmierzają w kierunku rozwiązań hybrydowych. Jest to zarówno IBM, oferujący bazę DB2 i funkcje OLAP zrealizowane na bazie Essbase'a, jak i Oracle, który zapowiada integrację bazy Oracle Express z bazą transakcyjną w kolejnych wersjach Oracle 9i. Za najbardziej zaawansowaną w tym zakresie technologię uważam jednak rozwiązanie Microsoft Analysis Services dostarczane z bazą SQL Server 2000.

Spędził Pan pół roku testując działanie wielu rozwiązań OLAP. Jak Pan ocenia ich rzeczywistą przydatność dla przedsiębiorstw?

Jesteśmy związani porozumieniami o wzajemnej poufności, nie mogę więc na tym etapie zdradzać zbyt wielu szczegółów. Rozwiązanie NCR jest dobre, bo oparte na prostej, sprawdzonej idei równoległości pracy. W sytuacji gdy nie występuje zbyt wiele wymiarów analiz, a objętości danych są ogromne, wydajność osiągana przez Teradatę jest imponująca. Sybase IQ jest również wart uwagi, ale dopiero w wersji 12. Słabą stroną poprzednich wersji były trudności w ładowaniu danych. Stosowana w nim technologia przeszukiwania tabel wzdłuż kolumn, a nie wg rekordów, przynosi świetne rezultaty, choć nie w każdym modelu danych.

Bardzo interesująco jako całość prezentuje się rozwiązanie Microsoftu. Oprócz mocnego wsparcia dla modelu HOLAP, baza relacyjna MS SQL Server umożliwia wykonywanie zapytań z użyciem dowolnej liczby jednopolowych indeksów. Takie rozwiązanie daje w praktyce bazę bardziej uniwersalną i eliminuje w znacznym stopniu konieczność prowadzenia statystyk zapytań i optymalizacji przeszukiwania tabel.

Znane nam są również dobre strony zarówno Oracle'a 8i, jak i DB2, niemniej nasze prace doprowadziły do ogólnego wniosku, że na tym rynku nie istnieje rozwiązanie idealne do każdego zastosowania. Technologie hurtowni danych i systemów analitycznych są wciąż jeszcze bardzo niedojrzałe, choć uważam za pozytywny objaw wykrystalizowanie się pewnych wspólnych kierunków ich rozwoju.


TOP 200