Wielowymiarowość w Excelu

Niezależność danych, wielowymiarowość i identyfikacja przez nazwę

Zastosowanie serwera bazy wielowymiarowej implikuje niezależność danych. Może powstawać wiele raportów i analiz, z których każda znajduje się w oddzielnym arkuszu, ale wszystkie oparte są na tych samych danych, co więcej, zawierają te same dane. Zamiast wartości przechowują one dynamiczne odwołania do bazy danych, tak że każda zmiana zawartości bazy spowoduje automatyczną zmianę we wszystkich arkuszach, odwołujących się do danych zmodyfikowanych.

Wielowymiarowa baza danych z natury pozwala na definiowanie podsumowań (agregowania) na dowolnym poziomie i dowolną liczbę razy. Oznacza to nie tylko wstawianie sum w wierszach i kolumnach w danym widoku danych, ale także możliwość przeprowadzania automatycznej konsolidacji wielu widoków. Ponadto agregacja jest wykonywana nie w arkuszu, ale na serwerze, jest zawsze dostępna dla wszystkich użytkowników i wciąż aktualna. Przeliczanie w czasie rzeczywistym nie jest cechą charakterystyczną wszystkich baz danych, jednak wiele z nich udostępnia taki mechanizm. Jest on szczególnie przydatny w analizach wymagających natychmiastowej reakcji na zmiany danych, takich jak budżetowanie, prognozowanie, raportowanie finansowe, analizy scenariuszowe itp.

Wraz z powiększaniem się systemu opartego na arkuszach użytkownicy napotykają kolejną trudność. Projekt zbudowania budżetu, który ma zawierać 250 pozycji kosztowych, na 12 miesięcy, dla każdego z 10 departamentów w 4 regionach, na kolejne 5 lat, oznacza wypełnienie 600 tys. komórek. Jeżeli dołączymy konieczność sprawdzania na bieżąco podsumowań, porównywania z archiwum, sprawdzania jak kolejna, właśnie wprowadzona dana, wpłynie na inne pozycje, okaże się, że zapewniliśmy pracę na kilka tygodni sporej grupie osób. Wielowymiarowe bazy danych (choć nie wszystkie) ułatwiają ten proces, pozwalając na odwoływanie się do danych przez nazwę. Zamiast pisać niewiele znaczące adresy A43, AV97, komórki są identyfikowane przez nazwę, np. oddział Opole, zysk brutto itp. bez potrzeby definiowania regionów dla wszystkich istotnych elementów skoroszytu. Dodatkowym atutem tego mechanizmu jest ułatwienie komunikacji w grupie analityków. Analizy przygotowane przez jedną osobę są zrozumiałe dla pozostałych bez konieczności tworzenia dodatkowej dokumentacji. Ponadto 600 tys. danych nie jest dużą liczbą dla wielowymiarowej bazy danych, zdarzają się bazy analityczne zawierające setki milionów danych w jednej kostce, zastosowania rzędu kilku milionów są bardzo częste, przy czym należy pamiętać, że baza danych może zawierać wiele takich kostek.

Konsekwencją identyfikacji danych przez nazwę jest wymuszenie niepowtarzalności nazw elementów wymiarów (nie dotyczy to danych typu tekstowego czy cech elementów, które mogą się powtarzać). Można dyskutować, czy to dobrze, czy źle. Na pewno jednak powoduje ujednolicenie terminologii stosowanej w przedsiębiorstwie i jasne zdefiniowanie pojęć, tak by oznaczały jedno dla wszystkich i nie było wątpliwości, czy np. sprzedaż netto w arkuszu zawiera, czy nie zawiera sprzedaż międzywydziałową. Musi ona oznaczać to samo dla dyrektora, kontrolera finansowego, szefa oddziału i analityka, który przygotował analizę. W bazie nie ma miejsca na dwa różne elementy o nazwie sprzedaż netto, wszyscy wiedzą natomiast, co oznaczają jej wartości.

Niezależność danych, wielowymiarowość i identyfikacja przez nazwę przynoszą jeszcze jedną nieoczekiwaną możliwość. Stworzony w arkuszu kalkulacyjnym model, służący do analizy zbioru danych, może posłużyć do analizy innego zbioru o takiej samej strukturze. Można łatwo zbudować raport, w którym wszystkie dane zostaną prosto zastąpione nowymi po zmianie tylko jednej z etykiet, np. z oddział Opole na oddział Katowice czy wpisaniu październik zamiast wrzesień.

Połączenie arkusza kalkulacyjnego z wielowymiarową bazą danych znacznie obniża koszty związane z tworzeniem powtarzalnych raportów (np. na koniec okresu). Wykorzystanie w tym celu samego arkusza wymusza za każdym razem konieczność ładowania danych z bazy operacyjnej. Podłączenie arkusza do bazy sprawia, że wszystkie te "ręczne" operacje są niepotrzebne, arkusz jest bowiem dynamicznie podłączony do źródła danych. Wiele raportów i analiz może powstać automatycznie dla następnego okresu przez otwarcie arkusza np. dla poprzedniego miesiąca i przeliczenie go lub przez zmianę zawartości jednej komórki, np. wpisanie październik w miejsce wrzesień. Stąd już tylko mały krok do pełnej automatyzacji raportowania okresowego - wystarczy napisanie krótkiego makra, by zamiast comiesięcznego kilkudniowego wysiłku, otrzymać ten sam zestaw raportów w ciągu godziny, uruchamiając proces przez naciśnięcie jednego przycisku i odbierając gotowe wydruki po powrocie do pracy.

Razem i osobno

Same zalety? Na pewno nie. Opisane środowisko nie zmienia ani arkusza kalkulacyjnego, ani wielowymiarowej bazy danych. Uczynienie z Excela lub Lotusa aplikacji klienckiej serwera wielowymiarowej bazy danych daje ich użytkownikom nowe możliwości. Niestety, równocześnie podkreśla ograniczenia. Chociaż w bazie wielowymiarowej może być wielokrotnie więcej niż tylko 64 tys. elementów, to pojedynczy arkusz może zawierać co najwyżej tyle linii. Pocieszeniem jest to, że niezwykle trudno jest analizować tak wiele danych w jednej tabeli. Jednocześnie to samo ograniczenie działa także w przeciwnym kierunku. Jeżeli chcemy zarządzać bazą danych jedynie z Excela, to liczba możliwych elementów na wymiarach szybko maleje wraz ze wzrostem liczby projektowanych hierarchii. Wyjściem jest zastosowanie dodatkowych narzędzi do budowy struktury, tyle że nie są to już arkusze kalkulacyjne. Podobnie pewnych dodatkowych narzędzi trzeba używać przy wybieraniu danych z ogromnych kostek wielowymiarowych.

Silne strony

Użytkownik otrzymuje środowisko o nowych lub szerszych możliwościach, które umożliwia mu modelowanie, zarządzanie i nadzorowanie procesów zachodzących w przedsiębiorstwie, przy użyciu ulubionej aplikacji. Fachowcy, dobrze znający arkusze kalkulacyjne, mogą łatwiej przekładać swoją wiedzę biznesową na silne aplikacje do zarządzania i kontrolingu wprost na swoich biurkach. Po naszkicowaniu modelu łatwo można go zasilić danymi i sprawdzić na bieżąco, a kiedy zostanie dopracowany, może być udostępniony innym użytkownikom jako samodzielna aplikacja kliencka. Możliwa jest pełna współpraca w grupie, operacje na tych samych danych w tym samym czasie, bez czekania na ostatnią wersję arkusza, przygotowywanego przez kolegę. W ten sposób osiągalne staje się zbudowanie nawet dużej, strategicznej aplikacji bez specjalnego przygotowania technicznego i pomocy informatyków.

Jedynym widocznym znakiem, że Excel jest podłączony do potężnego serwera wielowymiarowej bazy danych, jest dodatkowa pozycja w menu. W polu edycji widać, że w arkuszu znajdują się odwołania do źródła danych.

<hr size=1 noshade>Maciej Kujawski jest specjalistą systemów analitycznych w firmie TCH SYSTEMS.


TOP 200