Analiza - zrób sobie sam

Funkcje analityczne będą dostępne z poziomu normalnego kodu TSQL i używane w "zwykłych" kwerendach. Dotyczy to zarówno operacji na kostkach OLAP, jak i odwołań do modelu eksploracji danych. Wreszcie można będzie kolejno "ponumerować" wyniki zapytania - dodając operator RANK. Nowa wersja SQL Server pozwoli również na budowanie rozbudowanych raportów krzyżowych - poprzez wykorzystanie dwu nowych operatorów - PIVOT i UNPIVOT. Wprowadzono także obsługę kwerend rekurencyjnych, które w wielu przypadkach (np. drzewiastej hierarchii elementów) są trudne do zrealizowania.

Wprowadzony został mechanizm MDX Scripting (do obsługi kostek OLAP) i programowo definiowane struktury analityczne (przy użyciu języka ODL - Object Definition Language, opartego na XML).

W Yukon została dodana zupełnie przebudowana warstwa administracyjna, służąca do zarządzania rozwiązaniami analitycznymi. Nowe SQL Server 2005 Business Intelligence Development Studio to "pełnoprawne" IDE, pozwalające na tworzenie całych aplikacji - a nie tylko na administrowanie kostkami. Programista może tam w jednym środowisku połączyć pakiety DST, skrypty SQL, modele do eksploracji danych czy fragmenty kodu. To środowisko można traktować nie tylko jak środowisko programistyczne, ale również jako pulpit pracy analityka (a przynajmniej takiego, któremu nieobce są pewne szczegóły techniczne).

Warto też dodać, że nowe IDE zawiera gotowe wzorce obrazujące, jak wygląda struktura standardowych rozwiązań typu Business Intelligence. Dostępne są wzorce dla kostek, KPI, nazwanych zestawów danych, akcji itp. - praktycznie każdego elementu dostępnego w usługach analitycznych w Yukonie. Wzorzec zapisany jest w postaci XML i bez problemu można stworzyć własne tego typu "podpowiedzi" - albo ręcznie, albo przy użyciu kreatora.

BIDS upraszcza także proces wdrażania - pozwala łatwo przenieść elementy składowe projektu na docelowy serwer. Obsługuje także dodatkowo specjalny tryb pracy, gdzie operacje wykonywane są lokalnie, bez wgrywania na serwer. Dzięki temu nawet bez wgrywania struktur na serwer można przetestować rozwiązanie. Potem proces wgrywania wszystkich elementów na serwer sprowadza się właściwie do wyboru jednej opcji.

DTS na piątkę

Mechanizm Data Transformation Services (DTS) - przeznaczony do wykonywania operacji ekstrakcji, przekształcania i ładowania danych do hurtowni danych (ETL) w SQL 2005 to zupełnie nowy produkt. Po pierwsze, Microsoft oddzielił definiowanie zasad transformacji danych i algorytmów określających kolejność wykonywania operacji. Te operacje realizują dwa moduły Data Transformation Runtime (DTR) oraz Data Transformation Pipeline (DTP). Te elementy zostały także rozdzielone w graficznym interfejsie, co spowodowało, że diagram DTS stał się bardziej czytelny. W zależności od potrzeb, moduł projektanta może pomóc w ocenie, jakim zmianom ulegają same dane, albo też modyfikować cały proces transformacji. Oprócz samego projektowania, za jego pomocą można także śledzić krok po kroku wykonanie operacji typu Runtime, podglądając zmienne, stan danych itp.

Definiując przepływ danych w Yukon znacznie rzadziej trzeba uciekać się do pomocy skryptów. Większość często używanych czynności może być wykonana przy użyciu standardowych mechanizmów - wbudowano obsługę pętli czy iteracji po wierszach tabeli.

Warto przypomnieć, że jedynym sposobem rozszerzania funkcjonalności DTS w SQL Server 2000 było samodzielne stworzenie skryptu lub komponentu COM. W Yukonie istnieje dodatkowo tzw. Task Host - usługa zapewniająca, że samodzielnie napisany komponent w pełni zintegruje się z całym środowiskiem DTS.

Yukon DTS jest uniwersalnym "kanałem przesyłowym". O ile we wcześniejszych wersjach SQL Server DTS pobierał dane z jakiejś tabeli/pliku i zapisywał je do analogicznego medium, o tyle w wersji dla Yukon można np. bezpośrednio z DTS zasilić raport. Lepsza jest także integracja (w tym możliwość pobierania i zapisywania danych) z Microsoft Analysis Services (czyli OLAP) oraz z mechanizmów eksploracji danych. Dodatkowo wynik działania modelu data mining może być również źródłem informacji dla DTS.

Przebudowana analiza

W Yukon w usługach analitycznych i w mechanizmach eksploracji danych zmieniło się bardzo dużo.

Na przykład przy tworzeniu kostki OLAP można zdefiniować kilka tzw. tabel faktów, co pozwala na utworzenie dowolnego schematu kostki (a nie tylko gwiazdy/płatka śniegu). Z OLAP usunięto wiele ograniczeń, np. znikło automatyczne grupowanie wykorzystywane do tego, aby liczba elementów nie przekroczyła 64 tys., jak miało to miejsce w SQL 2000.

Wymiar może więc mieć w zasadzie dowolną objętość - w każdym razie nie jest już ograniczony wielkością dostępnej pamięci RAM.

Zmieniona została obsługa tzw. osieroconych wierszy w tabelach faktów (osierocone wiersze to takie, które nie mają elementów zdefiniowanych w którymkolwiek wymiarze). W SQL 2000 były one po prostu ignorowane. W Yukon można wskazać, w jaki sposób powinien się zachować serwer - w szczególności mogą być one pogrupowane w kategorii "nieznane".

Definiując strukturę kostek, można określać wiele elementów specyficznych dla określonego języka, np. kolejność sortowania i nazwy wymiarów mogą być realizowane w językach narodowych itp. Można nawet definiować tabele słownikowe tłumaczące pozycje w kostce na nazwy zrozumiałe w danym języku.

Nową "odmianą" kostki są perspektywy. Definiując je, projektant określa, jakie miary i które elementy kostki będą prezentowane jako widoki. Mimo to, z punktu widzenia aplikacji klienckiej, jest to nadal kostka.

W Yukon można zdefiniować tzw. wymiary quasi-addytywne. W pewnym uproszczeniu można to opisać tak, że przy ich definiowaniu określa się, które elementy mogą być razem grupowane. W ten sposób można np. łatwo zdefiniować plan kont i "automatycznie" grupować i sumować odpowiednie pozycje fakturowe wg określonej przynależności obiektów do grupy.


TOP 200