Baza do sukcesu

IBM i Oracle postrzegają siebie jako liderów w dziedzinie informacji zarządczej. Porównujemy strategię obu firm.

IBM i Oracle postrzegają siebie jako liderów w dziedzinie informacji zarządczej. Porównujemy strategię obu firm.

Biorąc pod uwagę szybką konsolidację rynku narzędzi do tworzenia i prezentacji informacji zarządczej (Business Intelligence - BI), jest oczywiste, że przetrwa tylko kilku producentów. W segmencie dużych i średnich firm będą to z pewnością IBM i Oracle.

To jednak nie te firmy stworzyły pierwsze narzędzia BI i zdominowały rynek pod koniec lat 80. i na początku 90. Były to raczej: Iris Software, Metaphor, Information Advantage, Red Brick, Arbor i Prism - większość z nich już nie istnieje. Wielcy, m.in. IBM i Oracle, wykupili te firmy lub przejęli ich technologie i teraz to oni określają, jak mają wyglądać narzędzia i aplikacje BI.

Wszystko w jednym

W dziedzinie BI oferta firm IBM i Oracle opiera się głównie na bazach danych IBM DB2 Universal Database i Oracle8i (od przyszłego roku Oracle9i). Wbudowano w nie tak wiele funkcji, że są w stanie spełniać wymagania stawiane aplikacjom transakcyjnym, analitycznym i eksploracyjnym - "wszystko w jednym".

Gdybyśmy chcieli porównywać kolejno właściwości funkcjonalne tych baz, tabela zajęłaby co najmniej kilkadziesiąt stron. Ponadto rozwój techniczny produktów jest niezwykle szybki: pojawienie się pewnej cechy w produkcie jednego producenta jest kontrowane w ciągu kilku miesięcy wprowadzeniem ulepszonej lub innej, równie ważnej cechy w konkurencyjnej bazie. Porównanie cecha-cecha nie obejmie również przewidywanych kierunków rozwoju produktu ani strategii firmy.

Analizę IBM DB2 Universal Database i Oracle8i, uwzględniającą strategię firm, przeprowadzono w pięciu kategoriach:

właściwości podstawowe

OLAP i hurtownie danych

obsługa danych geoprzestrzennych

technologie i narzędzia wspierające

strategia producenta.

Właściwości podstawowe. To te cechy produktu, których nabywca oczekuje znaleźć w każdej bazie danych, niezależnie od producenta.

Skalowalność. Oznacza przede wszystkim możliwość partycjonowania tabel i indeksów bazy na wiele systemów dyskowych i komputerowych, równoległą realizację zapytań do bazy i tworzenie indeksów, dostępność narzędzi do wsadowego ładowania danych i zarządzania bazą danych.

Hurtownie danych. Obie bazy kwalifikują się do obsługi dużych hurtowni danych. Narzędzia do pobierania, czyszczenia i ładowania do hurtowni danych z wielu źródeł są zintegrowane z programami do zarządzania bazą. IBM Visual Warehouse i Oracle Warehouse Builder służą do projektowania, tworzenia i utrzymywania hurtowni danych.

Java i XML. Obecnie podstawowym wymogiem wobec baz jest wbudowana maszyna wirtualna Java do wykonywania procedur składowanych i trygerów oraz uruchamiania komponentów Java w serwerze bazy danych. Oracle8i ma tę przewagę nad bazą IBM, że pozwala osadzać w serwerze bazy danych (lub w serwerze aplikacyjnym) kompletną aplikację w formie komponentów Enterprise Java Beans. Obie bazy oferują również możliwość obsługi języka, przechowywania i przeszukiwania dokumentów XML w bazie za pośrednictwem tzw. ekstendera (IBM XML Extender) lub kartusza tekstowego (Oracle Context Cartridge), dołączanych w razie potrzeby do serwera bazy.

Web. Ostatnia wersja IBM DB2 Universal Database ma wbudowaną obsługę bazy w pamięci, co zdecydowanie przyśpiesza operacje na danych i ma istotne znaczenie przy wykorzystaniu bazy do wspomagania pracy serwisów internetowych.

Hurtownie danych i OLAP

Indeksowanie. Największym wyzwaniem dla hurtowni danych są indeksy. Wszystkie bazy danych używają indeksów w formie tzw. B-drzewa oraz dodatkowo tzw. indeksów bitmapowych, ale w zastosowaniu do hurtowni to nie wystarcza. Unikalną cechą hurtowni jest potrzeba tworzenia struktur gwiaździstych, umożliwiających dostęp do danych tablicy faktów i danych zagregowanych, stosownie do zdefiniowanego wymiaru. Tradycyjne techniki indeksowania wymagają stworzenia iloczynu kartezjańskiego wszystkich wymiarów, co powoduje konieczność przeglądania ogromnych tabel faktów wiersz po wierszu. Jest to operacja kosztowna. Aby zapewnić odpowiednią wydajność hurtowni, producenci realizują indeksowanie oparte na gwiaździstej strukturze tabel bazy, pozwalające na pobieranie danych zagregowanych z tabel agregacji, bez potrzeby przeglądania tabeli faktów. Obie bazy mają wspomniane możliwości.

Agregacje. Operację sumowania danych wg wymiarów (agregowanie) w bazie Oracle8i wykonuje się zapisując skrypt w narzędziach do pobierania i transformacji danych podczas ładowania hurtowni. Natomiast baza IBM DB2 Universal Database ma możliwość definiowania automatycznych tabel agregacji, zapełnianych na bieżąco przez serwer bazy w trakcie ładowania lub w miarę potrzeby podczas pracy.

Nawigacja po wymiarach. Efektywne użycie tabel zagregowanych jest możliwe tylko wtedy, gdy optymalizator bazy je obsługuje. Obie bazy mają wbudowaną taką możliwość.

Serwer OLAP. Obie bazy współpracują z firmowymi serwerami wielowymiarowych baz danych, stanowiącymi źródło danych dla narzędzi analitycznych OLAP. Oracle posługuje się pakietem Oracle Express (zakupionym kilka lat temu od firmy Iris Software), natomiast IBM - DB2 OLAP Server (zmodyfikowaną wielowymiarową bazą danych Hyperion Essbase).

W przypadku dużych hurtowni danych efektywniejsza jest struktura wielowymiarowa odwzorowana na tradycyjną bazę relacyjną (ROLAP). IBM DB2 ma wbudowaną taką obsługę struktury ROLAP bezpośrednio w bazę, natomiast struktura ROLAP w Oracle8i jest dostępna za pośrednictwem Oracle Express.

Obsługa danych geoprzestrzennych

Coraz większe zapotrzebowanie na systemy informacji przestrzennej (GIS) rodzi potrzebę zapisywania, indeksowania i przeszukiwania danych geoprzestrzennych bezpośrednio w bazie danych.

IBM oferuje Spatial Extender definiujący specjalny typ danych przestrzennych (GEOMETRY), obsługiwanych bezpośrednio przez serwer bazy danych i optymalizator, oraz zapewniający możliwości dostępu do nich przez rozszerzenia SQL, zgodne ze standardem OpenGIS.

Kartusz Oracle Spatial Cartridge pozwala na przechowywanie danych przestrzennych w bazie Oracle8i w formie dużych obiektów binarnych (BLOB), ale bez możliwości optymalizacji. Dostęp do nich realizuje się za pośrednictwem zestawu funkcji API ze specjalnej biblioteki, wywoływanej z aplikacji.

Technologie i narzędzia wspierające

W sieci Web coraz ważniejsze są możliwość łączenia w portalu informacyjnym przedsiębiorstwa danych strukturalnych z bazy danych z danymi niestrukturalnymi (dokumenty tekstowe, pliki poczty elektronicznej, obrazy, grafika) oraz zapewnienie przeszukiwania, podziału na kategorie, klasyfikowania i poszukiwania informacji pokrewnych w sieci Web.

Oferta portali informacyjnych IBM i Oracle'a jest porównywalna, chociaż portal IBM jest bardziej otwarty, gdyż może korzystać z danych strukturalnych z dowolnej bazy, natomiast Oracle'a jest ściśle związany z bazą Oracle8i. Przewagę zapewnia mu możliwość korzystania z internetowego systemu plików iFS, w który można wyposażyć bazę danych Oracle8i.

Ważną cechą portali jest możliwość eksploracji danych (data mining). IBM oferuje dwa produkty - IBM Intelligent Miner for Data i Intelligent Miner for Text. Pierwszy jest bardziej przydatny do zadań analitycznych w biznesie, drugi zaś doskonale wspomaga tworzenie składnic wiedzy i portali informacyjnych. Oracle ma w ofercie program Darwin (kupiony od Thinking Machines), przeznaczony do zadań analitycznych.

Strategia producenta

Dataquest, firma zajmująca się badaniami rynku, opublikowała porównanie strategii firm IBM i Oracle w zakresie baz danych, narzędzi analitycznych i aplikacji powiązanych z bazami danych. Według Dataquest, IBM jest bardziej otwarty, lepiej współpracuje z partnerami i nie tworzy produktów konkurujących z nimi, natomiast oferuje wszystkie technologie wspierające ich działania, łącznie z ofertą w zakresie sprzętu i systemów operacyjnych.

Wejście Oracle'a w dziedzinę specjalizowanych aplikacji finansowych, ERP i CRM, wzbudza kontrowersje niektórych partnerów. Na przykład SAP odchodzi od oferowania swojego systemu R/3 na bazie Oracle'a, argumentując: "Nie zamierzamy wspierać konkurencyjnych Oracle Applications". Podobnie postąpiła firma Siebel, oferująca systemy CRM. Obie firmy podpisały umowy z innymi producentami baz danych, w tym z IBM, który nie oferuje konkurencyjnych aplikacji.

Dataquest ocenia, że Oracle dąży do tego, by stać się dostawcą aplikacji, dominującym na rynku ERP, CRM i szeroko pojętego e-biznesu. Natomiast IBM zmierza w kierunku bycia dostawcą najlepszych technologii infrastruktury informatycznej przedsiębiorstwa, na której podstawie coraz liczniejsi partnerzy tworzą aplikacje dla dowolnego rynku.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200