Analiza kliknięć myszą

Do bazy danych Oracle8i włączono funkcje OLAP, przydatne przy analizie zachowań użytkowników serwisów internetowych. Nowa baza Oracle8i pojawi się na początku br.

Do bazy danych Oracle8i włączono funkcje OLAP, przydatne przy analizie zachowań użytkowników serwisów internetowych. Nowa baza Oracle8i pojawi się na początku br.

Współczesne relacyjne bazy danych zapewniają doskonałą skalowalność i szybkie przetwarzanie zapytań, natomiast nie nadają się do wykonywania funkcji analitycznych, typowych dla zastosowań hurtowni danych. Nie należy oczekiwać od bazy danych tworzenia i przeliczania modeli neuronowych lub liczenia odchylenia standardowego. Z tego powodu pojawiły się wielowymiarowe bazy danych, specjalizowane bazy do zastosowań statystycznych czy eksploracji danych (data mining), a programy dla użytkownika końcowego mają dzisiaj wbudowane funkcje analityczne do pracy z hurtowniami danych.

Strumień kliknięć

Jednak relacyjne bazy danych wciąż się rozwijają, zwłaszcza w kierunku obsługi dużych hurtowni danych, które nie są dobrze zarządzane przez bazy wielowymiarowe.

Jednym z problemów, z którym nie radzą sobie nie tylko bazy relacyjne, ale czasem również specjalizowane narzędzia, jest analiza zachowania użytkowników witryny Web (analiza tzw. click stream). Przykładowo, prowadzący sklepy internetowe chcą wiedzieć, ilu klientów dokonało zakupów, jakie produkty były oglądane, a jakie kupowane, ilu klientów wróciło do witryny w ciągu miesiąca.

Opracowanie bazy danych do takich zastosowań nie jest łatwe, podobnie jak napisanie programów, które pozwolą uzyskać odpowiedzi na zadane pytania. Dokonywanie złożonych obliczeń za pomocą to zajęcie dla pasjonatów programowania, nie dla użytkownika biznesowego.

W nowej Oracle8i rel. 8.1.6 wprowadzono funkcje analityczne, pozwalające na bezpośrednie uzyskanie odpowiedzi na zapytania zbliżone do tych, które zaprezentowano wcześniej.

Na gruby kaliber

Specjaliści Oracle'a sądzą, że korzyść z funkcji wbudowanych w bazę ujawni się przy stosowaniu dużych zbiorów danych. Jeżeli pobiera się kilka tysięcy rekordów, można dokonywać na nich złożonych operacji analitycznych na biurkowym PC. Jeżeli jednak trzeba dokonać operacji na setkach tysięcy rekordów, to - mimo że nie da się ich zmagazynować w PC - można całkowicie zablokować działanie sieci podczas ściągania z bazy. Tu ma się ujawnić skalowalność i wydajność bazy działającej na serwerze, która dokona obliczeń i prześle użytkownikowi jedną stronę wyników.

Nowe funkcje analityczne nie są zawarte w standardzie SQL. Narzędzia analityczne do obsługi hurtowni danych korzystają z wielu baz, posługują się "najmniejszym wspólnym mianownikiem" właściwości tych baz - w praktyce oznacza to jedynie wspieranie SQL 92 Entry Level. Żaden z producentów narzędzi OLAP nie zechce opracować narzędzia posługującego się firmowymi rozszerzeniami SQL, ponieważ ryzykuje związanie się z jednym dostawcą bazy danych. Z tego powodu IBM i Oracle, które wspólnie opracowały opisane funkcje, zdecydowały przekazać komitetowi standaryzacyjnemu ANSI propozycję rozszerzenia standardu SQL o nowe funkcje analityczne.