Złoto w zasięgu ręki

Wiarygodność eksploracji

Nasuwa się jednak pytanie: jak eksploracja danych ma się do składnic danych (data warehousing), hurtowni danych (data mart) i narzędzi OLAP. Można to wyjaśnić w następujący sposób: narzędzia OLAP dotyczą tego, co wydarzyło się w przeszłości, eksploracja danych natomiast pozwala na spojrzenie w przyszłość.

Eksploracja danych uzupełnia takie technologie, jak składnice danych i OLAP, ale ich nie zastępuje. Na przykład użytkownicy składnic danych zazwyczaj mają już wykonany proces oczyszczania danych. Ekstrakcja podzbioru tych danych do hurtowni danych w celu eksploracji jest stosunkowo prostym zadaniem.

Wielu analityków biznesowych używa narzędzi OLAP. Za pomocą tradycyjnych narzędzi kwerendowania czy raportowania można oglądać, co zawierają dane. Narzędzia OLAP pozwalają analitykom na wykonanie kolejnego kroku: interpretacji wzorców danych zawartych w poszczególnych wynikach. Sprawdzanie stosunku dochodów do zadłużenia w celu określenia wiarygodności kredytowej jest przykładem takich możliwości, ale wymaga to postawienia przez analityków pewnych hipotez i użycia narzędzi OLAP do kwerendowania danych pod tym kątem - hipoteza spełniona/niespełniona.

Z kolei eksploracja danych nie zdaje się jedynie na hipotezy w odniesieniu do odkrytych wzorców danych. Same dane są używane do identyfikowania wzorców, które mogą odzwierciedlać problemy biznesowe. Używając eksploracji danych np. do określenia zdolności kredytowej, można kojarzyć przychody i zadłużenia, ale można także brać pod uwagę lata zatrudnienia potencjalnego kredytobiorcy - jako czynnik dodatkowy.

OLAP może być używany do wspomagania teoretyzacji efektów eksploracji danych (np. zdolności kredytowej). Technologia ta może również wspomagać analityków w przeglądaniu i lepszym zrozumieniu danych zgromadzonych w przedsiębiorstwie przed ich eksploracją.

Eksploracja za zaporą ogniową

Złoto w zasięgu ręki

Modele eksploracji danych

Jak porównać model cenowy własnej firmy z tym, co oferuje konkurencja? Czy klienci eksplorują firmowy portal głębiej, czy po wejściu na stronę główną opuszczają ją, nie zagłębiając się w szczegóły?

Szczegółową odpowiedź na takie pytania można uzyskać, eksplorując dane webowe, tj. wykrywając i analizując zawartość stron webowych, opisy znalezione w dokumentach webowych, całą strukturę ośrodka i tworząc wzorce jego użytkowania.

Eksploracja weba (Web mining) skupia się na zewnętrznych powiązaniach inteligencji biznesowej. Uzyskiwanie danych spoza zapory ogniowej może być wykonywane za pomocą agentów, przez analizowanie logów ośrodków webowych lub dodawanie metod wyszukiwania danych do aplikacji w ośrodkach webowych. Istniejące w sieci przedsiębiorstwa narzędzia eksploracji danych mogą być wykorzystywane do sprawdzania danych webowych, a wraz z narzędziami eksploracji tekstowej - do sprawdzania niestrukturalizowanych danych webowych.

Przy tworzeniu procesu eksploracji weba należy przede wszystkim zdefiniować problem biznesowy i typy pożądanych informacji (czas wizytowania ośrodka, liczbę łączników, ranking stron itp.). Takie dane mogą być "odkryte" przez motory wyszukiwawcze eksploracji bądź za pośrednictwem narzędzi eksploracji tekstowej.

Analiza wartościowa w sektorze firm pozwala na pokazanie, które z nich są najbardziej efektywne w pozyskiwaniu klientów i które otrzymują najwyższe noty w rankingu tworzonym przez motory wyszukujące. Następnie można sprawdzić zawartość i struktury ośrodka oraz podział stron firm najniżej oraz najwyżej notowanych. Na końcu można zanalizować, które ośrodki są najbardziej efektywne pod względem ruchu i najlepsze w rankingu stron.

Podobnie użyteczne spojrzenie można uzyskać przez analizowanie stron webowych. Używając dostępnych narzędzi, można analizować liczbę łączników na stronie prowadzących do różnych zawartości. Zazwyczaj im więcej łączników, tym więcej użytecznych treści.

Określenie trendów dostępu do strony może wskazać, jak przeprojektować strukturę ośrodka, aby zwiększyć ruch. Te same techniki i narzędzia używane do eksploracji poza zaporą ogniową mogą ujawniać, jak klienci współdziałają z ośrodkiem webowym. Analiza takich informacji może pomóc w zapewnieniu w sposób dynamiczny odpowiedniej zawartości i wybraniu struktury ośrodka.

Logi serwerów webowych dostarczają informacji niezbędnych do analizy użytkowania i dostępu do ośrodka. Jednak do przechwytywania dostatecznej liczby elementów do analizy może być konieczne użycie narzędzi dostawców niezależnych lub skryptów pisanych we własnym zakresie.


TOP 200