Inteligencja w biznesie

Wyjaśnianie danych polega na znalezieniu zależności między poszczególnymi pozycjami modelu opisowego. Przykład: "Zmniejszenie oprocentowania kredytu hipotecznego o 2% spowodowało wzrost liczby budowanych mieszkań o 4%". Takie zależności można wykryć za pomocą większości narzędzi do eksploracji danych (data mining), posługując się analizą regresji, drzewami decyzyjnymi czy sieciami neuronowymi.

Prognozowanie wymaga zaś posiadania dobrego modelu zależności między danymi i pozwala na przewidywanie zachowania się znanych zależności na obszarach nie objętych istniejącymi danymi. Prognozowanie jest na ogół wbudowane w większość narzędzi eksploracyjnych.

Do niedawna komercyjne narzędzia analityczne były typowymi produktami OLAP, nie zawierającymi możliwości prognozowania ani tworzenia modeli zależności między opisami danych. Obecnie większość producentów oferuje lepsze zestawy narzędziowe, zawierające mniej lub bardziej wyrafinowane narzędzia eksploracyjne do modelowania zależności i prognozowania. Największe możliwości w tym zakresie oferują zaawansowane pakiety statystyczne i eksploracyjne, ale na ogół nie mają one możliwości raportowania, typowych dla narzędzi OLAP.

Dane brakujące, domniemane lub niepewne

Proces podejmowania decyzji rzadko opiera się na danych całkowicie pewnych lub kompletnych. W każdym zbiorze istnieją pozycje "brak danych". Od przypisania im odpowiedniej wartości zależy wynik analizy i prognozy. W przypadku tworzenia nawet prostej agregacji za dowolny okres należy przypisać im pewną wartość. Narzędzia analityczne OLAP przez domniemanie przypisują "pustemu" polu bazy danych wartość zero, co na ogół jest obarczone błędem i może prowadzić do poważnych błędów w interpretacji wyników.

Podobnie ma się sprawa w przypadku prognozowania, gdy podaje się przybliżone oceny. "Oceniamy, że wzrost produkcji w br. wyniesie 30% (z błędem 5%)". Typowe statystyczne miary niepewności to odchylenie standardowe i wariancja. Właściwie jedynie zaawansowane pakiety statystyczne pozwalają na uwzględnianie niepewności w prognozach. Problem niepewności pogłębia się, gdy podawane miary niepewności wynikają z ustalonych wcześniej reguł biznesowych, tradycji lub doświadczenia.

Wizualizacja

Wizualizacja jest rzadko wymieniana jako samodzielne narzędzie do wspomagania procesów podejmowania decyzji. Tymczasem zrozumienia danych nie zapewnią same liczby - mało kto potrafi korelować w pamięci raporty liczbowe trafiające na jego biurko. Wprawdzie większość narzędzi analitycznych OLAP i do eksploracji danych oferuje proste możliwości wizualizacji zależności między danymi, ale te możliwości są niewielkie w porównaniu z właściwościami specjalizowanych pakietów wizualizacyjnych. Ludzkie oko potrafi znacznie lepiej porównywać wzory na ekranie niż najlepszy program. Dobry program wizualizacji o dużych możliwościach tworzenia i manipulowania grafiką jest nieocenionym pomocnikiem analityka i szefa przedsiębiorstwa.

Włączyć dane nienumeryczne

Informacja zarządcza to domena danych prawie wyłącznie numerycznych. Narzędzia OLAP, raportowanie, eksploracja danych i statystyki operują wyłącznie na liczbach. Wprawdzie producenci baz danych i niezależni dostawcy oferują narzędzia do przeszukiwania składnic dokumentów tekstowych, ale wcale nie zbliża to do ich zrozumienia. Program potrafi streścić dokument, ale nie może zrozumieć jego sensu.

Podobnie rzecz ma się ze zbiorami innych danych, np. zdjęć osób czy zapisów mowy. Istnieją możliwości znalezienia "obrazu podobnego do zadanego wzorca", ale nie daje to możliwości oceny - klient zadowolony czy niezadowolony?

Tymczasem kontekst danych, zawarty właśnie w zbiorach danych nienumerycznych, może mieć zasadnicze znaczenie dla całego procesu podejmowania decyzji. Tutaj mogą pomóc tylko intuicja i doświadczenie osobiste.


TOP 200