Inteligencja w biznesie

Zbieranie i ocena danych

Zbieranie danych i ich ocena to podstawowa część procesu tworzenia i wykorzystania informacji zarządczej. Dane można zbierać z wielu różnorodnych źródeł: linii produkcyjnej, kas fiskalnych w sklepie, ankiety telefonicznej, witryny handlu elektronicznego, świateł regulacji ruchu, czujników poziomu zanieczyszczeń powietrza i innych. Od rodzaju podejmowanej decyzji zależy, które dane są istotne. Dane bez intencji ich użycia nie mają wartości.

Bardzo ważna jest jakość danych. Wiele razy zdarzało się, że moje nazwisko wpisywano jako Łakomy, Łakomiec, Łakomski itp. A czy wypełniając, nawet w najlepszej wierze, kwestionariusz lub ankietę nigdy się nie mylimy i czy zawsze podajemy dane rzeczywiste, czy też intencjonalne? Narzędzie do czyszczenia danych może wykryć, że numer telefonu umieściliśmy zamiast nazwy ulicy, ale to może być szczyt jego możliwości.

Inny, ważny problem w zbieraniu danych to metadane (dane o danych). Dotyczy to przede wszystkim kwestii zdefiniowania rodzaju danych i nadania im odpowiednich nazw. Czy pozycja "cena" dotyczy ceny z VAT-em czy bez niego? Od tego zależy wynik analizy. Metadane są więc równie istotne jak dane.

Ważne są również dodatkowe, kontekstowe informacje o danych: data i źródło pochodzenia, jakie obliczenia były dokonywane na tych danych, w jakim celu je zbierano itp.

Przechowywanie i dostęp do danych

Zebrane dane należy przechowywać, sytuując je w historycznej perspektywie. W zasadzie aplikacje do wspomagania procesów podejmowania decyzji wymagają pamięci długofalowej. I nie jest ważne, czy dane są przechowywane w plikowych systemach transakcyjnych, relacyjnej bazie danych czy w hurtowni. Ważne jest, aby były łatwo dostępne.

Obecnie główną formą przechowywania danych są relacyjne bazy danych. Większość systemów do tworzenia informacji zarządczej koncentruje się na analizie danych numerycznych; trzeba jednak pamiętać, że ponad połowa informacji korporacyjnych ma postać nienumeryczną. Takie dane można przechowywać np. w bazach obiektowo-relacyjnych, ale nie cieszą się one powodzeniem ani wśród informatyków, ani w biznesie.

W efekcie, większość dostępnych danych ma charakter numeryczny lub postać dokumentów tekstowych. Żadne z komercyjnych systemów wspomagania podejmowania decyzji nie dają pełnych możliwości wykorzystania danych nie mających dobrze sprecyzowanej struktury.

Zrozumieć dane

Ogólny cel rozumienia danych sprowadza się do ekstrakcji z nich wiedzy w konkretnej dziedzinie. Zrozumieć dane to znaczy opisać je, wyjaśnić i na tej podstawie prognozować zachowanie się organizacji.

Opis stanowi podstawę tworzenia wielowymiarowych modeli, zawierających agregacje, stosunki lub wyniki innych operacji zachowujących prawdziwość informacji. Przykładami opisu będą stwierdzenia: "W poniedziałek sprzedano 30 par obuwia sportowego" lub "W lutym średnia cena obuwia wynosiła 120 zł". Największym problemem w tworzeniu opisowych modeli danych są brakujące pozycje (puste pola w rekordzie bazy danych). Dobry model musi uwzględniać możliwość przypisania im sensownych wartości, gdyż inaczej nie uda się uzyskać spójnych wyników analizy. Do tworzenia modeli zwykle wykorzystuje się zaawansowane narzędzia analityczne OLAP.


TOP 200