Data mining od podszewki

Dogłębna analiza danych ( data mining ) to jedno z wcieleń sztucznej inteligencji.

Dogłębna analiza danych ( data mining ) to jedno z wcieleń sztucznej inteligencji.

Przed dwudziestoma laty sztuczna inteligencja była najważniejszym tematem badań dużych zespołów informatycznych, przedmiotem licznych konferencji, publikacji naukowych i artykułów prasowych. Gdy okazało się, że za pomocą ówczesnej technologii niewiele można zrobić - temat zanikł zupełnie, zaprzestano finansowania badań, a zainteresowanie nim wykazywały tylko instytucje wojskowe, niepoprawni optymiści i bogate firmy komputerowe, które mogły pozwolić sobie na prowadzenie badań, nie zapowiadających natychmiastowych wyników komercyjnych.

Wiele opracowań technicznych i naukowych z zakresu sztucznej inteligencji spełniło oczekiwania ich twórców i doczekało się praktycznej realizacji w postaci szeroko stosowanych systemów ekspertowych. Przykładowo, na dworcu Lyońskim w Paryżu stosuje się system ekspertowy do kierowania pociągów na właściwy peron, w celu minimalizacji liczby zwrotnic, przez które musi przejechać pociąg wjeżdżając i wyjeżdżając z dworca. Linie lotnicze, mające setki samolotów, nie byłyby w stanie sprawnie funkcjonować bez systemu ekspertowego, wspomagającego zarządzanie parkiem maszyn.

Przykładem udanego i opłacalnego wdrożenia rozwiązań z zakresu sztucznej inteligencji było planowanie dostaw uzbrojenia i zaopatrzenia materiałowego wojsk podczas wojny w Zatoce Perskiej w 1991 r. Amerykańska wojskowa Agencja Zaawansowanych Badań ARPA (Advanced Research Project Agency) zleciła konwersję finansowanego przez nią programu do obsługi logistyki produkcji na program do zarządzania logistyką dostaw. Ocenia się, że osiągnięte korzyści przekroczyły nakłady ARPA na badania nad sztuczną inteligencją.

Równie spektakularne osiągnięcia zanotowano w dziedzinie rozpoznawania mowy. Obecnie proste systemy rozpoznawania mowy, rozróżniające ponad 20 tys. słów wypowiadanych przez jednego mówiącego, kosztują tyle co typowy zestaw aplikacji biurowych, tj. ok. 1000 USD. Natomiast wciąż na rozwiązanie czeka problem rozpoznawania mowy wielu mówców (speaker independent).

Te spektakularne osiągnięcia przyćmiły równie spektakularne upadki firm obiecujących złote góry w społeczeństwie bez granic, zarządzanym przez potężne maszyny obdarzone sztuczną inteligencją.

Dogłębna analiza danych a sztuczna inteligencja

W owych pionierskich czasach badań w informatyce pojęcie dogłębnej analizy danych (data mining) nie istniało, ale ta dziedzina praktyki informatycznej jest głęboko osadzona w wynikach badań nad sztuczną inteligencją. Data mining korzysta z technologii sztucznej inteligencji, ale nie ma bezpośredniego odniesienia: sztuczna inteligencja obejmuje znacznie więcej tematów i technologii - sieci neuronowe, systemy ekspertowe, rozpoznawanie mowy, zarządzanie wiedzą.

Jednak istnieje dość ścisłe powiązanie dogłębnej analizy danych (data mining) ze sztuczną inteligencją. Programy data mining to praktyczne wdrożenie wielu znanych algorytmów klasyfikowania, grupowania i hierarchizacji w postaci programów do zastosowań w biznesie.

Pierwsze informacje o data mining pojawiły się przed dwoma laty, obecnie jest to informatyczny temat numer dwa we wszystkich dużych przedsiębiorstwach handlowych, bankach, towarzystwach ubezpieczeniowych i in.

Programy dla dużych

Dogłębna analiza danych jest ważna dla dużych przedsiębiorstw i instytucji, ponieważ tylko one dysponują odpowiednio dużymi zbiorami danych, które można poddać badaniom i osiągnąć sensowne wyniki.

Z tego powodu potrzeba stosowania narzędzi do dogłębnej analizy danych uzasadnia konieczność zainstalowania hurtowni danych, dostarczającej narzędziu danych w odpowiedniej postaci - specjalnych struktur, zarządzanych przez system przystosowany do obsługi danych wielowymiarowych, sekwencji czasowych i geograficznych.

Dogłębna analiza danych pozwala znajdować zależności, których istnienia nawet nie podejrzewano. Możliwości dogłębnej analizy danych najlepiej oddaje metafora znajdowania w stogu siana dwóch igieł o jednakowej długości, nie wiedząc nawet czy są tam jakieś igły.

Dogłębna analiza danych w zasadzie jest stosowana do dwóch typów prac: znajdowania zależności i prognozowania (projekcji). W ramach tych dwóch prac typowe narzędzie analityczne znajduje jedną z sześciu typów informacji:

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200