BIG DATA - jak się do nich dobrać?

Nowe narzędzia analiz oferują możliwość wglądu w olbrzymie wolumeny danych korporacyjnych i zewnętrznych. Wyciąganie istotnych informacji z tych danych - strukturalizowanych i niestrukturalizowanych - było celem IT od czasu pojawienia się baz danych. Dostępne dzisiaj technologie pozwalają na zrealizowanie takich celów.

W poszukiwaniu przewagi konkurencyjnej firmy coraz częściej sięgają do wewnętrznych i zewnętrznych repozytoriów danych - w celu wyszukiwania trendów, statystyk i innych użytecznych informacji wspomagających proces podejmowania decyzji biznesowych. Takie zbiory danych, wraz z powiązanymi z nimi narzędziami, platformami i analityką, są często określane jako "Big Data".

Od momentu wprowadzenie baz danych udostępnienie możliwości szybkiego wyciągania sensownych informacji z olbrzymich wolumenów strukturalizowanych i niestrukturalizowanych danych jest celem działu IT w każdej organizacji. W przeszłości było to marzenie odległe, a co najmniej niezwykle kosztowne. Dzisiaj do dyspozycji jest coraz więcej technologii, które cel przybliżają. Przetwarzanie w chmurze zapewnia szybki dostęp do tysięcy rdzeni procesora i olbrzymich zbiorów danych dostępnych na żądanie. Pojawiają się technologie wykorzystujące przetwarzanie rozproszone do szybkiego uzyskiwania wyników z olbrzymich zbiorów danych. Nowe narzędzia analityki biznesowej korzystają z zawansowanych technik wizualizacji, które ułatwiają korzystanie z nich nie tylko zawodowym analitykom.

Zobacz również:

  • Ile big-techy mogą zarabiać na internautach? Wyliczenia Polskiego Instytutu Ekonomicznego
  • LG dołącza do IBM Quantum Network
  • PIIT przedstawia postulaty cyfrowej (r)ewolucji

Korzyści dla biznesu wynikające z eksploracji niemal wszystkich zgromadzonych danych są oczywiste. Można poszukiwać sensownych informacji w danych, które pojawiły się zaledwie jednorazowo (strumienie kliknięć na stronach WWW, zdarzenie zapisane w logach itp.) i używać tych informacji do wprowadzania ulepszeń w całym szeregu systemów. Przykłady zastosowań można mnożyć. Banki mogą rozpoznawać wzorce danych i dokumentów wskazujących na prawdopodobieństwo oszustw i podejmować działania naprawcze zanim odbije się to na biznesie. Lekarze mogą wyszukiwać wzorce leczenia chorób zapewniające najlepsze wyniki, z wykorzystaniem wieloletnich danych historycznych z wielu źródeł danych. Fabryka samochodów może wykrywać źródła opóźnień w produkcji i włączać analitykę do procesów biznesowych w celu podejmowania automatycznych działań korekcyjnych, takich jak np. różnicowanie źródeł zaopatrzenia.

Big Data, z odpowiednią wizualizacją danych, może skrócić tradycyjne procesy analizy biznesowej, w których zainteresowani przekazują zlecenia profesjonalnym analitykom tworzącym raporty statyczne. W wielu przypadkach wyniki ich analiz nie mogły być w pełni wykorzystane ze względu na czas potrzebny na ich wytworzenie.

Pomimo tak obiecujących perspektyw, technologia Big Data i aplikacje z tym związane są nadal na bardzo wczesnym etapie rozwoju. Preferowaną platformą do przetwarzania dużych zbiorów niestrukturalizowanych danych staje się Hadoop (zob. ramka), ale jest to środowisko projektowe strukturalne rozproszone, które, aby mogło być efektywnie wykorzystywane, wymaga zazwyczaj umiejętności specjalistycznego programowania aplikacyjnego. Poza tym jest ukierunkowane na dane niestrukturalizowane lub częściowo strukturalizowane. Big Data może także obejmować tak duże zbiory danych strukturalizowanych, że nie mogą być one przetworzone w rozsądnym czasie.

Dużym problemem jest wprowadzenie analityki Big Data do firm, które już mają infrastrukturę do analiz biznesowych. W wielu przypadkach eksploracja dużych zbiorów danych niestrukturalizowanych jest wstępem do głębszych analiz wykonywanych bardziej konwencjonalnymi narzędziami.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200