Poszukiwanie igły w stogu siana

Subskrybuj RSS A A A
26 kwietnia 2011
Marcin Marciniak

TAGI: analiza danych BI Business Intelligence

Nowoczesne narzędzia do obróbki dużych porcji danych umożliwiają odkrywanie prawidłowości oraz precyzyjne śledzenie działań.

16 eksabajtów
logów i innych informacji zapisano w ubiegłym roku w firmach na świecie.
Bardzo wiele firm posiada duże zbiory danych, z których można wyciągnąć interesujące informacje. W przypadku sklepów może to być aktywność klientów, nawyki oraz ruch, przy czym dzięki odpowiednim narzędziom, niektóre zależności można wyliczyć z dość dużą precyzją. Oprócz typowych dla sklepów zależności, takich jak produkty kupowane we wspólnym koszyku, analizując masowo zbierane logi, można określić z dużym prawdopodobieństwem branżę zatrudnienia klienta, to, co robi on po godzinach albo z kim spędza czas. Pozyskana w ten sposób informacja po dostosowaniu do potrzeb kampanii marketingowych może mieć dużą wartość dla firm, zajmujących się reklamą webową oraz przygotowaniem spersonalizowanych materiałów reklamowych. Pozyskanie takich informacji wymaga jednak zaawansowanej analizy sporych zbiorów danych, które często bywają przechowywane w masowo zrównoleglonych bazach, takich jak framework Apache Hadoop.

Analiza kluczem do informacji

Firmy zbierają bardzo wiele danych i nie zawsze potrafią wyzyskać potencjał, który tkwi w tych zbiorach. Podczas konferencji Structure Big Data 2011, Jeff Jonas, inżynier pracujący w firmie IBM, powiedział: "Trend analizy i wnioskowania na podstawie dużych zbiorów zmieni nasze pojęcie prywatności. Nadejście epoki ciągłego nadzoru jest nie tylko nieuniknione, jest to przemożna chęć, której nie mogą się oprzeć firmy i instytucje".

Termin "big data" jest związany z olbrzymimi zasobami informacji zbieranych ze strumieni generowanych przez maszyny i człowieka, przy czym informacje te mogą pochodzić z logów komputerowych zapisujących działania człowieka, zapisów transakcji finansowych, strumieni wyszukiwań w Internecie, metadanych poczty elektronicznej, zapytań kierowanych do wyszukiwarek oraz aktywności w sieciach społecznościowych.

W samym tylko ubiegłym roku powstało około 1,5 zettabajtów (1,5 mld terabajtów) takich danych, w większości były one wytworzone przez maszyny. Według Jasona Hoffmana, założyciela i głównego specjalisty firmy Joyent, zajmującej się usługami świadczonymi w modelu cloud computing, w ciągu ubiegłego roku firmy zapełniły dyski swoich macierzy porcjami takich danych, zapisując razem około 16 eksabajtów (16 mln terabajtów).
Ilość danych powstająca z magazynowanych strumieni nadal rośnie i przedsiębiorstwa pracują nad sposobami wykorzystania tych zasobów informacji w kreatywny sposób, przynoszący dodatkową wartość dla organizacji.

Oceń artykuł

średnio: 0 liczba ocen: 0
1  2  dalej »

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

Zarządzanie po japońsku

W praktyce przemysłowej wypracowano szereg skutecznych metod zarządzania. Wiele powstało w Japonii. Dlaczego, mimo ich efektywności, nie zawsze są stosowane w biznesie?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88