Eksplozja danych

W 2007 r. wzrost liczby informacji w postaci cyfrowej był większy o ok. 10% od prognoz z początku ubiegłego roku.

W 2007 r. wzrost liczby informacji w postaci cyfrowej był większy o ok. 10% od prognoz z początku ubiegłego roku.

Eksplozja danych
W kolejnym, drugim już raporcie IDC "The Diverse and Exploding Digital Universe" analitycy tej firmy przyznają, że w opracowanej przez siebie rok wcześniej analizie nie docenili tempa wzrostu ilości informacji tworzonych na świecie oraz przekazywanych lub przechowywanych w formacie elektronicznym. IDC dokonało ich korekty w górę. Najnowszy raport prezentuje trudne do wyobrażenia prognozy przyrostu danych, które będą tworzone i przechowywane w różnego typu pamięciach masowych.

  • 1800 eksabajtów - tyle danych pojawi się w informatycznym ekosystemie w 2011 roku, jeśli dotychczasowy wzrost zostanie utrzymany.
  • 281 eksabajtów - do tego poziomu wzrosła liczba danych w 2007 roku.
  • 161 eksabajtów - liczba danych elektronicznych w 2006 r. Jest to 3 miliony razy więcej niż liczba informacji we wszystkich napisanych i opublikowanych dotąd książkach.
  • 20 trylionów - liczba elektronicznych pojemników na dane (electronic data containers), czyli w uproszczeniu plików lub zestawów powiązanych informacji, będzie istniało w 2011 roku. Należy zauważyć, że oznacza to przewidywanie, że ich liczba będzie rosła o ok. 50% szybciej niż liczba danych.
  • 64 biliony bitów dziennie przesyłają do centrum kontroli kamery wideo do kontroli ruchu ulicznego, zainstalowane w Londynie.
  • 100 milionów strumieni wideo dziennie przekazuje YouTube .
  • 60% - średni roczny wzrost liczby danych obserwowany obecnie.
  • 45 GB przypada średnio na każdego człowieka żyjącego na Ziemi.
  • 30% - informacji potencjalnie może być szkodliwa (jest zakwalifikowana przez IDC jako dane lub kod, będące obiektem zainteresowania różnego typu aplikacji do zabezpieczania systemów IT).
  • 20% - informacji podlega przepisom prawnym, które nakazują konieczność ich archiwizowania.
Pod poniższym adresem można znaleźć zegar na bieżąco prezentujący liczbę informacji powstających na świecie (Worldwide Digital Growth Tracking Ticker).

www.emc.com/leadership/digital-universe/expanding-digital-universe.htm

Źródło: Raport IDC "The Diverse and Exploding Digital Universe", marzec 2008.

Trudno ocenić, w jakim stopniu te przewidywania się sprawdzą i jak ludzie sobie poradzą z ogromnym wzrostem informacji. Nie ulega wątpliwości, że taki raport ma jednak wpływ na rynek i jego wyniki przyczynią się zapewne do modyfikacji strategii producentów, a także powstania nowych pomysłów i firm, które zauważą swoją szansę na zrobienie dobrego biznesu dzięki zalewowi cyfrowych danych.

Największym problemem utrudniającym zrozumienie takiego raportu są wielkie liczby, które wymykają się ludzkiej percepcji. Prawie każdy potrafi zrozumieć, jak dużo można wygrać w totolotka, mniej ludzi ogarnia, jak naprawdę duży jest deficyt budżetowy szacowany na 40 mld zł, ale zapewne niewielu będzie wiedziało, co można by kupić za bilion złotych. Wydaje się, że na bilionie w ogóle kończą się możliwości ludzkiej percepcji; prawdopodobnie większe wartości potrafią ogarnąć tylko matematycy i fizycy. Jest to bowiem nie tylko "potworna" liczba - przedrostek określający bilion w oficjalnym układzie jednostek SI "tera" pochodzi od greckiego słowa "teras", czyli potwór - ale też ostatnia mająca "ludzkie" określenie. Kolejne przedrostki są tworzone standardowo przy wykorzystaniu nazw liczb.

Aby sobie wyobrazić, co realnie oznaczają liczby prezentowane w raporcie IDC, konieczny jest niemały wysiłek intelektualny. Pewną pomocą może być "szkolna" tabelka z nazwami i definicjami dużych liczb według obowiązującego, standardowego układu jednostek SI.

Liczba informacji a dostępna pojemność pamięci masowych
Do niedawna liczba informacji wytwarzanych była zbliżona do całkowitej pojemności pamięci masowych, co oznacza, że praktycznie każda informacja mogła zostać zapisana i przechowywana. W najbliższych latach nastąpi zmiana tej sytuacji i zasadniczemu wzrostowi liczby wytwarzanych i przekazywanych informacji nie będzie odpowiadał podobny wzrost fizycznej pojemności pamięci.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200