Dużo danych, duży problem

W obecnym cyfrowym świecie daje się zauważyć trend ciągłego wzrostu ilości składowanych danych. Dzisiejsze macierze muszą być nie tylko szybsze i pojemniejsze, ale także muszą być łatwiejsze w obsłudze, automatyzując niektóre czynności diagnostyczne.

Ilość magazynowanych danych stale rośnie - w 2009 roku na świecie przechowywano 0,8 zettabajta (zettabajt, ZB - 10^21 bajtów, czyli tryliard bajtów lub miliard terabajtów). Prognozy IDC przytaczane przez firmę EMC mówią, że w roku 2020 będzie to około 35 ZB, czyli 44 razy więcej. Te informacje są składowane na dyskach, taśmach i napędach optycznych, tworzone przez użytkowników różnych sieci oraz urządzenia techniczne. Pewna ich część powstaje w urządzeniach mobilnych (na przykład nakręcane i składowane filmy wideo) i jest następnie udostępniana w portalach, takich jak Youtube czy w serwisach społecznościowych.

Jednym z zastosowań, które wymagają składowania i przetwarzania dużej ilości danych, jest renderowanie wideo. Obecnie większość filmów rysunkowych oraz efektów specjalnych produkuje się za pomocą komputerów, przeprowadzając renderowanie gotowego obrazu w wysokiej rozdzielczości. Do przechowywania i przetwarzania takiej ilości danych niezbędne są wysokopojemne i wydajne .

Pewna część danych pochodzi z systemów rejestracji wideo CCTV. Dane nagrane z kamer muszą być składowane przez pewien czas, zależnie od polityki retencji może być to doba, tydzień, miesiąc, a nawet kilka lat.

Bardzo duże ilości danych są przetwarzane przy obliczeniach związanych z badaniami genetycznymi. W odróżnieniu od zapisu z kamer, który jest dopisywany sekwencyjnie, tutaj występują bloki danych; dostęp do nich może być zupełnie losowy, przy nierównym prawdopodobieństwie dla różnych bloków. Podobną charakterystykę mają badania geofizyczne, związane na przykład z poszukiwaniem ropy naftowej lub cennych minerałów. Tutaj przechowywane są także dane źródłowe pochodzące z różnych badań, przy czym ich liczba bardzo szybko rośnie.

Dane wrażliwe

Duże ilości danych są przechowywane także w systemach medycznych zawierających wyniki zapisów badań, takich jak: obrazy prześwietleń, przekroje tomograficzne, generowane syntetyczne obrazy czy elektroniczne karty pacjenta. Są to dane wrażliwe, zawierające informacje medyczne, zatem muszą być składowane i przetwarzane z zachowaniem rygorystycznych norm bezpieczeństwa. Najważniejsi producenci rozwiązań storage mają specjalizowane macierze, które służą do składowania takich danych w sposób niezawodny i bezpieczny.

SSD, FC, SATA...

O ile macierze klasy Enterprise od dawna mają podział na poziomy składowania danych, opcja ta dopiero teraz pojawia się w urządzeniach przeznaczonych dla sektora małych i średnich przedsiębiorstw. Podział na poziomy składowania danych umożliwia lepsze wykorzystanie najszybszych dysków, przy czym coraz częściej do przechowywania "najgorętszych" danych wykorzystywane są dyski półprzewodnikowe SSD. Ponieważ dyski te są kosztowne, nie opłaca się przechowywać na nich wszystkich danych, a ręczne manipulowanie miejscem składowania zasobów jest dość kłopotliwe.

Początkowo stosowano konfigurację per zasób, umożliwiając eksploatację najmocniej obciążonych woluminów w pamięci SSD, ale wysoki koszt tych dysków sprawia, że nie jest to optymalne kosztowo rozwiązanie.