Firmowe dyski pełne danych

Potrzeby dzisiejszych firm wykraczają daleko poza składowanie danych na macierzy dyskowej. Zapewnienie wydajności wymaga zaawansowanej technologii dysków mechanicznych wspartych modułami SSD.

W firmach bardzo wiele dokumentów przechowuje się w postaci niestrukturalnej, zapisując arkusze kalkulacyjne i dokumenty tekstowe na zasobach udostępnianych przez sieć. Ponieważ nadal rzadkością są systemy zarządzania treścią, powstaje wiele kopii tego samego dokumentu w różnych jego wersjach. Statystycznie co najmniej połowa dokumentów ma swoje kopie rozproszone w różnych zasobach, zatem wykorzystanie przestrzeni jest nieoptymalne. Gdy połączyć to z gwałtownym wzrostem ilości przetwarzanych danych, widać, że firmy potrzebują olbrzymich zasobów storage.

Z drugiej strony systemy zarządzania dokumentami, które centralizowałyby przechowywanie plików, ich wersji oraz statusu i nadzorowały pracę nad dokumentami, by uniknąć duplikowania pracy, nadal są rzadkością.

Bezpieczeństwo

Typowy serwer plików korzysta z kilku dysków połączonych w macierz RAID. Chociaż jest to rozwiązanie odporne na awarie pojedynczego dysku, nie może równać się z ochroną danych, jaką dają nowoczesne . Zazwyczaj woluminy konfiguruje się z użyciem poziomów RAID (na przykład RAID-6 lub raid_dp), które zapewniają lepszą ochronę, uodparniając system nawet na jednoczesną awarię dwóch dysków. Standardową opcją macierzy jest konfiguracja jednego dysku jako tzw. hot spare, czyli gorącej rezerwy, włączanej do użycia w przypadku konieczności wyłączenia z eksploatacji uszkodzonego dysku. Mechanizm ten daje się zastosować także w serwerach, ale przy macierzach dyskowych jest to standardowa opcja.

Kolejną zaletą jest niewrażliwość macierzy dyskowych na eksploity kierowane przeciw systemom Windows oraz Linux.

Niezbędna wydajność

Firmy składują nie tylko coraz więcej danych, ale oczekują możliwie szybkiego przetwarzania informacji w systemach transakcyjnych. Wiąże się to z koniecznością przechowywania informacji na szybkich dyskach i wdrażania nowoczesnych rozwiązań podziału na poziomy wydajności (tier). Standardowy dysk 7200 RPM powszechnie stosowany w stacjach roboczych i mniej obciążonych serwerach obsłuży około 80 operacji wejścia/wyjścia na sekundę (IOPS), co z powodzeniem wystarczy do masowego składowania niekrytycznych zasobów. Szybsze dyski, pracujące z prędkością obrotową 10 tys. RPM, obsłużą około 120 operacji na sekundę, a najszybsze, pracujące z prędkością 15 tys. RPM - około 170 IOPS. Razem z przyspieszeniem prędkości obrotowej skrócono także czas przesuwania głowicy z około 4-5 ms do 2 ms. Barierą dalszego przyspieszenia pracy dysków są ograniczenia wynikające z praw fizyki.

Macierze RAID stworzone z tak szybkich dysków mechanicznych są używane do przechowywania danych dla krytycznych aplikacji, przy czym barierą nie jest pojemność, ale konieczność zestawienia większej ilości napędów, by uzyskać żądaną wydajność. Jeszcze kilka lat temu kreowanie nowych woluminów z bardzo szybkich dysków mechanicznych było jedynym sposobem przyspieszenia pracy krytycznych aplikacji biznesowych, gdy właśnie storage był wąskim gardłem.

Poziom za poziomem

Im szybszy dysk, tym jest droższy, zatem nie opłaca się wszystkich zasobów przechowywać na najszybszych dyskach. W miarę wzrostu ilości danych w firmach okazało się, że koszty składowania wymuszają podział składowanej informacji pod kątem wymagań odnośnie do wydajności. Wprowadzono zatem podział na poziomy składowania (ang. tier), przenosząc najrzadziej dostępne dane na najtańsze dyski SATA w macierzy RAID-5 lub RAID-6 (raid_dp), a cenne miejsce na najszybszych dyskach SCSI, zachowując dla krytycznych aplikacji. Początkowo podział ten odbywał się per wolumin, ale opracowano technologię przenoszenia danych między zasobami. W tym czasie powstała także technologia umożliwiająca wykrywanie i odkładanie najrzadziej przetwarzanych plików do archiwum, na przykład na taśmę magnetyczną. Zwolnienie miejsca z dysków po skopiowaniu starszych wersji lub nieużywanych plików umożliwia znaczne zmniejszenie zapotrzebowania na przestrzeń dyskową. Badania dostawców storage udowadniają, że pliki starsze niż dwa lata (w kategoriach czasu ostatniego dostępu) charakteryzują się bardzo niskim prawdopodobieństwem ponownego wykorzystywania.


TOP 200