Redundancja ponad wszystko

Zasilanie i chłodzenie

Nie bez znaczenia dla niezawodności systemu pozostaje również wyposażenie macierzy czy też biblioteki taśmowej w nadmiarowe wentylatory oraz zasilacze. W przypadku awarii wentylatora, w wyniku wydzielanego na elementach elektronicznych urządzeń ciepła i niemożności jego skutecznego odprowadzenia, system zostaje narażony na ryzyko przegrzania i w konsekwencji poważnej awarii. Równie krytyczna, co redundancja chłodzenia, jest redundancja zasilania. W przypadku awarii zasilacza, co przecież nie jest znowu takie rzadkie, automatycznie system przestaje działać. W celu usprawnienia procedury wymiany zepsutych elementów, powszechnie wykorzystywane w macierzach wentylatory i zasilacze są typu "hot plug", a więc umożliwiają szybką i bezprzerwową dla działania systemu wymianę.

Nieulotny cache

Wszystkie wymienione wyżej elementy redundantne widać gołym okiem praktycznie w każdej pamięci masowej. Istnieją również mechanizmy “wewnętrzne", których nie widać, ale odgrywają bardzo dużą rolę w zapewnianiu wysokiej niezawodności całego systemu.

Z punktu widzenia architektury kluczowym elementem każdej macierzy dyskowej jest pamięć cache. Służy ona poprawie wydajności obsługi operacji IO. W większości systemów macierzowych pamięć cache’ująca zapisy jest typu nieulotnego (NVRAM), podtrzymywana bateryjnie. Zapobiega to utracie trwających operacji zapisu na dyski, w momencie np. awarii zasilania.

RAID

Redundancja ponad wszystko

Bloki danych w grupie RAID 5 zapisywane na kolejnych dyskach, parzystość rozrzucona jest po wszystkich dyskach grupy

Nie sposób wyobrazić sobie macierzy dyskowej bez służących podniesieniu niezawodności grup RAID (Redundant Array of Inexpensive Disks). Kluczem w zrozumieniu idei działania RAID jest operacja wyliczania parzystości z dysków danych przy użyciu logicznej funkcji XOR. Tak wyliczona parzystość jest następnie przechowywana i może posłużyć do przywrócenia danych zapisanych na dysku w razie jego awarii. Dostępnych jest kilka poziomów RAID, różnią się one od siebie sposobem działania i ilością dysków, przed których awarią chronią. RAID 1 polega na utworzeniu kopii lustrzanej - mirrora dysków, w tym przypadku parzystość nie jest wyliczana. W przypadku awarii pierwszego dysku, dane dostępne będą na drugim dysku. Poziomy RAID 3 oraz 4 wymagają co najmniej trzech dysków, na dwóch z nich znajdują się dane, natomiast trzeci dysk to dysk tzw. parzystości. RAID 5 różni się tym od poprzedników, że parzystość jest rozrzucona po wszystkich dyskach, a nie na jednym z nich.

O krok dalej idzie poziom RAID 6, w skład którego wchodzić muszą minimum cztery dyski twarde. RAID 6 pozwala zabezpieczyć dane przed awarią dwóch dowolnych dysków z grupy. Kiedy wystąpi awaria dysku lub dysków, system macierzowy pracuje bez przerwy. Po zastąpieniu zepsutego dysku nowym, następuje proces odbudowy danych z wykorzystaniem parzystości. W większości macierzy wszystkie dyski twarde umożliwiają wymianę “na gorąco", bez konieczności wyłączania samej macierzy.

Wymienione mechanizmy służą podniesieniu niezawodności pamięci masowych, a tym samym zagwarantowaniu ciągłej dostępności danych.


TOP 200