Redundancja ponad wszystko
- Szymon Pomorski,
- 10.05.2010
Pamięć masowa odgrywa istotną rolę w infrastrukturze każdego centrum danych. To właśnie na niej swoje miejsce znajdują dane systemów informatycznych, od których bezpieczeństwa i dostępności zależy niejednokrotnie działalność biznesowa organizacji.
W dzisiejszych czasach, gdzie modele biznesowe wielu organizacji opierają się na działaniu systemów informatycznych, priorytetem staje się zapewnienie ciągłego i niezawodnego dostępu do danych. Przerwa w dostępie do danych lub, co gorsza, ich utrata naraża firmę na ryzyko utraty klientów, zysków oraz problemy natury prawnej. Dlatego tak ważne staje się wyeliminowanie z całej ścieżki przepływu danych, począwszy od serwera, poprzez sieć, aż po macierz dyskową pojedynczych punktów awarii.
Podstawową metodą zapewnienia niezawodności dla pamięci masowej jest zastosowanie redundancji na wielu poziomach i dla wielu elementów składowych. Redundancja podnosi poziom niezawodności, ale podwaja koszty inwestycji. Jednak patrząc realnie, często są one minimalne w porównaniu ze stratami, jakie mogą wyniknąć z powodu przerwania działania systemu informatycznego lub utraty danych.
Kontrolery
Patrząc na typową macierz dyskową gołym okiem, widać, jak wiele mechanizmów niezawodnościowych zostało w niej przez producenta zaimplementowanych. Pierwszym elementem, którego zdublowanie podniesie poziom niezawodności, jest kontroler macierzowy. Dlatego praktycznie wszystkie macierze oferują możliwość sklastrowania swoich minimum dwóch kontrolerów w konfiguracje typu aktywny-aktywny. W tego typu konfiguracji każdy kontroler ma swoją pulę napędów dyskowych oraz przetwarza operacje wejścia-wyjścia. Każdy z nich podłączony jest również do puli dysków twardych partnera, a pomiędzy kontrolerami przesyłany jest sygnał dostępności, tzw. heartbeat. Zniknięcie tego sygnału to wyraźny znak dla drugiego kontrolera, aby rozpoczął operację przejęcia obsługi dysków i operacji I/O zepsutego sąsiada do czasu, aż powróci on do trybu normalnego działania. W przypadku mocno obciążonych systemów operacji przejęcia towarzyszy najczęściej, co jest rzeczą naturalną, spadek wydajności działania. Jednak lepsze to, aniżeli brak jakiegokolwiek działania. Zepsuty kontroler można zastąpić nowym w trybie wymiany "na gorąco", czyli bez konieczności wyłączania urządzenia.
Interfejsy sieciowe
Kolejne ważne elementy pamięci masowej, które wymagają redundancji, to interfejsy sieciowe, zarówno te ethernetowe, jak i typu Fibre Channel. Najczęściej każdy kontroler macierzy wyposażony jest w minimum dwa porty, co zabezpiecza przed pojedynczą awarią któregokolwiek z nich. Patrząc na ścieżkę komunikacyjną trochę szerzej. Dobrą i powszechnie przyjętą praktyką podniesienia poziomu niezawodności na ścieżce danych jest podłączenie każdego portu kontrolera do dwóch odrębnych przełączników sieciowych. W efekcie daje to tzw. wielościeżkowość danych - od portów kart sieciowych w serwerach do portów kontrolerów macierzy. Idąc dalej, warto zwrócić uwagę, aby również każda karta sieciowa miała minimum dwa porty, a każdy serwer dwie karty. Zabezpieczy to system przed awarią portu czy też samej karty sieciowej w serwerze. Wielościeżkowość implementowana jest również na tzw. backendzie macierzy, a więc redundancji pętli, na których podłączone są do macierzy kolejne półki dyskowe. Zabezpiecza to przed awariami modułów półek i kabli.