Raid do niezawodności

Matryce dyskowe, skonstruowane w technologii RAID stanowią jeden z przebojów ostatnich dwóch lat na rynku nośników pamięci masowej.

Matryce dyskowe, skonstruowane w technologii RAID stanowią jeden z przebojów ostatnich dwóch lat na rynku nośników pamięci masowej.

Postęp jest tak szybki, że nazwa RAID - Redundant Array of Inexpensive Disks (nadmiarowa matryca tanich dysków) - nieco się zdezaktualizowała. Spotyka się dziś tłumaczenie RAID jako Redundant Array of Interchangeable Disks, a więc dyski z "tanich" stały się "wymienne". Złożenie kilku dysków w jeden system, wraz z zapewnieniem tzw. redundancji (nadmiarowości) powoduje, że średni czas między kolejnymi utratami danych MTBDL (Mean Time Between Data Loss) staje się o kilka rzędów wielkości większy od średniego czasu pomiędzy awariami MTBF (Mean Time Between Failures), osiągając wartości liczone w miliardach godzin pracy!

Pomysł na wysoką pewność zapisu na dyskach "tanich", czyli po prostu zawodnych, zaczął żyć własnym życiem. Początkowy zamysł był, jak się zdaje, dość skromny. Chodziło m.in. o spowodowanie, by stosunkowo proste i tanie dyski twarde przestały wymagać uciążliwego zabezpieczania się przed utratą danych częstymi zrzutami zapisu na streamery. Częste zrzuty zresztą są dalekie od zapewnienia pełnego bezpieczeństwa.

Dwie pieczenie na jednym ogniu

Technologię RAID określają w zasadzie dwie cechy szczególne: nadmiarowość (redundance) zapisu informacji oraz rozproszenie zapisu między wieloma dyskami (stripping). Nadmiarowość ma na celu ochronę użytkownika przed utratą danych w wypadku uszkodzenia nośnika pamięci. Stripping pozwala na znaczne przyspieszenie operacji zapisu i odczytu, ponieważ kolejne porcje danych są zapisywane na kilku dyskach jednocześnie. Istnieje sześć poziomów RAID - od RAID0 do RAID5 - odpowiednio do sposobu realizacji nadmiarowości i strippingu. Komercyjnych realizacji doczekały się, jak dotąd, tylko poziomy 0,1,3, oraz 5.

RAID0 realizuje matryca, w której jedynym przejawem zespołowego działania dysków jest stripping, brak zaś nadmiarowości. Matryca zorganizowana w ten sposób działa N razy szybciej, niż gdyby zapisu dokonywano na jednym dysku (N jest ilością dysków w matrycy), za to brak jej jakiegokolwiek zabezpieczenia przed utratą danych na skutek awarii dysku.

RAID1 zakłada stripping oraz nadmiarowość zapisu w oparciu o technikę mirroring, czyli podwojenie zapisu. Każda informacja jest zapisana dwukrotnie na dwóch różnych dyskach. Pojemność matrycy jest więc, w rzeczywistości, dwa razy mniejsza od nominalnej, a szybkość zapisu dwukrotnie mniejsza niż w RAID0 (z uwagi na dwa razy większą liczbę operacji zapisu), za to szybkość odczytu jest proporcjonalna do N/2, bo dotyczy tylko połowy dysków.

Na poziomie RAID3 realizuje się nadmiarowy zapis sum kontrolnych, dzięki któremu na ochronę danych wystarczy poświęcić tylko jeden spośród N dysków matrycy. Zasadę logiczną tego systemu opisaliśmy dokładniej w CW nr ../92. Stripping dokonuje się na poziomie pojedynczych bajtów, tzn. pierwszy bajt zapisuje się na pierwszym dysku, drugi na drugim, itd. Sumy kontrolne zapamiętywane są na osobnym dysku, co niekorzystnie wpływa na szybkość operacji zapisu. Trzeba im bowiem poświęcać jeden cykl zapisu.

W systemie RAID5 sumy kontrolne są rozsiane po wszystkich dyskach, nie ma więc osobnych operacji ich zapisu. Stripping realizuje się na poziomie całych bloków danych.

...a serce bije jedno

Ważną cechą matryc dyskowych jest również spanning, co oznacza, że komputer widzi całą matrycę jako jeden dysk logiczny. Programy aplikacyjne uzyskują w ten sposób możliwość operowania bardzo dużymi plikami danych.

Groźna w skutkach awaria może wynikać nie tylko z uszkodzenia dysku, lecz w równym stopniu z uszkodzenia zasilania lub kontrolera. Dlatego przy ocenie konkretnej matrycy dyskowej trzeba brać pod uwagę również redundancję innych elementów, ważnych dla bezpieczeństwa danych: zasilacza i kontrolera. Do tego trzeba jeszcze dodać "hot swapping", czyli możność wymiany uszkodzonego elementu bez przerywania pracy systemu.

Jak to się robi w Ameryce?

Bill Lawrence, dokonał w sierpniowym numerze Byte'a porównania matryc dyskowych sześciu liczących się producentów: Ciprico, Core, Dynatek, Micropolis, Legacy i MicroNet. Zestawienie najważniejszych cech tych urządzeń zawiera poniższa tabela.

Cecha producent Ciprico Core Dynatek Micropolis Legacy MicroNet urządzenia RAID: 0 - - + + + + 1 - - - - + + 3 + + - - - - 5 - - + + + -

nadmiarowość: dyski + + + + + + zasilacz - + + + + + kontroler - + + + + +

hot-swapping: dyski + + + + + - zasilacz - + - + - - kontroler - + - + - -

syst. oper.: NetWare 3.1x + + + + + + NetWare 2.x + + - - + + Unix + + + - + + OS/2 + + + - + - DOS + + + - + +

pojemność: minimum [GB] 2.0 1.3 0.66 0.68 0.4 0.66 maximum [GB] 3.4 5.2 4.0 47.0 7.8 5.2

Jak widać z tabeli, producenci matryc na ogół znajdują są ciągle w pół drogi. W statystyce plusów prowadzi Micropolis ze swym systemem RAIDION, aczkolwiek jego słabością jest brak - chyba tymczasowy - dostosowania do kilku podstawowych systemów operacyjnych. Nieznacznie mu ustępuje Core, który jednak pozostaje w tyle na skutek braku implementacji najwyższego poziomu RAID5.

W tabeli nie ma uwidocznionej szybkości działania poszczególnych urządzeń. Jak się okazuje, Micropolis oraz Core przegrywają pod tym względem z większością konkurentów, za to wiodą prym pod względem odporności na uszkodzenia, co widać w tabeli; przypuszczalnie konstruktorzy położyli nacisk na tę właśnie cechę, co musiało odbić się niekorzystnie na szybkości. RAIDION Micropolis można jednak przełączyć w tryb pracy na poziomie RAID0, jeśli ktoś nade wszystko ceni sobie szybkość działania.

Nie sposób nie zauważyć, że Micropolis bije konkurentów na głowę osiągalną pojemnością pamięci; warto dodać, że również cena w ofercie tej firmy w przeliczeniu na gigabajt, jest zdecydowanie najniższa. Wysoką pozycję zajmuje również Dynatek, którego jedyną wadą, w porównaniu z Core i Micropolis, jest brak możliwości wymiany zasilacza i kontrolera bez zatrzymywania systemu.

Należy się jednak spodziewać, że najdalej za kilkanaście miesięcy powyższa tabela utraci sens, gdyż wówczas trzeba będzie wpisać do niej wyłącznie plusy.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200