Systemy kopii awaryjnych

Poziom bezpieczeństwa RAID 3 przypomina poziom RAID 4, jednak różni się tym, że paski zapisu w RAID 3 są tak małe, że każda pojedyncza operacja odczytu lub zapisu wymaga użycia wszystkich dysków w macierzy. Na przykład pierwszy bajt w bloku danych może być przechowywany na pierwszym dysku, drugi na drugim itp. W systemach RAID 3 zwykle utrzymuje się synchronizację głowic dysków, aby obniżyć czas oczekiwania. Ochrona RAID 3 dobrze się sprawdza w środowiskach, gdzie wymagana jest bardzo duża wydajność przy transmisji pojedynczych dużych plików, takich jak przetwarzanie obrazów. Jest jednak mało wydajna w środowiskach, gdzie wielu użytkowników wykonuje jednocześnie wiele nieskorelowanych operacji dyskowych, ponieważ każda operacja generuje ruch na każdym dysku macierzy. W macierzy RAID 4 każdy dysk danych może obsłużyć w tym samym czasie żądanie innego użytkownika.

Systemy kopii awaryjnych

Tworzenie macierzy RAID 4

Macierz dyskowa RAID 4 wykorzystuje jeden dysk do przechowywania informacji o parzystości danych rejestrowanych na pozostałych dyskach. Pasek (stripe) zawiera po jednym bloku z każdego dysku danych i jeden z dysku parzystości. Blok parzystości w każdym pasku umożliwia odtworzenie danych, jeśli jeden z bloków w pasku jest uszkodzony.

W macierzach poziomu RAID 4 uszkodzenie bloku z danymi powoduje odtworzenie jego zawartości na podstawie informacji o parzystości w danej grupie RAID i przeniesienie jej w nowe miejsce. W razie awarii całego dysku dane nie są tracone dzięki informacji o parzystości. Po wymianie uszkodzonego dysku na sprawny dysk parzystości jest wykorzystywany do automatycznego odtworzenia jego zawartości.

Utracone dane są zawsze obliczane i odtwarzane w trakcie pracy systemu, tak aby nie przerywał on działania nawet w razie uszkodzenia dysku. Także cała zawartość uszkodzonego dysku jest odtwarzana natychmiast po jego wymianie na nowy. Niestety, jeśli dwa bloki w jednym pasku ulegną uszkodzeniu, cała jego zawartość zostaje utracona, ponieważ nie ma już odpowiedniej ilości informacji, aby odtworzyć utracone dane. Jeśli awarii ulegnie jedynie dysk parzystości, musi być on wymieniony, lecz nie powoduje to zmiany danych w systemie.

Ochrona RAID 5 jest podobna do RAID 4, ale zamiast przechowywania bloków parzystości na pojedynczym dysku rozprasza tę informację na wszystkie dyski w macierzy: parzystość dla pierwszego paska na pierwszym dysku, dla drugiego na drugim itp. Tak więc podstawową zaletą systemu RAID 5 jest uniknięcie przeciążenia dysku parzystości, który łatwo może stać się "wąskim gardłem" całego systemu. Istotną wadą tego systemu jest problem z dodawaniem do niego pojedynczego dysku. System ten można łatwo rozbudowywać jedynie przez dodawanie kompletnych macierzy dyskowych. Na przykład jeśli w danej implementacji RAID 5 jest 7 dysków w każdej macierzy, trzeba dodawać po 7 dysków jednocześnie.

Sieci SAN

Systemy kopii awaryjnych

Infrastruktura sieci SAN

Sieciowa infrastruktura pamięci masowej SAN (Storage Area Network), łączona także z architekturą NAS (Network Attached Storage), znacznie zmniejsza czas przerw w pracy systemów dyskowych - w porównaniu do tradycyjnych podsystemów RAID. W tych rozwiązaniach dane są zwykle zabezpieczane przed awarią dysku za pośrednictwem systemów działających podobnie jak macierz RAID 4. W odróżnieniu od standardowych implementacji systemów RAID 4 i 5 (konstruowanych bez uwzględniania struktury i aktywności systemu plików) w rozwiązaniach sieciowych SAN implementacja RAID 4 jest optymalizowana do pracy łącznie z systemem plików. Równoczesna optymalizacja systemu plików i systemu RAID umożliwia wykorzystanie zalet zabezpieczania danych za pomocą sumy kontrolnej (parzystości) bez straty wydajności systemu - typowej dla standardowych rozwiązań opartych na RAID 5. Użycie systemu RAID 4, który w odróżnieniu od RAID 5 nie przeplata informacji o parzystości z danymi, umożliwia prostą rozbudowę systemu bez utraty zabezpieczania danych przez RAID.

W architekturze sieci SAN zespoły pamięci masowej (dyski, taśmy) są łączone do sieci komputerowej najpierw przez sieć SAN (szybka pętla Fiber Channel - nie mniej niż 1 Gb/s) i dalej przez serwer z siecią LAN przedsiębiorstwa (komputery, serwery, terminale).

Wysoki poziom dostępności w sieciach SAN uzyskuje się przez stosowanie rozwiązań pozwalających na tworzenie kopii zapasowych na dyskach i odzyskiwanie z nich danych bez ograniczenia - jakim jest okno backupu - co skraca czas odzyskiwania danych. Wśród innych sposobów zwiększenia dostępności na uwagę zasługują: dynamiczne rozszerzanie pojemności wirtualnego dysku, eliminowanie konieczności rekonfigurowania pamięci masowej, replikacja danych w sieci rozległej poprzez asynchroniczny lub synchroniczny system lustrzany (mirroring) oraz stosowanie techniki klastrowej w celu zwiększenia niezawodności systemu.

Do uzyskania tego celu stosuje się wyspecjalizowane urządzenia (appliance) zwiększające dostępność danych i łatwość testowania. Komputer ogólnego przeznaczenia ma bowiem tak wiele różnych funkcji i zastosowań, że prawie niemożliwe jest przetestowanie wszystkich jego sposobów pracy. Urządzenie wyspecjalizowane można przetestować znacznie dokładniej, ponieważ realizuje tylko jedną lub kilka funkcji użytkowych. Prostszy sprzęt także redukuje prawdopodobieństwo wystąpienia awarii.


TOP 200