Kopia za horyzontem

Do zdalnego wykonywania kopii danych najlepiej nadają się rozwiązania wykorzystujące bezpośrednią transmisję między macierzami. Przedstawiamy kilka najbardziej dopracowanych rozwiązań w tym zakresie.

Do zdalnego wykonywania kopii danych najlepiej nadają się rozwiązania wykorzystujące bezpośrednią transmisję między macierzami. Przedstawiamy kilka najbardziej dopracowanych rozwiązań w tym zakresie.

Istnieje co najmniej kilka powodów zdalnego wykonywania kopii danych. Pierwszy i najważniejszy z nich to zabezpieczenie przed ich utratą na skutek awarii. Innym powodem jest wykonywanie kopii na potrzeby budowy systemów testowych, umożliwiających np. testowanie nowych wersji aplikacji na rzeczywistych danych, ale bez konsekwencji dla danych produkcyjnych. Kopie niejednokrotnie są wykorzystywane do wykonywania kopii bezpieczeństwa danych na nośnikach taśmowych.

W wysoko wydajnych rozwiązaniach klasyczne metody wykonywania kopii danych za pomocą oprogramowania backupowego odchodzą powoli do lamusa. W wielu przypadkach danych jest zbyt dużo, a czas potrzebny na ich archiwizowanie zbyt krótki, aby stosować tradycyjny, bezpośredni backup danych produkcyjnych na taśmy. Rosnących oczekiwań coraz częściej nie spełniają także mechanizmy do archiwizowania danych wbudowane w aplikacje (najczęściej motory baz danych), ponieważ wymagają krótkiego, ale jednak, wstrzymania ich pracy.

Receptę na te niedogodności stanowią najnowsze techniki, pozwalające kopiować dane nie na poziomie systemu operacyjnego czy aplikacji, lecz wewnątrz lub pomiędzy - na poziomie bloków fizycznych. Podstawową zaletą takiego podejścia jest brak konieczności zatrzymywania aplikacji - w większości przypadków proces odbywa się bez ich "wiedzy". Kopiowanie sprzętowe jest ponadto bardzo szybkie i nie obciąża zasobów serwera.

Metody zdalnego wykonywania kopii można podzielić na: synchroniczne i asynchroniczne. Pierwsza grupa rozwiązań wykorzystuje mechanizm transakcji: operacja zapisu w systemie głównym jest uważana za zakończoną dopiero wtedy, gdy ze zdalnej lokalizacji nadejdzie potwierdzenie wykonania dokładnie tej samej czynności. Jak można sobie wyobrazić, takie podejście zwiększa wymagania dotyczące wydajności sprzętu i niezawodności łączy telekomunikacyjnych (a co za tym idzie - cenę całego rozwiązania). Metody asynchroniczne nie wymagają, aby zdalny system potwierdził operację I/O, zanim zostanie rozpoczęta kolejna - dane na zdalnym systemie są aktualizowane z pewnym opóźnieniem w stosunku do oryginału, co zazwyczaj zmniejsza wymagania sprzętowe. Wśród rozwiązań asynchronicznych można wskazać dwa najczęściej występujące modele. W pierwszym z nich zmiany w macierzy źródłowej są "odkładane" w osobnym miejscu i z określoną częstotliwością kopiowane do odległej lokalizacji. W drugim przypadku replikacja odbywa się prawie na bieżąco, jednak do wykonania kolejnej operacji I/O nie jest wymagane potwierdzenie zdalnego zapisu.

Jeżeli dane są kopiowane w celu ich ochrony przed awarią, trzeba mieć świadomość, że kopiowanie nie wystarczy do odtworzenia systemu. Wystąpienie awarii w systemie głównym prawie na pewno spowoduje przeniesienie błędów do systemu zapasowego. W efekcie ani jeden, ani drugi system nie będą wiarygodnymi źródłami danych dla odbudowywanego systemu. Rozwiązania do kopiowania danych muszą zatem współpracować z rozwiązaniami uzupełniającymi, np. oprogramowaniem klastrowym, bibliotekami taśmowymi itd.

Przedstawiamy kilka najważniejszych, a przy tym dopracowanych rozwiązań do wykonywania zdalnych kopii.

EMC

EMC od lat rozbudowuje swoje możliwości do zdalnego tworzenia kopii. Pakiet SRDF - Symmetrix Remote Data Facility pozwala na równoległy, synchroniczny, półsynchroniczny lub asynchroniczny zapis danych na dwóch lub większej liczbie oddalonych od siebie macierzy Symmetrix.

U podstaw SRDF leży pracujący na poziomie sterowników macierzy mechanizm RAID 1, odpowiadający za wykonywanie lustrzanych kopii danych. Zapis synchroniczny oznacza, że zlecając podsystemowi wykonanie operacji I/O aplikacja musi poczekać, aż odległa macierz potwierdzi, że otrzymała dane. Z uwagi na to, że ten sposób zapisu ma znaczący wpływ na wydajność, EMC oferuje też zapis "prawie synchroniczny", w którym aplikacja nie musi czekać na potwierdzenie zdalnego zapisu. Gdy tylko zdalna macierz potwierdzi otrzymanie danych, zmiany nanoszone są lokalnie. Wbudowany w rozwiązanie SRDF system kolejek dba o to, aby danych na macierzy lokalnej nie można było zmienić, zanim odległa macierz nie odeśle potwierdzenia.

Istnieje także odmiana SRDF, przeznaczona do całkowicie asynchronicznego kopiowania danych między macierzami. Kopiowanie danych w trybie Adaptive Copy oznacza wykonanie zwykłej (za pomocą systemu plików) lub fotograficznej kopii danych, co nie gwarantuje zachowania ich 100-proc. spójności (metoda ta używana jest raczej do przenoszenia większych ilości danych między macierzami). Aby dane kopiowane metodą Adaptive Copy nie zakłóciły kopiowania w trybie synchronicznym, administrator może tej operacji nadać niski priorytet. Mechanizm SRDF pozwala też na tworzenie grup zasobów, których synchronizacja ma być śledzona - z reguły są to bazy danych. Gdy łącze ulegnie awarii, dane są zapisywane lokalnie, lecz w innym niż zwykle miejscu; zapis w standardowej lokalizacji następuje po przywróceniu komunikacji z odległą macierzą. Każdy dysk logiczny macierzy może być synchronizowany w inny sposób.


TOP 200