Backup w systemach zwirtualizowanych

Ciągła ochrona danych

Funkcja CDP (Continuous Data Protection) to kolejna technologia, której popularność jako standardowego elementu aplikacji do backupu systematycznie rośnie.

Zawsze gdy zmianie ulegnie jakikolwiek blok danych chronionych przez system z funkcją CDP, informacje o tym są zapisywane w logu. W rezultacie możliwe jest odtworzenie danych z dowolnego momentu. Funkcja określana jako near-CDP różni się od CDP tym, że zmiany są zapisywane tylko w określonych, zdefiniowanych przez administratora, dyskretnych odcinkach czasu.

Technologie CDP są znane, ale do niedawna były wykorzystywane tylko w sieciach pamięci SAN jako drogie, opcjonalne rozwiązanie dla dużych centrów danych. Obecnie wirtualizacja i mechanizmy CBT (Change Block Tracking) umożliwiły popularyzację CDP i nie tylko duże korporacje, ale większość użytkowników może sobie pozwolić na wdrożenie systemu, który tworzy ciągłe lub częste migawki zmian najważniejszych maszyn wirtualnych i replikuje zmodyfikowane bloki danych.

Odtwarzanie aplikacji

Każdy administrator chciałby uniknąć sytuacji, w której odtwarza maszynę wirtualną po awarii, informuje użytkowników, że za chwilę aplikacja będzie dostępna, a tu okazuje się, iż niezbędne jest jeszcze sprawdzenie integralności bazy danych, które zajmie np. 20 godzin. Czasami też bywa, że po odtworzeniu VM z kopii zapasowej sam system operacyjny nie chce się uruchomić i w efekcie aplikacja też nie może funkcjonować.

Nawet jeśli po wykonaniu backupu maszyny wirtualnej operacja ma status „success”, daje to tylko złudne poczucie bezpieczeństwa i niestety nie gwarantuje, że po odtworzeniu danych system i aplikacje będą dostępne.

Dlatego też mechanizmy kontroli integralności danych są bardzo ważnym elementem zwiększającym użyteczność oprogramowania do backupu.

Kontrola integralności danych jest związana z klasycznymi parametrami RTO (Recovery Time Objective) i RPO (Recovery Point Objective), które odpowiednio definiują, ile czasu powinno trwać odtwarzanie danych i jaki poziom strat jest dopuszczalny. Ale jej znaczenie jest nieco inne – bo przede wszystkim określa ona, czy po odtworzeniu danych aplikacja będzie mogła zostać natychmiast uruchomiona, czy nie.

Ważna jest nie tylko integralność danych dotyczących aplikacji, ale również systemu operacyjnego uruchamianego w maszynie wirtualnej.

Najnowszej generacji programy do backupu są często wyposażone w funkcje umożliwiające testowanie, czy po odtworzeniu danych system operacyjny i aplikacje będą mogły zostać bez problemu uruchomione. Testy mogą być uruchamiane automatycznie, generować raporty, a administrator może też tworzyć skrypty pozwalające na testowanie zdefiniowanych grup maszyn wirtualnych.

Niektóre aplikacje do backupu umożliwiają wykonanie testów integralności kopii zapasowych przy wykorzystaniu natywnych narzędzi dostarczanych wraz z systemami operacyjnymi i aplikacjami.

Podstawowe problemy, które można napotkać przy tworzeniu kopii bezpieczeństwa danych w systemach zwi

•Ograniczone zasoby fizyczne

Jedną z zalet wirtualizacji jest możliwość zwiększenia poziomu wykorzystania dostępnych zasobów fizycznych, takich jak moc przetwarzania lub pamięć masowa. Maszyny VM działające na jednym hoście z zasady współdzielą te zasoby. W efekcie, zainstalowane w maszynie wirtualnej agenckie oprogramowanie do backupu, po uruchomieniu, może znacznie zmniejszyć wydajność systemu. Wynika to z faktu, że musi ono najpierw wykorzystać moc przetwarzania do analizy, które pliki lub bloki danych zostały zmienione i wymagają utworzenia nowej kopii, następnie skompresować te dane, by były gotowe do transmisji i przesłać je do repozytorium. Operacje te obciążają nie tylko procesor serwera, ale również pamięć masową i interfejsy sieciowe. Dodatkowo należy zauważyć, że w hoście może działać wiele maszyn VM i jednoczesne uruchomienie procesów backupu może spowodować przeciążenie systemu.

•Wirtualne dyski traktowane jak pojedyncze pliki

By uniknąć konfliktów w dostępie do zasobów, niektórzy administratorzy tak konfigurują program do backupu, by kopie zapasowe były zapisywane lokalnie w pamięci masowej hosta, w którym działa maszyna wirtualna. Rozwiązanie takie może się sprawdzać w wypadku metadanych (np. plików konfiguracyjnych), ale nie do tworzenia kopii każdego wirtualnego dysku.

Współczesne technologie wirtualizacyjne z reguły tworzą wirtualne dyski będące elementem większego, fizycznego zasobu pamięci. Dyski te mają formę plików o objętości dziesiątków gigabajtów.

To stwarza problem dla standardowych narzędzi do backupu. Jeśli nie mają one wiedzy, jak wygląda wewnętrzna struktura wirtualnego dysku, w przypadku jakiejkolwiek jego modyfikacji muszą tworzyć kopię całego takiego pliku. Jest to proces bardzo nieefektywny.

Oprócz tego, jeżeli kopia danych jest wykonywana bez zatrzymywania pracy maszyny wirtualnej, ich integralność może być naruszona, a stan wirtualnego dysku – niezgodny z zapisanymi metadanymi.

•Wykrywanie nowych maszyn wirtualnych

Często wykorzystywaną, ważną zaletą wirtualizacji jest możliwość szybkiego i łatwego tworzenia maszyn wirtualnych, w celu uruchomienia nowych aplikacji i usług. Jeśli jednak w systemie brakuje bezpośredniej integracji narzędzi do backupu z wirtualnym środowiskiem, administrator odpowiedzialny za bezpieczeństwo danych musi polegać na informacjach dostarczanych przez administratorów serwerów lub korzystać z narzędzi pozwalających na wykrywanie nowych maszyn wirtualnych. Jeśli bowiem w nowej maszynie nie zostanie zainstalowane oprogramowanie do backupu, to aplikacja i jej dane nie będą chronione.

•Migracja VM, aplikacji i danych

Klasyczne oprogramowanie do backupu przez lata było tworzone przy założeniu, że aplikacja działa na tym serwerze, na którym została zainstalowana. Ale w środowisku zwirtualizowanym maszyny wirtualne mogą być i często są przenoszone z jednego fizycznego hosta na drugi. Jeżeli program do backupu nie będzie w stanie automatycznie zlokalizować, gdzie dana maszyna wirtualna aktualnie się znajduje, proces tworzenia kopii zapasowej może zostać zaburzony.

•Problemy z odtwarzaniem pojedynczych plików

Kopię całego wirtualnego dysku można wykonać względnie szybko i łatwo. Ale jeśli oprogramowanie do backupu nie jest w stanie analizować jego struktury i traktuje go jak każdy inny plik, to wówczas nie jest możliwe odtwarzanie zapisanych na tym dysku pojedynczych plików, rekordów lub e-maili. A taka potrzeba występuje najczęściej. W rezultacie żądanie przywrócenia małego fragmentu zapisanych danych wymaga najpierw odtworzenia zawartości całego dysków, by dotrzeć do niezbędnego pliku.


TOP 200