Strategia archwizowania danych (cz.II)

W ubiegłym tygodniu wyjaśniliśmy dlaczego warto robić zapasowe kopie danych oraz jakie wymogi powinien spełniać system archiwizacji danych. Disiaj przedstawiamy metodologię przygotowywania kalendarza archwizacji.

W ubiegłym tygodniu wyjaśniliśmy dlaczego warto robić zapasowe kopie danych oraz jakie wymogi powinien spełniać system archiwizacji danych. Disiaj przedstawiamy metodologię przygotowywania kalendarza archwizacji.

Wbrew pozorom wykonywanie zawsze pełnej archiwizacji (kopie wszystkich plików naszego systemu) nie jest rozwiązaniem najrozsądniejszym. Pełna archiwizacja wymaga więcej czasu, więcej miejsca na nośniku oraz zużywa urządzenie wykonujące kopie zapasowe w większym stopniu niż inne rodzaje archiwizacji (np. różnicowa lub przyrostowa). Ponadto, czas potrzebny do odtworzenia wybranych elementów może być dłuższy, w przypadku korzystania z nośnika, na którym znajdują się wszystkie dane, niż wtedy, gdy jest ich tam tylko część.

Należy też zwrócić uwagę, że wykonywanie kopii zapasowej na jednym egzemplarzu nośnika jest w praktyce pozorowaniem wykonywania kopii zapasowej. Dlaczego? Przede wszystkim dlatego, że po zapisaniu całego nośnika urządzenie archwizujące zacznie zapisywać go od początku.

Jeśli był to jedyny egzemplarz nośnika (jedyna taśma), to w momencie rozpoczęcia kolejnej archiwizacji od początku nośnika nie mamy wcale kopii zapasowej.

A jeśli podczas archwizacji nastąpi awaria? W przypadku gdy mamy kilka egzemplarzy nośnika, tego niebezpieczeństwa nie ma, ale istnieje inne. Chodzi tu o okres jaki obejmują kopie zapasowe. Jeśli mamy niewiele nośników i w dodatku wykonujemy pełną archiwizację, to najstarsza kopia zapasowa będzie stosunkowo nowa. A co zrobimy, gdy okaże się, że potrzebna jest nam wersja dokumentu sprzed miesiąca, dwóch lub skasowany przez przypadek (lub świadomie) trzy miesiące temu plik?

W oprogramowaniu NetWare 4.1 firmy Novell istnieje możliwość kompresji nie używanych przez pewien czas (standardowo, przez tydzień) plików na wolumenach serwera. Praktyka wskazuje, że użyteczność tej opcji jest ogromna (zyski kilkudziesięciu procent przestrzeni dyskowej). Oznacza to, że na dyskach przechowywana jest masa plików nie używanych przez całe tygodnie. Bardzo łatwo takie pliki usunąć i skutków tego nie zauważyć przez miesiące.

Kalendarz archwizacji

A wirusy? Co będzie, gdy okaże się, że mamy w swoim systemie wirusa, który zaatakował nas pół roku temu. Po pół roku prawie wszystkie elementy naszego środowiska są już zarażone. Jedyne wyjścia to, albo zainstalowanie i skonfigurowanie wszystkiego od nowa, albo (i po to właśnie wykonujemy archiwizację) odtworzenie danych z kopii zapasowej. Ale wymaga to posiadania kopii zapasowej sprzed pół roku. Warto więc stosować strategię mieszanych archiwizacji pełnych i przyrostowych (tylko to co się zmieniło od ostatniej archiwizacji) lub różnicowych (to co się zmieniło od ostatniej pełnej archiwizacji). Oszczędza to czas, urządzenie i nośnik, a przez to daje możliwość przechowywania danych z odleglejszych okresów niż wtedy, gdy wykonujemy wyłącznie archiwizacje pełne. Złotym środkiem wydaje się być strategia zakładająca, że mamy 21 egzemplarzy nośnika:

- 1 egzemplarz roczny - archiwizacja pełna, - 12 egzemplarzy (12 miesięcy w roku) - archiwizacje pełne, - 4 egzemplarze (4 tygodnie w miesiącu) - archiwizacje pełne, - 4 egzemplarze (4 dni w tygodniu, w piątym dniu używamy nośnika tygodniowego) - archiwizacje różnicowe lub przyrostowe.

Na początek wystarczy np. 8 taśm, a potem można co miesiąc dokupić kolejną. Można wtedy mieć pewność odtworzenia danych z dowolnego okresu działalności. Dane najdawniejsze mogą być odtworzone z dokładnością do miesiąca (taśma miesięczna), ale lepsze to niż nic.

Wymarzony system archwizujący

Przy dużej liczbie taśm i pracy z różnymi rodzajami kopii zapasowych istotna staje się się możliwość jednorazowego zaprojektowania schematu archiwizacji i zlecenie oprogramowaniu pamiętania o tym na przyszłość. Jedyna czynność, która powinna należeć (po takim zaprojektowaniu) do osoby obsługującej oprogramowanie, to zmiana taśmy na taką jakiej żąda system w danym dniu. W przypadku posiadania urządzenia o nazwie Autoloader, obsługującego wiele taśm lub Jukebox, obsługującego wiele dysków magnetooptycznych nie powinniśmy nawet pamiętać o konieczności zmieniania taśm i czyszczenia urządzenia (system sam powinien używać taśmy czyszczącej w zaleconych mu okresach). System powinien też umożliwiać wykonywanie kopii zapasowych w określonych godzinach, np. w okresach najmniej intensywnej pracy.

Inwentaryzacja kopii zapasowych

W sytuacji, gdy liczba kopii zapasowych staje się duża, konieczna jest dobra inwentaryzacja tego co i kiedy zostało skopiowane. Dobry system powinien uwolnić administratora od konieczności robienia tego "ręcznie". Wszystkie wykonane kopie zapasowe powinny być automatycznie przez system rejestrowane dając możliwość znalezienia każdego zarchiwizowanego pliku.

W momencie usunięcia danych z nośnika poprzez narzędzia systemu (np. zapisanie na danym nośniku nowych danych), powinien on dokonać odpowiednich poprawek w swojej bazie. W sytuacji, gdy mamy bazę danych wszystkich naszych kopii zapasowych można od niej oczekiwać wskazania nośników, które mogą być użyte do odtworzenia np. stanu danych na serwerze z 12 marca 1995 r. (13 marca zaatakował wirus), a na stacjach roboczych DOS stanu z dnia 2 stycznia 1995 r. (pierwszy stwierdzony przypadek zarażenia przez wirus stacji roboczej).

Kopie zapasowe to nie wszystko

Kopie zapasowe są tylko jednym z elementów koniecznych (zwykle nie wystarczającym) do pełnego odtworzenia systemu po awarii. Jeśli uszkodzeniu ulega dysk, na którym zainstalowane było oprogramowanie do archiwizacji, to musimy je zainstalować od nowa. Może się okazać, że oprogramowanie zostało kupione kilka lat temu i nie wiadomo gdzie są dyskietki instalacyjne, ani jak TO się instaluje (nie jest to wcale taki rzadki przypadek).

Czy taki system istnieje?

Dla środowiska Novell NetWare i DOS: tak. Są systemy spełniające w dużej mierze wymienione wyżej oczekiwania. Czy spełniają one oczekiwania wszystkich? To zależy od środowiska pracy. W każdym razie warto poszukiwać i wymagać od producentów żeby takich narzędzi produkowali jak najwięcej.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200