Cechy dobrego systemu archiwizacji danych (Część I)

Czy warto się ubezpieczać? Gdyby instytucja ubezpieczenia była niepotrzebna zapewne firmy ubezpieczeniowe zbankrutowałyby już dawno. Tymczasem rozwijają się, oferując coraz to nowsze formy ubezpieczeń. Kopie zapasowe są taką formą ubezpieczenia: dopóki wszystko idzie dobrze - są zbędne, ale w momencie awarii - warte są znacznie więcej niż koszty ich stworzenia.

Czy warto się ubezpieczać? Gdyby instytucja ubezpieczenia była niepotrzebna zapewne firmy ubezpieczeniowe

zbankrutowałyby już dawno. Tymczasem rozwijają się, oferując coraz to nowsze formy ubezpieczeń. Kopie zapasowe są taką formą ubezpieczenia: dopóki wszystko idzie dobrze - są zbędne, ale w momencie awarii - warte są znacznie więcej niż koszty ich stworzenia.

Czasami administratorzy zastanawiają się czy opłaca się robić kopie zapasowe wtedy, gdy mają dyski lustrzane (mirroring lub duplexing), matrycę dyskową (np. klasy RAID 5 z redundancją zapisu danych, co chroni przed ich utratą w przypadku awarii jednego dysku w matrycy) lub nawet lustrzane kopie serwerów (jak w przypadku SFT III Novella).

Po co, w sytuacji, gdy na drugim dysku znajdują się duplikaty wszystkich plików, robić jeszcze kopię zapasową? Czyżby tylko po to, żeby ustrzec się przed niezwykle nieprawdopodobnym przypadkiem uszkodzenia dwóch dysków jednocześnie? Niekoniecznie, chociaż oczywiście przypadki mało prawdopodobne nie są wykluczone (np. zdarza się, że ludzie trafiają 6 liczb z 49 w totolotka). Jednakże prawdziwy powód, dla którego należy pamiętać o kopii zapasowej, również w sytuacji pełnej ochrony (w praktyce pełnej ochrony nie da się wprowadzić) danych przed niedoskonałością urządzeń, jest inny - błędy popełniane przez ludzi, a więc użytkowników, administratorów i programistów.

Errare humanum est

O ile można by polemizować ze stwierdzeniem, że administrator musi się troszczyć o dane użytkowników i utrzymywać, że użytkownik sam jest sobie winien, gdy niszczy swoje pliki, to w przypadku błędów administratora sytuacja może być tragiczna.

Jednak, zawsze można powiedzieć, że zatrudniamy administratora, który nie robi błędów. Rzeczywiście, powiedzieć tak można, trudniej stwierdzić czy ten człowiek rzeczywiście nigdy nie robi błędów.

Nawet gdy mamy system zabezpieczający nas (w rozsądnych granicach) przed awarią sprzętu, zatrudniamy wyłącznie wysoko kwalifikowany personel, mamy administratorów, którzy nigdy się nie mylą to i tak potrzebujemy kopii zapasowej.

Zawsze pozostaje bowiem ostatni element: błędy programistów, co oznacza dla nas błędy w oprogramowaniu, które mogą zniszczyć nasze cenne dane. Nie ma takiej firmy zajmującej się produkcją oprogramowania, która śmiałaby twierdzić, że w jej oprogramowaniu nie ma błędów (wystarczy przeczytać warunki licencji/gwarancji na dowolne oprogramowanie). Tak więc może się zdarzyć, że dane zniszczy oprogramowanie systemu operacyjnego, w którym pracujemy lub inny program wykorzystywany w naszej firmie.

W tym wypadku nie mamy możliwości ustrzeżenia się przed jego błędami. Jeśli ktoś w tym momencie stwierdzi, że może przecież sam napisać potrzebne mu oprogramowanie (a on sam błędów nie robi) to można mu tylko pogratulować i zachęcić do wzięcia się do pracy od razu (trzeba przecież zacząć od systemu operacyjnego, a nie zawadziłoby też pomyśleć o napisaniu własnych BIOS-ów do różnych urządzeń - tam też mogą być błędy). Wszyscy pozostali czytelnicy powinni przyjąć tezę, że kopie zapasowe są potrzebne zawsze, niezależnie od poziomu zabezpieczeń przed awarią i niezależnie od kwalifikacji pracowników.

Identyczność kopii i oryginału

Oczywiście nigdy nie mamy stuprocentowej pewności, że wykonana kopia zapasowa jest identyczna z oryginalnymi danymi. W przeciwnym wypadku oznaczałoby to, że nasze dane się nie zmieniają, czyli że system jest "martwy".

Jednakże pod hasłem "identyczności" mam na myśli takie cechy oprogramowania, które pozwalają sterować oprogramowaniem w taki sposób, aby pliki otwarte w trakcie archiwizacji system próbował kopiować wielokrotnie (a nuż, w którymś momencie będą dostępne) w ustalonych odstępach czasu, przez określony czas lub ustaloną liczbę powtórzeń.

Po drugie, po zakończeniu operacji system powinien sprawdzić czy wszystko, co zostało zapisane w postaci kopii zapasowej, daje się odczytać oraz czy wartości odczytane z kopii zapasowej są identyczne z oryginalnymi.

Tutaj napotykamy na problem częściowo niezależny od oprogramowania, a mianowicie: trwałość danych na różnych nośnikach. Jeśli producent taśm magnetycznych twierdzi, że dane na nich zapisane można przechowywać przez rok, a potem należy je odczytać i ponownie zapisać, to żadne oprogramowanie, nie zwiększy trwałości taśmy. Natomiast oczekuję, że w przypadkach, gdy potrzebuję dane przechowywać latami, będę mógł użyć innego niż taśma magnetyczna nośnika (np. dysków magnetooptycznych, których gwarancja jest najczęściej dożywotnia) i system archiwizujący potrafi również na nim wykonać kopię zapasową.

Za tydzień napiszemy w jaki sposób należy przygotowywać archiwizację i tworzyć kalendarium wykonywania archwizacji.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200