Strategie zabezpieczania danych
- Józef Muszyński,
- 15.03.2010
Osoby odpowiedzialne za składowanie danych na co dzień doświadczają problemów z wydajnością i niezawodnością systemów. Nowe techniki oferują zdecydowanie większe możliwości składowania, odtwarzania i ochrony danych. Rzecz w tym, by wiedzieć jak je efektywnie wykorzystać.
Pożytki z de duplikowania
W procesie typowego składowania duplikaty danych tworzone są na dwa sposoby: powtarzane są elementy składowania pełnego i powtarzane przyrosty tego samego pliku, kiedy zmienia się on wielokrotnie. System deduplikacji rozpoznaje obie sytuacje i eliminuje pliki nadmiarowe, redukując rozmiar pamięci dyskowej niezbędnej do przechowania składowania w stosunku od 10:1 do 50:1, a nawet więcej, w zależności od poziomu nadmiarowości w danych.
Deduplikacja danych stosowana jest w celu zmniejszenia fizycznej zajętości pamięci masowej wymaganej do przechowania składowanych danych. Popularną metodą deduplikacji jest dzielenie strumienia danych na segmenty i wykonywanie skrótów danych (fingerprint) tych segmentów. Nadmiarowe segmenty są identyfikowane przez porównywanie skrótów danych.
Schemat deduplikacji wykorzystującej skróty z segmentów danych
Systemy deduplikujące na poziomie miejsca składowania, pozwalające na wysyłanie tradycyjnych składowań do pamięci masowej (gdzie następnie zostaną zdeduplikowane), są używane zazwyczaj w średnich i dużych centrach danych i realizowane z dużą szybkością. Systemy deduplikacji na poziomie źródła eliminują nadmiarowe dane na samym początku procesu i obsługują zazwyczaj składowanie oddziałów zamiejscowych i użytkowników mobilnych.
Składowanie ciągłe i migawkowe
CDP (Continuous Data Protection) jest opartą na dysku, coraz popularniejszą techniką składowania. Można ją traktować jako replikację z możliwością odtworzenia w dowolnym punkcie. Za każdym razem, kiedy zmienia się jakiś blok danych w składowym systemie, jest przemieszczany do systemu CDP. Jednak odmiennie niż replikacja, CDP zapamiętuje zmiany w logu, tak więc można odtworzyć te zmiany na bardzo szczegółowym poziomie. W rzeczywistości można odtworzyć system dokładnie w takim punkcie, w którym dane zostały przechowane w systemie CDP.