Strategie zabezpieczania danych

Osoby odpowiedzialne za składowanie danych na co dzień doświadczają problemów z wydajnością i niezawodnością systemów. Nowe techniki oferują zdecydowanie większe możliwości składowania, odtwarzania i ochrony danych. Rzecz w tym, by wiedzieć jak je efektywnie wykorzystać.

Pożytki z de duplikowania

W procesie typowego składowania duplikaty danych tworzone są na dwa sposoby: powtarzane są elementy składowania pełnego i powtarzane przyrosty tego samego pliku, kiedy zmienia się on wielokrotnie. System deduplikacji rozpoznaje obie sytuacje i eliminuje pliki nadmiarowe, redukując rozmiar pamięci dyskowej niezbędnej do przechowania składowania w stosunku od 10:1 do 50:1, a nawet więcej, w zależności od poziomu nadmiarowości w danych.

Deduplikacja danych stosowana jest w celu zmniejszenia fizycznej zajętości pamięci masowej wymaganej do przechowania składowanych danych. Popularną metodą deduplikacji jest dzielenie strumienia danych na segmenty i wykonywanie skrótów danych (fingerprint) tych segmentów. Nadmiarowe segmenty są identyfikowane przez porównywanie skrótów danych.

Strategie zabezpieczania danych

Schemat deduplikacji wykorzystującej skróty z segmentów danych

Deduplikacja danych może być wdrożona na poziomie źródła (serwera, gdzie dane są tworzone), albo na docelowej pamięci masowej. Zaletą deduplikacji na poziomie źródła jest to, że rozmiar składowanych danych jest optymalizowany przed wysłaniem ich w sieć, co istotnie zmniejsza ramy czasowe składowania. Konwencjonalna deduplikacja na poziomie źródła konsumuje jednak zasoby składowanego obiektu, co może wpływać na wydajność aplikacji, jeżeli składowanie realizowane jest on-line. Deduplikacja na poziomie miejsca składowania nie wpływa na zasoby w źródle, ale za to znacznie obciąża sieć. Jednak łącząc deduplikację danych ze składowaniem migawkowym, administrator może wykorzystać zalety deduplikacji bez wpływu na wydajność aplikacji produkcyjnych w czasie składowania.

Systemy deduplikujące na poziomie miejsca składowania, pozwalające na wysyłanie tradycyjnych składowań do pamięci masowej (gdzie następnie zostaną zdeduplikowane), są używane zazwyczaj w średnich i dużych centrach danych i realizowane z dużą szybkością. Systemy deduplikacji na poziomie źródła eliminują nadmiarowe dane na samym początku procesu i obsługują zazwyczaj składowanie oddziałów zamiejscowych i użytkowników mobilnych.

Składowanie ciągłe i migawkowe

CDP (Continuous Data Protection) jest opartą na dysku, coraz popularniejszą techniką składowania. Można ją traktować jako replikację z możliwością odtworzenia w dowolnym punkcie. Za każdym razem, kiedy zmienia się jakiś blok danych w składowym systemie, jest przemieszczany do systemu CDP. Jednak odmiennie niż replikacja, CDP zapamiętuje zmiany w logu, tak więc można odtworzyć te zmiany na bardzo szczegółowym poziomie. W rzeczywistości można odtworzyć system dokładnie w takim punkcie, w którym dane zostały przechowane w systemie CDP.


TOP 200