Deduplikacja pomoże przy wirtualizacji

Schemat działania usługi polega na zachowywaniu referencji do kolejnych wystąpień pliku zamiast samego pliku. Technologię tę firma NetApp opracowała już kilka lat temu na użytek funkcjonalności kopii migawkowych (snapshotów). Rozwiązanie to pozwala pojedynczemu blokowi danych reprezentować wiele jego wystąpień, łącznie z identyfikacją pliku oryginalnego lub samej referencji - ściślej rzecz biorąc, taki znacznik dodawany jest do każdego bloku danych o 4 KB. Narzędzie deduplikacyjne czyta i porównuje metadane Data ONTAP; po znalezieniu identycznych sygnatur dwóch różnych bloków danych zostaje wykonany dokładny skan porównawczy i dopiero po jego pozytywnym wyniku nadmiarowe dane są zastępowane referencją.

Brzmi to nieco skomplikowanie, niemniej jest proste - skoro w systemie plików, tworzonym przez oprogramowanie, bloki są już "oznakowane", uruchomienie i działanie narzędzia jest prostym procesem. Sama deduplikacja nie ogranicza się już do archiwizacji - narzędzie pracuje także na aktywnych wolumenach z włączoną opcją znakowania plików (deduplication-enabled). Krok po kroku, cała operacja wygląda tak:

1) Wczytanie znaczników aktywnych bloków danych.

2) Porównanie znaczników. Wg NetApp, proces ten nie jest znaczącym obciążeniem dla systemu.

3) Po weryfikacji identyczności dwóch lub więcej znaczników następuje dokładne porównanie zawartości bloków. Ma to przeciwdziałać wynikom fałszywie pozytywnym i - w rezultacie - utracie danych.

4) Ustanowienie referencji w miejsce danych i oznaczenie nadmiarowych bloków jako puste.

Jak pomóc deduplikacji

Deduplikację w środowisku Hyper-V można wspomóc uruchamiając usługę zarządzania wolumenami LUN (za pomocą NetApp FlexVol) dla zasobów powiązanych ze środowiskiem Hyper-V. Warto też zwrócić uwagę na inne ustawienia konfiguracyjne, za których pomocą można usprawnić ten proces.

Ponieważ w jednym wolumenie może rezydować wiele maszyn wirtualnych, warto je grupować wg używanego systemu operacyjnego (ponieważ te części każdej maszyny są prawie identyczne, czyli podatne na proces deduplikacji).

Niekiedy proces ten można usprawnić przez odseparowanie danych systemów operacyjnych i aplikacji na osobnych dyskach wirtualnych, a następnie zgrupowanie ich (osobno systemów, osobno aplikacji) w odpowiednich wolumenach. Dla systemów zawierających wiele wirtualnych instancji systemów operacyjnych MS Windows, pomocne może być zgrupowanie plików stronicowania na osobnych dyskach wirtualnych, a te w osobnym wolumenie (z powodów jak wyżej) - z jednym zastrzeżeniem: na wolumenach zawierających pliki stronicowania Windows nie należy uruchamiać procesu deduplikacji.

Przed masowym wdrożeniem obejmującym wszystkie aplikacje należy koniecznie sprawdzić dokumentację produktu, gdyż nie wszystkie stosowane aplikacje nadają się do deduplikacji. Nie powinno się stosować deduplikacji w przypadku aplikacji, które wymagają sekwencyjnego zapisu i odczytu.


TOP 200