Deduplikacja pomoże przy wirtualizacji

Wirtualne środowiska serwerowe umożliwiają konsolidację przepływu danych, co przekłada się na łatwiejsze zarządzanie nimi. Przy projektowaniu takich rozwiązań należy wziąć pod uwagę radykalny wzrost ilości danych, które będą składowane. Jedną z możliwości poradzenia sobie z tym jest deduplikacja, oferowana przez producentów nowoczesnych macierzy dyskowych.

Proces implementacji rozwiązań wirtualizacji pociąga za sobą konieczność wypracowania procedur zarządzania danymi oraz tworzenia i nadzoru nad aplikacjami, by jak najbardziej wyzyskać możliwości oferowane przez to środowisko. Właściwe zarządzanie ilością magazynowanych danych jest tu wartością krytyczną, gdyż wraz ze wzrostem ilości tworzonych i uruchamianych maszyn wirtualnych zapotrzebowanie na przestrzeń dyskową znacznie wzrasta, co pociąga za sobą większe koszty.

Na przykładzie danych pozyskanych z firm trzecich oraz od analityków i użytkowników macierzy NetApp i środowiska wirtualizacji Hyper-V, można ułożyć praktyczną listę rozwiązań stosowanych w celu ograniczenia ilości przechowywanych danych. NetApp oferuje następujące narzędzia: NetApp FlexVol - ułatwiające zarządzanie danymi, NetApp Snapshot - do wykonywania kopii migawkowych (lub małych, konkretnych archiwizacji) i NetApp deduplication - narzędzie deduplikujące.

Przy rozwiązywaniu problemów ze wzrostem zapotrzebowania na miejsce dyskowe, najważniejsze wydaje się to ostatnie narzędzie - wspierające wyszukiwanie i eliminację identycznych danych przechowywanych w różnych miejscach danego wolumenu. Fizycznie zapamiętywana jest jedna kopia, a o pozostałych wystąpieniach danego pliku informuje jedynie odpowiedni wpis w strukturach kontrolnych danych. Jest to skuteczne narzędzie, stosowane przez wielu producentów. Według firmy NetApp, funkcjonalność ta została zaimplementowana w 37000 jej systemów na całym świecie.

Skala problemu

Pewne pojęcie o skali problemu stojącego przed administratorami wirtualnych środowisk może dać chociażby informacja, że uruchomienie typowego, wirtualnego komputera PC zabiera 8-10 GB powierzchni dyskowej. Nie wydaje się to dużo, jeśli myślimy o małej lub średniej firmie, mającej w planie kilka, kilkanaście tego typu stanowisk. W miarę wzrostu skali projektu, gdy zakłada się uruchomienie kilkuset lub kilku tysięcy wirtualnych komputerów, ilość danych rośnie proporcjonalnie. Gdy ilość składowanych danych rośnie, przydają się narzędzia do deduplikacji - ponieważ każdy wirtualny komputer, który był tworzony według standardowych szablonów, składa się prawie w stu procentach z redundantnych danych. Są to identyczne systemy operacyjne, większość oprogramowania, drobne dane użytkowników, przy czym wszystko przechowywane osobno, w specjalnych plikach stanowiących odpowiednik dysku twardego dla maszyny wirtualnej.

Redukcja nadmiaru

Macierze firmy NetApp, od wersji systemu Data ONTAP 7.2.2, zawierają funkcjonalność deduplikacji. Opcja ta nazywa się Deduplication for FAS i jest dostępna bez dodatkowych opłat (niekiedy trzeba wprowadzić przy tym darmową licencję NetApp NearStore).