Dane cenniejsze niż złoto

Inną metodą składowania maszyn wirtualnych jest użycie skonsolidowanej technologii składowania. W składowaniu skonsolidowanym proces składowania jest przeniesiony z maszyny wirtualnej i fizycznego serwera na oddzielny serwer składowania (serwer proxy), co zapobiega problemom wydajnościowym.

Wykonywanie fotografii i klonowanie obrazów maszyny wirtualnej ma wiele zalet. Jedną z nich jest to, że są to rozwiązania zazwyczaj dobrze znane administratorom, ponieważ od wielu lat stosuje się je do składowania maszyn fizycznych. Technologie takie są również zawarte w wielu pakietach wirtualizacji, takich jak VMware czy XenSource, a także w wielu tradycyjnych narzędziach składowania.

Obniżanie kosztów składowania

Dane cenniejsze niż złoto

Deduplikacja danych

Jedną z metod obniżania kosztów składowania jest deduplikacja danych w bibliotekach dyskowych lub wirtualnych bibliotekach taśmowych (VTL - Virtual Tape Library). Możliwość deduplikacji danych - to jest składowania lub kopiowania jedynie unikatowych bloków danych - dość istotnie zmienia ekonomikę ochrony danych.

W przedsiębiorstwach generuje się nie tylko coraz więcej nowych danych, ale także wielokrotne kopie danych, wymagane przez różne regulacje prawne dotyczące przechowywania danych w ich cyklu życia.

Technologia deduplikacji danych może pomóc w efektywnej kontroli przyrostu danych, poprzez jednokrotne składowanie i przechowywanie poszczególnych obiektów danych.

Oprogramowanie deduplikacji przechowuje podstawowe zestawy danych i następnie sprawdza kolejne składowania pod kątem duplikatów już zeskładowanych danych. Po znalezieniu takiego duplikatu, przechowywana jest tylko niewielka jego reprezentacja, która pozwala na odtworzenie całego pliku, jeżeli zajdzie taka potrzeba.

Istnieją dwie podstawowe metody deduplikacji danych: oparta na binarnym skrócie danych i oparta na porównywaniu na poziomie bajtów - bajt do bajta. Metoda wykorzystująca skróty przepuszcza wpływające dane przez tzw. algorytm haszujący, który tworzy unikatowy skrót (identyfikator) tych danych. Taki skrót jest porównywany z listą wcześniej zapisanych skrótów w odpowiedniej tablicy wyszukiwań. Jeżeli skrót zostanie odnaleziony w tablicy, dane są zastępowane przez odniesienie do istniejącego już skrótu. Jeśli nie ma takiego skrótu, jest on dopisywany do tablicy. Jednak przeszukiwanie takiej tablicy może mieć istotny wpływ na wydajność.

Bardziej efektywną metodą jest proste porównywanie elementów obiektów tej samej klasy, np. porównywanie dokumentów Word. Efektywną technologią jest też wstępna analiza składowanych plików identyfikująca pliki, które są prawdopodobnie nadmiarowe, przed bardziej szczegółowym porównaniem dwóch plików.

Deduplikacja na poziomie bajtów pozwala na osiąganie stopnia redukcji danych 25:1. W połączeniu z technologią kompresji można uzyskać nawet pięćdziesięciokrotne zmniejszenie wolumenu składowanych danych. Taki stopień redukcji danych pozwala już na zastosowanie w większym stopniu składowania online i dłuższe ich przechowywanie.

Inne korzyści z deduplikacji danych to także możliwość wydłużenia czasu przechowywania danych online. Redukcja wolumenu składowanych danych w stosunku 50:1 dla typowej mieszanki danych biznesowych (poczty elektronicznej i plików) oznacza, że dane mogą być przechowywane online w dłuższym okresie w celu spełnienia coraz większych wymagań dotyczących ochrony danych i jej dostępności.

Deduplikacja może być wykonywana w czasie składowania danych - inline - ale spowalnia ona składowanie i wprowadza dodatkową złożoność do tego procesu. Inne technologie wykonują deduplikację pozapasmowo - najpierw dane składowane z pełną szybkością łącza, a potem wykonywana jest deduplikacja.

Deduplikacja danych zmienia ekonomikę ochrony danych, znacząco obniżając koszty składowania. Jest istotnym elementem obniżania spiralnie rosnących kosztów energii, roboczogodzin, przestrzeni fizycznej oraz zarządzania ciągłym niedostatkiem zasilania i chłodzenia, związanych z utrzymywaniem danych. Według badań Gartnera, w roku bieżącym 50% obecnych centrów danych będzie odczuwać niedostatek mocy zasilania i zdolności chłodzenia, związany z ciągle zagęszczającą się powierzchnią wypełnioną nowym sprzętem.


TOP 200