Przyszłość deduplikacji danych

Wśród technologii tworzonych wokół pamięci masowych i ochrony danych, jedna budzi szczególnie duże zainteresowanie, jak również wiele wątpliwości - deduplikacja.

Zainteresowanie jest zrozumiałe, ponieważ potencjalna wartość tej technologii, w kategorii zmniejszania zapotrzebowania na pamięć masową, jest porównywalna z korzyściami jakie przynosi wirtualizacja serwerów. Korzyści jakie wnosi ta technologia - lepsze usługi (np. odzyskiwanie danych oparte na dyskach) przy jednoczesnej redukcji kosztów - są niewątpliwie atrakcyjne.

Chociaż korzyści są oczywiste, to jednak droga do ich uzyskania niekoniecznie jest prosta. Nie jest łatwo podjąć decyzję o zastosowaniu konkretnej technologii, kiedy technologia ta przejawia się w tak wielu różnych formach. Deduplikacja, podobnie jak przedtem kompresja, może być zawarta w wielu różnych typach produktów. Chociaż nie jest to lista kompletna, główne opcje to: oprogramowanie składowania, urządzenia pamięci sieciowej (NAS) i wirtualne biblioteki taśmowe (VTL).

Te trzy rodzaje produktów są istotnie różne w sposobie implementacji deduplikacji i mają swoje własne zalety. Przy ocenie tych rozwiązań trzeba brać pod uwagę takie m.in. przeciwstawne cechy jak deduplikacja źródła lub w miejscu przemieszczenia, deduplikacja w czasie przetwarzania danych lub po przetworzeniu, zakres globalny czy lokalny itp.

Tak jak w każdym innym zestawie produktów, ta różnorodność odzwierciedla dążenie do optymalizacji pod kątem specyficznych celów projektowych czy rynkowych: wysoka wydajność, niski koszt, duże przedsiębiorstwo, mały lub średni biznes, itp. Do niedawna, jeden z aspektów deduplikacji był generalnie niekwestionowany - to jest skupienie się na danych wtórnych, zwłaszcza danych składowania. Jednak pojawiają coraz wyraźniejsze oznaki, że to powoli się zmienia.

Deduplikacja w teorii może być stosowana wszędzie, gdzie ma się do czynienia z znacznymi wolumenami danych, co wyjaśnia dlaczego tak pasuje do składowania danych. Jeżeli rozejrzeć za innymi takimi "skupiskami danych", to jednym z potencjalnych obszarów, który się nasuwa są zwirtualizowane środowiska serwerowe.

Niedawno NetApp zaproponowała deduplikację dla podstawowych (pierwotnych) pamięci masowych w tych środowiskach. Firma stale rozwija obsługę deduplikacji, początkowo oferując ja dla pamięci wtórnych (paltforma Nearstore), następnie dla pamięci pierwotnych serii FAS, a ostatnio dla bram NAS serii V, gdzie duplikacja może dotyczyć pamięci EMC, HDS, HP i innych.

Mogą, co prawda, pojawić się tu problemy wydajnościowe, ale ponieważ koszt pamięci pierwotnych i wtórnych często wyraża się stosunkiem 20:1, to pomysł zastosowanie tej technologii nawet do części środowiska pamięci pierwotnych jest kuszący.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200