Przyszłość deduplikacji danych
- Józef Muszyński,
- IDG News Service,
- 08.08.2008, godz. 13:33
Wśród technologii tworzonych wokół pamięci masowych i ochrony danych, jedna budzi szczególnie duże zainteresowanie, jak również wiele wątpliwości - deduplikacja.
Zainteresowanie jest zrozumiałe, ponieważ potencjalna wartość tej technologii, w kategorii zmniejszania zapotrzebowania na pamięć masową, jest porównywalna z korzyściami jakie przynosi wirtualizacja serwerów. Korzyści jakie wnosi ta technologia - lepsze usługi (np. odzyskiwanie danych oparte na dyskach) przy jednoczesnej redukcji kosztów - są niewątpliwie atrakcyjne.
Chociaż korzyści są oczywiste, to jednak droga do ich uzyskania niekoniecznie jest prosta. Nie jest łatwo podjąć decyzję o zastosowaniu konkretnej technologii, kiedy technologia ta przejawia się w tak wielu różnych formach. Deduplikacja, podobnie jak przedtem kompresja, może być zawarta w wielu różnych typach produktów. Chociaż nie jest to lista kompletna, główne opcje to: oprogramowanie składowania, urządzenia pamięci sieciowej (NAS) i wirtualne biblioteki taśmowe (VTL).
Te trzy rodzaje produktów są istotnie różne w sposobie implementacji deduplikacji i mają swoje własne zalety. Przy ocenie tych rozwiązań trzeba brać pod uwagę takie m.in. przeciwstawne cechy jak deduplikacja źródła lub w miejscu przemieszczenia, deduplikacja w czasie przetwarzania danych lub po przetworzeniu, zakres globalny czy lokalny itp.
Tak jak w każdym innym zestawie produktów, ta różnorodność odzwierciedla dążenie do optymalizacji pod kątem specyficznych celów projektowych czy rynkowych: wysoka wydajność, niski koszt, duże przedsiębiorstwo, mały lub średni biznes, itp. Do niedawna, jeden z aspektów deduplikacji był generalnie niekwestionowany - to jest skupienie się na danych wtórnych, zwłaszcza danych składowania. Jednak pojawiają coraz wyraźniejsze oznaki, że to powoli się zmienia.
Deduplikacja w teorii może być stosowana wszędzie, gdzie ma się do czynienia z znacznymi wolumenami danych, co wyjaśnia dlaczego tak pasuje do składowania danych. Jeżeli rozejrzeć za innymi takimi "skupiskami danych", to jednym z potencjalnych obszarów, który się nasuwa są zwirtualizowane środowiska serwerowe.
Niedawno NetApp zaproponowała deduplikację dla podstawowych (pierwotnych) pamięci masowych w tych środowiskach. Firma stale rozwija obsługę deduplikacji, początkowo oferując ja dla pamięci wtórnych (paltforma Nearstore), następnie dla pamięci pierwotnych serii FAS, a ostatnio dla bram NAS serii V, gdzie duplikacja może dotyczyć pamięci EMC, HDS, HP i innych.
Mogą, co prawda, pojawić się tu problemy wydajnościowe, ale ponieważ koszt pamięci pierwotnych i wtórnych często wyraża się stosunkiem 20:1, to pomysł zastosowanie tej technologii nawet do części środowiska pamięci pierwotnych jest kuszący.