Urządzenia do deduplikacji danych

Za trzy lata wolumen danych przechowywanych w pamięciach masowych przedsiębiorstw wzrośnie czterokrotnie. Gigabajty zamienią się w terabajty, a terabajty w petabajty. Jak poradzić sobie z takim przyrostem danych? Do efektywnego "upakowania" danych w pamięciach masowych warto skorzystać z systemów deduplikacji.

Sprawdzamy działanie czterech systemów do deduplikacji danych: FalconStor FDS 304, NetApp FAS2040, Spectra Logic nTier v80 i nTier vX.

Deduplikacja danych jest procesem obejmującym analizowanie bloków lub segmentów danych zapisywanych na nośnikach oraz wynajdywanie a następnie usuwanie powtarzających się wzorców, zastępując je dużo krótszymi odnośnikami. Dzięki tej technice można w znacznym stopniu zwiększyć efektywność wykorzystania nośników danych. Jest to szczególnie istotne, gdy trzeba zaplanować pamięć na potrzeby przechowywania kopii zapasowych plików i informacji na potrzeby odtwarzania serwerów po katastrofie, lub po prostu, gdy określa się zapotrzebowanie na pamięć masową na najbliższy rok. Sprawdziliśmy działanie mechanizmów deduplikacji w czterech urządzeniach pamięci masowej używających tej technologii: FalconStor FDS 304, NetApp FAS2040, Spectra Logic nTier v80 i nTietr vX. Wszystkie zapewniają dobrą skalowalność i wydajność, chociaż każde z nich ma specyficzne cechy.

FalconStor FDS 304 jest sieciową pamięcią masową (NAS) mieszczącą się w obudowie 2U. Wyposażona jest w dyski twarde SATA i interfejs sieciowy 10 Gigabit Ethernet. Wdrażana jest zazwyczaj jako cel backupów opartych na dyskach, ale może być także wykorzystywana jako podstawowa pamięć masowa.

NetApp FAS 2040, również w obudowie 2U, można wdrażać zarówno jako pamięć NAS (Network Attached Storage) jak i SAN (Storage Area Network). Ta druga może być oparta zarówno o IP, Fibre Channel, jak i o Fibre Channell over Ethernet. Może być także używana jako lokalizacja backupów i replikacji danych, jak również jako nośnik pamięci ogólnego użytku.

Dla przedsiębiorstw, które zainwestowały w fizyczne biblioteki taśmowe lub zamierzają wirtualizować swoje farmy taśm, dobrym wyborem może być seria Spectra Logic nTier. Jako urządzenie VTL (Virtual Tape Library), które wykorzystuje silnik deduplikacji danych firmy FalconStor, nTier może zastąpić system taśm fizycznych lub pracować równolegle z fizyczną biblioteką taśmową, deduplikując zachowywane dane.

Wszystkie testowane urządzenia okazały się łatwe we wdrożeniu i zarządzaniu oraz zapewniały efektywny, dający się wykorzystać w każdej sieci przedsiębiorstwa system deduplikacji danych. Opierając się na wynikach testów przeprowadzonych na wysoce redundantnych zbiorach plików Windows i dokumentach Office oraz ich backupach, można zakładać podobny poziom deduplikacji dla wszystkich danych. Należy jednak pamiętać, że jeżeli planuje się zastosowanie systemu deduplikacji do plików kopii zapasowych, jak również nieformatowanych plików, to trzeba się upewnić, czy silnik deduplikacji współpracuje z systemami tworzącym je.


TOP 200