Urządzenia do deduplikacji danych
- Józef Muszyński,
-
- Keith Schulz,
- 13.01.2011
W ramach testów przeprowadzano kopiowanie plików do obszarów udostępnionych w urządzeniu NetApp, a także używano urządzenia jako lokalizacji składowania dla różnych zadań Backup Exec. Deduplikacja plików i folderów w wykonaniu NetApp charakteryzuje się dobrym wykrywaniem i eliminacją zduplikowanych lub częściowo zduplikowanych danych. Podobnie jak w urządzeniach FalconStor i Spectra Logic, redukcja danych wysoce zduplikowanych plików łatwo osiągała 90%. Aczkolwiek urządzenie NetApp miało pewne problemy z plikami utworzonymi przez Backup Exec.
W czasie testów wykonano kopie zapasowe serwerów na wolumin udostępniony za pomocą CIFS. Niezależnie od tego, jak i kiedy silnik deduplikacji analizował składowane pliki, to nigdy nie udało się osiągnąć więcej niż 8% redukcji wolumenu danych. Wiadomości pocztowe Exchange składowały się trochę lepiej, osiągając redukcję 12%.
Firma NetApp za prawdopodobną przyczynę tak słabych wyników uznała fakt, że silnik działa na blokach o rozmiarze 4 KB. Seria produktów Backup Exec dokłada metadane do składowanych plików, zakłócając ustawienia 4 KB i utrudniając zlokalizowanie zduplikowanych segmentów. Symantec wprowadził zmiany w Enterprise Vault 8.0 na zgodność bloków dla silnika NetApp, tak więc nie wszystkie produkty Symantec mają tę wadę. Backup z użyciem oprogramowania innych dostawców (ComVault, VMware) utrzymuje granice bloków w ryzach 4 KB.
Administrator może definiować politykę deduplikacji w odniesieniu do woluminu. Ustawienia silnika deduplikacji nie zapewniają oszałamiającej liczby opcji, ale pozwalają na definiowanie polityki uruchamiającej deduplikacje ręcznie, na żądanie, lub automatycznie, kiedy pojawia się określona ilość danych w wolumenie, a także w ustalonych przedziałach czasowych lub dniach tygodnia.
NetApp System Manager: definiowanie polityki deduplikacji dla każdego udostępnionego obszaru dysku w urządzeniu.
Tak jak w rozwiązaniach FalconStor i Spectra Logic, brak jest rozbudowanego silnika raportów. Dostępne są jednak użyteczne wykresy i istotne dane, takie jak detale wolumenu i zaoszczędzona pamięć. Informacje zapewniane przez System Manager są odpowiednie i użyteczne, bez zasypywania nadmiarem danych.
FAS2040 charakteryzuje się odpowiednią liczbą opcji i możliwością dobrego zarządzania. Urządzenie łatwo integruje się z siecią i jest proste w użyciu. Deduplikacja jest łatwa w zarządzaniu, a typowe pliki i foldery są deduplikowane efektywnie. Rozczarowują słabe wyniki deduplikacji zbiorów danych zapisywanych przez Backup Exec, co jest poważną wadą, ponieważ wybrany do wdrożenia system deduplikacji powinien współpracować z używanym oprogramowaniem do backupów.