Deduplikacja w ośmiu odsłonach

Quantum Disk Deduplication Backup Appliance

Urządzenie Quantum DXi4520 ma obudowę o wysokości 2U, mieszczącą 8 dysków o łącznej pojemności użytkowej 4,4 TB. Rozwiązanie ma wbudowane 4 gigabitowe porty ethernetowe i jest uniwersalne pod względem dostępnych zastosowań.

Deduplikacja w ośmiu odsłonach
Pozwala tworzyć kopie zapasowe maszyn wirtualnych, umożliwia replikację danych, może działać jako NAS (Network Attached Storage), wspiera protokół udostępniania OpenStorage i oferuje kilka przydatnych narzędzi do raportowania oraz monitorowania stanu pracy.

Na uwagę zasługuje fakt wbudowania opcji replikacji danych, co nie jest standardową możliwością w podobnych rozwiązaniach (nadal potrzebne jest jednak drugie urządzenie, na którym dane będą powielane).

Cena Quantum DXi4520, wynosząca 22 500 USD (wersja otrzymana do testów), jest wyższa niż podobnych rozwiązań firm Barracuda czy FalconStor, ale trzeba pamiętać, że DXi4520 pozwala replikować dane, ma cztery gigabitowe porty ethernetowe, może działać jako samodzielna pamięć masowa podłączona do sieci (NAS) i dysponuje zaawansowanymi możliwościami raportowania procesów przetwarzania danych.

NetApp FAS 2040 System

NetApp FAS 2040 System nie jest typowym narzędziem do sporządzania backupu czy przeprowadzania deduplikacji, przypomina bardziej uniwersalne rozwiązanie typu NAS. Pozwala tworzyć kopie migawkowe wolumenów, wspiera mechanizmy thin provisioningu, umożliwia replikację danych, może pracować w wielopoziomowym systemie RAID. Testowany egzemplarz - umieszczony w obudowie o wysokości 3U - wyposażono w 12 szybkich dysków SAS (300 GB każdy).

Deduplikacja w ośmiu odsłonach
Macierz NetApp przeprowadza deduplikację "online" (primary storage), co jest zupełnie innym procesem niż uruchamianie jej po zakończeniu backupu. Z tego powodu procedura testowa musiała ulec modyfikacji. FAS 2040 System okazał się jednak wydajnym rozwiązaniem, w niczym nieustępującym urządzeniom dokonującym deduplikacji na istniejącej już kopii zapasowej.

Pierwszy skopiowany wolumen (589 GB) po deduplikacji zajął 566 GB. Drugi zestaw danych - ze zmienionymi 32 GB - zmieścił się w 604 GB. Trzecia kopia (z tymi samymi danymi) zwiększyła sumaryczną wielkość tylko o 1 GB (do 605 GB). Oznacza to, że pomimo trzykrotnego kopiowania wolumenów o pojemności 589 GB, NetApp FAS 2040 System zużył jedynie 605 GB do stworzenia kopii zapasowej.

Testowana macierz o wewnętrznej pojemności 3,6 TB kosztuje 25 000 USD. Za tę cenę użytkownik otrzymuje uniwersalne narzędzie, mogące pracować jako NAS, dysponujące wysoką wydajnością i szybkością deduplikacji.

Procedura testowa i wnioski

Aby sprawdzić działanie narzędzi wspierających deduplikację, przygotowano specjalne środowisko testowe. Serwer oparty na MS Windows 2008R2 połączono (Fibre Channel) z systemem Storage Center S30 SAN (Compellent, obecnie Dell), zawierającym dwa wolumeny danych, będących kopiami migawkowymi serwera produkcyjnego. Snapshoty wykonano w odstępie 4 miesięcy. Na serwerze zainstalowano aplikację Netbackup 7.0.

Każde z testowanych rozwiązań - po zainstalowaniu i skonfigurowaniu - zostało podłączone do serwera poprzez protokół udostępniania CIFS (Common Internet File System), OST (OpenStorage) lub interfejs iSCSI. W ten sposób utworzono kopię zapasową pierwszego wolumenu. W niektórych przypadkach konieczne było manualne uruchomienie procesu deduplikacji po zakończonym backupie, jednak wynikające z tego straty czasu nie były znaczące. W podsumowaniu za całkowity backup uznano utworzenie kopii zapasowej i zakończenie procesu deduplikacji.

Cztery z testowanych rozwiązań, które korzystały z łączy ethernetowych, ukończyły proces tworzenia kopii zapasowej w niemal identycznym czasie, co wskazywało, że obciążenie łącza było za każdym razem maksymalne. Obliczanie miejsca zajętego przez backup polegało na obserwacji wolnej pamięci, która zostawała po zakończeniu procesu (np. jeśli urządzenie miało 10 TB pamięci użytkowej, a po backupie zostawało 9,438 TB, to uznawano, że kopia zapasowa zajęła 562 GB).

Zauważono, że ilość pamięci zajmowanej przez pierwszą kopię zapasową była tylko nieznacznie mniejsza od faktycznego miejsca zajmowanego przez dane wolumenu. Było to wynikiem istnienia niewielu zduplikowanych danych. Dopiero drugi backup przyniósł oczekiwane rezultaty.

Łączna pamięć użyta przez dwie kopie zapasowe była tylko o ok. 1 GB większa niż całego pierwszego backupu. Druga kopia zapasowa była wynikiem sprawnego działania deduplikacji - 1 GB pamięci zajmowały wskaźniki do danych z pierwszego backupu. Trzeci backup odnosił się do drugiego wolumenu, na którym zmieniono, usunięto lub dodano 32 GB danych (4552 pliki). Był on jednak na tyle efektywny, że dodatkowo przestrzeń potrzebna na skopiowanie danych była mniejsza niż owe 32 GB.

W przypadku rozwiązań dokonujących deduplikacji online (NetApp FAS 2040 System i Xiotech File Storage Controller), bez backupu danych, zmieniono nieco procedurę testową. Początkowo zastosowano analogiczną metodę - dwukrotnie przekopiowano ten sam wolumen danych. Następnie dodano 12 plików .vmdk (każdy po 32 GB), zawierających głównie te same dane, ale istniejących pod różnymi nazwami i datami utworzenia. Ostatnim etapem testów było przesłanie 20 folderów (katalogów) różnych użytkowników, które wypełnione były w większości tymi samymi plikami (każdy katalog zajmował 560 MB).


TOP 200