Bezpieczne dane według potrzeb

Mamy wówczas dwie możliwe sytuacje:

1. Streamer zapisuje pojedyncze strumienie, a zatem:

a. Wydłuża się okno backupowe (zabezpieczana maszyna zapisująca 10MB/s skutecznie zablokuje streamer na wiele godzin)

b. Streamer / taśma ulegają szybkiemu zniszczeniu (częste starty i zatrzymywania silnika)

2. Łączymy wiele strumieni naraz, starając się wysycić streamer (multiplexing), co z kolei:

a. Wymaga oprogramowania najwyższej klasy

b. Jest pracochłonne (dogłębna analiza środowiska)

c. Jest nietrwałe (małe zmiany w środowisku powodują ponowny brak wysycenia streamera)

d. Odtwarzanie jest bardzo wolne (nawet tylko kilka MB/s).

Zapis na dyski, na dwa sposoby

Aby usprawnić wykonywanie kopii bezpieczeństwa, można wykorzystać pulę dyskową, udostępnioną z typowej macierzy dowolnego producenta. Problem polega jednak na tym, że urządzenie, które umożliwi składowanie tak dużej ilości danych przy oczekiwanej wydajności zapisu, a następnie zapisanie na taśmę, wysycając przy tym streamer, musiałoby być wyposażone w wiele napędów dyskowych, a to wiąże się z bardzo wysokimi kosztami. Wydajność takiej macierzy musiałaby być zbliżona do tej, na której zazwyczaj pracuje produkcyjne środowisko - a jest to znaczny wydatek.

Metodą, która radykalnie zmniejsza ilość danych zapisywanych na nośnikach backupowych, jest deduplikacja. Jeśli operacja deduplikacji jest przeprowadzana "w locie", podczas zapisywania strumienia na nośnik, wykorzystanie dysków jest bardzo niskie, gdyż większość pracy wykonuje procesor urządzenia (gdy deduplikacja jest przeprowadzana na źródle, część z tych obliczeń realizuje procesor maszyny źródłowej). W odróżnieniu od streamerów, deduplikowany nośnik może przyjąć jednocześnie nawet 20-100 strumieni o różnej przepustowości, zależnie od tego, ile potrafią dostarczyć serwery. Deduplikowane medium dyskowe, niezależnie od miejsca przeprowadzanej redukcji ilości danych, posiada zalety właściwe dla dysków (elastyczność) oraz taśm (prędkość pracy przy pojedynczym strumieniu)

Jak deduplikacja usprawnia backup

Deduplikacja w pierwszej kolejności zmniejsza pulę zasobów niezbędną do przechowania informacji. Dla 2 TB danych zazwyczaj potrzeba 1 TB mediów deduplikacyjnych, przy czym w ten sposób przechowuje się nie jedną kopię, ale 20-30 ostatnich backupów. Tak wysoki współczynnik redukcji rozmiaru wynika stąd, że przedsiębiorstwa rzadko charakteryzują się dużą zmiennością przechowywanej informacji. W porównaniu do 60 TB niezbędnych do przechowania danych w postaci surowej (każda kopia realizowana jako pełna), efektywność kosztowa jest bardzo wysoka. Za tym idzie zazwyczaj także bardzo dobra wydajność. Przykładowe urządzenie klasy entry level wyposażone w 11 typowych dysków serwerowych pracujących w macierzy RAID-6, przy zastosowaniu deduplikacji na źródle połączonym przez gigabitowy LAN, osiąga wydajność rzędu 850 MB/s. Jest to urządzenie, które razem z potrzebnym oprogramowaniem kosztuje kilkanaście tysięcy euro, wliczając w to także narzędzia niezbędne do realizacji kopii bezpieczeństwa baz danych oraz systemów w środowisku wirtualizowanym.

Backup do zadań specjalnych

Jednym z zastosowań wymagających szczególnego podejścia, jest kopia bezpieczeństwa zasobów zajmujących wielkie ilości drobnych plików (rzędu 10 mln). Z takimi zasobami większość oprogramowania nie radzi sobie w ogóle lub czas wykonania kopii sięga powyżej doby. Przy dobrze dopracowanym agencie dokonującym deduplikacji na źródle, to samo zadanie można zrealizować w 2-3h, niekiedy czas ten jest jeszcze krótszy. Redukcja ilości danych przynosi także korzyści biznesowe w wirtualizowanych środowiskach, gdy wiele maszyn wirtualnych zawiera te same pliki programów.

Oprócz dobrej kopii bezpieczeństwa firmy potrzebują także rozwiązania umożliwiającego odłożenie kopii do zdalnej lokalizacji przez sieć. Rozwiązania wykorzystujące deduplikację radykalnie zmniejszają ilość danych, które trzeba przesłać przez sieć WAN łączącą obie serwerownie - zazwyczaj jest to 50-200 mniej danych transferowanych między lokalizacjami. Przy typowym zasobie o pojemności 10TB, para urządzeń wyposażonych w deduplikację wymaga przesłania mniej niż 100GB przez WAN. A to oznacza konkretne oszczędności na kosztach łącza - możemy odtworzyć 100% danych przy minimalnym transferze między ośrodkami. Dzisiejsze oprogramowanie backupowe klasy enterprise może być zintegrowane z rozwiązaniami deduplikacyjnymi w taki sposób, że całość replikacji między urządzeniami deduplikacyjnymi jest zarządzana poziomu aplikacji backupowej. Dzięki takim rozwiązaniom automatycznie wykonywana kopia bezpieczeństwa jest synchronizowana do zdalnej lokalizacji w sposób przezroczysty dla aplikacji, przesyłając około 0,1% - 2% danych przez WAN.


TOP 200