Efektywny backup - to jest możliwe!

Off-host - poza hostem

Deduplikacja danych w systemach backupowych

Polecamy:

Zobacz też:

Testy:

Jest to jedno z najlepszych rozwiązań do przeprowadzenia backupu dużej ilości danych z dysków wewnętrznych serwerów. W backupie typu off-host wolumeny serwera znajdujące się na sieciowej pamięci masowej są wystawiane jako zasób do serwera backupu. Ten ostatni może wtedy skopiować dane z takiego wolumenu bez jakiegokolwiek obciążania serwera źródłowego po szybkiej sieci SAN.

W środowiskach niezwirtualizowanych oprogramowanie backupu kontaktuje się z serwerem źródłowym i przekazuje mu polecenie wykonania kopii migawkowej danych, przeznaczonych do zbackupowania. Serwer źródłowy wykorzystuje następnie oprogramowanie dostarczone przez producenta pamięci masowej, aby wykonać spójny snapshot na macierzy. W dalszej kolejności serwer backupu montuje kopię migawkową i wykonuje z niej backup na dyski lub taśmę. Natomiast w środowiskach zwirtualizowanych, zwłaszcza tych opartych na hypervisorze VMware ESX, proces wygląda nieco inaczej. Oprogramowanie backupu wykorzystuje mechanizm VMware Consolidated Backup (VCB), w celu stworzenia kopii migawkowej maszyny wirtualnej na poziomie hypervisora. Serwer backupu może następnie zbackupować spójny obraz maszyny wirtualnej bezpośrednio z pamięci masowej SAN, bez wpływu na maszynę wirtualną, hosta czy też sieć.

Zobacz również:

  • Ransomware zagraża ochronie zdrowia
  • Dlaczego kopia zapasowa telefonu to coś, o czym nie warto zapominać
  • Wyjaśniamy czym jest SD-WAN i jakie są zalety tego rozwiązania

Backupy typu off-host są bardzo szybkie - przewyższają pod względem wydajności metodę tradycyjnego backupu z wykorzystaniem agenta. Umożliwiają także maksymalne wykorzystanie urządzeń, na które kierowany jest strumień backupu - napęd taśmowy lub dyski. Trzeba jednak pamiętać, że backup typu off-host nie rozwiąże każdego problemu związanego z wydajnością samego procesu backupu. Jednak w wielu przypadkach bardzo pomaga. Pozwala maksymalnie wykorzystać sieć SAN oraz zmniejszyć długość okna backupu.

Efektywne składowanie backupu

Technologią, która w znacznym stopniu może przyczynić się do podniesienia efektywności backupu, zwłaszcza pod względem zajmowanej przez kopie zapasowe przestrzeni dyskowej, jest deduplikacja. W dużym uproszczeniu jej działanie polega na eliminacji redundantnych bloków danych i zastąpieniu ich kolejnych powtórzeń odsyłaczami do danych oryginalnych. W efekcie, na zasobach dyskowych przeznaczonych pod repozytorium backupu zostają zapisane tylko unikalne dane. Zastosowanie technologii deduplikacji ma sens w środowiskach, które charakteryzują się dużą powtarzalnością backupowanych danych. W zależności od charakterystyki danych i użytej technologii, współczynnik deduplikacji może wynieść od 10:1 do ponad 50:1, co z kolei pozwala zwiększyć w systemie backupu liczbę kopii zapasowych przetrzymywanych na repozytorium dyskowym.

Miejsca deduplikacji danych w systemach backup

Technologia deduplikacji ostatnio została dodana do wielu aplikacji służących do backupu danych. Patrząc na rozwiązania dostępne na rynku, w zależności od charakterystyki środowiska i wymagań proces deduplikacji może zachodzić na źródle, a więc na serwerze, z którego dane wysyłane są do serwera backupu, na samym serwerze backupu lub na urządzeniu dyskowym służącym jako repozytorium kopii zapasowych. Trudno wskazać, które z rozwiązań jest najlepsze i zawsze należy rozpatrywać miejsce deduplikacji dla konkretnych przypadków środowisk oraz rodzaju danych.

Wiele z dostępnych na rynku produktów oferuje tzw. globalną deduplikację, a więc obejmującą swoim zasięgiem np. kilka lokalizacji, co usprawnia replikację danych poprzez łącza WAN między oddziałami a centralą, otwierając drogę do posiadania backupu oddziałów w centrali. To z kolei przekłada się na obniżenie kosztów związanych z wymaganą przepustowością łączy czy też administrowaniem rozproszonym środowiskiem.

Podsumowanie

Projektowanie efektywnego systemu backupu wymaga szczegółowej analizy wielu istotnych czynników - od ilości, zmienności i przyrostu danych, przez wykrywanie potencjalnych wąskich gardeł w infrastrukturze, po odpowiednio zdefiniowane reguły polityki i retencję danych. Szczegółowa analiza środowiska pozwala dobrać odpowiednie metody backupu i technologie, w zależności od charakterystyki danych i wymagań wyznaczanych przez współczynniki RTO oraz RPO. Przy stale zwiększającej się ilości danych i kurczących się oknach backupowych, zbudowanie wydajnego systemu backupu staje się dla wielu przedsiębiorstw wyzwaniem, ale oferowane na rynku technologie umożliwiają rozwiązanie większości problemów związanych z zazwyczaj niełatwym procesem tworzenia kopii zapasowych danych.


TOP 200