Ciągłość działania - sposoby fizyczne i wirtualne

Zazwyczaj najlepsze wyniki daje skorzystanie z mechanizmów HA wbudowanych w hiperwizor. Prawie wszystkie tego typu mechanizmy - czy jest to HA VMware vSphere czy klaster serwerów Microsoft Hyper-V - wymagają pamięci współdzielonej. Chociaż koszt podstawowej SAN klasy enterprise spadł znacznie w ciągu ostatnich kilku lat, to nadal nie jest to pamięć tania. Małe firmy z umiarkowanymi wymaganiami na pamięć masową mogą dojść do wniosku, że narzędzia replikacji hosta od dostawców niezależnych są mniej kosztowne.

Dostawcy rozwiązań wirtualizacyjnych zapewniają możliwość implementacji HA dla hostów wirtualizacji na różne sposoby, ale koncepcja ogólna jest prosta: dwa lub więcej hostów wirtualizacji są łączone w klaster i dołączane do pojedynczej, współdzielonej pamięci masowej. Hosty klastra przechowują informacje o maszynach wirtualnych i w trybie ciągłym wzajemnie monitorują swój stan. Kiedy jeden host ulegnie uszkodzeniu lub utraci połączenie z siecią czy pamięcią, pozostałe restartują maszyny wirtualne, które pracowały na uszkodzonym hoście.

W zależności od implementacji zabiera to zazwyczaj czas liczony w minutach oraz skutkuje utratą sesji użytkowników i niezapisanych jeszcze na dysku danych - efekty porównywalne z przeładowaniem oryginalnego hosta po nieoczekiwanym uszkodzeniu zasilania.

W porównaniu do tradycyjnego klastra serwerów fizycznych, czas reakcji klastra wirtualnego może być znacząco dłuższy. Jednak możliwość zastosowania go do prawie dowolnego typu aplikacji pracującej na maszynie wirtualnej rekompensuje zazwyczaj niedogodności wydłużenia czasu przywracania.

TESTOWANIE

Bez względu na to, jakie rozwiązanie zostanie wybrane w strategii zapewniającej ciągłość działania, konieczne jest opracowanie spójnego planu testowania. Bez częstego testowania, nie można nigdy być pewnym, czy składowane dane mogą być dokładnie odtworzone, oraz czy zapasowe centrum danych będzie online, gdy nastąpi katastrofa.

Jest to element, do którego organizacje przywiązują zbyt małą wagę. Backup może jednak zawieść w najważniejszym momencie - kiedy trzeba z niego skorzystać w celu odtworzenia systemu. Jeżeli nie jest testowany, to wiedza o jego niedostatkach pojawi się zbyt późno. Parametrem testowania samego procesu odtwarzania po katastrofie jest TTO (Test Time Objective). Określa on okno czasowe, w którym powinien zakończyć się test, aby proces uznać za pomyślny. Celem testu jest sprawdzenie, czy po odtworzeniu pliki danych i odbudowane serwery są kompletne i będą poprawnie pracować.

High Availability, Disaster Recovery i Bussiness Continuity wymagają obecnie nowego podejścia. Jest to nie tylko problem działu informatycznego. Ponieważ awaria IT dotyka wszystkie działy w każdej organizacji, to zarząd i kadra menedżerska powinny być włączane w procesy decyzyjne dotyczące zachowania ciągłości działania.

Ciągłość działania - sposoby fizyczne i wirtualne

Opracowano na podstawie "Info-World Deep Dive".


TOP 200