Tak zwany plan B
-
- 16.10.2013
Każda organizacja powinna się przygotować na różne zdarzenia, nawet te mało prawdopodobne. Nie zawsze budżet pozwala na pełną nadmiarowość całej infrastruktury, ale nawet niewielkim nakładem środków można wiele osiągnąć.

Awaria serwera
Podstawowym elementem firmowego IT odpowiedzialnym za świadczenie usług biznesowych jest serwer. Możliwość awarii serwera i związanej z tym przerwy w pracy sprawia, że firmy zainwestowały w budowę rozwiązań klastrowych. Wprowadzenie wysokiej dostępności umożliwia przetrwanie awarii pojedynczego serwera praktycznie bez utraty ciągłości działania, ale wiąże się z dużymi inwestycjami oraz bardziej skomplikowaną pracą aplikacji.
Wprowadzenie wirtualizacji (nawet bez konfiguracji klastrowej) radykalnie upraszcza tę konfigurację, gdyż obraz maszyny wirtualnej przechowywany na macierzy dyskowej można bardzo szybko uruchomić na innym komputerze, dzięki czemu przerwa w pracy znacząco się skraca. Metoda ta jest do dziś stosowana w firmach z sektora MSP. Czas odtworzenia danej usługi można dzięki temu liczyć w minutach, chociaż procedura manualna bywa skomplikowana. Należy ją jednak regularnie sprawdzać w praktyce.
Nie każda firma wymaga od IT dostępności usług na poziomie 99,999% (pięć dziewiątek) i niekiedy ewentualna krótka przerwa jest akceptowana przez biznes – a wtedy zamiast kosztownej konfiguracji z klastrem aplikacyjnym można zbudować konfigurację klastra wirtualizacyjnego. Jest to de facto standard wdrożenia wirtualizacji serwerowej w dzisiejszych firmach i znacząco upraszcza zarządzanie systemami operacyjnymi oraz aplikacjami.
Klaster wirtualizacyjny z pewną rezerwą wydajności umożliwia niemal natychmiastowe uruchomienie maszyn, które znajdowały się na uszkodzonym serwerze, znacznie skraca czas przywrócenia dostępności usług.
Zanik napięcia
Jednym z najpoważniejszych błędów jest istnienie pojedynczego punktu awarii. Bardzo dotkliwie przekonała się o tym 4 czerwca 2012 r. firma Beyond.pl, w której awaria energetyczna spowodowała utratę danych przechowywanych na głównej macierzy dyskowej. Firma nie miała kopii bezpieczeństwa wszystkich danych i zmuszona była do odzyskiwania informacji z dysków, zawierających zniszczony wolumin RAID. Przyczyną problemów była awaria systemu energetycznego, utrata danych była spowodowana przez nieznany dotąd błąd kontrolerów macierzy dyskowej, skutkujący zniszczeniem danych po nieplanowanym wyłączeniu urządzenia.