Tak zwany plan B

Każda organizacja powinna się przygotować na różne zdarzenia, nawet te mało prawdopodobne. Nie zawsze budżet pozwala na pełną nadmiarowość całej infrastruktury, ale nawet niewielkim nakładem środków można wiele osiągnąć.

Tak zwany plan B
Przy planowaniu odpowiedzi firmowego IT na ewentualne awarie zazwyczaj rozpoczyna się od zdarzeń o największym prawdopodobieństwie wystąpienia. Są to awarie techniczne, spowodowane przerwą w pracy jednego z urządzeń IT. Takim urządzeniem może być serwer, przełącznik sieciowy, agregat klimatyzacji, przełącznik energetyczny w układzie dystrybucji energii elektrycznej, a nawet elektroniczny zamek w drzwiach do serwerowni. W każdym przypadku firmowe IT powinno mieć przygotowany plan działania na wypadek awarii pojedynczego urządzenia, gdyż takie zdarzenie na pewno kiedyś nastąpi.

Awaria serwera

Podstawowym elementem firmowego IT odpowiedzialnym za świadczenie usług biznesowych jest serwer. Możliwość awarii serwera i związanej z tym przerwy w pracy sprawia, że firmy zainwestowały w budowę rozwiązań klastrowych. Wprowadzenie wysokiej dostępności umożliwia przetrwanie awarii pojedynczego serwera praktycznie bez utraty ciągłości działania, ale wiąże się z dużymi inwestycjami oraz bardziej skomplikowaną pracą aplikacji.

Wprowadzenie wirtualizacji (nawet bez konfiguracji klastrowej) radykalnie upraszcza tę konfigurację, gdyż obraz maszyny wirtualnej przechowywany na macierzy dyskowej można bardzo szybko uruchomić na innym komputerze, dzięki czemu przerwa w pracy znacząco się skraca. Metoda ta jest do dziś stosowana w firmach z sektora MSP. Czas odtworzenia danej usługi można dzięki temu liczyć w minutach, chociaż procedura manualna bywa skomplikowana. Należy ją jednak regularnie sprawdzać w praktyce.

Nie każda firma wymaga od IT dostępności usług na poziomie 99,999% (pięć dziewiątek) i niekiedy ewentualna krótka przerwa jest akceptowana przez biznes – a wtedy zamiast kosztownej konfiguracji z klastrem aplikacyjnym można zbudować konfigurację klastra wirtualizacyjnego. Jest to de facto standard wdrożenia wirtualizacji serwerowej w dzisiejszych firmach i znacząco upraszcza zarządzanie systemami operacyjnymi oraz aplikacjami.

Klaster wirtualizacyjny z pewną rezerwą wydajności umożliwia niemal natychmiastowe uruchomienie maszyn, które znajdowały się na uszkodzonym serwerze, znacznie skraca czas przywrócenia dostępności usług.

Zanik napięcia

Pojedynczy punkt awarii

Jednym z najpoważniejszych błędów jest istnienie pojedynczego punktu awarii. Bardzo dotkliwie przekonała się o tym 4 czerwca 2012 r. firma Beyond.pl, w której awaria energetyczna spowodowała utratę danych przechowywanych na głównej macierzy dyskowej. Firma nie miała kopii bezpieczeństwa wszystkich danych i zmuszona była do odzyskiwania informacji z dysków, zawierających zniszczony wolumin RAID. Przyczyną problemów była awaria systemu energetycznego, utrata danych była spowodowana przez nieznany dotąd błąd kontrolerów macierzy dyskowej, skutkujący zniszczeniem danych po nieplanowanym wyłączeniu urządzenia.

Klasyczną katastrofą, która spędza sen z oczu menedżerom IT odpowiedzialnym za świadczenie usług, jest awaria zasilania. Każdy plan awaryjny zakłada zanik napięcia i każda serwerownia jest wyposażona w mniej lub bardziej zaawansowaną instalację zasilania gwarantowanego. Zawiera ona co najmniej zasilanie zewnętrzne i zasilacz UPS, przeważnie instalacje są o wiele bardziej skomplikowane. Wprowadzenie generatora znacząco wydłuża czas podtrzymania, ale wymaga wdrożenia procedur związanych z dostarczeniem paliwa, wykonywania regularnych przeglądów i przechodzenia na zasilanie z generatora co pewien czas. W odróżnieniu od poważnych awarii, zanik napięcia jest standardowym zagrożeniem i praktycznie każda serwerownia jest przygotowana na problemy z zasilaniem. Jest to jednocześnie najpopularniejsza z awarii, w niektórych regionach mikrozaniki (wymuszające przejście na zasilanie z UPS lub wykorzystanie energii zmagazynowanej w zasilaczu elektromechanicznym) zdarzają się częściej niż raz w miesiącu. Podstawową obroną przed tym zagrożeniem jest dobrze opracowana sieć zasilania gwarantowanego.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200