Firma bez prądu: bezpieczeństwo infrastruktury IT
- Jarosław Badurek,
- 03.09.2013
Ryzyka awarii systemów IT nie można całkowicie wyeliminować, ale należy je identyfikować i ograniczać, korzystając z rozwiązań referencyjnych. Aby zminimalizować skutki braku prądu trzeba uwzględnić taką sytuację w planach eskalacyjnych firmy.
Z zasilaniem prądem elektrycznym w gospodarce jest podobnie jak z niezbędnym nam do życia powietrzem – jego obecność wydaje się oczywista, ale odcięcie od niego miałoby katastrofalne skutki. Zdając sobie z tego sprawę przedsiębiorstwa kupują systemy zasilania awaryjnego UPS (Uninterruptible Power Supply). Mogą one, w przypadku przerwy w dopływie prądu, zapewnić funkcjonowanie infrastruktury firmy nawet przez wiele dni (pod warunkiem wyposażenia systemu we własne agregaty prądotwórcze). W praktyce tak kompleksowe rozwiązania, z uwagi na wysoki koszt, są rzadko stosowane. W przeciętnym przedsiębiorstwie zasilanie awaryjne, oparte na akumulatorach, dedykowane jest przede wszystkim serwerowniom, a ich głównym celem jest podtrzymania napięcia przez czas umożliwiający bezpieczne, bez utraty danych, wyłączenie komputerów.
Planowe wyłączenie prądu
Brak prądu w firmie może wystąpić także w trybie planowanym, np. na czas konserwacji czy wymiany elementów systemu elektrycznego. Wówczas także trzeba wyłączyć komputery w firmie, a potem je uruchomić, co wbrew pozorom nie jest banalnym zadaniem. Przeprowadzenie bezpiecznego wyłączenia systemu informatycznego i jego ponownego uruchomienia, wymaga specjalistycznej wiedzy i wykonania w ściśle określonej kolejności, szeregu czynności.
Zobacz również:
- IDC CIO Summit – potencjał drzemiący w algorytmach
- Dzięki nowym przepisom, walka z nadużyciami w komunikacji elektronicznej będzie łatwiejsza
- Dlaczego warto korzystać z VPN w 2024 roku?
Przedsięwzięcie komplikuje się gdy trzeba wyłączyć wszystkie pracujące w firmie serwery. Ich aplikacje, zarówno narzędziowe jak i użytkowe, są przecież od siebie zależne. Nie można np. najpierw wyłączyć systemów wirtualnych konsol (operations console) obsługujących fizyczne serwery, bo w konsekwencji stracilibyśmy dostęp do tych ostatnich.
Koszty i ryzyka
D = MTBF / (MTBF + MTTR), gdzie
MTBF – Mean Time Between Failures – średni czas pracy bezawaryjnej
MTTR – Mean Time To Repair – średni czas naprawy
100-proc. dostępność systemu istnieje przy jego zerowym czasie naprawy w przypadku wystąpienia awarii.
Przykład. Dla systemu MTBF = 100 tys. godzin, który można naprawić w ciągu 2 h, mamy D = 100 000/(100 000 + 2) = 0,99998 ≈ 99,99%
W praktyce operuje się n-dziewiątkowymi (n-nines) współczynnikami dostępności odnoszącymi się do jednego roku:
90% - jednodziewiątkowa (1-nine) – 5,21 tygodni
99% - dwudziewiątkowa (2-nines) – 3,65 dnia
99,9% - trzydziewiątkowa (3-nines) – 8,76 godzin
99,99% - czterodziewiątkowa (4-nines) – 52,56 minuty
W poszczególnych działach firmy opracowywane są zmodyfikowane plany awaryjne jej funkcjonowania, szacowane koszty oraz możliwe ryzyka i dopiero wtedy wybierany jest optymalny termin przeprowadzenia „kontrolowanej awarii zasilania”.
Pamiętając o konieczności przeprowadzenia, po ponownym uruchomieniu systemów, podstawowych testów aplikacyjnych, trzeba w planie uwzględnić fakt, że może to wymagać zapewnienia udziału wybranych użytkowników.
Ponadto, jak pokazuje praktyka, nawet planowe wyłączenie prądu w firmie może spowodować awarię sprzętu np. dysku serwera, zwłaszcza gdy mamy do czynienia z urządzeniami starszego typu. Taki dysk i tak uległby kiedyś uszkodzeniu, zgodnie z MTBF (Mean Time Between Failure - średni czas pracy bezawaryjnej) ale moment włączania po dłużej przerwie w pracy stanowi moment krytyczny. Wynika to m.in. z temperatury pracy - dłuższe wyłączenie energii elektrycznej powoduje, że sprzęt stygnie. Uruchomienie serwera prowadzi do szybkiego wzrostu jego temperatury. Słabsze komponenty mogą „nie wytrzymać” takiej zmiany, zwłaszcza jeśli towarzyszy jej wahanie parametrów prądu zasilania (przepięcia). To ostanie zagrożenie można wyeliminować stosując w roli stabilizatora napięcia systemy UPS, najlepiej działające jako centralny zestaw dla wszystkich urządzeń elektrycznych serwerowni.