Firma bez prądu: bezpieczeństwo infrastruktury IT

Ryzyka awarii systemów IT nie można całkowicie wyeliminować, ale należy je identyfikować i ograniczać, korzystając z rozwiązań referencyjnych. Aby zminimalizować skutki braku prądu trzeba uwzględnić taką sytuację w planach eskalacyjnych firmy.

Firma bez prądu: bezpieczeństwo infrastruktury IT

Z zasilaniem prądem elektrycznym w gospodarce jest podobnie jak z niezbędnym nam do życia powietrzem – jego obecność wydaje się oczywista, ale odcięcie od niego miałoby katastrofalne skutki. Zdając sobie z tego sprawę przedsiębiorstwa kupują systemy zasilania awaryjnego UPS (Uninterruptible Power Supply). Mogą one, w przypadku przerwy w dopływie prądu, zapewnić funkcjonowanie infrastruktury firmy nawet przez wiele dni (pod warunkiem wyposażenia systemu we własne agregaty prądotwórcze). W praktyce tak kompleksowe rozwiązania, z uwagi na wysoki koszt, są rzadko stosowane. W przeciętnym przedsiębiorstwie zasilanie awaryjne, oparte na akumulatorach, dedykowane jest przede wszystkim serwerowniom, a ich głównym celem jest podtrzymania napięcia przez czas umożliwiający bezpieczne, bez utraty danych, wyłączenie komputerów.

Planowe wyłączenie prądu

Brak prądu w firmie może wystąpić także w trybie planowanym, np. na czas konserwacji czy wymiany elementów systemu elektrycznego. Wówczas także trzeba wyłączyć komputery w firmie, a potem je uruchomić, co wbrew pozorom nie jest banalnym zadaniem. Przeprowadzenie bezpiecznego wyłączenia systemu informatycznego i jego ponownego uruchomienia, wymaga specjalistycznej wiedzy i wykonania w ściśle określonej kolejności, szeregu czynności.

Zobacz również:

  • IDC CIO Summit – potencjał drzemiący w algorytmach
  • Dzięki nowym przepisom, walka z nadużyciami w komunikacji elektronicznej będzie łatwiejsza
  • Dlaczego warto korzystać z VPN w 2024 roku?

Przedsięwzięcie komplikuje się gdy trzeba wyłączyć wszystkie pracujące w firmie serwery. Ich aplikacje, zarówno narzędziowe jak i użytkowe, są przecież od siebie zależne. Nie można np. najpierw wyłączyć systemów wirtualnych konsol (operations console) obsługujących fizyczne serwery, bo w konsekwencji stracilibyśmy dostęp do tych ostatnich.

Koszty i ryzyka

Formuła dostępności D systemu

D = MTBF / (MTBF + MTTR), gdzie

MTBF – Mean Time Between Failures – średni czas pracy bezawaryjnej

MTTR – Mean Time To Repair – średni czas naprawy

100-proc. dostępność systemu istnieje przy jego zerowym czasie naprawy w przypadku wystąpienia awarii.

Przykład. Dla systemu MTBF = 100 tys. godzin, który można naprawić w ciągu 2 h, mamy D = 100 000/(100 000 + 2) = 0,99998 ≈ 99,99%

W praktyce operuje się n-dziewiątkowymi (n-nines) współczynnikami dostępności odnoszącymi się do jednego roku:

90% - jednodziewiątkowa (1-nine) – 5,21 tygodni

99% - dwudziewiątkowa (2-nines) – 3,65 dnia

99,9% - trzydziewiątkowa (3-nines) – 8,76 godzin

99,99% - czterodziewiątkowa (4-nines) – 52,56 minuty

Operacja wyłączenia prądu w przedsiębiorstwie za każdym razem wymaga starannego zaplanowania. To domena firmowych informatyków i elektryków. Chociaż z reguły przeprowadzana jest w weekendy, to w zakładach o ruchu ciągłym, wymaga uzgodnień z produkcją i przedstawicielami innych działów, np. sprzedaży czy logistyki.

W poszczególnych działach firmy opracowywane są zmodyfikowane plany awaryjne jej funkcjonowania, szacowane koszty oraz możliwe ryzyka i dopiero wtedy wybierany jest optymalny termin przeprowadzenia „kontrolowanej awarii zasilania”.

Pamiętając o konieczności przeprowadzenia, po ponownym uruchomieniu systemów, podstawowych testów aplikacyjnych, trzeba w planie uwzględnić fakt, że może to wymagać zapewnienia udziału wybranych użytkowników.

Ponadto, jak pokazuje praktyka, nawet planowe wyłączenie prądu w firmie może spowodować awarię sprzętu np. dysku serwera, zwłaszcza gdy mamy do czynienia z urządzeniami starszego typu. Taki dysk i tak uległby kiedyś uszkodzeniu, zgodnie z MTBF (Mean Time Between Failure - średni czas pracy bezawaryjnej) ale moment włączania po dłużej przerwie w pracy stanowi moment krytyczny. Wynika to m.in. z temperatury pracy - dłuższe wyłączenie energii elektrycznej powoduje, że sprzęt stygnie. Uruchomienie serwera prowadzi do szybkiego wzrostu jego temperatury. Słabsze komponenty mogą „nie wytrzymać” takiej zmiany, zwłaszcza jeśli towarzyszy jej wahanie parametrów prądu zasilania (przepięcia). To ostanie zagrożenie można wyeliminować stosując w roli stabilizatora napięcia systemy UPS, najlepiej działające jako centralny zestaw dla wszystkich urządzeń elektrycznych serwerowni.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200