Zarządzanie infrastrukturą fizyczną

  • Sylwester Igras,

Jak pokazuje jednak doświadczenie, w znacznym stopniu przestój centrum przetwarzania danych wynika z awarii pojedynczych obwodów lub przekroczenia temperatury w niektórych częściach szafy. Monitorowanie pojedynczych obwodów oraz temperatury w szafie pozwala na istotne zwiększenie dostępności, dzięki możliwości uzyskania przez administratorów informacji o zwiększonym ryzyku wystąpienia awarii.

Istotnym czynnikiem związanym z bezpieczeństwem zasilania jest monitorowanie poziomu obciążenia (wartości prądu obciążenia) grupy bądź pojedynczego urządzenia. Wymagania dotyczące optymalizacji powierzchni zajmowanej przez sprzęt IT mogą być przyczyną niebezpiecznego wzrostu temperatury, ponieważ większa gęstość upakowania urządzeń jest bezpośrednio związana z większą emisją ciepła i większymi potrzebami w zakresie chłodzenia. Dzięki urządzeniom pozwalającym na zdalne wyłączanie lub włączanie pojedynczych urządzeń teleinformatycznych można zoptymalizować (wydłużyć) czas pracy systemu informatycznego w razie awarii zasilania (praca UPS-a z baterii), wyłączając zbędne lub mniej ważne urządzenia. Urządzenia zarządzające poszczególnymi obwodami odbiorczymi ułatwiają również zarządzanie, umożliwiając ich restart oraz optymalizację pracy sprzętu w sieciach rozległych.

Przeciwdziałanie awariom

Skuteczne narzędzia do analizy zapobiegają występowaniu problemów, określając obszary, na które należy zwrócić uwagę, i wskazując na źródła potencjalnych awarii. Aby przeprowadzić analizę pod kątem przewidywania awarii, system zarządzania musi mieć rejestr zdarzeń wraz z odpowiednią bazą danych o systemie informatycznym. Dzięki takiej analizie możliwa jest identyfikacja problemów związanych z uszkodzeniami baterii w systemach UPS (siłowniach prądu stałego) oraz newralgicznych punktów o podwyższonej temperaturze, a także zdefiniowanie zakłóceń występujących w elektroenergetycznej linii zasilającej, takich jak odchylenia od znamionowej wartości, częstotliwość i czas trwania zaników napięcia.

Urządzenia i parametry, które należy monitorować

• parametry elektryczne obwodów odbiorczych,

• parametry środowiskowe (temperatura, wilgotność),

• systemy chłodzenia i klimatyzacji,

• zasilacze UPS i agregaty prądotwórcze.

Zakłócenia zasilania i zbyt wysoka temperatura są przykładami zdarzeń, które - jeżeli nie zostaną podjęte żadne działania zaradcze - mają bezpośredni wpływ na dostępność systemu teleinformatycznego. Uzyskane w odpowiednim czasie informacje są krytycznym czynnikiem, wpływającym na zapewnienie wysokiej dostępności systemu IT, pozwalają bowiem podejmować działania naprawcze jeszcze przed uszkodzeniem lub awarią sprzętu. Przykładem może być komunikat dla administratora systemu IT o przekroczeniu wartości prądu pobieranego przez określony obwód ponad wartość dopuszczalną, dzięki czemu może on właściwe zareagować.

Przydatna może być również możliwość całościowego skonfigurowania i zautomatyzowania odpowiedzi na zdefiniowane wcześniej sytuacje awaryjne.