Dostępność i niezawodność

Systemy chłodzenia

Systemy chłodzenia i klimatyzacji są niezwykle ważną częścią infrastruktury fizycznej, a ich sprawne funkcjonowanie ma duży wpływ na dostępność sytemu teleinformatycznego. Urządzenia teleinformatyczne generują bowiem znaczne ilości ciepła, które trzeba wyprowadzić, aby temperatura w serwerowni nie przekroczyła wartości dopuszczalnych. Z powodu panującej ostatnio tendencji wzrostu upakowania urządzeń teleinformatycznych znacznie wzrosła ilość generowanego ciepła, co zwiększyło ryzyko wystąpienia awarii. W środowiskach o niekorzystnych warunkach chłodzenia zaleca się stosowanie (dla szaf o mocy przekraczającej 1500 W) dodatkowych układów wentylatorów wymuszających obieg powietrza. W zależności od gęstości mocy w szafie sposób zasilania systemów klimatyzacji jest bardziej lub mniej krytyczny. Dla systemów o wysokiej gęstości, gdzie temperatura narasta szybko, konieczne jest zapewnienie zasilania gwarantowanego również dla układów klimatyzacji. Prawidłowe działanie systemów klimatyzacji, a więc to, czy urządzenia IT nie będą narażone na przekraczanie dopuszczalnych temperatur, w dużym stopniu zależy również od prawidłowo skonfigurowanych systemów monitorowania i zarządzania. Producenci systemów chłodzenia zalecają, aby w celu zapewnienia wysokiego poziomu niezawodności czynności kontrolne dla niektórych urządzeń były wykonywane nawet co kwartał. Gdy nie są dostępne bardziej zaawansowane metody pomiaru temperatury w przejściach, to należy przyjąć punktowy pomiar temperatury na wysokości ok. 1,5 metra nad podłogą. Zmierzone wartości temperatury należy ewidencjonować i porównywać z temperaturami zalecanymi przez producenta urządzeń teleinformatycznych. Jeśli zalecane temperatury na wlotach do obudowy urządzeń komputerowych nie są podane, należy przyjąć wartość temperatury w przedziale 20–25°C, zgodnie z normą ASHRAE. Temperatury wykraczające poza ten zakres mogą być bowiem przyczyną pogorszenia się wydajności systemu, skrócenia żywotności urządzeń i niespodziewanych przestojów. W wyniku pomiaru temperatur w różnych miejscach między rzędami szaf uzyskuje się profil temperaturowy ułatwiający zdiagnozowanie ewentualnych problemów z chłodzeniem i informację, czy do newralgicznych rejonów serwerowni doprowadzany jest czynnik chłodzący o odpowiednich parametrach. Na tej podstawie można również stworzyć model przepływu czynnika chłodzącego w pomieszczeniu serwerowni, który pozwala zidentyfikować obszary mieszania się ciepłego powietrza z zimnym. Zjawisko to jest bowiem przyczyną pogorszenia się warunków chłodzenia serwerów, i tym samym zagrożeniem dla ich prawidłowej pracy.

Dostępność i niezawodność

W celu zapewnienia odpowiedniego poziomu dostępności systemu chłodzenia i klimatyzacji oraz całej serwerowni, konieczne jest przeprowadzanie zabiegów konserwacyjnych zgodnie z zaleceniami producenta. Aby utrzymać wysoki poziom niezawodności, należy okresowo czyścić i wymieniać filtry, które w trakcie użytkowania ulegają stopniowemu zabrudzeniu, co w konsekwencji prowadzi do obniżania wydajności całego systemu ze względu na zmniejszenie przepływu powietrza. Agregaty zewnętrzne, w wyniku codziennej eksploatacji, również ulegają zabrudzeniu, co jest przyczyną pogorszenia sprawności, przez co spada wydajność chłodzenia. Na skutek przepływu powietrza w skraplaczu, jego powierzchnia pokrywa się pyłem, co również powoduje coraz słabsze schładzanie powietrza. Ważne jest też okresowe sprawdzanie szczelności instalacji „freonowej”, gdyż zbyt mała ilość gazu ograniczy stopień chłodzenia. Okresowa kontrola stanu i oczyszczanie instalacji odprowadzania skroplin gwarantuje funkcjonowanie urządzeń w sposób zgodny z oczekiwaniami. Bieżące kontrole systemu chłodzenia niewątpliwie pozwalają na wczesne wykrycie potencjalnych problemów z chłodzeniem, zwiększając niezawodność systemu teleinformatycznego i zapobiegając tym samym przestojom.

Zobacz również:

  • AI ma duży apetyt na prąd. Google znalazł na to sposób
  • Strategiczna współpraca NTT DATA Business Solutions i Beyond.pl
  • Zasilanie infrastruktury IT - oto najpopularniejsze zagrożenia
Dostępność i niezawodność

Punkty monitorowania temperatury na wlotach urządzeń

KONFIGURACJE NADMIAROWE

• Niezależna 2N to połączenie równoległe dwóch lub więcej jednostek UPS (modułów) – każda o takiej samej mocy, przy czym moc nominalna pojedynczego zasilacza musi być większa niż całkowita moc odbiorników z niego zasilanych. Cechuje się ona wysoką niezawodno¬ścią, gdyż urządzenia pracują synchronicznie, dzieląc się proporcjonalnie mocą i w przypadku awarii jednego, pozostałe mogą przejąć całe obciążenie bez wpływu na dostępność systemu teleinformatycznego. Największą wadą takiego systemu są stosunkowo duże koszty, wynikające z konieczności minimum dwukrotnego przewymiarowania mocy nominalnej systemu oraz obniżenia w stosunku do wartości nominalnej sprawności energetycznej, co jest wynikiem niepełnego obciążenia poszczególnych jednostek.

• Równoległa N+1 polega na zastosowaniu dodatkowego (nadmiarowego) modułu w zasilaczu UPS-a o budowie modularnej. Dzięki budowie modułowej UPS-a znacznemu przyśpieszeniu ulega proces usuwania awarii oraz łatwiejsze jest wprowadzanie zmian w konfiguracji. Przechowywanie w miejscu instalacji części zamiennych pozwala na skrócenie średniego czasu naprawy, a zoptymalizowanie pod standardowe elementy zmniejsza liczbę przechowywanych części zapasowych. Konstrukcja modułowa daje również teoretycznie większą pewność w zakresie jakości sprzętu, ponieważ produkowane są większe serie mniejszych urządzeń zamiast mniejszej liczby urządzeń o dużych mocach.

• Niezależna – występują dwa zasilacze o tych samych mocach (każdy o mocy mniejszej bądź równej mocy odbiorników), przy czym tylko jeden UPS może zasilać odbiory – drugi pracuje nieobciążony (tzw. gorąca rezerwa). UPS „nadmiarowy” zasila statyczny tor obejściowy głównego UPS-a. Konfiguracja taka wymaga, aby podstawowy moduł zasilacza dysponował osobnym wejściem statycznego obwodu obejściowego. Jest to sposób na zapewnienie określonego stopnia nadmiarowości w konfiguracji, która wcześniej jej nie miała, bez konieczności wymiany istniejącego zasilacza UPS. Do zalet takiego rozwiązania należy również zaliczyć możliwość elastycznego doboru zasilaczy (możliwość łączenia UPS różnych producentów) oraz brak konieczności synchronizacji jednostek. Do głównych wad takiej konfiguracji należy zaliczyć niższą sprawność oraz to, że nie jest ona w stanie zapewnić pełnej ciągłości zasilania.

• Rozproszona – jest stosowana głównie ze względu na niskie koszty instalacji w stosunku do rozwiązań alternatywnych. Podstawę tej konfiguracji stanowią co najmniej trzy jednostki zasilaczy UPS. Zaciski wyjściowe zasilaczy są połączone z obciążeniem krytycznym za pośrednictwem układów dystrybucji, którego kluczowym elementem są przełączniki statyczne. Zaletą konfiguracji nadmiarowej rozproszonej jest możliwość wyizolowania, i tym samym ograniczenia obszaru awarii, a także umożliwienie stosowania procedur serwisowych bez konieczności przerywania zasilania odbiorników. Do podstawowych wad tej konfiguracji należy duża zależność od prawidłowego funkcjonowania przełączników STS oraz skomplikowane zarządzanie ze względu na wielość trybów działania. Obciążenia z podwójnym zasilaniem mogą być zasilane z dwóch przełączników statycznych. Ponieważ w centrach danych maleje obecnie liczba obciążeń z pojedynczym zasilaniem, praktyczniejsze wydaje się umieszczanie przy tych obciążeniach większej liczby niewielkich punktowych przełączników źródeł zasilania.

Systemu monitorowania – sposób na zwiększenie dostępności

Narzędziem wspomagającym bądź realizującym rutynowy nadzór nad warunkami środowiskowymi powinien być system monitorowania oraz zarządzania infrastrukturą zasilania i chłodzenia. Skuteczny system monitorowania powinien zapobiegać występowaniu przestojów poprzez wskazanie źródeł potencjalnych problemów. Takim przykładem może być komunikat dla administratora systemu IT o przekroczeniu wartości prądu pobieranego przez określony obwód ponad wartość dopuszczalną, dzięki czemu może on właściwe zareagować. Uzyskane w odpowiednim czasie informacje są bowiem krytycznym czynnikiem determinującym uzyskanie wysokiej dostępności systemu IT, gdyż umożliwiają podejmowanie działań zaradczych, i tym samym niedopuszczenie do wystąpienia przestoju. Przydatna może być również możliwość częściowego skonfigurowania i zautomatyzowania odpowiedzi na zdefiniowane wcześniej zagrożenia. Aby zapewnić możliwość predykcyjnych działań, mających na celu zapobieżenie wystąpieniu awarii, system zarządzania powinien zawierać rejestr zdarzeń wraz z odpowiednią bazą danych o urządzeniach zainstalowanych w centrum przetwarzania danych. Dzięki takiej analizie możliwa jest identyfikacja problemów związanych na przykład z uszkodzeniami baterii w systemach UPS oraz identyfikacja zakłóceń występujących w elektroenergetycznej linii zasilającej, czy obszarów pomieszczenia o zbyt wysokiej temperaturze. Ważnym czynnikiem wpływającym na utrzymanie założonego poziomu niezawodności systemów technicznych jest również dbałość o przestrzeganie wymaganych zakresów przeglądów okresowych i ich terminów oraz ustalonych przez producenta procedur obsługowych.


TOP 200