Filary niezawodnego data center
- Sylwester Igras,
- 08.07.2013
Systemy zasilania i chłodzenia stanowią fundament infrastruktury fizycznej przedsiębiorstwa - zapewniają możliwość prawidłowego funkcjonowania systemu teleinformatycznego. Ich niezawodne działanie to klucz do zachowania ciągłości operacyjnej firmy.
Urządzenia wchodzące w skład systemów zasilania i chłodzenia wraz z czujnikami i systemami sterowania mają za zadanie utrzymywać optymalne warunki zasilania oraz parametry środowiskowe (wilgotność, temperaturę) dla wszystkich urządzeń pracujących w serwerowni. Dla centrum przetwarzania danych jednym z najważniejszych parametrów jest niezawodność, jednak gdy dojdzie już do awarii, najważniejsze staje się jak najszybsze przywrócenie dostępności systemu teleinformatycznego i obsługi procesu biznesowego. Wszystkie urządzenia, w tym oczywiście układy zasilania i chłodzenia, nie są wolne od możliwości wystąpienia awarii, dlatego w celu zwiększenia ich niezawodności, stosuje się układowe rozwiązania nadmiarowe.
Dostępność, niezawodność, parametry MTBF, MTBR
Dostępność zgodnie z definicją IEEE (Institute of Electrical and Electronics Engineers) określa się jako gotowość systemu lub elementu do zrealizowania postawionego przed nim zadania. Poziom dostępności systemu zależy głównie od jego odporności na awarie oraz średniego czasu naprawy. Zazwyczaj dostępność jest określana jako pewna wartość dotycząca danego urządzenia (systemu) lub też jako wartość procentowa odnosząca się do całkowitego okresu jego eksploatacji. Pojęcie niezawodności definiowane jest jako własność systemu mówiąca o zdolności do wykonywania żądanych funkcji w danych warunkach przez określony czas. Prognozowanie poziomu niezawodności urządzeń (w tym systemów zasilania i chłodzenia) jest zagadnieniem bardzo złożonym. Jedną z często stosowanych przez producentów metod jest prognozowanie na podstawie podobieństwa nowego produktu do posiadanych już doświadczeń. Efektywność tej metody zależy głównie od stopnia podobieństwa sprzętu nowego do tego już istniejącego, dla którego dostępne są doświadczenia wynikające z okresu jego użytkowania. Inną metodą określania niezawodności jest oparcie się na rzeczywistych danych pomiarowych związanych z konkretnym systemem. Analizując wskaźniki awaryjności użytkowanych produktów, producenci mogą szybko określić przyczyny usterek i usunąć je na etapie wytwarzania, zwiększając dzięki temu ich niezawodność. Ważnym czynnikiem wpływającym na utrzymanie poziomu niezawodności systemów technicznych jest dbałość o przestrzeganie wymaganych zakresów przeglądów okresowych i ich terminów oraz ustalonych przez producenta procedur obsługowych.
Zobacz również:
Zależność współczynnika awaryjności w funkcji czasu
Współczynnik MTTR (Mean Time to Repair / Recover) oznacza średni czas wymagany do naprawy uszkodzonego urządzenia od momentu wystąpienia awarii do ponownego osiągnięcia przez niego pełnej funkcjonalności. Najczęściej uwzględnia on czas reakcji serwisu, czas wymagany na zdiagnozowanie problemu oraz czas fizycznej naprawy systemu. Parametr MTTR (podobnie jak MTBF) jest wyrażany w godzinach i im większa jego wartość, tym gorzej, gdyż oznacza to, iż na naprawę urządzenia po awarii należy przeznaczyć więcej czasu, z czego wynika mniejsza dostępność.