Dostępność i niezawodność

Parametry MTBF, MTTR

W branży IT przy wyborze sprzętu najczęściej wykorzystuje się parametr MTBF (Mean Time Between Failure), czyli średni czas bezawaryjnej pracy, który dla wielu klientów jest wyznacznikiem jakości produktu. Średni czas pomiędzy uszkodzeniami jest sumą średniego czasu naprawy MTTR, Mean Time to Repair (or Recover) oraz średniego czasu do uszkodzenia MTTF (Mean Time To Failure). Przy jego stosowaniu trzeba jednak pamiętać, iż współczynnik MTBF nie oznacza szacowanego okresu eksploatacji produktu. Częstym błędem popełnianym przez użytkowników odnośnie do interpretowania współczynnika MTBF jest bowiem uznawanie jego jako tzw. okresu eksploatacji, czyli szacowanej średniej liczby godzin działania, po której dochodzi do awarii systemu. Zdarza się, iż producenci podają współczynnik MTBF o ogromnej wartości nawet miliona godzin, z czego wynikałoby, iż takie urządzenie będzie działać bezawaryjnie przez 100 lat. Taka wartość w przypadku skomplikowanych systemów jest właściwie niemożliwa do osiągnięcia, gdyż wraz z upływem czasu i technicznym zużyciem prawdopodobieństwo awarii rośnie.

Innym często uwzględnianym parametrem jest średni czasu naprawy MTTR, który określa czas usunięcia awarii, czyli ponownego osiągnięcia przez system (urządzenie) pełnej funkcjonalności. Najczęściej uwzględnia on tzw. czas reakcji serwisu, czas wymagany na zdiagnozowanie problemu oraz czas fizycznej naprawy. Parametr MTTR (podobnie jak MTBF) jest najczęściej wyrażany w godzinach i w przeciwieństwie do MTBF im większa jego wartość, tym gorzej, gdyż oznacza to, iż na naprawę urządzenia po awarii należy zarezerwować więcej czasu. Podsumowując można więc stwierdzić, że im wyższy współczynnik MTBF i niższy współczynnik MTTR, tym większa dostępność. Porównanie współczynników MTBF i MTTR różnych produktów daje pogląd na różnice między nimi w zakresie niezawodności i dostępności, co stanowi doskonałe wsparcie w procesie podejmowania decyzji dotyczących wyboru konkretnych rozwiązań

Zobacz również:

  • AI ma duży apetyt na prąd. Google znalazł na to sposób
  • Strategiczna współpraca NTT DATA Business Solutions i Beyond.pl
  • Zasilanie infrastruktury IT - oto najpopularniejsze zagrożenia
Dostępność i niezawodność

Dostępność zasilania

Systemy zasilania gwarantowanego

SYSTEMY ZASILANIA GWARANTOWANEGO

Dostępność i niezawodność

Zasilanie systemu informatycznego z centralnego UPS-a w konfiguracji 2N

Zapewnienie wysokiego poziomu dostępności energii elektrycznej dla systemów teleinformatycznych jest niezwykle ważne dla jego funkcjonowania, gdyż żadne urządzenie teleinformatyczne nie może działać bez zasilania. Zdecydowana większość zakłóceń (w tym przerwy napięcia) ma na szczęście charakter krótkotrwały (trwający nie dłużej niż 5 s), lecz jednak i one mogą spowodować poważne uszkodzenia i długotrwały przestój systemu. Znaczenie układów zasilania gwarantowanego zapewniającego nieprzerwane utrzymanie stabilizowanego (pozbawionego zakłóceń i o ściśle określonych parametrach) napięcia dla prawidłowego funkcjonowania systemu teleinformatycznego jest więc niebagatelne. Niestety skomplikowane urządzenia wchodzące w skład tej warstwy same nie są wolne od możliwości wystąpienia awarii i również mogą być przyczyną przestoju data center. W celu podniesienia niezawodności systemów zasilania bezprzerwowego, dość często stosuje się więc układy redundancyjne (nadmiarowe), co pozwala na znaczące zmniejszenie ryzyka wystąpienia awarii. W redundancyjnych (2 N) systemach zasilania gwarantowanego możliwe jest uzyskanie niezawodności na poziomie 99,99999999, co oznacza zakładany czas braku dostępności zasilania na poziomie jedynie ok. 30 ms na rok.

Dostępność i niezawodność

Zasilanie systemu teleinformatycznego z centralnego UPS-a w wersji modułowej w konfiguracji N+1

Przy wyborze właściwego rozwiązania nadmiarowego należy pamiętać, aby stworzony system zasilania zapewniał założony poziom niezawodności, co przekłada się bezpośrednio na poziom dostępności systemu teleinformatycznego. W wyborze odpowiedniej konfiguracji ważne jest uwzględnienie negatywnego wpływu przestojów i poziomu akceptacji ryzyka dla danego systemu teleinformatycznego. Wyboru konfiguracji systemu należy dokonywać zależnie od stopnia krytyczności odbiorów, gdyż im większe wymagania w zakresie niezawodności, tym wyższe koszty zakupu i utrzymania systemu. W przypadku zasilaczy gwarantowanych dla zminimalizowania ryzyka awarii niezmiernie ważna jest okresowa kontrola stanu ogniw akumulatorów (ta standardowa, która jest zaimplementowana w systemach UPS, nie jest zwykle dostatecznie miarodajna) oraz układów wentylatorów. Warto taki okresowy przegląd systemu zlecić specjalistycznym firmom, gdyż oszczędności na tej procedurze mogą okazać się bardzo

Dostępność i niezawodność

Konfiguracja nadmiarowa rozproszona


TOP 200