Czas kosztownych przestojów

Analiza przestojów przeprowadzona przez Uptime Institute w 2022 r. w raporcie „Outage Analysis” wykazała, że koszty i konsekwencje takich sytuacji rosną, a wysiłki branży zmierzające do ograniczenia ich częstotliwości są nieskuteczne.

Czas kosztownych przestojów

Fot. Miguel Á. Padriñán, Pexels

"Operatorzy infrastruktury IT wciąż mają trudności ze spełnieniem wysokich standardów, których oczekują klienci i których wymagają umowy SLA - pomimo coraz lepszych technologii i silnych inwestycji branży w odporność i zapobieganie przestojom" - powiedział Andy Lawrence, founder member i executive director, Uptime Institute Intelligence.

"Brak poprawy w zakresie ogólnych wskaźników przestojów jest po części wynikiem ogromnych inwestycji w infrastrukturę cyfrową i związanej z nimi złożoności, z którą operatorzy muszą się zmierzyć, przechodząc na hybrydowe, rozproszone architektury" - powiedział Lawrence. "Z czasem zarówno technologia, jak i praktyki operacyjne ulegną poprawie, ale obecnie przerwy w dostawach energii pozostają głównym problemem dla klientów, inwestorów i organów regulacyjnych. Operatorzy będą w stanie najlepiej sprostać temu wyzwaniu dzięki rygorystycznemu szkoleniu pracowników i procedurom operacyjnym, które pozwolą ograniczyć błędy ludzkie leżące u podstaw wielu tych awarii".

Kluczowe wnioski z raportu Uptime Institute to między innymi:

- Wysokie wskaźniki przestojów nie zmieniły się znacząco. Jedna na pięć organizacji zgłasza, że w ciągu ostatnich trzech lat doświadczyła "poważnej" lub "dotkliwej" awarii (powodującej znaczne straty finansowe, szkody dla reputacji, naruszenie zgodności z przepisami, a w niektórych poważnych przypadkach - utratę życia), co oznacza niewielką tendencję wzrostową w częstości występowania poważnych awarii. Według badania Uptime 2022 Data Center Resiliency Survey, 80% menedżerów i operatorów centrów danych doświadczyło jakiegoś rodzaju przestoju w ciągu ostatnich trzech lat - jest to nieznaczny wzrost w stosunku do normy, która wahała się między 70% a 80%.

- W ostatnich latach gwałtownie wzrósł odsetek awarii kosztujących ponad 100 tys. USD. Ponad 60% awarii powoduje straty całkowite w wysokości co najmniej 100 tys. USD, co stanowi znaczny wzrost z 39% w 2019 r. W tym samym okresie udział awarii, których koszty przekraczają 1 mln USD, wzrósł z 11% do 15%.

- Problemy związane z zasilaniem nadal doskwierają operatorom centrów danych. Awarie związane z zasilaniem stanowią 43% awarii klasyfikowanych jako znaczące (powodujące przestoje i straty finansowe). Najczęstszą przyczyną awarii zasilania są awarie zasilaczy bezprzerwowych (UPS).

- Problemy z siecią są przyczyną dużej części przestojów w systemach informatycznych. Według badania Uptime 2022 Data Center Resiliency Survey, w ciągu ostatnich trzech lat problemy związane z siecią były pojedynczą, największą przyczyną wszystkich przestojów w usługach IT - niezależnie od ich dotkliwości. Przestoje przypisywane problemom związanym z oprogramowaniem, siecią i systemami rosną ze względu na złożoność wynikającą z coraz częstszego stosowania technologii chmury, architektur definiowanych programowo oraz hybrydowych architektur rozproszonych.

- Przeważająca większość przestojów spowodowanych błędami ludzkimi wiąże się z ignorowaniem procedur lub nieodpowiednimi procedurami. Prawie 40% organizacji doświadczyło poważnej awarii spowodowanej błędem ludzkim w ciągu ostatnich trzech lat. 85% tych incydentów wynika z nieprzestrzegania procedur przez pracowników lub z wad samych procesów i procedur.

- Zewnętrzni dostawcy IT są przyczyną większości poważnych awarii publicznych. Im więcej zadań jest zlecanych zewnętrznym dostawcom, tym częściej to właśnie ci operatorzy są odpowiedzialni za głośne, publiczne awarie. Zewnętrzni, komercyjni operatorzy IT (w tym dostawcy chmury, hostingu, kolokacji, telekomunikacji itp.) odpowiadają za 63% wszystkich publicznie zgłoszonych przestojów, które Uptime śledzi od 2016 roku. W 2021 r. operatorzy komercyjni spowodowali 70% wszystkich przestojów.

- Wydłużony czas przestoju staje się coraz częstszym zjawiskiem w przypadku publicznie zgłaszanych przestojów. W ciągu ostatnich pięciu lat znacznie wydłużył się okres między początkiem poważnej awarii a pełnym przywróceniem sprawności. Prawie 30% przestojów w 2021 r. trwało dłużej niż 24 godziny, co stanowi niepokojący wzrost z zaledwie 8% w 2017 r.

- Trendy związane z awariami sugerują, że każdego roku na całym świecie będzie miało miejsce co najmniej 20 poważnych, głośnych awarii IT. Spośród 108 publicznie zgłoszonych awarii w 2021 r. 27 było poważnych.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200