Bezbłędne zasilanie i chłodzenie

Informatyka dotyka wielu aspektów życia, więc żadna współczesna organizacja nie może funkcjonować bez systemów teleinformatycznych, a te - bez infrastruktury fizycznej. W związku z tym, iż rozmaite rodzaje systemów teleinformatycznych sterują liniami produkcyjnymi, sieciami elektroenergetycznymi czy zgłoszeniami kryzysowymi, po prostu nie można pozwolić na to, aby przestały funkcjonować. Dlatego warto wiedzieć, jak zredukować błędy przy obsłudze infrastruktury zasilania i chłodzenia centrum danych.

Wymóg zapewnienia systemowi wysokiej dostępności definiuje się jako zdolność do prawidłowego działania w ciągu założonego czasu (np. roku, miesiąca). Aby zapewnić wysoki poziom dostępności, konieczne jest zminimalizowanie ryzyka wystąpienia awarii do minimum poprzez podjęcie działań, które ograniczą główne przyczyny występowania przerw, a jak szacuje się, że aż 40 do 60% przyczyn awarii centrów danych to błąd ludzki. Jednocześnie ocenia się, że ok. 60% problemów w centrum przetwarzania danych można przypisać bezpośrednio infrastrukturze fizycznej. Reasumując, można dojść do wniosku, że duża liczba usterek spowodowana jest prostymi problemami ze sprzętem, a znaczna ich część wynika z błędów obsługi, popełnianych zarówno podczas instalacji, konserwacji, jak i standardowych czynności eksploatacyjnych. Niestety, ryzyko awarii spowodowanej błędami ludzi wzrasta w miarę wzrostu złożoności budowanych centrów przetwarzania danych, co w znacznej mierze wynika z postępu technologii.

Potrzeba standaryzacji

Dość częstą przyczyną pomyłek popełnianych przez obsługę centrum danych jest brak wykorzystywania standardów w projektowaniu oraz brak procedur dla procesów utrzymaniowych. Aby zredukować ryzyko awarii, pierwsze działania należy podjąć już na etapie projektu systemu teleinformatycznego, podczas którego powinno się uwzględnić sposób integracji systemu IT z infrastrukturą fizyczną oraz sposób jej eksploatacji. Brak standaryzacji prowadzi do większej indywidualizacji wymagań w zakresie obsługi technicznej, co ma niekorzystny wpływ na niezawodność, ponieważ do sprawnego utrzymywania i obsługi centrum danych konieczne jest stworzenie wielu specyficznych procedur oraz spełnienie wymogu posiadania przez pracowników specjalistycznych kwalifikacji i doświadczeń w zakresie obsługi różnych typów urządzeń. Jasne i jednorodne struktury pomagają zredukować błędy oraz pomyłki w trakcie eksploatacji, jak i rozbudowy. Struktury modułowe ułatwiają prace i eliminują pomyłki personelu, szczególnie, jeśli pracuje on w różnych obiektach. Modułowa struktura i ergonomiczne rozwiązania sprzyjają również lepszemu zdobywaniu wiedzy o systemie przez ludzi odpowiedzialnych za utrzymanie serwerowni, gdyż lepiej rozumieją realizowane czynności obsługowe i chętniej współpracują ze sobą przy analizie i rozwiązywaniu problemów. Jeśli chodzi o czas usunięcia awarii, to przy zastosowaniu urządzeń o konstrukcji modułowej ulega on skróceniu, gdyż naprawa dokonuje się najczęściej przez wymianę całego modułu na zapasowy (przechowywany na miejscu), a jego dalsze prace odbywają się w siedzibie firmy serwisującej. Dzięki przeprowadzaniu napraw modułów w centrum serwisowym można pozyskać pełniejsze dane o uszkodzeniach, które producent może wykorzystać do dalszej analizy i statystyk, a w konsekwencji do poprawy jakości produktów. Uszkodzenie modułu przekazanego do naprawy może zostać gruntownie przeanalizowane pod kątem przyczyn awarii, co pozwala nie tylko dowiedzieć się, co stało się z danym urządzeniem, lecz także wyciągnąć dalsze wnioski w kontekście wszystkich zdarzeń awaryjnych danego komponentu. Dzięki temu producent może z wyprzedzeniem korygować źródło potencjalnych problemów w innych modułach, które mogą być narażone na te same przyczyny awarii i tym samym zmniejszyć prawdopodobieństwo wystąpienia podobnych uszkodzeń w innych instalacjach.

Jak już wspomnieliśmy, szacuje się, iż błąd ludzki to od 40 do 60% przyczyn awarii centrów danych, jednocześnie paradoksalnie wiele zdarzeń pokazuje, że znaczny wkład w tę liczbę mają zespoły serwisowe, którym zlecono działania, mające na celu zminimalizowanie ryzyka wystąpienia awarii. Czasami dochodzi do sytuacji, iż wskutek błędów popełnianych podczas przeglądów okresowych prowadzonych przez specjalistyczne firmy, awariom ulegają urządzenia cechujące się wysoką niezawodnością i jakością. Aby tych problemów uniknąć, warto więc stosować modułowe konstrukcje, które są łączone w zestandaryzowany sposób, co powoduje zmniejszenie ryzyka powstawania błędów podczas eksploatacji, a w szczególności rozbudowy, co również przyczynia się do obniżenia kosztów serwisu. Szafy i obudowy tworzą środowisko, które jeśli będzie prawidłowo zaprojektowane, może w znaczący sposób ograniczyć czas przestojów i zredukować koszty ponoszone przez firmę. We współczesnych centrach przetwarzania danych wyposażenie jest zwykle, przynajmniej w części, zmieniane co dwa-trzy lata z powodu rozwoju technologii informatycznej oraz konieczności dostosowania się do zmian wymagań biznesu, więc bardzo ważne jest, aby przygotować się do przyszłych modyfikacji i zmian. Modularne podejście do budowy systemów teleinformatycznych staje się obecnie atrakcyjnym wyborem, ponieważ dzięki niemu wprowadzanie zmian jest proste, a ryzyko błędu człowieka zostaje zminimalizowane.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200