Aplikacje wysoce dostępne

IBM proponuje rozwiązanie klastrowe zabezpieczające przed awarią oprogramowania.

IBM proponuje rozwiązanie klastrowe zabezpieczające przed awarią oprogramowania.

Wiele systemów o wysokiej niezawodności może wykryć poważny defekt programu tylko w razie awarii całego systemu. Zdarzają się wady, które nie wywołują poważnej awarii, a jednak potencjalnie zagrażają pracy systemu.

Rozwiązanie klastrowe dla komputerów IBM RS/6000 zawiera pakiet programowy, którego zadaniem jest zapewnienie niezawodnej pracy sprzętu i oprogramowania na klastrach złożonych z jedno- lub wieloprocesorowych węzłów. Podstawowymi elementami w rozwiązaniu proponowanym przez IBM są moduły obsługi zdarzeń EM (Event Manager) i usług grupowych GS (Group Services).

Event Manager jest używany przez aplikacje rozproszone do monitorowania, wykrywania i powiadamiania o wystąpieniu zdarzeń. Korzystając z EM, aplikacja może stwierdzić, co dzieje się w systemie i będzie powiadomiona o konieczności interwencji. Monitorowaniem zdarzeń w systemie i aplikacji zajmują się agenci Resource Monitor, rozmieszczeni w najważniejszych punktach systemu. Można np. monitorować wykorzystanie mocy obliczeniowej procesora, rozmiar wolnej przestrzeni dyskowej lub plików dziennika bazy danych, awarię sprzętową węzła, dysku lub układów we/wy itp. EM współpracuje z programami usługowymi (klienci EM), których zadaniem jest dokonywanie działań naprawczych lub prewencyjnych (przekazanie zadania do innego węzła systemu, zmiana konfiguracji dysków, zażądanie archiwizacji pliku dziennika).

Moduł Group Services służy do formułowania i wykonywania planu postępowania w sytuacji kryzysowej, zamiany uszkodzonego modułu programu użytkowego na sprawny i spójnego odtwarzania stanu aplikacji. W tym celu w module GS tworzy się grupy węzłów, wykonujących wspólnie akcje prewencyjne lub ratunkowe.

Monitorowanie zasobów

Rozwiązanie klastrowe IBM realizuje znaczną część funkcji monitorowania zasobów za pośrednictwem usług topologicznych Topology Services (TS). Tworzą one mapę systemu i monitorują stan sieci łączącej węzły klastra i węzłów. Co pewien czas przesyłają zapytania do węzłów i sieci w celu sprawdzenia ich działania. Korzystając z wysoce nadmiarowego protokołu komunikacyjnego i równoległych dróg przesyłania, usługi EM i GS otrzymują aktualne informacje o stanie systemu, nawet w razie awarii. Monitory zasobów są integralną częścią pakietu klastrowego IBM i pozwalają na monitorowanie m.in. stanu wspólnych systemów dyskowych, rozdzielania obciążenia na poszczególne węzły, operacji systemu AIX na poszczególnych węzłach, wyników działań i programów inicjowanych przez użytkownika.

Własne narzędzia

Pakiet programów klastrowych IBM dla RS/6000 współpracuje z narzędziami do zarządzania systemem, które mogą podejmować działania mające na celu zapobieganie lub usuwanie awarii. Korzystając z informacji o zdarzeniach w systemie, mogą one podejmować działania polegające na uruchomieniu skryptu do automatycznej korekty sygnalizowanych problemów i programu powiadamiającego administratora systemu, zapisaniu informacji o zdarzeniu do pliku dziennika oraz wytworzeniu przerwania SNMP do programów zarządzania systemem. Nie można jednak uzyskać wysokiego poziomu dostępności dla aplikacji, których nie przystosowano do modułów obsługi zdarzeń EM i usług grupowych GS. Moduły te eksponują zestaw funkcji programistycznych API, z których korzysta programista, przystosowując aplikację do działania na systemie o wysokiej dostępności.