Technologie zwiększające dostępność serwerów

Wszyscy chcą mieć system informatyczny, który świadczy usługi przez 24 godziny na dobę i 7 dni w tygodniu. Tylko wtedy można mieć pewność, że operacje biznesowe będą realizowane szybko i bez żadnych opóźnień. Aby system informatyczny pracował właśnie w taki sposób, zainstalowane w nim serwery muszą działać bezawaryjnie i być zawsze dostępne.

Wszyscy chcą mieć system informatyczny, który świadczy usługi przez 24 godziny na dobę i 7 dni w tygodniu. Tylko wtedy można mieć pewność, że operacje biznesowe będą realizowane szybko i bez żadnych opóźnień. Aby system informatyczny pracował właśnie w taki sposób, zainstalowane w nim serwery muszą działać bezawaryjnie i być zawsze dostępne.

Producenci wprowadzają do serwerów wiele rozwiązań, które mają to zapewnić. Ich celem jest zagwarantowanie usług nawet wtedy, gdy jeden z elementów systemu odmówi posłuszeństwa. Poniżej prezentujemy kilka z nich.

Nadmiarowe połączenia Ethernet

Rozwiązanie to stosuje wielu producentów serwerów. Sprzyja temu fakt, że wiele opcji oferowanych przez sieciowe jest opartych na uznanych standardach, takich jak IEEE 802.x (kontrola przepływu pakietów), IEEE 802.1Q (sieci VLAN) i IEEE 802.3ad (agregowanie połączeń).

W przypadku jednoportowych kart sieciowych dodatkowy adapter sieciowy zajmuje kolejne gniazdo. Ponieważ serwery zawierają ograniczoną liczbę gniazd, dostępne są karty sieciowe, na których znajduje się kilka portów Ethernet. Dysponując wieloportową kartą, administrator dzieli często sieć LAN na kilka segmentów, likwidując w ten sposób "wąskie gardła", które mogą powstawać w jednosegmentowej sieci.

Wieloportową kartę można też wykorzystać do zwiększenia dostępności serwera, konfigurując dwa porty znajdujące się na jednej karcie w ten sposób, aby obsługiwały ten sam segment sieci LAN. Jeśli pierwszy port ulegnie uszkodzeniu, pakiety są przekierowywane do drugiego, zapasowego portu, dzięki czemu serwer ma dalej kontakt z siecią.

Grupowanie sieciowych

Technologia polega na budowaniu grupy składającej się z wielu adapterów sieciowych (najczęściej z 2 do 8), które funkcjonują tak jakby były jedną kartą sieciową. Rozwiązanie takie stosuje w swoich serwerach HP. Po zastosowaniu opcji NFT (Network Fault Tolerance), ruch obsługiwany przez grupę jest automatycznie przesuwany z uszkodzonego portu do funkcjonującego poprawnie, co zwiększa dostępność serwera.

Administrator możne aktywować w obszarze grupy takie opcje, jak TLB (Transmit Load Balancing) czy SLB (Switch-Assisted Load Balancing). W pierwszym przypadku ruch wychodzący jest obsługiwany przez wszystkie porty wchodzące w skład grupy. Zwiększa to dostępność serwera, ponieważ komunikuje się on ze światem zewnętrznym przez kilka przełączników. W przypadku SLB identyczna metoda jest stosowana zarówno dla ruchu wychodzącego, jak i przychodzącego. Cały ruch obsługują wtedy wszystkie porty zainstalowane w przełącznikach, które są podłączone do adapterów sieciowych serwera wchodzących w skład grupy.

Badanie topologii sieci

Technologie zwiększające dostępność serwerów

Opcja FPF - Fast Path Failover

Istnieją też rozwiązania, dzięki którym serwer może się przystosowywać do zmieniającej się topologii sieci, co zwiększa jego dostępność. Jednym z nich jest INP firmy HP (Intelligent Networking Pack), badające topologię sieci (rozmieszczenie przełączników - zarówno tych z pierwszego, jak i z drugiego rzędu). Gdy topologia sieci ulega zmianie, INP odnotowuje to i kieruje pakiety optymalną ścieżką.

INP oferuje trzy opcje: APF (Active Past Failover), FPF (Fast Past Failover) i DCT (Dual Channel Teaming). APF gwarantuje, że serwer będzie się mógł komunikować z rdzeniem sieci nawet wtedy, gdy połączenie między przełącznikiem i rdzeniem sieci ulega uszkodzeniu. Po włączeniu tej opcji porty wchodzące w skład grupy monitorują bez przerwy połączenia sprzęgające serwer z rdzeniem sieci. Gdy ścieżka podstawowa ulega uszkodzeniu, ruch jest automatycznie kierowany do ścieżki zapasowej.

FPF definiuje najszybszą w danym momencie ścieżkę dostępu do przełącznika obsługującego rdzeń sieci, gwarantując tym samym, że serwer będzie wymieniać pakiety z siecią z maksymalną szybkością, jaką w danym momencie oferuje topologia sieci. Przykład - jeśli połączenie Gigabit Ethernet sprzęgające przełącznik brzegowy z przełącznikiem zainstalowanym w rdzeniu sieci ulegnie uszkodzeniu, FPF odnotowuje to zdarzenie i przekierowuje ruch na wolniejsze połączenie Ethernet 100 Mb/s. W następnym kroku ruch jest kierowany na alternatywne połączenie gigabitowe.

DCT pozwala administratorowi budować grupy składające się z kilku kart sieciowych. Grupa odbiera i transmituje pakiety, wspiera funkcję "load balancing" (równoważenie obciążeń) i zapewnia serwerowi redundancję w obszarze przełączników. Po zastosowaniu tej opcji dwie grupy kart sieciowych są postrzegane jako jedno połączenie sprzęgające serwer ze światem zewnętrznym. Jeśli jeden z przełączników ulega uszkodzeniu, serwer komunikuje się dalej z siecią, a administrator może spokojnie wymienić uszkodzony węzeł sieci na inny.

Testowanie warstwy sprzętowej i lokalizowanie uszkodzeń

Technologie zwiększające dostępność serwerów

Przykładowy wybór poziomu RAID dla serwerów HP ProLiant

Nawet najlepiej zaprojektowany serwer może odmówić posłuszeństwa. Aby przyspieszyć proces lokalizowania uszkodzeń i następnie umożliwić szybką naprawę serwera, stosuje się rozwiązania kontrolujące na bieżąco pracę poszczególnych elementów systemu obliczeniowego. Gdy jeden z elementów serwera ulegnie awarii (albo daje np. zbyt wiele błędów), natychmiast jest to odnotowywane i administrator jest informowany o tym fakcie.

Rozwiązanie takie stosuje w swoich serwerach np. IBM. Nosi ono nazwę Light Path Diagnostic. Jest to specjalny, widoczny z zewnątrz panel diagnostyczny, na którym znajduje się szereg diod. Jeśli jedna z nich zaświeci się, oznacza to, że określona część serwera (zasilacz, układ CPU, dysk twardy, pamięć RAM itd.) uległa awarii. Można wtedy od razu przystąpić do wymiany uszkodzonego podzespołu.


TOP 200