Sieci odporne na awarie

Niezawodność infrastruktury sieciowej to podstawa działania każdego nowoczesnego przedsiębiorstwa. Sprzęt elektroniczny bywa jednak zawodny, co może powodować konkretne straty finansowe. Istnieją jednak mechanizmy, które pozwalają zminimalizować ryzyko niedostępności sieci w razie awarii urządzeń sieciowych.

Wysoka dostępność HA (High-Availability) w sieci to zapewnienie ciągłości działania usług, gdy zawiodą komponenty poszczególnych systemów. Systemy HA umożliwiają wykrycie problemów sprzętowo-programowych oraz zapewniają niezbędne mechanizmy automatycznego przywrócenia funkcjonalności. Wszystko odbywa się bez konieczności podejmowania interwencji administracyjnej. Zapewnienie wysokiej dostępności sieci komputerowej jest najczęściej realizowane w warstwie drugiej i trzeciej modelu OSI.

Redundancja warstwy drugiej

W związku z redundancją warstwy drugiej, warto powiedzieć o agregacji portów fizycznych przełącznika oraz mechanizmach zapobiegania powstawaniu pętli w środowisku wielościeżkowym.

Dzięki ostatnio zaprezentowanym specyfikacjom łączy Ethernet o przepustowości 40G oraz 100G, agregacja łączy będzie preferowaną metodą tworzenia wysoce wydajnych połączeń szkieletowych. Agregacja łączy - opisywana przez standard IEEE 802.3ad - scala wiele fizycznych portów w jeden port logiczny. W tej sytuacji nawet jeżeli jedno z łączy fizycznych ulegnie awarii, nie wpływa to na pracę danej ścieżki logicznej. Przepustowość nie zawsze będzie się skalowała wraz ze wzrostem liczby uczestniczących w agregacji portów. Zazwyczaj przeprowadzana będzie dystrybucja przepływów między portami, składającymi się na grupę łączy agregowanych. Typowo przełącznik sprawdza zawartość przepływów i wykorzystuje specyficzne algorytmy do przydzielenia dla każdego przepływu odpowiedniego członka LAG (Link Aggregation Group). Większość obecnie dostępnego sprzętu sieciowego pozwala rozproszyć fizyczne ścieżki, nawet między wiele kart liniowych w urządzeniach modularnych. Nawet gdy karta liniowa przełącznika ulegnie uszkodzeniu, użytkownicy nie powinni odczuć skutków awarii.

Jak działa protokół VRRP (Virtual Router Redundancy Protocol)

Jak działa protokół VRRP (Virtual Router Redundancy Protocol)

Jeżeli wykorzystujemy przełączniki sieciowe, oczywistą metodą redundancji będzie realizacja zapasowych połączeń między nimi. Okażą się one niezwykle pomocne, gdy łącze lub sprzęt zawiedzie, ponieważ całość ruchu będzie mogła zostać skierowana na alternatywne ścieżki. Przełączenie na ścieżkę zapasową będzie jednak trwało określony czas, w którym nie będzie odbywał się żaden ruch sieciowy. Przeważnie czas przełączenia alternatywnej ścieżki na poziomie kilku minut jest akceptowalny, bo wymiana i rekonfiguracja urządzenia i tak trwałaby zdecydowanie dłużej. W dobrze skonfigurowanej sieci użytkownicy nie powinni jednak zauważyć awarii.

Zapewnienie redundancji w sieciach Ethernet będzie typowo oznaczało wdrożenie mechanizmów STP (Spanning Tree Protocol). Mechanizmy te pracują w warstwie drugiej modelu OSI. Podstawową ich funkcją jest zapobieganie powstawaniu pętli, które tworzą redundantne łącza warstwy drugiej. Poprzez wymianę komunikatów BPDU między przełącznikami, mechanizm STP decyduje o ewentualnym blokowaniu lub odblokowaniu ruchu na danym porcie. Wadą mechanizmów STP jest powolna konwergencja, która jest ściśle uzależniona od konfiguracji parametrów czasowych. W przeciwieństwie do STP, mechanizm RSTP (Rapid STP) reaguje znacznie szybciej. Problemem obu mechanizmów są jednak niezbyt wydajne działania w przypadku pracy w dużej sieci. Wdrożenie mechanizmów STP/RSTP będzie wiązało się z koniecznością dostrojenia konfiguracji. Nawet w przypadku wykorzystania RSTP (802.1w), którego czas konwergencji jest stosunkowo niski, warto poeksperymentować z ustawieniami.