Klastry serwerów - Systemy Novella i Microsoftu

Konserwacja sprzętu i oprogramowania

Jednym z większych problemów związanych z administrowaniem serwerem jest zarządzanie i planowanie konserwacji, szczególnie gdy związane jest to z uaktualnianiem systemu, podczas którego serwer jest nieczynny.

Jednym z interesujących mechanizmów klastrowych Windows 2000 jest jego zdolność do wykonywania uaktualnień systemu sposobem falowym. Pozwala on na szeregowe uaktualnianie węzłów klastra - jednego w danym czasie - zapewniając ciągłą dostępność usług i zasobów oferowanych przez klaster. Pozwala to administratorom uaktualnić system do poziomu nowego service pack lub nowej wersji systemu operacyjnego, bez przerywania usług dla użytkownika. Dla wykonania tej operacji potrzebne są pewne kroki wstępne. Węzeł, który ma być uaktualniany, musi być usunięty z klastra - aby to wykonać, należy przedtem zatrzymać usługi klastra. Po uaktualnieniu systemu operacyjnego przebudowany węzeł można z konsoli sterującej dołączyć z powrotem do istniejącego klastra.

Rozkładanie obciążeń w sieci

Oprogramowanie NLB rozdziela ruch IP na poszczególne serwery w sieci pracujące w klastrze. NLB tworzy pojedynczy wirtualny adres sieciowy IP dla wszystkich serwerów operujących w klastrze. Z punktu widzenia klienta klaster widziany jest jako pojedynczy adres IP. W teorii każde zlecenie ze strony klienta jest rozdzielane pomiędzy różne serwery webowe.

Wykrywanie uszkodzeń i odtwarzanie

Uszkodzenia serwera powinny wywoływać proces odtwarzania, automatycznie restartujący aplikacje lub cały wsad pracy serwera na maszynie zastępczej w klastrze. Proces ten, od wykrycia do odtworzenia, powinien przebiegać bardzo szybko. W przypadku Windows 2000 wydłuża się czasami do kilku minut. Compaq udostępnia w pakiecie aplikację CAU (Compaq Array Utility), która pozwala na sprawdzanie urządzeń lustrzanych lub macierzy RAID i ich konfiguracji, logicznej i fizycznej. Program ten nie pracuje jednak w sposób ciągły i dlatego nie może automatycznie alarmować użytkownika, gdy pojawią się uszkodzenia dysków. Windows Event Viewer także ujawnia uszkodzone dyski, lecz podobnie jak CAU musi być cały czas otwarty, aby można było w porę dostrzec zaistniały problem.

Ponieważ narzędzia te normalnie nie są cały czas aktywne, to może powstać niebezpieczna sytuacja. Jeżeli uszkodzenie nastąpi na dysku lustrzanym lub dysku macierzy RAID w klastrze, administrator serwera prawdopodobnie tego nie zauważy. Drugie uszkodzenie dysku lustrzanego lub kolejnego dysku w macierzy RAID spowoduje utratę zasobu. W tej sytuacji zaleca się instalowanie w systemie pułapek SNMP dla każdego dysku i innego sprzętu. Pułapki te mogą wyłapać uszkodzenia sprzętu i przesłać alarm na konsolę zarządzającą SNMP.

Obejście uszkodzenie i przywrócenie do pracy

Windows 2000 zapewnia elastyczny system, w którym można deklarować pojedynczy węzeł, grupę węzłów lub brak węzła w roli preferowanego właściciela zasobu. Preferowana przynależność wyznacza, jakie usługi klastra są pod kontrolą każdego z węzłów klastra. Ustawienia te są wykonywane w oparciu o usługi, można także ręcznie przenosić usługi dyskowe - takie jak grupy klastrów i serwer SQL - pomiędzy węzłami. Można również ustawić sposób wykonywania przywrócenia zasobu do pracy. Do wyboru jest akcja natychmiastowa lub po okresie liczonym w pełnych godzinach.

Do instalowania, konfigurowania i testowania macierzy RAID i dysków lustrzanych używane jest CAU. Normalną procedurą jest rozdzielanie poszczególnych usług pomiędzy węzły klastra, jednak po wykonaniu tego uruchomienie CAU nie jest możliwe. Nie współdzielone środowisko wymaga, aby wszystkie usługi pracowały na pojedynczym węźle klastra, z innym węzłem jako gorącą rezerwą. Rozdzielanie usług pomiędzy węzły klastra nie może być wykonane, jeżeli chce się użytkować CAU. Microsoft i Compaq pracują nad rozwiązaniem tego problemu. Doraźnym krokiem jest przeniesienie wszystkich opartych na dyskach usług do tego samego węzła klastra, zanim uruchomi się CAU. Można wtedy wykonać wszelkie niezbędne czynności administracyjne i konserwacyjne przewidziane w CAU. Po ich wykonaniu należy zamknąć CAU i wykonać redystrybucję obciążeń. Microsoft uważa, że uruchamianie CAU nie jest rutyną codzienną, ale przyznaje jednocześnie, że ten ręczny proces jest „złem koniecznym” niepodzielnego środowiska.

Windows 2000 dostarczany jest z podręcznikiem Getting Started, opisującym wszystkie nowości w Windows 2000 Advanced Server. Podręcznik zawiera także uwagi do planowania, instalowania, uruchamiania utility setup, uaktualniania i instalowania węzłów klastra, omawia system odtwarzania i identyfikowania problemów. Microsoft Deploymet Planning Guide zawiera natomiast szczegółowe informacje na temat wdrażania klastrów serwerów oraz rozkładania obciążeń i jest dostępny na stronach webowych firmy.

Oprogramowanie Windows 2000 Cluster Services jest łatwe do zainstalowania, a dołączanie lub usuwanie serwerów z klastra jest stosunkowo proste. Konsola zarządzająca jest intuicyjna i oferuje dobrą informację o stanie klastra.

Można jednak znaleźć kilka obszarów, gdzie ulepszenia są bezwzględnie potrzebne. Wiele operacji obchodzenia uszkodzeń i odtwarzania wymaga ręcznej interwencji. Alarmy dotyczące uszkodzeń sprzętu nie są prezentowane automatycznie administratorowi. Gdy zdarzy się uszkodzenie dysku, pojawia się zbyt wiele ramek dialogowych koniecznych do odtworzenia usługi.

Mimo pewnych niedostatków Windows 2000 Advanced Server można uznać za równoważnego konkurenta klastrów serwerowych oferowanych na platformach Unix, NetWare czy Linux.


TOP 200