Co robić, gdy vSphere nie działa

Dobre wskazówki

Trudno wskazać najczęstszą przyczynę awarii, ale zgłoszenia dotyczące dostępności usług umożliwiają szybkie zawężenie obszaru poszukiwań. Na przykład udane połączenie do vCenter oznacza, że działa sieć, usługa DNS i vCenter, że ten LUN w sieci SAN, z którego korzysta maszyna vCenter, jest sprawny i że serwer vCenter może połączyć się z hostem ESX. Innymi słowy - rozumienie zasady działania infrastruktury umożliwia szybkie wykluczenie niektórych przyczyn.

Większość problemów z infrastrukturą dotyczy hostowanych systemów, zatem należy sprawdzić hostowany OS, podłączając klienta vSphere do konsoli. Czy maszyna się załamała? Czy usługi i procesy aplikacji działają? Jeśli to jest problem hostowanego OS lub aplikacji, należy to rozwiązać w pierwszej kolejności.

Niedostateczna wydajność

Jeśli serwer działa, maszyna również razem z hostowanym systemem, ale czas odpowiedzi jest zbyt długi, należy sprawdzić wskaźniki wydajności maszyn wirtualnych. Wskaźniki podawane przez klienta vSphere dają pogląd na pracę maszyny. Częstą przyczyną jest niedostateczna ilość przydzielonej pamięci RAM (efekt widoczny w postaci wzrostu zapotrzebowania do 100%) lub nadmierne jej wykorzystanie (na przykład wyciek pamięci w jakiejś aplikacji, to można sprawdzić za pomocą Menedżera Zadań Windows). Jeśli jest to niepożądana aplikacja, proces można zamknąć, z kolei pożądanej aplikacji można przydzielić więcej pamięci. Jeśli w maszynie wirtualnej jest włączona opcja hot-plug memory, proces dodawania pamięci można wykonać bez restartu hostowanego systemu.

Trzeba sprawdzić wszystko

Aby diagnoza przyczyn awarii była poprawna, należy sprawdzić wszystkie składniki, które odpowiadają za pracę infrastruktury. Są nimi:

Fizyczne serwery - należy sprawdzić, czy są zasilane, czy elementy, takie jak CPU, pamięć i dyski lokalne, są sprawne.

Sieć LAN - umożliwia połączenie między serwerami, przełącznikami, urządzeniami SAN/NAS, serwerami DNS, użytkownikami i aplikacjami, w tym vSphere client.

Współdzielony storage - zazwyczaj jest to SAN lub NAS i awaria również może mieć wpływ na pracę infrastruktury wirtualizowanej.

ESX oraz ESXi Hypervisor - "system operacyjny" działający na sprzęcie, który również musi działać, przyjmować połączenia. Problemy mogą się pojawić w przypadku jego załamania, nazywanego PSOD (purple screen of death).

vCenter - chociaż vCenter nie jest wymagany do pracy serwerów, administratorzy potrzebują go, by analizować stan infrastruktury oraz inicjować działania takie jak vMotion.

Maszyny wirtualne - działający wewnątrz nich system operacyjny może przerwać pracę z błędem STOP, co z kolei może powodować przerwy w pracy usług, takich jak DNS, Active Directory, vCenter i innych.

Aplikacje pracujące w maszynach wirtualnych oraz ich składniki - awaria jednego ze składników (na przykład bazy danych) może powodować niedostępność aplikacji.


TOP 200