Sieciowe narzędzia analityczne i diagnostyczne - czyli kilka słów o tym jak proaktywnie zapewniać działanie usług w data center

Wymagania jakie stawiają przed Data Center nowoczesne platformy IT i technologie programistyczne powodują, że zmieniają się wzorcowe modele infrastruktury sieciowej. Znany dotąd tradycyjny model dwuwarstwowy oparty na spanning tree z modularnymi przełącznikami dystrybucyjnymi zastępuje sieć w pełni routowalna, oparta o architekturę leaf-spine oraz warstwę tunelującą VXLAN. To duże zmiany. Nowoczesne sieci potrzebują w związku z tym zaawansowanych mechanizmów zarządzania, monitorowania i analizowania ruchu, aby oferować utrzymanie odpowiedniego poziomu niezawodności działania systemów i śledzić zachodzące w nich zmiany.

O trendach w rozwoju systemów sieciowych, nowoczesnych narzędziach do wspomagania zarządzania i diagnozowania problemów komunikacji w Data Center dla Computerworld mówi Grzegorz Gondek, specjalista ds. rozwoju rozwiązań Data Center w Cisco Systems.

Jakie są główne kierunki rozwoju infrastruktury sieciowej wykorzystywanej w centrach przetwarzania danych?

Zacznę od tego, że sieci w Data Center w ostatnich latach mocno ewoluowały. W jednym środowisku muszą pracować maszyny wirtualne, fizyczne oraz coraz częściej kontenery. Aplikacje zabezpieczane są za pomocą mikrosegmentacji, która definiuje różne poziomy dostępu do poszczególnych komponentów w obrębie tej samej podsieci. Nasi klienci bardzo często zarządzają kilkoma środowiskami Data Center jednocześnie. Dodatkowo, żeby poradzić sobie z jednoczesnym łączeniem różnych środowisk i umożliwić konfiguracje wysokiego poziomu zabezpieczeń, firmy najczęściej korzystają z sieci programowalnych opartych o VXLAN - Software Defined Networks. Wynik? Duża liczba wykorzystywanych technologii, wysoki stopień skomplikowania infrastruktury i oczekiwanie utrzymania ciągłej dostępności usług powodują, że zarządzanie i utrzymanie sieci w Data Center jest sporym wyzwaniem. Sprawę ułatwia nieco wykorzystanie sieci SDN Cisco, gdzie zarządzanie całością infrastruktury przejmuje na siebie kontroler. To co jednak sprawia wiele trudności to poszukiwanie błędów, rozwiązywanie codziennych problemów, odpowiadanie na pytanie co jest źródłem awarii, jaki jest jej powód i zasięg.

Sieci w Data Center utrzymywane są od lat. Czy narzędzia wykorzystywane do ich zarządzania i utrzymania również się zmieniają?

Tak, to co sprawdzało się w przypadku tradycyjnych topologii dwuwarstwowych, opartych o spanning tree, dziś często nie wystarcza. Poszukiwanie problemu poprzez logowanie się na poszczególne urządzenia, ręczne wykonywanie prób, sprawdzanie tablic i konfiguracji zabiera mnóstwo czasu, jest zadaniem punktowym i pracochłonnym. Wiele awarii jest wielowymiarowych i współzależnych. Znalezienie źródła problemu wymaga opanowania, doskonałej wiedzy i precyzji, a czasem trochę szczęścia. Dodatkowo stare narzędzia i protokoły nie są często przystosowane do przepustowości nowych urządzeń i dynamiki zmian obecnych w sieciach Data Center. Protokół netflow nie dostarcza pełni informacji o ruchu i ciężko wyskalować go w środowisku z łączami 100G do przełączników szkieletowych, statystyki SNMP są powolne i wymagają sporo zasobów.

O najnowszych narzędziach do monitorowania sieci i przeciwdziałania awariom, które ma do zaoferowania Cisco mowa będzie podczas webinarium:

NARZĘDZIA ANALITYCZNE I DIAGNOSTYCZNE CZYLI O TYM JAK PROAKTYWNIE UTRZYMYWAĆ USŁUGI W DATA CENTER

które odbędzie się 16.12.2020 o godzinie 11:00, udział w nim jest bezpłatny, a rejestracja jest dostępna pod adresem https://e-seminaria.pl/Cisco-Data-Center

Serdecznie zapraszamy do udziału.

W nowoczesnej sieci możemy polegać na telemetrii. Aby odpowiedzieć na pytanie o źródło awarii i dostępność systemów narzędzia diagnostyczne zbierają ruch jednocześnie z całej sieci, o każdym pakiecie i czasie przetworzenia. Analizowany jest stan wszystkich urządzeń sieciowych, ich oprogramowania, procesów, następnie dane są korelowane i porównywane ze wzorcami. W wyniku tego administrator jest w stanie na bieżąco wskazywać miejsce utraty pakietów, powód awarii, dotknięte urządzenia klienckie i skojarzone z tym problemy. Dzięki nowoczesnym narzędziom klienci mogą szczegółowo śledzić ścieżkę dowolnego przepływu w czasie rzeczywistym bądź historycznie i określić, czy liczba wysłanych i odebranych pakietów się zgadza, a w przypadku niezgodności wskazać dokładne miejsce utraty danych. Gdy ruch gubi się na przełączniku lub firewall-u, wtedy za pomocą narzędzi Cisco możliwe jest wskazanie miejsca wystąpienia problemu, określenie czy dotyczy sieci podkładowej czy nakładkowej, skali zjawiska oraz powiązanych z nim zdarzeń. Narzędzia o których mowa noszą nazwę Nexus Dashboard.

Więc te narzędzia pozwalają połączyć informacje z wielu miejsc sieci i na tej podstawie wyciągają wnioski?

Ogólnie tak, ale robią też więcej. Poza badaniem sytuacji bieżącej, system analityczny stara się wyłapać źródła problemów, zanim staną się przyczyną prawdziwej awarii. Szereg kłopotów system jest w stanie wychwycić na podstawie symptomów, które niekoniecznie jeszcze przerodziły się w wielki problem. Np. pojawiające się błędy na interfejsach, pętle w routingu, nakładające się połączone sieci z tą samą adresacją itd. mogą zostać wychwycone na podstawie wzorców kilku tysięcy zgłoszeń serwisowych wbudowanych w szkielet rozwiązania. Jeśli system zidentyfikuje taki scenariusz, wtedy ostrzeże administratora i zaproponuje rozwiązanie, zanim dojdzie do poważnej awarii, często pomagając uniknąć kataklizmu. Rozwiązanie działa proaktywnie, ostrzegając, analizując zmiany i wskazując podatności oraz odejścia od najlepszych praktyk.

Czy każda sieć Data Center mogłaby skorzystać na posiadaniu systemu, który w porę ostrzeże o kłopotach i pomoże znaleźć ich przyczynę?

W zasadzie tak, to prawda, ale nie każdy dostawca jest w stanie dostarczyć takie narzędzia. Cisco opiera swoje przełączniki na własnych układach scalonych - ASIC-ach, których nie ma nikt inny na rynku. Wspomniana telemetria, czyli pełna informacja o ruchu, generowana jest w sposób nieobniżający wydajności przełącznika, zapewniając pracę z pełną przepływnością urządzenia. Środowisko wymaga oczywiście danych o ruchu, ale także odpowiednich algorytmów działających na bazie dostarczonej wiedzy. Jest to wiedza zdobyta przy implementacji olbrzymiej liczby działających u naszych klientów przełączników Cisco Nexus, baza rozwiązanych przez lata zgłoszeń serwisowych, doświadczenia inżynierów wsparcia, to wszystko łącznie zaprogramowane w postaci modeli matematycznych stanowi największą wartość rozwiązania. Cisco w ramach sieci SDN pozwala monitorować i śledzić problemy zarówno środowiska podkładowego (underlay) jak i sieci nakładkowej (overlay). Jest to olbrzymia przewaga nad rozwiązaniami innych firm, gdzie każdą z sieci często należy zarządzać oddzielnie. Analityka pozwala wyprzedzić pewne zdarzenia zanim będą miały miejsce.

W czym konkretnie może pomóc zastosowanie takiej analityki?

Może na przykład pomóc lepiej przygotować się do okna serwisowego, sprawdzić w jaki sposób i przez ile aktualizacji należy przejść, aby uzyskać pożądaną wersję oprogramowania na przełączniku. Czy będzie zgodna z posiadaną konfiguracją i czy aktualizacja będzie wymagała przerwy w pracy urządzenia. Zmniejszamy ryzyko wystąpienia niespodzianki podczas aktualizacji środowiska. Rozwiązanie może przeanalizować skutki wydania konkretnych komend, odpowiedzieć na pytanie co się stanie ze środowiskiem po wydaniu zadanych poleceń. Narzędzia nie zastępują administratorów sieci, ale w znacznym stopniu ułatwiają im pracę i zwiększają jej efektywność. Czasami w roku jest tylko kilka okien serwisowych dla wszystkich zespołów IT, które dzięki wykorzystaniu analityki można lepiej wykorzystać.

Czy to rozwiązanie jest drogie?

Nie, koszt rozwiązania Nexus Dashboard zależny jest od liczby nadzorowanych przełączników Nexus 9000. Środowisko wymaga urządzenia – (appliance) zbierającego i analizującego dane w sieci klienta. Wszystko odbywa się na miejscu, bez wysyłania danych na zewnątrz. Zaletą rozwiązanie jest to, że działa zarówno z sieciami SDN jak i z infrastrukturą tradycyjną. Cena rozwiązania to oczywiście rzecz względna. Każdy sam powinien ocenić, ile dla firmy lub jej klientów warty jest czas odtwarzania środowiska po awarii spowodowanej niedostępnością sieci. Czasem wiąże się to z poważną utratą wizerunku lub zaufania partnerów, które bardzo ciężko odrobić, a można tego uniknąć.

Co powinni zrobić czytelnicy, którzy chcą dowiedzieć się więcej o narzędziach Cisco?

Zapraszam serdecznie do kontaktu z zespołem Data Center w biurze Cisco Polska oraz partnerami handlowymi Cisco. Już za kilka dni, podczas webinaru IDG, zaprezentujemy bliżej możliwości rozwiązania analitycznego dla Cisco Data Center. Zapraszamy do rejestracji.

O najnowszych narzędziach do monitorowania sieci i przeciwdziałania awariom, które ma do zaoferowania Cisco mowa będzie podczas webinarium:

NARZĘDZIA ANALITYCZNE I DIAGNOSTYCZNE CZYLI O TYM JAK PROAKTYWNIE UTRZYMYWAĆ USŁUGI W DATA CENTER

które odbędzie się 16.12.2020 o godzinie 11:00, udział w nim jest bezpłatny, a rejestracja jest dostępna pod adresem https://e-seminaria.pl/Cisco-Data-Center

Serdecznie zapraszamy do udziału.