Serwery Lenovo X6 – nie ma mowy o przestoju

Materiał promocyjny Czas to pieniądz. Nawet kilkuminutowy przestój może spowodować znaczące straty w przedsiębiorstwie i na dobre wstrzymać procesy biznesowe.

Skutki awarii wpływają nie tylko na wewnętrzne funkcjonowanie firmy. Mogą one poważnie nadwyrężyć jej relacje z klientami, dostawcami i partnerami biznesowymi. Skutkiem jest rosnący brak zaufania, niszczący reputację firmy i ostatecznie mogący wyeliminować ją z biznesu. To dlatego stała i nieprzerwana dostępność usług stała się tak czymś tak ważnym, wpływając na każdy aspekt naszego życia i każdą branżę.

Zobaczmy jak to działa w praktyce:

Ochrona zdrowia – instytucje medyczne potrzebują stałego dostępu do danych o pacjentach i muszą działać w zgodzie z regulacjami prawnymi i branżowymi. Przestój systemu informatycznego skutkuje brakiem dostępu do informacji medycznych i wpływa na jakość opieki zdrowotnej. Może też prowadzić do braku ochrony prywatności pacjenta.

Bezpieczeństwo publiczne – służby reagujące w nagłych wypadkach działają w trybie 24 x 7 x 365. Awaria aplikacji może sparaliżować centra powiadamiania i ograniczyć skuteczność wspomaganej komputerowo pomocy, a w rezultacie skutkować większą liczbą ofiar wypadków i nadwyrężać zaufanie społeczne.

Usługi finansowe – organizacje finansowe zarządzają tysiącami transakcji na sekundę. Awaria – skutkując zakłóceniami w systemie transakcyjnym – może oznaczać stratę dochodów zarówno samej instytucji, jak i jej klientów. Może także wywołać problemy natury prawnej, narażać prywatność klientów i obniżać ich zaufanie do instytucji.

Przemysł – zakłady przemysłowe muszą utrzymywać ciągłość działania swoich linii produkcyjnych. Awaria systemu informatycznego może przynieść utratę dochodów oraz problemy związane z jakością produktów, dodatkowymi kosztami i zgodnością z regulacjami prawnymi i branżowymi.

Handel – handlowcy realizują swoje codzienne cele sprzedażowe. Awaria systemu transakcyjnego może oznaczać utratę transakcji i tak ważnych informacji, jak dane sprzedażowe i dane klientów. W efekcie przepadają szanse na osiągniecie zakładanych wyników sprzedaży oraz maleje reputacja firmy.

Ochrona – agencje ochrony strzegą budynki, firmy i instytucje przed zewnętrznymi zagrożeniami. Awaria aplikacji wspomagającej ochronę może zwiększać ryzyko przełamania zabezpieczeń, zmniejszać komfort korzystania z budynku i powodować problemy natury prawnej.

Awarie są największym zagrożeniem w przypadku aplikacji krytycznych dla funkcjonowania firmy czy instytucji. Jak wynika z badania „ITIC 2015 - 2016 Global Server Hardware, Server OS Reliability Report”, zdecydowana większość przedsiębiorstw (82%) wymaga obecnie zapewnienia ciągłości pracy serwerów na poziomie przynajmniej 99,99% w przypadku sprzętu o znaczeniu krytycznym, systemów operacyjnych i najważniejszych aplikacji biznesowych. Niemal wszystkie ankietowane firmy (98%) twierdzą, że koszty godziny przestoju przekraczają 100 tys., a 81% szacuje je na ponad 300 tys. USD. W ocenie jednej trzeciej badanych firm straty w wyniku godzinnej awarii przekraczają 1 mln USD. To są ogromne kwoty...

Spokój zapewnia RAS

Takie cechy, jak niezawodność serwera, jego dostępność i skuteczność serwisowania - określane wspólnym atrybutem RAS (Reliability, Availability, Serviceability) – mają kluczowe znaczenie w ograniczaniu niezaplanowanych przestojów systemu informatycznego.

Co składa się na poszczególne elementy RAS

Niezawodność (Reliability) – opiera się na wbudowanych w serwer funkcjonalnościach, które mają utrzymywać system w działaniu. Ich zadaniem są:

  • Detekcja błędów i funkcje samo-naprawy.
  • Minimalizowanie ryzyka awarii.
  • Zapewnienie w trybie ciągłym prawidłowego przetwarzania.

Dostępność (Availability) – odnosi się do działania systemu nawet w wypadku wystąpienia problemów i odpowiada za:

  • Ograniczanie częstotliwości i czasu trwania awarii.
  • Auto-diagnostykę: działanie z obejściem wadliwych komponentów lub i ich samo-naprawę.
  • Brak zatrzymań lub spowolnień pracy systemu.

Skuteczność serwisowania (Serviceability) – minimalizuje czas awarii/przestojów poprzez:

  • Unikanie powtórnych napraw dzięki prawidłowej diagnostyce.
  • Wykonywanie równoległych napraw wysoce awaryjnych podzespołów.
  • Łatwość naprawy i rozbudowy.

Do zapewnienia ciągłości działania biznesu i tym samym zwiększenia produktywności pracowników niezbędne jest zagwarantowanie ciągłości działania sprzętu serwerowego i systemów operacyjnych. Ale jak to zrobić? Wybór serwerów, które pod względem RAS należą do najlepszych na rynku, powinien znacznie ułatwić to zadanie. Liderem w tej kategorii są serwery System x firmy Lenovo. Wśród nich dwa - Lenovo System x3850 X6 oraz System x3950 X6 – mają takie funkcjonalności RAS, których w innych serwerach nie znajdziemy. Poprzez wykorzystanie zaawansowanej technologii samo-naprawy serwery X6 zapewniają maksymalną ciągłość działania – proaktywnie identyfikują potencjalne przyczyny awarii i bez wpływu na działanie systemu przeprowadzają odpowiednie działania naprawcze.

Pod względem RAS przypominają platformy mainframe, ponieważ oferują podobny do nich wysoki stopień integracji sprzętowo-programowej. Zastosowanie wbudowanych w serwer technologii składających się na RAS zapewnia wyjątkową dostępność systemu i niczym niezakłóconą wydajność, wymaganą przez krytyczne dla biznesu aplikacje. Z najnowszego badania ITIC 2015-2016 Global Server Hardware and Server OS Reliability Report wynika, że serwery Lenovo System x (oraz IBM Power System) są najbardziej niezawodnymi systemami w zestawieniu z serwerami HP ProLiant i Integrity, Dell PowerEdge oraz platformami sprzętowymi Oracle x86 i SPARC.

Pięć poziomów ochrony przed awariami

Serwery Lenovo X6 oferują pięć poziomów RAS (z których cztery wykraczają poza standardowe funkcjonalności RAS, dostępne w serwerach wyposażonych w procesory Intela).

1) Poziom standardowego RAS w serwerach opartych na procesorach Intela – Funkcjonalności RAS dostępne we wszystkich serwerach Lenovo:

  • Solidna ochrona przed błędami
  • Detekcja/korekcja błędów

2) Poziom Intel Run Sure Technology – to RAS klasy enterprise, dostępny wyłącznie w serwerach x3850 X6 i x3950 X6, wyposażonych w procesory Intel E7-4800/8800. Dotyczy takich funkcjonalności, jak:

  • MCA consumed error recovery
  • UPI faildown
  • Double device data correction (DDDC) for memory
  • PCIe live error recovery

3) Poziom Lenovo Platform RAS – platformowy poziom RAS, zapewniający większą dostępność poprzez następujące funkcjonalności:

Automated processor failover

Automated firmware backup

Automated memory page sorting and page retire

Advanced transaction recovery

4) Poziom Lenovo Management – zapewnia większe możliwości zarządzania RAS poprzez integrację oprogramowania X6 z platformami wirtualizacyjnymi takich producentów oprogramowania, jak:

  • VMware
  • Microsoft

5) Poziom modularnej konstrukcji X6 – budowa serwerów skraca czas serwisowania, umożliwiając szybką i łatwą wymianę wadliwych bądź modernizowanych komponentów:

Można wsuwać i wysuwać modularne podsystemy serwera (books) podobnie jak książki na półce.

Brak górnej pokrywy do zdejmowania, a moduły są łatwo dostępne zarówno z przodu, jak i z tyłu serwera.

Pięć powyższych poziomów RAS w serwerach X6 dodatkowo rozszerza rozwiązanie Lenovo xClarity, które odpowiada za centralne zarządzanie systemami:

  • Zapewnia administratorom narzędzia umożliwiające szybsze wdrażanie platform i łatwiejsze nimi zarządzanie.
  • Pozwala serwerowi „zadzwonić po pomoc”, gdy wykryje usterkę, aby został ona naprawiona zanim problem z potencjalnego zmieni się w rzeczywisty.
  • Zbiera i przesyła dane diagnostyczne, w tym: logi, dane serwisowe i inwentaryzacyjne, które pomagają zidentyfikować przyczynę problemu.

Więcej szczegółów na temat funkcjonalności RAS w serwerach X6 RAS pokazuje materiał wideo RAS Features of X6 Servers.