Uderzenie pioruna przyczyną niedostępności usług Amazon EC2 i Microsoft BPOS

Burza przechodząca nad Dublinem spowodowała awarię zasilania w centrach danych obsługujących usługi Amazon EC2 i EBS, a także Microsoft Business Productivity Online Standard Suite. O ile usługi firmy Microsoft udało się przywrócić po kilku godzinach, tak przywracanie pełnej dostępności usług cloud koncernu Amazon nadal trwa.

Przerwa w dostępności usług Amazon Elastic Compute Cloud, Amazon Elastic Block Storage i Microsoft Business Productivity Online Standard Suite to efekt burzy, która 7 sierpnia przeszła nad Dublinem. Wiadomo, że piorun, który uderzył w transformator elektryczny spowodował eksplozję i rozległy pożar w wyniku którego zniszczona została część infrastruktury energetycznej zasilającej centra danych firm Amazon i Microsoft. Uszkodzone zostały m.in. awaryjne agregaty prądotwórcze, system kontroli zapasowego centrum zasilania oraz część sprzętu serwerowego. Nastąpiło też rozsynchronizowanie faz zapasowych generatorów. Wskutek uderzenia pioruna ucierpiały m.in. centra danych osługujące europejskich użytkowników usług hostingowych Amazon EC2 oraz oprogramowania Microsoft BPOS. W efekcie niedostępne stały się witryny i usługi świadczone na bazie rozwiązań koncernu Amazon. Podobnie wspomniane oprogramowanie biznesowe firmy Microsoft. Dopiero po trzech godzinach od awarii udało się przywrócić zasilanie infrastruktury sieciowej. Przedłużyły się natomiast procedury mające na celu przywrócenie sprawności serwerów. Cztery godziny po przywróceniu zasilania ponownie uruchomiona została pełna funkcjonalność oferowanego w formie usługi oprogramowania pakietu Microsoft BPOS.

Natomiast przywrócenie pełnej sprawności infrastruktury odpowiedzialnej za funkcjonowanie oferowanych w modelu cloud usług firmy Amazon może potrwać nawet dwa dni. "Skala zakłóceń w zasilaniu serwerów spowodowała, że obecnie wiele urządzeń musi zostać ponownie skonfigurowana ręcznie. Zakładamy, że proces przywracania danych i konfiguracji potrwa od 24 do 48 godzin" - czytamy w opublikowanym niecałe 12 godzin po awarii oświadczeniu firmy Amazon. Tam, gdzie jest to możliwe przedstawiciele firmy Amazon zalecają swoim klientom przeniesienie instancji EC2 do innych stref dostępności. Niewykluczone, że części danych nie uda się przywrócić. Warto wspomnieć, że największa do tej pory awaria infrastruktury Amazon EC2 miała miejsce w kwietniu 2011 roku. Wskutek szeregu następujących po sobie awarii sprzętowych nastąpiły poważne problemy z dostępnością usług świadczonych ze zlokalizowanego w stanie Virginia centrum danych firmy Amazon.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200