Błąd na błędzie błędem pogania

Lokalizacja

Kolejne błędy w konstrukcji planów awaryjnych są związane z fizyczną lokalizacją siedzib firm i ich centrów danych. Wiele z nich znajduje się zazwyczaj w miejscach gęsto zaludnionych, co utrudnia jakąkolwiek akcję awaryjną czy wręcz powoduje dodatkowe ryzyko. Przykładowo: kilka lat temu jedna z niemieckich instytucji finansowych zbudowała w jednym z miast nową siedzibę ze wspaniałym centrum przetwarzania (śmiano się nawet, że to raczej katedra informatyki, a nie centrum komputerowe). Pech chciał, że w okolicy dokonano napadu na sklep. Policja rozpoczęła pościg za bandytami, nastąpiła strzelanina, dwie kule wpadły przez okno do jednego z pomieszczeń budynku. W efekcie na trzy dni zamknięto budynek w celu zebrania dowodów. Żaden z pracowników nie mógł wejść do budynku ani wykonać operacji z użyciem systemu komputerowego.

Nieuwzględnianie w planach awaryjnych niefortunnych decyzji służb publicznych może mieć katastrofalny wpływ na działalność firmy. Jeśli np. w budynku wybuchnie pożar, to cały budynek od momentu zgłoszenia pożaru przechodzi pod zarząd straży pożarnej. Dopóki nie zezwoli ona na ponowne wejście do niego, staje się niemożliwe kontynuowanie w nim pracy. Przekonał się o tym boleśnie jeden z amerykańskich banków. W jego nowym kilkudziesięciopiętrowym biurowcu w Filadelfii wybuchł pożar. Okazało się, że zapaliła się instalacja elektryczna, wykonana przez nieuczciwego podwykonawcę z materiałów, które nie powinny być wykorzystane w tego typu budynkach. W związku z tym w wyniku działania ognia nastąpiło skażenie uwolnionymi związkami chemicznymi. Od trzech lat budynek stoi pusty i prawdopodobnie zostanie wyburzony.

Problemy rozwiązań mobilnych

Inne problemy są związane z wykorzystywaniem rozwiązań mobilnych, czyli ciężarówek wyposażonych w sprzęt niezbędny do uruchomienia awaryjnego centrum danych lub punktu pracy użytkowników. Rozwiązania te nie są jednak popularne w Polsce (jedynym centrum mobilnym dysponuje w tej chwili tylko Hewlett-Packard). Przewidując wykorzystanie centrum mobilnego, należy uwzględnić wszelkie ograniczenia, jakim podlegają takie pojazdy.

Przykładowo: jeden z banków w Wlk. Brytanii podpisał porozumienie z dostawcą rozwiązań na awaryjne uruchomienie alternatywnego ośrodka przetwarzania w ciężarówce wyposażonej w niezbędny sprzęt oraz generator prądu. Dostawca zobowiązał się dostarczyć alternatywny ośrodek przetwarzania w ciągu sześciu godzin od zgło- szenia awarii. Podczas awarii taśmy zawierające backup danych przewieziono helikopterem do dostawcy rozwiązania. Ten wysłał ciężarówkę, a w trakcie jej jazdy do banku (4 godziny) pracujący w środku konsultanci odtworzyli zawartość wszystkich taśm: system, aplikacje i dane. Po przyjeździe wystarczyło jedynie połączyć sieć ciężarówki z siecią banku, by wznowić przetwarzanie. Kiedy ciężarówka dojechała na miejsce, okazało się jednak, że jest zbyt duża, by zaparkować z tyłu budynku, a z przodu nie pozwolono jej stanąć, gdyż bank mieścił się przy głównej ulicy w mieście.

Świadomość a rzeczywistość

Różne postrzeganie dostępności systemów informatycznych może stanowić problem. Rozbieżność wynika z różnicy między wyobrażeniem o przebiegu procedury odtwarzania danych a rzeczywistością związaną z odtwarzaniem.

Zazwyczaj procedurę odtwarzania systemu postrzega się jako proces rozpoczynający się tuż po katastrofie, który polega na odtworzeniu danych pochodzących z ostatniej kopii awaryjnej (wykonanej nie później niż 24 godziny przed wystąpieniem katastrofy), co w idealnym modelu trwa nie dłużej niż 12 godzin, i przywróceniu pełnej zdolności przetwarzania danych w ciągu kolejnych 48 godzin. Od chwili katastrofy do przywrócenia pełnej zdolności przetwarzania są wykonywane procedury awaryjne, a po przywróceniu, następuje powrót do zwykłych procedur.

Rzeczywistość odtwarzania danych wygląda jednak inaczej. Nawet mimo odtworzenia danych z ostatniej kopii, powrót do zwykłych procedur może być niemożliwy. W wyniku katastrofy tracone są bowiem wszystkie dane przetwarzane od czasu wykonania ostatniej kopii bezpieczeństwa do momentu katastrofy. W przypadku firm prowadzących działalność finansową strata danych z ostatniej doby może być równoznaczna z upadkiem firmy.

W rzeczywistości nie zawsze daje się odtworzyć dane. Jeśli zniszczeniu uległy nie tylko dyski i serwery, ale też urządzenia archiwizujące, to odtworzenia danych dokonuje się na innym urządzeniu - nie zawsze takim samym jak podstawowe - i na innym serwerze. Może się okazać, że urządzenia te nie spełniają parametrów niezbędnych do poprawnego odtworzenia danych, przez co okres ten wydłuża się dodatkowo o czas niezbędny do zakupu nowych urządzeń. Nawet po przeprowadzeniu odtworzenia danych nie można jeszcze uznać całej operacji za zakończoną sukcesem. Konieczne jest bowiem odtworzenie (w sposób manualny) na tyle, na ile to możliwe, brakujących, nie zarchiwizowanych danych. Konieczność ta uniemożliwia powrót do zwykłych procedur. W rezultacie więc konieczne jest stosowanie równolegle procedur podwójnych: zarówno awaryjnych, jak i zwykłych.


TOP 200