Informatyczna Formuła 1

Subskrybuj RSS A A A
6 listopada 2007

Wysoka dostępność systemów informatycznych tylko do pewnego stopnia jest pochodną dobrej infrastruktury. W równie dużym stopniu to efekt umiejętnego zarządzania organizacją, procesami i zespołem. Tak jak w wyścigach Formuły 1 we współczesnej informatyce sukces jest efektem działania zespołowego.


Odwołując się do Formuły 1, można podać przykład - wymianę opon. Ekipa techniczna ma na to dosłownie kilka sekund, ale przedtem następuje mozolne dobieranie właściwych opon do nawierzchni, temperatury oraz stanu zużycia poprzednich; potem przygotowuje się do ich założenia. Gdy Robert Kubica zjeżdża do boksu, przez dosłownie kilka sekund należy odkręcić śruby, zdjąć stare koła, założyć nowe i ponownie dokręcić śruby. Czas i wysiłek poświęcony na przygotowanie zmiany jest stosunkowo długi w porównaniu z czasem jej "wdrażania", zaś kluczowe jest umiejętne skalkulowanie ryzyka.

Nie mniej złożona, choć pewnie mniej efektowna od wymiany kół, jest wymiana dysków. Pamiętajmy, że maszyny działającej w trybie wysokiej dostępności nie można tak po prostu wyłączyć. Jedna z możliwych opcji to przygotowanie serwera zapasowego, przeniesienie na niego wszystkich danych, błyskawiczna "podmiana" serwerów. Potem trzeba wykonać odpowiednie operacje na dyskach, szybko sprawdzić nowe dyski, z powrotem "podmienić" serwer i na koniec upewnić się, że żadne dane i transakcje nie zostały zagubione lub zmienione podczas tej skomplikowanej operacji.

Dość pełne i spójne definicje, czym jest zarządzanie operacyjne i taktyczne informatyką, daje standard ITIL. Jednak sam standard nie zawiera definicji procesów; nie da się ich też w żaden sposób "kupić" (choć na pewno znajdą się chętni, by je naszej organizacji "sprzedać" i "wdrożyć"). Trzeba je zbudować samemu, stosownie do rozmiaru organizacji, poziomu jej dojrzałości, specyfiki klienta oraz poziomu kosztów, które decydenci są skłonni ponieść.

W strefie śmierci

Powyżej 99% dostępności rozciąga się "strefa śmierci", w której najmniejszy błąd oznacza niespełnienie oczekiwań i umów SLA. 0,1% niedostępności systemu w przypadku reżimu 24x7 to ok. 40 min w ciągu miesiąca. Akurat tyle, żeby przeprowadzić czynności absolutnie niezbędne, jak np. instalacja krytycznych łatek do systemu operacyjnego. Zaś np. błąd krytyczny, powodujący konieczność ponownego uruchomienia aplikacji, oznacza wyczerpanie praktycznie całego "zapasu" dopuszczalnego czasu niedostępności.

W "strefie śmierci" z pomocą częściowo przychodzą rozwiązania techniczne: klastrowanie serwerów i baz danych, redundancja łączy, budowanie infrastruktury zapasowej oraz instalacja i regularne testowanie mechanizmów failover. Chronią one przed przerwami wynikającymi z przyczyn trudnych do przewidzenia: awarią dysków, przypadkowym rozłączeniem sieci lokalnej itd. Dają czas na przywrócenie normalnego działania uszkodzonego elementu.

Projektowanie systemów, tak by zapewniały pełną redundancję (tj. awaria występująca w jednym miejscu nie została zaobserwowana przez użytkownika), to cała dziedzina nauki, tzw. inżynieria bezpieczeństwa systemów. Informatykom można poradzić czerpanie pełną garścią z doświadczeń inżynierów innych specjalności: biomedyków (projektujących urządzenia podtrzymujące życie), inżynierów motoryzacji oraz specjalistów konstrukcji lotniczych i kosmicznych.

Ale żadna redundancja nie zabezpieczy przed błędami o charakterze ludzkim. Jeśli aplikacja nie poradzi sobie ze zmianą czasu z letniego na zimowy (kiedy to w logach po raz drugi pojawiają się te same stemple czasowe), jeśli przy przejściu pomiędzy platformą aplikacyjną a bazodanową "gubią się" znaki narodowe, jeśli przy kombinacji warunków program wpada w nieskończoną pętlę - to żadna redundancja i failover nie spełnią swojego zadania. To tak jak w wyścigach Formuły 1 - nowa para opon nie pomoże, jeśli do baku wlano niewłaściwe paliwo.

Redundancja nie może być traktowana jako antidotum na wszelkie bolączki, bo ma także bardzo istotne efekty uboczne - koszty. Systemy informatyczne w firmie zawsze stanowią jakiś kompromis między pożądaną funkcjonalnością i jakością a kosztami, które przedsiębiorstwo jest skłonne ponieść.

Błędy programistyczne i konstrukcyjne ukryte w aplikacji mogą stać się przyczyną niedostępności, ale nie tylko. W "strefie śmierci", powyżej 99%, najlepiej widać skutki długofalowego zarządzania. Na przykład tylko firma dbająca o bezpieczeństwo swoich systemów na każdym poziomie (tj. komponentu, systemu oraz procedur i regulacji) jest w stanie uniknąć przestojów spowodowanych włamaniem na konto administracyjne albo epidemią wirusową. Tylko przedsiębiorstwo, które dba o rozwój kwalifikacji pracowników, jest w stanie zapewnić, że nie popełnią oni banalnego błędu przy ryzykownej operacji typu wymiana sprzętu albo upgrade systemu do nowej wersji. Organizacja, która przestrzega godzin pracy i nie eksploatuje ponad miarę swoich pracowników, będzie w stanie uchronić swoją infrastrukturę przed skutkami usterki wprowadzonej przez kogoś pracującego dwunastą godzinę z rzędu.

Wysoka dostępność to także dobra komunikacja i zaufanie do ludzi. CIO, ani nawet menedżerowie średniego szczebla nie są w stanie kontrolować wszystkich czynników, które wpływają na dostępność. Ale jeśli ludzie w organizacji IT są świadomi celów biznesowych, jeśli wiedzą, że mają prawo do samodzielnego myślenia, działania oraz ewentualnego błędu, to taka organizacja jest w stanie działać w sposób efektywny. Zapewni wysoką dostępność swoim odbiorcom - i to nie dlatego że miliony włożono w drogie technologie. Dlatego że tym, co posiada, jest w stanie zarządzać w sposób optymalny.

Poza dostępnością

Wracamy więc do dobrego zarządzania. Bez niego infrastrukturalne "pudełka" mogą okazać się jedynie drogimi zabawkami, nie zaś sposobem na wysoką dostępność systemów. A dobrze zarządzana firma nie tylko umożliwia swoim klientom korzystanie z systemów, kiedy ich potrzebują, ale także stanowi miejsce, gdzie informatykom chce się pracować i rozwijać.

Oceń artykuł

średnio: 0 liczba ocen: 0
« wstecz 1  2 

Komentarze (0)

Najnowsze

Państwo do konsolidacji

Obywatele uważają administrację publiczną za jeden organizm. W rzeczywistości jest to kilka tysięcy oddzielnych struktur, obrosłych biurokratycznymi naroślami. Czy można zracjonalizować działanie państwa? Jak w tym może pomóc informatyka?

e-Sąd z odsieczą sprawiedliwości

Polski wymiar sprawiedliwości postrzegany jest jako skostniały i opieszały. Tymczasem kolejne e-usługi udostępniane przez Ministerstwo Sprawiedliwości ułatwiają życie przedsiębiorcom i usprawniają pracę sądów.

e-Zdrowie w Polsce i na świecie

Projekty informatyzacji służby zdrowia realizowane są na świecie z różnym powodzeniem. Skąd Polska mogłaby czerpać wzorce? A może jesteśmy skazani na własne rozwiązania?

Raport Państwo 2.0, czyli nowa wizja informatyzacji państwa

Michał Boni, minister administracji i cyfryzacji, zaprezentował raport "Polska 2.0. Nowy start dla e-administracji". Przedstawia on informacje na temat stanu realizacji projektów będących w gestii nowo utworzonego ministerstwa oraz prezentuje kierunki dalszych działań związanych z informatyzacją i cyfryzacją administracji publicznej w naszym kraju.

Cyberprzestępcy podążają za użytkownikami

Już dwie na trzy polskie firmy odnotowały ataki lub awarie, które spowodowały spadek produkcji. Co trzecia firma utraciła dane. Liczba takich przypadków będzie rosła, bo hakerzy biorą na cel najbardziej masowe technologie. Szybko reagują też na zmiany w firmowej architekturze.

Jak zaplanować karierę w branży IT

Doświadczenia łączone na różnych stanowiskach w firmach o odmiennych profilach są szczególnie cenione przez pracodawców. Dlatego warto głęboko przeanalizować możliwości rozwoju kariery, które obecnie stwarza rynek IT.

Jakie są różnice między chmurą a wirtualizacją

Wirtualizacja jest obecnie standardową technologią, stosowaną powszechnie w IT. Od środowiska chmury prywatnej dzieli ją jednak długa droga, gdyż wymaga ona uzupełnienia o istotne składniki.

Rekomendacje



Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści - Prenumerata: Computerworld, Networld, PC World
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88