Ma działać bez przerwy

Subskrybuj RSS A A A
27 października 2009
Marcin Marciniak

Niektóre usługi biznesowe muszą być świadczone w trybie ciągłym, z możliwie niskim prawdopodobieństwem nieplanowanych przerw. Aby systemy IT mogły świadczyć usługi na żądanym poziomie niezawodności, muszą być do tego odpowiednio przystosowane.


Użytkownicy biznesowi wymagają określonej dostępności usług, zazwyczaj mierzonej za pomocą procentowego udziału czasu, gdy można z niej skorzystać, do całego mierzonego czasu. Jeśli wymagana jest dostępność na poziomie 95%, oznacza to sumaryczny czas przerw zbliżony do 8h w ciągu tygodnia (czytaj - maksymalnie 8h na siedem dni pracy). Pojęcie dostępności usługi nie zawsze przekłada się bezpośrednio na czas pracy systemu operacyjnego i aplikacji (uptime). Na czas dostępności usługi wpływają wszystkie elementy odpowiedzialne za jej pracę, nie tylko serwery, systemy operacyjne i aplikacje, ale także infrastruktura sieciowa, składowanie danych, zasilanie, chłodzenie oraz systemy zapewniające bezpieczeństwo.

Należy przy tym rozróżnić pojęcie przerwy planowanej oraz awarii, czyli przerwy nieplanowanej. Niekiedy dana usługa pracuje okresowo, na przykład w określonych godzinach i tylko wtedy niezbędna jest jej niezawodność. Poza godzinami pracy dana usługa może nie działać w ogóle - przykładem mogą być urządzenia obsługujące linię produkcyjną cukrowni, pracującą jedynie podczas prowadzenia kampanii cukrowniczej. Podobne wymagania dotyczą pracy systemów kasowych w supermarketach - gdy kasy są nieczynne, taką usługę można wyłączyć, w celu konserwacji bez szkód dla biznesu. W takich przypadkach biznes zazwyczaj wymaga dostępności na określonym poziomie (na przykład 99,9%) w ustalonych godzinach pracy.

Od zasilaczy do klastra

Kliknij, aby powiększyćSystemy składają się z wielu pojedynczych podzespołów, z których każdy może ulec awarii, unieruchamiając większą lub mniejszą część systemu. Dlatego do osiągnięcia wysokiej dostępności stosuje się rozwiązania, które zmniejszają prawdopodobieństwo awarii w przypadku uszkodzenia pojedynczego elementu. Rozwiązania takie, stosowane z powodzeniem w wielu konstrukcjach, zakładają eliminacje pojedynczego punktu awarii dzięki nadmiarowości. Klasycznym przykładem jest stosowanie nadmiarowych (N+1) zasilaczy w urządzeniach, interfejsów sieciowych oraz niezależnych kompletów urządzeń aktywnych.

Pomimo radykalnego zmniejszenia prawdopodobieństwa całkowitego zatrzymania pracy komputera, nadal może wystąpić przerwa w pracy, spowodowana awarią oprogramowania. Problem ten w praktyce rozwiązuje się za pomocą klastra - zestawu dwóch niezależnych systemów, które razem przetwarzają dane (klaster active-active) lub jeden z nich oczekuje na awarię drugiego, aby przejąć jego zadania (klaster active-passive). Rozwiązania takie obecne są w większości baz danych (Oracle, DB2, Microsoft SQL Server, PostgreSQL, MySQL), w wielu systemach operacyjnych (AIX, Solaris, HP-UX, Linux, Windows i inne, włącznie z OpenVMS), macierzach dyskowych oraz serwerach aplikacyjnych. Najważniejszy problem dotyczy jednak zgodności aplikacji. Nie każda aplikacja będzie poprawnie pracowała w środowisku klastrowym.

Jak napisać program, by działał w klastrze

Aby aplikacja prawidłowo pracowała w klastrze, musi być pod tym kątem zaprojektowana. W szczególności powinna:
- wykorzystywać współdzielony zasób storage, na przykład NAS lub SAN. Jeśli jedynym miejscem składowania danych jest relacyjna baza danych, należy wybrać technologię, która natywnie wspiera pracę w klastrze, najlepiej z równoważeniem obciążenia,
- przechowywać jak najwięcej informacji o swoim stanie w nieulotnym, współdzielonym zasobie,
- móc się ponownie uruchomić na innym węźle klastra przy wykorzystaniu ostatniego stanu zapisanego we współdzielonym zasobie,
- posiadać narzędzia do łatwego uruchomienia, kontrolowanego zatrzymania, wymuszenia zatrzymania oraz uzyskania informacji o swojej pracy. Zazwyczaj przekłada się to na posiadanie narzędzia pracującego w trybie wiersza poleceń, umożliwiającego użycie skryptów,
- przy tym aplikacja nie może niszczyć żadnych danych w razie załamania, wymuszonego wyłączenia lub restartu od zapisanego stanu.

Jak widać, są to dość ostre wymagania i spełnienie ich jest trudne, dlatego fakt eksploatacji danej aplikacji w środowisku klastrowym najlepiej uwzględniać na początkowych etapach projektowania.

Oceń artykuł

średnio: 3.7 liczba ocen: 2
1  2  dalej »

Komentarze (3)

~pGnMOZJsWZuMqkOCawx

22-12-2011 03:48

At last! Somnoee who understands! Thanks for posting!

~eqCfNztxAWb

20-12-2011 14:16

Absolutely first rate and copper-bototemd, gentlemen!

czikorafal

09-11-2009 14:27

Cześć, A jak w tym co piszesz widzisz rolę backup/odtwarzania danych. Jeżeli apliakcja ma mieć dostępnośc na poziomie 99.9 % to jakie rozwiązania backupowe proponujesz. Czy rozwiązania backupowe też widzisz jako znacząco podnoszące dostępność.

Najnowsze

MAC, czyli ministerstwo reformowania rządzenia

Premier wspiera lojalnie w kryzysie najbliższego współpracownika, Michała Boniego, przyjmując na siebie atak oburzonych internautów podczas debaty o ACTA.

Nowe, unijne zamówienia publiczne

Komisja Europejska proponuje ważne zmiany prawa wspólnotowego w obszarze zamówień publicznych. Warto im się przyjrzeć bo to jeden z elementów nowej perspektywy finansowej UE. Warto zatem przyjrzeć się owej propozycji bliżej.

Bezpieczeństwo rządowych stron - analiza

Zespół zadaniowy ds. ochrony portali rządowych opublikował wytyczne. Trudno stwierdzić, że to najlepsze rekomendacje, jakie można było przy okazji zaistniałych ataków wypracować.

DEBATA: Kiedy walka polityczna w sieci przemienia się w cyberterroryzm?

Skuteczny atak cybernetyczny przyniesie opłakane skutki dla państwa i gospodarki. Boleśnie się o tym przekonaliśmy, gdy nie można było dostać się na strony internetowe najważniejszych instytucji w Polsce.

Czy MSW chce unieważnienia przetargu na pl.ID?

Rośnie ryzyko całkowitego unieważnienia przetargu na nowe dowody osobiste. Krajowa Izba Odwoławcza odrzuciła odwołanie firmy Sygnity, która nie zgadzała się na wydłużenie o trzy miesiące terminu składania ofert na dostawę blankietów nowych dowodów osobistych. Wydłużenie całego postępowania o trzy miesiące może spowodować skargi uczestniczących w nim firm, a w konsekwencji unieważnienie przetargu.

Garść rad dla roztropnego szefa IT

Trudne czasy w gospodarce to okres, kiedy szczególnego znaczenia nabiera hasło: Jak cię widza, tak cię piszą. Osłabienie rynku przekłada się na oszczędności w przedsiębiorstwie, a oszczędności najłatwiej szukać w działach, które, w opinii zarządu, nie są bezpośrednio związane z prowadzoną działalnością - czyli również w dziale IT.

Sprzeczne wizje e-dowodu

Koncepcja elektronicznego dowodu osobistego powstała w Polsce wiele lat temu. Starsze są koncepcje elektronicznego systemu świadczeń ochrony zdrowia. Mimo to, nadal są w trakcie budowy.

Rekomendacje

Serwisy IDG - Warunki obsługi - Kontakt - Redakcja - Regulamin - O nas - Polityka prywatności - Serwis zgodny z ASME
Reklama - Licencjonowanie treści
Computerworld Polska i Computerworld Polska online są znakami towarowymi IDG Poland SA.
© Copyright 2012 International Data Group Poland S.A. 04-204 Warszawa ul. Jordanowska 12 tel.(+4822)321-78-00 fax(+4822)321-78-88