Namierzanie winnego

Błędna reakcja systemu teleinformatycznego - to jedna z hipotetycznych przyczyn katastrofy promu kosmicznego Columbia.

Błędna reakcja systemu teleinformatycznego - to jedna z hipotetycznych przyczyn katastrofy promu kosmicznego Columbia.

Z chwilą, gdy eksperci NASA odrzucili hipotezę, że przyczyną katastrofy promu kosmicznego Columbia mogło być uszkodzenie skrzydła wkrótce po starcie przez jedną z oderwanych płytek osłony termicznej kadłuba, "głównym podejrzanym" stał się układ autopilota promu. Jako że jest to program komputerowy sprzężony z całą infrastrukturą teleinformatyczną Columbii, nie trzeba było długo czekać na sensacyjne oskarżenia, że znowu zawinili informatycy.

Columbia miała pięć niezależnie działających systemów komputerowych. Cztery z nich pracują z identycznym oprogramowaniem, równolegle odbierając dane z poszczególnych czujników. Cały czas porównują wyniki swojej pracy, w przypadku ewentualnych różnic podejmując decyzje na zasadzie głosowania. Piąty komputer ma nieco inne oprogramowania i pełni rolę rezerwową na wypadek, gdyby wszystkie cztery pozostałe komputery się zawiesiły.

W czasie startu czy lądowania bieżące sterowanie promem kosmicznym właściwie w całości przejmują komputery. Człowiek by sobie nie poradził, bowiem wymagany czas odpowiedzi na zmieniające się warunki lotu jest liczony w milisekundach. Komputery przetwarzają dane w blokach, których w ciągu sekundy może być nawet 1000.

Ostatnie chwile

Namierzanie winnego

W rozwiązaniach teleinformatycznych promu Columbia zastosowano aż 4-krotną redundancję wszystkich elementów.

Kilka minut przed katastrofą promu kosmicznego odnotowano zbyt duże obciążenie lewego skrzydła. System autopilotażu powinien dokonać korekty (poprzez krótkotrwałe, bo jedynie półtorasekundowe włączenie silników pomocniczych). Pytanie, czy rzeczywiście zadanie to zostało wykonane prawidłowo?

Jeśli komputery "zarządziły" błędną korektę lotu, mogło być to przyczyną tragedii. Wszystko działało prawidłowo aż do godziny 8.59, kiedy to łączność została zerwana. Wiadomo jedynie, że zjawisko przeciążenia, które wymagało korekty, było nietypowe.

Specjaliści NASA zarzekają się, że trudno znaleźć tak stabilne i dobrze przetestowane oprogramowanie, jak to wykorzystywane w promach kosmicznych. Zostało ono przygotowane we współpracy z IBM i tylko w części składa się z rozwiązań komercyjnych, tzw. off-the-shelf. IBM rozpoczął prace nad systemem informatycznym stosowanym w promach kosmicznych jeszcze w 1972 r., na 9 lat przed pierwszym lotem. Wykorzystując najlepsze dostępne wówczas elementy technologii skonstruowano hybrydową maszynę AP-101, która w 40-centymetrowej sześciennej obudowie stała się wyposażeniem promu. Jej oprogramowanie (400 tys. linii kodu) napisane w specjalnym języku HAL/S (High Order Assembly Language/Shuttle), przystosowanym do równoległego przetwarzania obfitych strumieni danych, uzyskało najwyższy piąty stopień bezpieczeństwa i pewności nadawany przez Software Engineering Institute działający przy uniwersytecie Cornegie Mellon.

Faktem jest jednak, że w 1991 r. komisja działająca przy Kongresie USA w specjalnym raporcie skrytykowała zarząd Amerykańskiej Agencji Kosmicznej za to, że NASA nie zleciła dodatkowego niezależnego audytu oprogramowania stosowanego w systemach wahadłowców.

Wadliwe oprogramowanie było prawdopodobną przyczyną eksplozji europejskiej rakiety Ariane 5 w grudniu ub.r. Także pierwszy lot bombowca B-2 uniemożliwiły błędy w oprogramowaniu. Jednak to stosowane w Columbii działało bez zarzutu aż w 110 misjach kosmicznych. Dokładnie przeanalizowano wszystkie zanotowane do tej pory przypadki jakichkolwiek awarii promów kosmicznych w ponad 20-letniej historii ich lotów. W 1981 r. podczas pierwszej misji Columbii pojawił się banalny błąd prowadzący do rozsynchronizowania zegarów poszczególnych komputerów promu. Dwa lata później, również na pokładzie Columbii, zawiódł jeden z dwóch głównych komputerów, co było przyczyną kilkugodzinnego opóźnienia lądowania. Podczas jednej z misji w 1985 r. na pewien czas zawiesił się jeden z komputerów i nie reagował na sygnały z pozostałych. W marcu 1996 r. zawiódł jeden z trzech głównych obwodów elektrycznych w systemie sterowania klapami lewego skrzydła.

Jednak żadna z tych awarii nie miała tragicznych konsekwencji. Obecnie specjaliści badający przyczyny katastrofy Columbii mają utrudnione zadanie, NASA nie dysponuje bowiem pełnymi danymi telemetrycznymi dotyczącymi ostatnich chwil lotu Columbii. Utracono łączność ze statkiem, zaś w promach kosmicznych nie stosuje się tzw. czarnych skrzynek. Dane z pokładowych systemów są na bieżąco transmitowane do naziemnego centrum z wykorzystaniem protokołu SCPS (Space Communications Protocol Standard) będącego rozwinięciem klasycznego TCP (wykorzystuje się tutaj pakiety "stemplowane" znacznikami czasu). Są też na bieżąco archiwizowane zarówno przez komputery na promie (z 6 ostatnich godzin lotu), jak i w centrum obliczeniowym Johnson Space Center (gdzie od razu dokonuje się ich ekstrakcji do hurtowni danych ROLAP).

Dane za pośrednictwem satelitów geostacjonarnych są odbierane przez sieć anten (Space Ground Link System) i przesyłane do centrum kontroli lotów w NASA. Łącznie przebywają ponad 30 tys. km i to często powoduje utratę części danych retransmitowanych z pamięci buforowej komputerów wahadłowca. Komputery pokładowe nie miały szansy na przetrwanie katastrofy. Można jednak, jak się wyraził jeden z ekspertów NASA, szukać "śladów pamięci" wśród szczątków promu rozrzuconych na przestrzeni kilkuset kilometrów na terytorium Texasu, by odnaleźć dane, których transmisja nie dotarła na ziemię.

Ślady na ziemi

Poszukiwaniami szczątków promu zajmuje się ok. 70 zespołów wyposażonych w najwyższej klasy odbiorniki GPS. Dane lokalizacyjne z miejsca odnalezienia nawet najmniejszego elementu wahadłowca są przekazywane do systemu GIS kalifornijskiej firmy ESRI. Przy zastosowaniu odpowiednich algorytmów ustala się prawdopodobieństwo położenia kolejnych szczątków statku. Odnalezienie ważnych elementów Columbii może pomóc określić przyczyny katastrofy, ale, jak utrzymuje Ron Dittemore z NASA, nie ma żadnej gwarancji, że kiedykolwiek uda się ustalić to ze 100-proc. prawdopodobieństwem.

Być może tragicznego w skutkach błędu nie należy wcale szukać w rozwiązaniach informatycznych - wszak agencja kosmiczna boryka się z trudnościami budżetowymi i na skutek cięć finansowych musiała w ciągu 4 lat zredukować zatrudnienie o prawie 50%. A realizacja tylko pojedynczej misji promu kosmicznego wymaga uruchomienia i kontroli ponad 1 miliona 200 tys. procesów organizacyjnych i technologicznych.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200