Brak rozeznania może drogo kosztować

Najlepiej jest uczyć się od tych użytkowników, którzy uruchomili już u siebie systemy przetwarzania równoległego

Najlepiej jest uczyć się od tych użytkowników, którzy uruchomili już u siebie systemy przetwarzania równoległego

Wprowadzenie do eksploatacji pierwszej, pracującej równolegle bazy danych Quantum zajęło firmie American Express Co. dwa lata, tj. ponad rok dłużej niż przewidywano. Wdrażaniem całego projektu w życie zajmował się oddział Epsilon, który musiał stworzyć od początku nie tylko system przeszukiwania bazy danych i program zarządzający nią, ale też procedury sortowania i przesyłania danych czy generatory sprawozdań. Jedynymi gotowymi produktami były kompilatory.

Bazę danych Quantum oddano do użytku na początku 1994 r. Ma ona pojemność 400 GB i zarządza nią komputer CMý5 firmy Thinking Machines Corp. Doświadczenia zdobyte przez Epsilon zaowocowały tym, że sprzedaje one obecnie swe usługi innym firmom, pomagając im wdrażać do produkcji duże systemy przetwarzania równoległego. Tomas Tague, wiceprezydent Epsilon mówi, "systemy przetwarzania równoległego architektury MPP przestały już być, żeby użyć terminologii motoryzacyjnej, nieco podrasowanymi, wyposażonymi w większej mocy silnik i radio stereo, dziesięcioletnimi samochodami. Nie znaczy to oczywiście, że można jeździć takim samochodem nie wiedząc, co jest pod jego maską". I dodaje, "Na rynku dostępnych jest obecnie dużo więcej baz danych, kompilatorów i narzędzi wspomagających proces systemów równoległych. Nie są to jednak tak doskonale pracujące produkty, jak to się starają wmówić klientom ich producenci. Stworzenie dobrego oprogramowania dla systemów SMP i MPP jest po prostu sztuką. To nie to samo co napisanie książki kucharskiej".

Niektóre firmy, które zdecydowały się już na zastosowanie u siebie komputerów MPP twierdzą, że jest jeszcze chyba za wcześnie na wprowadzanie tej technologii w życie. Nawet zaprojektowane specjalnie dla celów komercyjnych systemy, takie jak: i Series 3600 firmy AT&T odmawiają posłuszeństwa, gdy uruchamiane na nich aplikacje mają pracować z pełną szybkością. Z kolei systemy SMP mają tę wadę, że chociaż pracują już bardzo szybko i są jako tako skalowalne, to nie jest to technologia wystarczająco dobra dla każdego i zdolna obsłużyć wszystko.

"Jest to co prawda solidna technologia, która często spełnia oczekiwania użytkowników i przetwarza dane bardzo szybko" - mówi Armando Silva, wiceprezydent Sabre Decision Technologies (oddział firmy AMR Corp.). "Problemy zaczynają się jednak wtedy, gdy zamierzamy wyszukiwać pewnych specyficznych informacji w specyficznych tablicach bazy danych. System zaczyna raptem pracować bardzo wolno".

Sabre eksploatuje sześć komputerów Teradata i jeden 3600, które obsługują ponad 25 aplikacji, w tym system rezerwacji biletów i system planowania przewozów towarowych linii lotniczej American Airlines. "Profilowanie aplikacji i dostosowanie ich do pracy w środowisku przetwarzania równoległego nie było trudnym zadaniem" - dodaje Silva, który kierował tymi pracami (wspólne przedsięwzięcie firm Sabre i kolei francuskich SNCF). "Jednak dostrojenia aplikacji, tak aby pracowały one z maksymalną szybkością, to już zupełnie inna para kaloszy. Teradata jest systemem, który wymaga wyjątkowo dużo pracy. Odpowiednie wyprofilowanie aplikacji jest prawdziwą sztuką".

Fred Otteson (konsultant z firmy Sabre) dodaje natomiast, że "to jak szybko pracuje aplikacja zależy od czynników, takich jak: doświadczenie programistów i zagwarantowanie im odpowiednio dużo czasu na opracowanie tego tematu". Bazy danych MPP są niewiarygodnie wrażliwe na problemy profilowania. Prawda jest taka, że znając podstawowe cechy systemu MPP stosunkowo prosto jest wyprofilować jako tako każdą aplikację. Ale zrobić to tak, aby pracowała ona na najwyższych obrotach, nie jest już tak łatwe. Konieczna jest to tego dobra znajomość wszystkich elementów komputera MPP.

Niektóre aplikacje, które firmy były zmuszone do tej pory uruchamiać tylko na systemach MPP (z powodu ich dobrej skalowalności) można już obecnie powierzać coraz wydajniej pracującym systemom typu plugýandýplay architektury SMP. Dlatego firma Sabre robi już rozeznanie czy nie byłoby możliwe przeniesienie pewnych aplikacji na komputer AT&T GIS 3600, czy inne systemy SMP. I dodaje, "obecnie nie można już być tak pewnym, jak jeszcze kilka lat temu, że niektóre aplikacje można uruchamiać tylko na komputerze Teradata (MPP)".

Niepewny wybór

Jedną z firm, która zdecydowała się na zamianę systemu MPP (komputer nCube) na czteroprocesorowy komputer SMP firmy DEC jest U.S. Surgical Corp. Graham Fyffe (dyrektor Surgical Corp.) mówi, "firma nasza instalując komputer nCube w 1993 r. uważała, że jedynym sposobem na zbudowanie szybko pracującego i taniego systemu informatycznego jest technologia przetwarzania równoległego. Jednak najpierw oprogramowanie firmy Oracle Corp. dotarło do nas z opóźnieniem, a następnie okazało się, że 16 procesorów (a tyle miał zakupiony przez nas komputer nCube) to za mało".

Firma zwiększyła więc konfigurację komputera do 32 procesorów, ale nawet wtedy system przeszukiwania bazy danych pracował z maksymalna szybkością tylko wtedy, gdy korzystało z niej nie więcej niż pięciu użytkowników. Samo zarządzanie bazą danych było bardzo pracochłonne. Administrator systemu poświęcał ok. 80% swojego czasu na nadzorowanie pracy bazy danych o pojemności 7 GB.

Przed firmą stanęła alternatywa: albo wydać jeszcze 1,2 mln USD i wyposażyć nCube w 64 procesory, albo kupić od firmy DEC za 250 tys. USD komputer SMP, który, jak zapewnia producent, poradzi sobie z tym problemem. Decyzja mogła być tylko jedna - zakup komputera SMP.

Niektórzy wolą SMP

Gary Smaby, prezydent Smaby Group Inc. w Minneapolis mówi, że w ok. 90% przypadków systemy SMP obsługują aplikacje komercyjne lepiej niż systemy MPP. Tylko niewielka liczba aplikacji może wykorzystać możliwości oferowane przez systemy architektury MPP.

Inną firmą, która zamierza wkrótce stosować komputery równoległe, jest Insurance Company of the West (San Diego, Calif.). W opinii Dona Fieldsa, wiceprezydenta tej firmy, systemy architektury MPP są za drogie i oferują możliwości, które ich firma nie zawsze mogłaby wykorzystać. Kolejnym problemem jest brak doświadczenia w profilowaniu i uruchamianiu aplikacji na tego rodzaju systemach. Fields dodaje, "całą sprawę trzeba oceniać trzeźwo i spokojnie sprawdzać, jaka technologia przetwarzania równoległego nadaje się najlepiej do uruchamiania aplikacji komercyjnych". Wniosek jest jeden - firma postawi na komputery architektury SMP.

Wspomniany już Epsilon (oddział firmy American Express Co.) projektuje bazy danych obsługiwane zarówno przez komputery SMP, jak i MPP. Standardowa pojemność takiej bazy to 150 GB. I jeśli użytkownik nie zamierza jej rozbudowywać na tyle, żeby wystąpiły problemy ze skalowalnością systemu, to Epsilon doradza klientom stosowanie komputerów platformy SMP. Sami użytkownicy eksploatujący takie systemy twierdzą, że są one dużo łatwiejsze w eksploatacji i zarządzaniu.

Elektrownia jądrowa San Onofre Nuclear Generating Station (San Clemente, Calif.) eksploatuje cztery systemy architektury SMP firmy Sequent Computer Inc. (komputery Symmetry). Firma miała na początku pewne problemy z wdrożeniem systemu do produkcji, ale nie miało to nic wspólnego z tym, że komputery firmy Sequent są wyposażone w wiele procesorów. Rzeczywistym wyzwaniem dla programistów, którzy pracowali do tej pory w środowisku komputerów typu mainframie czy PC LAN, było stworzenie pojedynczego systemu ochrony danych. Jednym z większych problemów jest fakt, że Sequent nie oferuje żadnego oprogramowania do archiwizowania danych. Zmusza to firmę do stosowania skryptowych programów systemu Unix, co nie jest najlepszym rozwiązaniem.

Kolejnym przykładem przemawiąjącym za systemami architektury SMP jest Mellon Bank NA (Pitsburg). Tu też nie było specjalnych problemów, gdy zdecydowano się odejść od komputerów typu mainframe na rzecz komputerów SMP. Bank eksploatuje obecnie dwa systemy SMP firm Sequent i Hewlett-Packard. Oczywiście były pewne problemy związane z tym, że są to jednak maszyny pracujące nieco inaczej. Nie zdarzyło się jednak nigdy, tak aby ucierpiała na tym poważnie jakaś aplikacja.

Brak narzędzi

Porównując systemy SMP i mainframe nie sposób nie zauważyć, że te pierwsze oferują dużo mniej narzędzi do administrowania i zarządzania bazami danych. Wiele operacji trzeba tu wykonywać po prostu ręcznie.

Programowanie systemów SMP nie jest dla programistów sprawą prostą. Przekonała się o tym firma Invesco Fund Inc. (Denver). Jednym z najtrudniejszych zadań przy uruchamianiu dwóch systemów SMP firmy AT&T GIS (3550 i 3600) było w Invesco przenoszenie applikacji na te maszyny z eksploatowanego do tej pory komputera firmy Data General Corp. Jak twierdzi David Barret, wiceprezydent Invesco Fund Inc., "błędem było przenoszenie wszystkich aplikacji naraz. Lepszą taktyką byłoby chyba przenoszenie ich kawałkami, tj. krok po kroku". I dodaje, "dla Invesco ważne jest to, że przetwarzające dane w trybie równoległym systemy SMP dysponują na tyle dużym zapasem mocy, że będą mogły sprostać przyszłemu rozwojowi firmy. Naszym zamiarem było dysponowanie komputerem, który daje się możliwie łatwo rozbudowywać i skalować. Mamy już taki system, a jego możliwości przekraczają na razie nasze zapotrzebowanie".


TOP 200