Maszyny marzeń (Komputery MPP cz. 2)

W tej części cyklu o komputerach MPP, prezentujemy krótki przegląd systemów masowo równoległych. Maszyny te oferują duże możliwości i mimo, że są stosunkowo drogie, powoli wypierają przetwarzanie symetryczne w informatycznych działach zachodnich firm. Jednak może minąć jeszcze kilka lat, zanim MPP pojawi się w polskich firmach i instytucjach, obecnie dość sporadycznie korzystających z mniej złożonych maszyn wieloprocesorowych klasy SMP. Myśląc o przyszłości przedstawiamy aktualną ofertę producentów - zarówno tych wielkich, jak i tych mniej znanych.

W tej części cyklu o komputerach MPP, prezentujemy krótki przegląd systemów masowo równoległych. Maszyny te oferują duże możliwości i mimo, że są stosunkowo drogie, powoli wypierają przetwarzanie symetryczne w informatycznych działach zachodnich firm. Jednak może minąć jeszcze kilka lat, zanim MPP pojawi się w polskich firmach i instytucjach, obecnie dość sporadycznie korzystających z mniej złożonych maszyn wieloprocesorowych klasy SMP. Myśląc o przyszłości przedstawiamy aktualną ofertę producentów - zarówno tych wielkich, jak i tych mniej znanych.

Producenci maszyn MPP okazali się bardzo przyjaźnie nastawieni do polskiej edycji tygodnika Computerworld, mimo

braku potencjalnych klientów na naszym rynku. Praktycznie wszystkie firmy, do których zwróciliśmy się z prośbą o

informacje były bardzo zainteresowane współpracą i przysłały materiały opisujące szczegółowo swoje rozwiązania.

nCUBE stawia na Oracle7

Masowa równoległość świetnie sprawdza się przy zastosowaniu jej do przetwarzania danych, szczególnie przy dużej intensywności transakcji, czyli w bankach, systemach rezerwacji lotów itp. Wbrew wyobrażeniom wielu osób

komputery MPP to nie tylko te "supersilne i superszybkie" serwery baz danych, ale i maszyny dające możliwości typowych serwerów SMP, sprzedawane za niezbyt wygórowaną cenę. Już przy ośmiu procesorach działających równolegle (średnia ilość dla systemów SMP) systemy takie jak nCUBE 2E czy 2S są stosunkowo tanie przy dużych możliwościach. W połączeniu z systemem baz danych Oracle7 stanowią silną konkurencję dla maszyn SMP. Niestety, praktycznie żaden inny SZBD nie jest obecnie dostępny na tej platformie.

Najmniejsza maszyna nCUBE - Model 2E może mieć od 8 do 128 64-bitowych procesorów (produkowanych w technologii CMOS VLSI przez nCUBE) i od 32 MB do 4 GB pamięci. Już system z 8 procesorami za 30 tys. USD ma moc 80 MIPS i 27 MFLOPS. Najpotężniejszy system nCUBE, 2S Model 80 można wyposażyć w 8192 procesory, osiągając prędkość przetwarzania do 123 GIPS i 34 GFLOPS. Oczywiście, rzadko która organizacja na świecie potrzebuje komputerów o takiej mocy, ale dobrze wiedzieć, że w razie potrzeby jest to możliwe już nie tylko w teorii, ale

i w praktyce.

AT&T GIS System 3600 - kompatybilność z systemami SMP

Inne spojrzenie na funkcję maszyn MPP ma firma AT&T GIS (dawny NCR), która proponuje swój system NCR 3600 jako

uzupełnienie serii 3000, na którą składa się kilka rodzajów komputerów - od laptopów poprzez stacje robocze, serwery SMP aż po NCR 3600 - system klasy MPP.

Podobnie jak w przypadku nCUBE, tak i na platformie NCR działa Oracle7 Parallel Server; AT&T GIS proponuje jednakże

alternatywę w postaci SZBD DataBase. Największą chyba zaletą komputerów NCR jest to, że wszystkie aplikacje napisane na dowolnym systemie serii 3000 będą działały na pozostałych (oczywiście jeśli spełnione zostaną wymogi pamięciowe i dyskowe danego programu). W NCR 3600 zastosowano procesory i486, co dowodzi, że nawet stosunkowo słaby procesor (w porównaniu np. z kośćmi RISC-owymi) jest w stanie zaoferować potężne możliwości, jeśli zostanie wykorzystany w maszynie równoległej z odpowiednią siecią połączeń.

Wielka inicjatywa producentów baz danych - ICL Goldrush

Najlepszym przykładem rosnącej popularności maszyn MPP jest inicjatywa, jaką brytyjska firma ICL podjęła wraz z liderami w produkcji systemów relacyjnych baz danych - Oracle, ASK/Ingres i Software AG (twórcami Adabas). Opisywany obszernie w CW 42 (15.11.1993) ICL Goldrush to maszyna MPP do obsługi dużych baz danych, oferująca do 6000 TPS (16360 MIPS) przy zastosowaniu 128 procesorów HyperSPARC RISC pracujących równolegle. Pojemność dyskowa w maksymalnej konfiguracji (System 640) wynosi do 1200 GB.

Najmniejsza konfiguracja ICL Goldrush System 80 (14 procesorów, do 126 GB HD) pozwala na uzyskanie 600 TPS (1860 MIPS), co znacznie przewyższa możliwości np. komputerów nCUBE. Wynika to z zastosowania silniejszych procesorów, lecz odbija się na cenie systemu. Goldrush System 80 kosztuje bowiem ok. 750 tys. GBP (ponad 1 mln USD), zaś System 640 - ok. 15 mln USD.

IBM konkuruje z samym sobą

Najnowsze konstrukcje IBM-a, systemy SP/1 i SP/2, to najostrzejsza konkurencja dla komputerów klasy mainframe

produkowanych także przez tę firmę. SP/2, przeznaczony zarówno do obliczeń naukowych jak i do obsługi systemów baz danych, to komputer z procesorami IBM Power2. Ze względu na specyficzną konfigurację, klasyfikowany jest czasem jako klaster, nie zaś jako maszyna MPP. Nowe modele SP/2 będą bazować na procesorach PowerPC 601 lub 604, zaś w 1995 r. użytkownicy tej maszyny będą mogli zainstalować w niej karty SMP, umożliwiające łatwiejsze korzystanie z aplikacji przeznaczonych na komputery symetrycznie wieloprocesorowe.

Kto dziś stosuje transputery?

Brytyjska firma Parsys produkuje systemy MPP bazujące na transputerach. Ten "niewypał" w komercyjnej technologii

komputerowej okazał się bardzo przydatny w środowiskach naukowych, zaś firmy Parsys, Parsytec oraz Meiko (ta trzecia przestawiła się niedawno na elementy bardziej standardowe w postaci procesorów RISC-owych) potrafiły wykorzystać transputery do konstrukcji komercyjnych maszyn masowo równoległych, oferując (w przypadku Parsysa) zarówno systemy wspomagające obliczenia w postaci modułów MPP podłączanych do stacji roboczych, jak i serwery bazodanowe.

Seria Parsys SN 2000 to świetny przykład na to, że komputery coraz częściej są przystosowywane do aplikacji, a nie

odwrotnie. Sn 2000 paraMIS8 i paraMIS16 to maszyny przeznaczone do systemów zarządzania informacją, gdzie

najbardziej liczy się szybki czas reakcji i brak blokad pracy innych użytkowników przy skomplikowanych zapytaniach.

paraMIS8 to system 8-transputerowy z 8,5 GB HD, 576 MB RAM, w cenie 115 tys. GBP (ok. 170 tys. USD). W przypadku stosowania komputera do aplikacji OLTP (przetwarzanie transakcji) ważniejsze jest zachowanie integralności bazy danych oraz łatwość przewidzenia czasu reakcji. Do tego celu Parsys przygotował systemy paraTRANS16, paraTRANS32 i paraTRANS64 (odp. 16, 32 i 64 transputery, 12,5, 21,5 i 42,5 GB HD i 768, 1472 i 2944 MB RAM z dodatkowymi streamerami archiwizującymi: 5, 10 i 10 GB; ceny: 175, 340 i 650 tys. GBP). Do pisania i testowania aplikacji - tańsze paraDEV4 i paraDEV8 (4 i 8 transputerów, 2,5 i 4,5 GB HD, 128 i 256 MB RAM w cenie 45 i 70 tys. GBP, czyli porównywalnie z najmniejszymi konfiguracjami nCUBE). Wszystkie systemy SN 2000 są dostosowane do współpracy z Oracle7 Parallel Server.

Dla zastosowań naukowych Parsys oferuje ciekawe rozwiązanie w postaci modułów MPP (do postawienia na biurku). Seria SN 9000 to zestaw modułów (np. SN 9100 HTRAM, SN 9400 Desktop Stacking System, SN 9700 Large Scale Cluster System) do podłączenia do stacji roboczej. Przy wykorzystaniu odpowiedniego oprogramowania, napisane aplikacje mogą korzystać z modułów przy wykonywaniu skomplikowanych obliczeń numerycznych, podczas gdy w tym samym czasie stacja robocza zajmuje się innymi zadaniami.

Z firmą Parsys spotkaliśmy się na targach CEBIT '94, gdzie promowała swoje produkty MPP. Parsys planuje otwarcie

przedstawicielstwa w Polsce.

Meiko - potęga z Wielkiej Brytanii

Stosunkowo mała firma z Bristolu (W. Brytania) ma na swoim koncie już ponad 400 instalacji komputerów MPP, m.in. w

takich firmach jak: British Aerospace, British Telecom, General Electric, US Department of Defence, Oracle, a nawet

IBM, HP, Hitachi, Intel czy Cray Research. Stanowi ona silną konkurencję dla firm amerykańskich, aktualnie oferuje

komputer Computing Surface 2, przeznaczony przede wszystkim do celów obliczeniowych, lecz współpracujący także z SZBD Oracle7, co pozwala na skuteczne wykorzystanie go w świecie komercyjnym. Meiko jest trzecią pod względem liczby instalacji firmą na rynku amerykańskim, co dla brytyjskiej firmy jest nie lada wyczynem.

Meiko Computing Surface CS-2 to bardzo zaawansowana architektura MPP, oferująca dużą moc i rozszerzalność. Ten

komputer, bazowany na procesorach SPARC RISC, posiada zarówno konfiguracje z procesorami skalarnymi jak i

wektorowymi: 8-256 jednostek przetwarzających. Minimalna konfiguracja skalarna (CS-2 S4Q16, 16 procesorów, 0,6 do 4 GB RAM, 2-40 GB HD) osiąga 0,8 GFLOPS (64-bit), zaś maksymalna wektorowa (CS-2 S8V256, 256 procesorów, 8-36 GB RAM, 8-200 GB HD) - aż 51,2 GFLOPS.

Parsytec - europejskie MPP

Na rynku europejskim zdecydowany prym wiedzie niemiecka firma Parsytec. W Europie wykonała ponad 1000 instalacji komputerów równoległych. Praktycznie wszystkie te instalacje są stosowane w laboratoriach naukowych.

Bazujący na najnowszej technologii w postaci procesorów PowerPC 601 oraz transputerów IMS T805-30 komputer

GC/PowerPlus to jedna z bardziej nietypowych konstrukcji. Jej wyjątkowe możliwości zawdzięcza optymalnemu

wykorzystaniu elementów, tzn. procesorów do zadań obliczeniowych, zaś transputerów do komunikacji między

procesorami. 128-procesorowa maszyna GC/PowerPlus (z 256 transputerami) pozwala na osiągnięcie prędkości obliczeń do 10 GFLOPS (64-bit) i 20 GMIPS (32-bit).

Parsytec oferuje też urządzenie przypominające moduły SN 9000 Parsysa - Parsytec PowerXplorer. Architektura systemu jest identyczna jak w komputerach serii GC (np. opisany powyżej GC/PowerPlus), lecz pozwala na pracę równoległą jedynie 64 procesorów PowerPC. Ten komputer dostępny w postaci małych, przenośnych modułów i posiadający własny system operacyjny stanowi rodzaj "peceta" MPP.

Bliźniaki - DECmpp 12000 i MasPar MP-1/MP-2

Na podstawie umów licencyjnych, Digital Equipment Corporation jest producentem superkomputera DECmpp 12000/Sx

który w praktyce jest dokładną kopią systemów MP-1/MP-2 amerykańskiej firmy MasPar. Komputer ten, prezentujący jedną z najciekawszych architektur MPP (klasy SIMD), jest maszyną przeznaczoną do obliczeń numerycznych, został więc wyposażony jedynie w oprogramowanie do celów naukowych.

DECmpp 12000/Sx Model 100, zawierający od 1024 do 16384 procesorów MP-1 (odpowiednik komputera MasPar MP-1) to maszyna osiągająca 560 MFLOPS i 13 tys. MIPS (64-bit) przy pamięci RAM do 1GB oraz pojemności dyskowej 88 GB. Nowszy model, DECmpp 12000/Sx Model 200 (odpowiednik MasPar MP-2), różniący się od poprzedniego modelu jedynie zastosowanymi procesorami, osiąga 2400 MFLOPS i 34 tys. MIPS. DEC produkuje także superkomputer DECmpp 12000/Mx Model 100, o całkiem innej architekturze (MIMD), wyposażony w 16 lub 32 procesory Intel i860, 1 GB RAM, do 4,5 GB HD. Komputer ten osiąga 1900 MFLOPS.

Wszystkie systemy DECmpp i MasPar MP-1/MP-2 korzystają z oddzielnej konsoli systemowej; w przypadku systemów Sx jest to DECsystem 5900 (DECstation 5000/240 HX dla MasPar), zaś Mx - PC i386.

Inne spojrzenie na MPP - Kendall Square Research

Stosunkowo mało znana firma amerykańska jest producentem jednej z najbardziej efektywnych architektur MPP, ALLCACHE. Nowatorskość tego rozwiązania polega na zastosowaniu struktury pamięciowej składającej się z hierarchicznie połączonych pamięci podręcznych (cache). Przy takim rozwiązaniu, wszystkie adresy pamięci są przydzielane dynamicznie.

KSR2 to druga z serii maszyn wykorzystujących architekturę ALLCACHE, znacznie potężniejsza od swojego poprzednika (KSR1). Minimalna konfiguracja KSR2-32 (32 procesory, 1 GB RAM, 0.5 TB HD) kosztuje ok. 3 mln USD i oferuje 2,6 GIPS i 2,6 GFLOPS, podczas gdy maksymalna, KSR2-5000 (ponad 5 tys. procesorów, 160 GB RAM, 93 TB HD) - 400 GIPS i 400 GFLOPS.

Oprogramowanie dla systemów KSR to, podobnie jak w przypadku innych maszyn MPP, przede wszystkim narzędzia do tworzenia aplikacji (równoległe wersje języków Fortran, C++), narzędzia obliczeniowe i systemy wizualizacji danych oraz SZBD Oracle7. Warto odnotować, że obecnie Oracle jest praktycznie jedyną firmą oferującą swój produkt na prawie wszystkich platformach MPP.

Mikro- i makro- w wykonaniu Intela

Intel znany jest raczej z produkcji najpopularniejszych procesorów stosowanych w mikrokomputerach. Drugie oblicze

firmy to Intel Supercomputing Division, gdzie powstają najpotężniejsze dzieła techniki MPP.

Intel jest największym dostawcą superkomputerów równoległych w Stanach Zjednoczonych. Ma na swoim koncie kilkaset instalacji, w tym ponad 300 instalacji maszyny iPSC 860, uważanej za najpopularniejszy komputer MPP w USA. Systemy Intela są wykorzystywane w ośrodkach obliczeniowych (większe komputery jak Touchstone Delta, Paragon) i w firmach komercyjnych, np. do analizy finansowej (przede wszystkim iPSC 860 Model 32). Intel oferuje odpowiednie

oprogramowanie, jednakże nie współpracuje bezpośrednio z żadnym producentem oprogramowania SZBD.

Najpotężniejsze i zarazem najmłodsze dziecko Intela to superkomputer Paragon. Najmniejszy model XP/E-8N, wyposażony w 8 procesorów i860, 1,28 GB RAM i do 8 GB HD osiąga 0,6 GFLOPS i 0,35 GIPS (64-bit). Największy - XP/S-35 (480 procesorów, 77,6 GB RAM, 272 GB HD) - do 36 GFLOPS i 21 GIPS. Nie jest to może wynik oszałamiający w porównaniu z innymi superkomputerami, ale maszyny Intela mają wyjątkowo wysoki wskaźnik price/performance, czyli oferują dużą moc za stosunkowo niską cenę.

Myślące maszyny Thinking Machines

Thinking Machines Co. może poszczycić się pierwszym miejscem w teście najpotężniejszych komputerów świata opracowanym przez Jacka Dongarry (znanego naukowca amerykańskiego). Znajdujący się w Los Alamos w Kalifornii 1024-procesorowy CM-5 to tylko namiastka teoretycznych możliwości tego superkomputera, dopuszczającego do równoległej pracy ponad 16 tys. procesorów HyperSPARC RISC.

Connection Machine 5 to w praktyce trzecie przedsięwzięcie tej ściśle wyspecjalizowanej firmy, od wielu lat pracującej nad superkomputerami MPP. Pierwsze dzieło Thinking Machines, Connection Machine CM-1 był komputerem wiążącym 65536 procesorów CISC, lecz jego następcy, budowani z pomocą nowych technologii i w odmiennej architekturze, osiągnęli znacznie większą prędkość przetwarzania niż ten historyczny już komputer.

Connection Machine 5 to bardzo wszechstronna maszyna, pozwalająca na praktycznie dowolne dynamiczne

rekonfigurowanie dostępnych procesorów. Może ona być logicznie wykorzystywana jako sieć mniejszych komputerów MPP o dowolnie skalowalnych możliwościach. Maksymalna konfiguracja CM-5 (16384 procesorów) pozwoliłaby na osiągnięcie zawrotnej prędkości obliczeń 2 TFLOPS (2048 GFLOPS). Komputer taki kosztowałby jednak ok. 1 mld dolarów i praktycznie żadna instytucja na świecie nie mogłaby pozwolić sobie na taki wydatek. Sprzedawana jednak w cenie ok. 1,5 mln USD 32-procesorowa konfiguracja pozwalająca na osiągnięcie ok. 4 GFLOPS to realna inwestycja i takie lub nieco większe CM-5 są zainstalowane w kilku laboratoriach na świecie, m.in. w Paryżu.

Superkomputer przyszłości - Cray T3D

Wieloletni lider technologii superkomputerowej, jakim jest firma Cray Research, zmuszony był odpowiedzieć na

zagrażającą mu ofensywę komputerów MPP. Wektorowe maszyny Craya dają dość duże możliwości, ale w porównaniu z MPP ich skalowalność (praktycznie równoznaczna z odniesieniem sukcesu) jest bardzo mała. Kontratak Craya to system T3D, będący chyba najbardziej zaawansowanym rozwiązaniem MPP wśród współczesnych komputerów tej klasy.

Zastosowanie wyjątkowo nietypowej konfiguracji pamięci (logicznie globalnej, fizycznie lokalnej) pozwala na znaczne

ułatwienia przy przenoszeniu programów na platformę T3D. Dodatkowo, 2048 pracujących równolegle procesorów DEC wspomaganych dodatkowymi układami zarządzającymi siecią połączeń, oferuje nie lada moc obliczeniową.

Cray T3D pozwala aktualnie na uzyskanie 300 GFLOPS w maksymalnej konfiguracji 2048 procesorów DEC Alpha. Firma obiecuje jednak, że nowsze modele (planowane za dwa lub trzy lata) będą osiągały prędkość przetwarzania nawet do 1 TFLOPS. Testy przeprowadzone na konfiguracji T3D zawierającej jedynie 256 procesorów wykazały, że maszyna ta przewyższa mocą produkty konkurencji (oczywiście także w konfiguracjach z 256 procesorami) w praktycznie wszystkich testach, zaś w niektórych osiąga wyniki aż 3 razy lepsze.

Niekompletny poczet

W naszych poszukiwaniach producentów komputerów MPP uwzględnilimy praktycznie wszystkie większe firmy zajmujące się wytwarzaniem i sprzedażą tego typu maszyn. Pomineliśmy firmy mniej znaczące na rynku europejskim i amerykańskim, takie jak: Hitachi i Fujitsu (także zajmujących się technologią MPP). Należy dodać, iż mimo tego, że wiele z wymienionych firm ma swoje przedstawicielstwa w Polsce, to komputery MPP rzadko są częścią oferty rynkowej adresowanej na polski rynek, a dostępne są jedynie na specjalne zamówienie.