Superkomputery bliżej biznesu

Prognozy i wnioski z listy TOP500

Można zauważyć, że moc obliczeniowa najwydajniejszych superkomputerów co roku rośnie 2-3-krotnie, a tempo to może znacznie się zwiększyć, jeśli powiedzie się plan budowy do 2012 roku kolejnego superkomputera o wydajności ok. 20 petaflopów. Natomiast jeszcze dalej ekstrapolując wyniki list TOP500, można wyciągnąć wniosek, że superkomputer o wydajności 100 petaflopów pojawi sie na rynku ok. roku 2016.

Wypada przypomnieć, że historycznie 1000-krotny wzrost wydajności następował dotąd co 11 lat - w 1986 r. pojawił się komputer Cray2 o mocy przekraczającej barierę gigaflopów, w 1997 r. - Intel ASCI Red o mocy teraflopowej, a w 2008 r. IBM Roadrunner przekroczył poziom 1 petaflopa. Utrzymanie tego tempa będzie oznaczało, że w 2019 roku powinien się pojawić system o trudnej obecnie do wyobrażenia mocy obliczeniowej, liczonej w exaflopach (1000 petaflopów).

Sun Microsystems we współpracy z Intel, Bull, ParTec i Mellanox oddał ostatnio do eksploatacji superkomputer JuRoPA2 (Sun Constellation), składający się z 26 304 jednostek CPU. Zainstalowano go w niemieckim ośrodku Julich Supercomputing Centre. Komputer zajął 10. miejsce na liście TOP500 przy wydajności ocenionej na 274,8 teraflopa.

Aby jednak można było utrzymać ten wzrost, muszą zostać spełnione podstawowe warunki niedotyczące samej techniki - dostatecznie niski koszt inwestycji niezbędnej do budowy kolejnych superkomputerów, zmniejszenie zużycia energii oraz dostępność narzędzi i specjalistów potrafiących efektywnie tworzyć kod oprogramowania równoległego nowych aplikacji lub tak modyfikować istniejące programy, by mogły wydajnie pracować w systemach masowo-równoległych.

Natomiast z technicznego punktu widzenia niezbędny jest rozwój architektur zapewniających niezawodne i wydajne działanie systemów składających się z ogromnej liczby elementów - nie tylko setek tysięcy lub nawet milionów rdzeni CPU, ale również łączącej je infrastruktury sieciowej i pamięci masowych.

Warto też zauważyć, że ze standardowymi, uniwersalnymi układami x86, SPAR lub Power instalowanymi w superkomputerach zaczynają konkurować procesory graficzne GPU. Ich zaletami jest duża wydajność przetwarzania strumieni danych, która już osiągnęła poziom teraflopów (do którego uniwersalne układy dopiero dążą), a także względnie niska cena i zużycie energii. Niestety są też wady - procesory graficzne są przystosowane do równoległego przetwarzania strumieni danych i nie są w stanie wydajnie obsłużyć wszystkich aplikacji, a ponadto wymagają innych niż standardowe narzędzi programistycznych.

Coraz więcej jest jednak maszyn z architekturą hybrydową, która w jednym systemie wykorzystuje zarówno procesory uniwersalne, jak i graficzne. Przykładem jest lider rankingu IBM Roadrunner. Można też zauważyć, że w czerwcu na TOP500 pojawiła się maszyna Tsubame - klaster uruchomiony w Tokyo Institute of Technology, wyposażony w 170 graficznych modułów Nvidia Tesla-S1070, które teoretycznie zapewniają wydajność 170 teraflopów. Jednak praktyczne testy wykorzystywane w rankingu TOP500 dały temu komputerowi wynik tylko 77,48 teraflopa.

Wzrost wydajności nie jest jednocześnie wyścigiem o sławę, bo rosnąca moc przetwarzania otwiera nowe możliwości zastosowań technik obliczeniowych. I dotyczy to nie tylko superkomputerów znajdujących się w czołówce TOP500, bo warto zauważyć, że również średnia moc wszystkich klasyfikowanych maszyn co roku rośnie ponad 2-krotnie, podobnie jak minimalna wydajność, która pozwala znaleźć się na liście rankingowej.

Wydajność systemów o dużej mocy przetwarzania określanych jako HPC (High Performance Computing) wzrasta zarówno wskutek pojawiania się kolejnych generacji procesorów wyposażonych we wciąż większą liczbę rdzeni CPU, jak i nowych konstrukcji, które pozwalają na współpracę większej liczby węzłów obliczeniowych, a także nowych architektur wykorzystujących innowacyjne pomysły na zwiększenie mocy przetwarzania na przykład przez wprowadzenie struktur hybrydowych, efektywnie wykorzystujących różnego rodzaju układy. Pod tym ostatnim względem dobrym przykładem jest IBM Roadrunner, który ma zestaw procesorów AMD Opteron i IBM PowerXCell 8i.


TOP 200