Lista Top 500 i jeden petaflop/s

Najnowsza edycja zestawienia Top 500, zawierająca listę najszybszych komputerów na świecie, przynosi kolejny rekord. Na pierwszym miejscu uplasował się {{a:HTTP://www.networld.pl/news/154662/Roadrunner...superkomputer.o.wydajnosci.1.5.teraflopa.html}}Roadrunner{{/a}}, osiągający wydajność 1 petaflopa/s. IDG News Service przeprowadził wywiad z Erichem Strohmaierem, naukowcem z Lawrence Berkeley National Laboratory i jednym z twórców listy Top 500. Strohmaier dzieli się swoimi spostrzeżeniami odnośnie przyszłości procesorów, wydajności komputerów i zdradza genezę Top 500.

Skąd się wziął pomysł na stworzenie listy Top 500. Czy przyświecał temu jakiś cel czy też była to tylko zabawa?

Lista Top 500 i jeden petaflop/s

Erich Strohmaier

Początkowo była to tylko zabawa, ale z czasem pozyskiwane dane pozwoliły nam lepiej rozeznać światowy rynek superkomputerów. Mój przyjaciel prof. Hans Meuer zaczął robić pierwsze statystyki pod koniec lat 80-tych. To była złota era wektorowych systemów operacyjnych, łatwo było nam zatem określić liczbę superkomputerów koncentrując się jedynie na tych systemach. W latach 90-tych zagościło przetwarzanie równoległe i musieliśmy zredefiniować nasze pojęcie wydajnych jednostek obliczeniowych. Wciąż jednak systemy wektorowe odznaczały się wysoką szybkością przetwarzania danych, a ponieważ było ich akurat 500 w tych czasach, to zadecydowaliśmy o powstaniu właśnie listy Top 500.

Czy w chwili konstruowania listy Top 500 spodziewałby się Pan, że superkomputery osiągną wydajność 1 petaflopa/s?

Absolutnie nie, 15 lat temu zadawaliśmy sobie pytanie czy wszystkie zebrane w zestawieniu komputery mogą zbliżyć się jedynie do teraflopa/s. Po obliczeniach okazało się, że razem osiągają one moc obliczeniową nieznacznie tylko przekraczającą jeden teraflop/s.

Skąd się wzięła taka przewaga IBM w czołówce Top 500. Czy to wyłącznie zasługa zastosowania procesorów Cell czy innych, zaawansowanych technologii?

W przypadku najnowszego superkomputera Roadrunner mamy do czynienia z superpozycją bardzo dużej wydajności procesora Cell i jego ośmiu rdzeni oraz wysokiej skali integracji całego systemu. Przypomnijmy, że jest to rozwiązania skalowalne typu blade (kasetowe), umieszczone w specjalnych szafach. Dzięki temu dodatkowo zminimalizowano opóźnienia sygnałowe między poszczególnymi jednostkami.

Czy ktoś nadzoruje wiarygodność danych zawartych w Top 500?

Przede wszystkim stawiamy na uczciwość instytucji, uczelni i firm, które przesyłają do nas wyniki wydajnościowe swoich superkomputerów. Oczywiście w przypadku największych i najszybszych maszyn zawsze nakazujemy przeprowadzenie całej procedury "benchmarku" i dopiero wówczas analizujemy dane wyjściowe.

Zostaliście kiedyś oszukani?

Oszukani to niewłaściwe określenie. Najczęściej zdarza się po prostu, że firmy nie informują nas o wyłączeniu, rozdzieleniu, sprzedaży swoich superkomputerów i potem mamy problem z aktualizowaniem listy - przypominam, że jest ona poprawiana co pół roku. Typowo w tym czasie zmienia się ok. 200-220 pozycji na liście. Obecnie mamy rekord, ponieważ aż 300 systemów znikło z najświeższej Top 500 w porównaniu do poprzedniego zestawienia.

Dlaczego tak się dzieje, skąd te zmiany?

Rynek superkomputerów rozwija się bardzo dynamicznie, szczególnie szybko w zakresie stosowania procesorów czterordzeniowych. Na przykład obecnie na liście jest o wiele więcej systemów Intel Harpertown (Xeon 5400) niż Intel Clovertown, które również są bardzo szybkie, ale bazują na słabszej odmianie procesorów Xeon 5300. W ciągu pół roku wiele się może zmienić nawet w takim zakresie.

Intel wydaje się dominować na liście Top 500. Czy dalsze pozycje AMD wynikają z opóźnień w produkcji czterordzeniowych procesorów przez ten koncern?

Tak, moim zdaniem tak właśnie jest. Kiedy AMD wypuściła na rynek pierwsze dwurdzeniowe procesory zdecydowanie pogrążyło to Intela na liście. Na przestrzeni ostatniego 1-1,5 roku sytuacja ta uległa diametralnej zmianie. W tym czasie pojawiły się procesory czterordzeniowe, a tu przewagę ma Intel. W układach Clovertown zastosowano metodą pozwalającą na wykonywanie 4 operacji zmiennoprzecinkowych w jednym cyklu (na 1 rdzeń) - AMD zdecydowanie opóźnia się z wprowadzeniem podobnych rozwiązań do swoich "quadów" i w ogóle rozpowszechnieniem ich na rynku. Tymczasem systemy obciążeniowe Linpark używane przy obliczaniu wydajności superkomputerów Top 500 doskonale wykorzystują technologie stosowane w czterordzeniowych procesorach Intela i stąd się bierze przewaga w zestawieniu tej firmy nad AMD.

Ma Pan jakieś przewidywania, co do następnej edycji listy Top 500?

Nie jestem pewny, czy w następnym zestawieniu będziemy mieć już system osiągający 2 petaflopy/s, mimo bardzo dynamicznego rozwoju superkomputerów opartych na czterordzeniowych procesorach. Jednak ciekawostką na pewno będzie zamieszczenie obok wydajności procesorów informacji o konsumpcji energii przez superkomputery. Dodam, że nie będą to wartości szczytowe określane w dokumentacji, bo te są zwykle mylące, ale prawdziwe wartości wynikające z rzetelnie przeprowadzanych testów.

***

Najnowsza lista Top 500 (czerwiec 2008 r.) dostępna jest pod tym adresem.


TOP 200