Te komputery są super!

A w Europie piąty

Te komputery są super!

W 1997 r. po raz pierwszy w historii komputer pokonał w turnieju szachowym mistrza świata. Gari Kasparow przegrał 2,5:3,5 ze stworzonym przez zespół konstruktorów IBM superkomputerem Deep Blue.

Ulokowany w zabytkowych wnętrzach kaplicy na terenie Politechniki Katalońskiej (Barcelona) MareNostrum zajmuje piąte miejsce na liście najsilniejszych superkomputerów na świecie.

W połowie 2004 r. rząd hiszpański, rząd Katalonii i Politechnika Katalońska podpisały porozumienie o zbudowaniu nowego centrum obliczeniowego - BSC (Barcelona Supercomputer Center), w którym będzie pracować system obliczeniowy MareNostrum (dawna, łacińska nazwa Morza Śródziemnego). Kiedy 28 października 2004 r. uruchomiono superkomputer, dysponował on mocą obliczeniową 20,5 TF. Docelowo MareNostrum ma mieć moc przetwarzania 40 teraflopów.

System składa się całkowicie z komercyjnie dostępnych komponentów IBM. Obecnie tworzy go 2400 serwerów kasetowych eServer BladeCenter JS20 umieszczonych w 170 obudowach BladeCenter. Daje to razem 4800 64-bitowych procesorów PowerPC 970FX 2,2 GHz. Do tego dochodzi 140 TB pamięci masowej TotalStorage DS4100. Serwery wchodzące w skład klastra (system Linux 2.6) komunikują się przez szybkie połączenia oparte na technologii Myrinet. MareNostrum zajmuje powierzchnię 120 m2 i waży 60 ton.

Linux rządzi, a Windows się spóźnia

Wśród superkomputerów najczęściej spotykanymi systemami operacyjnymi były dotąd różne odmiany Uniksa, odpowiednio modyfikowane do takich zastosowań. Od kilku lat statystyki dotyczące maszyn znajdujących się na liście Top500 (nieoficjalne, bowiemhttp://www.top500.org nie podaje zestawień dotyczących systemów operacyjnych) mówią o wielkiej ekspansji Linuksa. Szacuje się, że obecnie wśród 500 najszybszych na świecie komputerów aż 60% pracuje pod Linuksem. W pierwszej dziesiątce Top500 aż 8 superkomputerów korzysta z tego systemu.

Te komputery są super!

W przypadku superkomputera MareNostrum połączenie najnowszej techniki ze starą architekturą Politechniki Katalońskiej robi niesamowite wrażenie.

Zwolennicy Linuksa zwracają uwagę na to, że odmiany Uniksa działają zwykle na jednej lub dwóch architekturach sprzętowych, podczas gdy Linux pracuje na ponad 20 różnych platformach - zarówno intelowskich, jak i opartych na procesorach RISC. I chociaż tylko część z tych platform nadaje się do HPC (High Performance Computing), to ta różnorodność w połączeniu z wielką dostępnością i brakiem kosztów licencyjnych stanowi o przewadze systemu open source.

Microsoft pracuje nad pierwszą wersją systemu Windows, który będzie mógł obsługiwać superkomputery mające topologię klastra. Premiera oprogramowania Windows Server 2003 Compute Cluster Edition opóźnia się jednak. Zapowiadane na koniec tego roku (przeznaczona do testowania wersja beta miała być latem) ma się pojawić w połowie przyszłego. Oprogramowanie, za pomocą którego Microsoft chce zaistnieć na rynku zdominowanym przez systemy linuksowe i uniksowe, ma w pierwszym wydaniu obsługiwać tylko procesory x86 z rozszerzeniem 64-bitowym. Oczekiwana nie tylko przez HP obsługa procesorów Itanium 2 ma się pojawić dopiero w drugim wydaniu Windows Server 2003 CCE. Zdaniem Microsoftu procesory Itanium 2 są zbyt drogie i zbyt potężne dla niewielkich, tanich klastrów (a przede wszystkim takie mają być budowane przy użyciu nowego systemu Windows Server).

Microsoft zapowiada, że wersja klastrowa systemu Windows będzie zawierać pewne ograniczenia dotyczące sposobu wykorzystywania oprogramowania, tak aby firmy nie mogły go używać do wykonywania niektórych zadań sieciowych, takich jak hosting WWW.

Wiadomo już, że pierwsza wersja Windows Server 2003 Compute Cluster Edition będzie oferować wiele opcji podobnych do tych, jakie są stosowane w klastrach linuksowych. I tak produkt będzie np. wspierać technologię MPI (Message Passing Interface) i zawierać narzędzia do pisania aplikacji uruchamianych na systemach klastrowych. Microsoft podał też, że jedna z kolejnych wersji systemu będzie wspierać technologię .Net, dzięki czemu programiści będą mogli projektować aplikacje, wykorzystując do tego celu język C.

Superkomputery trafiają pod strzechy

Te komputery są super!

MareNostrum składa się całkowicie z komercyjnie dostępnych komponentów IBM - serwerów kasetowych eServer BladeCenter JS20 umieszczonych w obudowach BladeCenter.

Superkomputerami interesowały się do niedawna głównie instytucje naukowe, wojsko i duże korporacje. Ponieważ ceny superkomputerów znacznie spadły, zainteresowanie tego rodzaju systemami obliczeniowymi zgłasza też biznes.

Tego typu rozwiązania stają się powszechnie dostępne w dużej mierze za sprawą Linuksa. Dużą popularność zyskała architektura Beowulf, czyli klaster linuksowy zbudowany przy użyciu powszechnie dostępnych komponentów sprzętowych - komputerów PC połączonych siecią opartą na standardowych kartach sieciowych i przełącznikach Ethernet. Taka wieloprocesorowa architektura stała się alternatywą dla zintegrowanych systemów równoległych i świetnym rozwiązaniem dla mniejszych, niedysponujących wielkimi środkami finansowymi instytucji.

Jej początki sięgają 1993 r., w którym amerykańska NASA zainicjowała Beowulf Parallel Workstation Project. Celem projektu było stworzenie klastra opartego na tanim sprzęcie i darmowym oprogramowaniu, który mógłby wykonywać zadania dotychczas realizowane jedynie przez systemy mainframe i superkomputery. Nazwa projektu NASA wywodzi się z duńskiego poematu "Beowulf" z VIII w., którego bohater pokonywał potężne bestie. Tym razem Beowulf miał być pogromcą superkomputerów.

Obecnie w ofertach producentów serwerów można znaleźć gotowe, zaawansowane klastry Beowulf (oparte także na procesorach RISC). Są to prekonfigurowane systemy do montażu na stelażach, wykorzystujące szybkie, przełączane sieci.

Tańsze klastry nie są jednak w stanie całkowicie zastąpić superkomputerów. Nadal istnieją aplikacje, które można uruchomić wyłącznie na drogich systemach klasy high-end. Między innymi dla tych, którzy muszą korzystać z takich aplikacji, IBM przygotował komercyjną wersję swojego legendarnego superkomputera Blue Gene.

eServer Blue Gene zajmuje mniej niż 1 m2 podłogi, wykorzystuje procesory PowerPC, techniki chłodzenia oraz klasteringu ze swego większego brata i oferuje moc 5,7 teraflopa. Jeśli ktoś zdecydowałby się posiadać tę "komercyjną" wersję Blue Gene na własność, musi się liczyć z wydatkiem minimum 1,5 mln USD. Tym, którzy takiej kwoty nie mają, IBM ma umożliwić wynajmowanie mocy obliczeniowej tego superkomputera w swoich centrach Deep Computing On Demand, ulokowanych w USA i Europie.

Polska poza rankingiem

Te komputery są super!

Tańsze klastry nie są jednak w stanie całkowicie zastąpić superkomputerów. Nadal istnieją aplikacje, które można uruchomić wyłącznie na drogich systemach klasy high-end. Dla tych, którzy muszą korzystać z takich aplikacji, IBM przygotował komercyjną wersję swojego legendarnego superkomputera - eServer Blue Gene, dostępną za 1,5 mln i więcej USD.

W tym roku nie ma na liście Top500 żadnego polskiego superkomputera. Jeszcze rok temu, w 23. notowaniu można było znaleźć dwa. Należący do Telekomunikacji Polskiej, a zbudowany przez HP komputer SuperDome 875, dysponujący 384 procesorami i mocą 744 gigaflopów, zajął wtedy miejsce 381. Na miejscu 487. odnotowano system Holk Optimusa, o mocy 641,6 gigaflopa.

W latach 1993-1999 w ramach realizowanego przez Komitet Badań Naukowych programu budowy infrastruktury informatycznej nauki powstały centra komputerów dużej mocy, udostępniające środowisku naukowemu swe zasoby. Takich centrów jest pięć: w Gdańsku (TASK), Krakowie (CYFRONET), Poznaniu (PCSS), Warszawie (ICM) i Wrocławiu (WCSS).

Zamieszczony rok temu na liście Top500 Holk znajduje się w gdańskim TASK-u. Zbudowany przez Optimusa system to klaster maszyn SMP z siecią Gigabit Ethernet/InfiniBand i 256 procesorami Itanium 2. Od listopada 2004 r. w skład klastra Holk wchodzi podklaster clusterix z 16 węzłami wyposażonymi w 2 procesory Itanium2 1,4 GHz oraz sieć InfiniBand. Moc tego rozbudowanego, 288-procesorowego superkomputera jest szacowana na 1510 gigaflopów, co dawałoby mu pierwsze miejsce wśród polskich superkomputerów.

Poznańskie Centrum Superkomputerowo Sieciowe forsuje koncepcję budowy metakomputera, który składa się z wielu różnorodnych, specjalizowanych zasobów komputerowych. Użytkownik używa metakomputera w sposób zbliżony do korzystania ze zwykłego, pojedynczego systemu komputerowego. W PCSS zbudowano klaster składający się z 126 węzłów obliczeniowych (109 maszyn HP Integrity rx2600 i 17 Optimus NSERVER), połączonych siecią Gigabit Ethernet. Szacowana moc klastra to 1,4 teraflopa.

W ICM na Uniwersytecie Warszawskim dwa najsilniejsze komputery to Halo i Tornado. Pierwszy z nich składa się z 98 węzłów IBM e325, każdy z 2 procesorami Opteron 246 (2 GHz). Teoretyczna wydajność tego superkomputera to 784 gigaflopów. Z kolei Tornado to superkomputer Cray X1e składający się z 8 węzłów i 128 procesorów o częstotliwości taktowania 1130 MHz. Teoretyczna wydajność tej maszyny to 576 gigaflopów.

Wśród komputerów dużej mocy obliczeniowej w Cyfronecie na krakowskiej AGH jest linuksowy klaster PC typu Boewulf, zainstalowany pod koniec 2002 r. na potrzeby europejskiego projektu CrossGrid. Obecnie klaster o nazwie Zeus ze 144 procesorami (Intel Xeon), obsługiwany przez system operacyjny RedHat Linux 7.3, oferuje teoretyczną moc obliczeniową 545 gigaflopów.

Głównym komputerem dużej mocy we wrocławskim WCSS jest SGI Origin 2000 (32 procesory). Centrum posiada też m.in. klaster złożony z 29 dwuprocesorowych węzłów PC i serwera plików.

Superkomputerowe statystyki

Ostatnie zestawienie Top500 jest przełomowe, wszystkie zamieszczone w nim superkomputery oferują moc przetwarzania powyżej 1 teraflopa. Moc ostatniego na liście, przetwarzającego dane z szybkością 1,166 teraflopa, równa się sumarycznej wydajności wszystkich 500 superkomputerów zamieszczonych w pierwszym zestawieniu Top500, które ukazało się w czerwcu 1993 r.

Procesory Intela obsługują 333 systemy na najnowszej liście. Układów Pentium 4 użyto w 175 systemach, Itanium 2 w 79, a Xeon Extended Memory 64 Technology (EM64T) w 76 komputerach. Procesory PowerPC firmy IBM wykorzystano w 77 maszynach, PA-RISC firmy HP w 36, a Opterony AMD napędzają 25 superkomputerów z Top500. 304 superkomputery to systemy klastrowe i taka architektura dominuje na liście.

IBM pozostaje zdecydowanym liderem w ostatnim Top500. Producent dostarczył 51,8% wszystkich systemów i 57,9% sumarycznej mocy przetwarzania. Na drugim miejscu jest HP z 26,2% systemów i 13,3% mocy przetwarzania. Na trzecim uplasował się SGI z wynikiem odpowiednio 5% i 7,45%. Z licznego grona pozostałych producentów ani jeden nie może pochwalić się wynikiem ponad 5-proc. w żadnej kategorii.

Geograficznie prym wiodą Stany Zjednoczone. Zainstalowanych jest tam 294 z 500 systemów. Druga jest Europa ze 114 superkomputerami. Wzrasta liczba azjatyckich instalacji poza Japonią. Jest ich teraz 58. Sama Japonia może pochwalić się 23 systemami na liście Top500.


TOP 200