Najszybszy superkomputer w Polsce

Po raz drugi w historii polski superkomputer znalazł się wśród pięćdziesięciu najszybszych maszyn na świecie notowanych na liście top500.org. Przedstawiamy klaster Prometheus uruchomiony w Akademickim Centrum Komputerowym Cyfronet AGH.

Klaster Prometheus miał swoją premierę w kwietniu bieżącego roku. Inicjatorem projektu budowy superkomputera był obecny dyrektor naczelny Cyfronetu, prof. Kazimierz Wiatr. Maszyna ta obecnie znajduje się na 49 miejscu listy top500 org datowanej na czerwiec 2015r. Jest to bardzo wysoka lokata, poprzednio miejsce 48. na liście z czerwca 2008r. zajął klaster Galera zlokalizowany w TASK (news z 2007r.)

Najszybszy superkomputer w Polsce

Superkomputer Prometheus

W klastrze Prometheus pracuje 1728 serwerów HP ProLiant XL730f Gen9 (41472 rdzenie Intel Haswell, 216TB RAM) połączonych magistralą Infiniband 56GBit/s, zasoby storage stanowią dwa systemy plików Lustre po 5PB każdy (szybszy z tych zasobów osiąga prędkość dostępu 120GB/s). Serwery są zasilane prądem stałym, każda półka posiada wysokosprawną przetwornicę DC/DC o mocy do 1,2 kW. Klaster pracuje w reżimie pracy ciągłej, sieć zasilania gwarantowego składa się z zasilaczy bezprzerwowych oraz generatora z silnikiem diesla o mocy 2,5MW.

Wydajność teoretyczna klastra osiąga 1,68 Pflops, maksymalna zmierzona osiąga 1,26 Pflops, co obecnie klasyfikuje ten klaster na 49 miejscu na świecie i jest to najszybszy komputer dużej mocy w kraju. Jak większość superkomputerów na świecie, Prometheus korzysta z Linuksa, na klastrze zainstalowana jest dystrybucja CentOS 7.1. Według informacji firmy HP, jest to pierwsza w Europie i największa na świecie instalacja platformy HP Apollo 8000.

Oprogramowanie

Z superkomputera korzystać będą przeważnie naukowcy, dla których większa moc obliczeniowa oznacza możliwość pracy z zadaniami o wyższym stopniu skomplikowania, które dodatkowo będzie można wykonać szybciej, niż dotąd. Na klastrze Prometheus pracuje oprogramowanie specjalistyczne, w tym aplikacje matematyczne, chemiczne oraz inżynierskie CAD/CAE, systemu informacji terenowej GIS, a także specjalizowane dodatkowe kompilatory. Dla oprogramowania pracującego w klastrze jest również dostępna baza Oracle. Na potrzeby wielkich projektów takich jak PLGrid, fizyki wysokich energii czy badań astrofizycznych i geofizycznych udostępnione są dodatkowe specjalizowane narzędzia.

Komputery chłodzone wodą

Konstrukcja klastra od początku zakładała wysoką gęstość mocy instalacji. Cały klaster Prometheus, który pobiera ponad 600kW energii elektrycznej, mieści się zaledwie w 15 standardowych szafach na powierzchni 13 mkw, a zatem mamy do czynienia z bardzo dużą gęstością mocy, zbliżoną do 40kW na szafę. Już przy mocy rzędu 20kW na jedną szafę odprowadzenie ciepła jest dość trudne przy chłodzeniu powietrzem, a system charakteryzowałby się wtedy co najwyżej przeciętną sprawnością energetyczną. Inżynierowie postanowili sięgnąć po chłodzenie wodne. Ciepło wytwarzane przez elementy aktywne (głównie procesory) jest odprowadzane na zewnątrz serwera przez zestaw rurek wypełnionych cieczą.

Najszybszy superkomputer w Polsce

System chłodzenia (obieg wewnątrzserwerowy) procesora, pamięci i dysków w serwerach platformy Apollo 8000.

Styk z wymiennikiem centralnego systemu chłodzenia szafy odbywa się z jednej strony serwera kasetowego, wchodząca do szaf ciecz chłodząca ma temperaturę około 30°C, a odprowadzone z serwerów ciepło przechodzi przez dwa następne zamknięte obiegi (pierwotny i wtórny), by ulec odprowadzeniu na zewnątrz za pomocą agregatu. Dzięki specjalnej konstrukcji obiegów możliwe jest odłączenie serwerów z szafy bez przerwania pracy obiegów cieczy chłodzącej. Wysokie ciepło właściwe wody oraz dopracowany system chłodzenia umożliwia osiągnięcie współczynnika efektywności PUE około 1,03, podczas gdy dla klasycznego chłodzenia powietrzem ten współczynnik wynosi od 1,3 do 2. Tak sprawny system chłodzenia umożliwia radykalne oszczędności na energii elektrycznej (rocznie rzędu kilkuset tysięcy złotych przy rachunkach liczonych w milionach złotych).


TOP 200