Jak zbudować tani klaster obliczeniowy

Rozwiązanie bardzo skomplikowanych zadań wymagających dużej ilości obliczeń realizuje się za pomocą klastrów komputerowych. Przedstawiamy najciekawsze rozwiązania, łączące niskie koszty z wysoką wydajnością.

Aby zbudować superkomputer, najczęściej korzysta się z tradycyjnego podejścia, łącząc dużą liczbę szybkich serwerów za pomocą bardzo szybkich łączy, a dane przechowuje się na wydajnych . Rozwiązanie to daje bardzo dobre wyniki, ale jest kosztowne. Niekiedy można skorzystać z alternatywnej drogi do wysokiej mocy obliczeniowej - wykorzystanie dużego klastra tanich komputerów, które przy tym pobierają niewiele energii. W ten sposób można zrealizować klastry obliczeniowe wykorzystywane w astronomii, projektowaniu radarów lub nawet uruchamianiu testów tak szybko, jak na to pozwalają ograniczenia budżetowe.

GPU w astronomii

Anteny radioteleskopu Murchison Widefield Array

Anteny radioteleskopu Murchison Widefield Array

Ciekawym zastosowaniem klastrów są obliczenia astronomiczne, związane z badaniami przeprowadzanymi na australijskim pustkowiu. Radioteleskopy Murchison Widefield Array są zlokalizowane na odludziu, z dala od wszelkich siedzib cywilizacyjnych, aby uniknąć zakłóceń spowodowanych przez infrastrukturę miast. Na tym pustkowiu nie ma infrastruktury światłowodowej, by móc przesłać nieprzetworzone dane z teleskopów, niezbędne było przetwarzanie danych na miejscu, w czasie rzeczywistym, przy użyciu superkomputera. Ponieważ teren instytutu badawczego znajduje się aż 50 km od najbliższych zabudowań i ponad 300 km od miasta, jedynym źródłem zasilania w tej lokalizacji jest generator z silnikiem Diesla. Ograniczenia związane z zasilaniem wykluczyły standardowy klaster, zatem zdecydowano się na użycie procesorów graficznych obecnych w nowoczesnych kartach, gdyż charakteryzują się wysoką efektywnością energetyczną.

Dwa klastry eksploatowane w Murchison Widefield Array wykorzystują 80 jednostek GPU obecnych w kartach Nvidia Tesla S1070, przy czym całość jest zasilana z generatorów dieslowskich mocą zaledwie 40 kW. Wydajność obliczeniowa klastra sięga 2,5 teraflopsa, przepustowość to 3 GB/s. Dane pochodzące z anten radioteleskopu są porządkowane w korelatorze, a następnie dostarczane do klastra, który je przetwarza. Obliczenia obejmują modelowanie za pomocą przekształceń Fouriera, korekcję zniekształceń wprowadzanych przez jonosferę, a także kalibrację instrumentów.

Jak mówi Richard Edgar, badacz w ośrodku Murchison Widefield Array, "standardowe procesory, takie jak Xeon czy Opteron nie dostarczyłyby wymaganej mocy obliczeniowej, mieszcząc się jednocześnie w ograniczeniach związanych z dostępną ilością energii. Zastanawialiśmy się nad oszczędnymi energetycznie procesorami MIPS, ale również okazały się za mało wydajne. Dopiero zastosowanie GPU umożliwiło pogodzenie wysokiej wydajności z ograniczeniami budżetu energetycznego".

Klaster ten nie jest jeszcze ukończony, ale testowe wdrożenie już działa i przetwarza dane. Według Edgara jest to najszybsza maszyna na świecie pod względem stosunku mocy obliczeniowej do pobieranej energii elektrycznej.

PlayStation 3 na usługach wojska

Klaster konsol PlayStation 3 wykorzystywany przez wojsko

Klaster konsol PlayStation 3 wykorzystywany przez wojsko

Jednym z największych wyzwań jest modelowanie zachowania człowieka przez komputer, by oprogramowanie wykonywało podobne zadania co ludzie. Dla sił powietrznych USA oznacza to między innymi rozpoznawanie obrazów radarowych i dostrzeganie wszystkich anomalii w czasie rzeczywistym.

Według Richarda Lindermana, głównego naukowca oddziału informacji w Air Force Research Laboratory, laboratorium to "wykorzystuje superkomputery do korekcji zniekształceń wprowadzanych przez atmosferę w czasie rzeczywistym oraz do sprawnego rozpoznawania celu za pomocą algorytmów sztucznej inteligencji w taki sposób, jak zrobiliby to ludzie". Zadania te wymagają bardzo dużej mocy obliczeniowej, przy czym wykorzystanie konsol PlayStation rozważano już kilka lat temu, gdy grupa analizowała koszty superkomputerów. Linderman wspomina, że analizowano maszynę RoadRunner, zbudowaną przez IBM dla Los Alamos kosztem ponad 100 mln USD, i stwierdzono, że sercem tego komputera są procesory Cell, które są także wykorzystywane w konsolach PlayStation 3.

Przenośny ultraoszczędny komputer QuadPlug

Przenośny ultraoszczędny komputer QuadPlug

Klaster PlayStation 3 kosztował 330 tys. USD i miał szczytową moc obliczeniową 40 teraflopsów, zatem wykazywał się dziesięciokrotnie korzystniejszym stosunkiem wydajności do ceny. Obecnie Air Force przekonstruowało klaster w taki sposób, by wykorzystywać tańsze komponenty i jeszcze podwyższyć wydajność. Obecnie połowa z mikroprocesorów to GPU, szczytowa moc obliczeniowa jest rzędu 500 teraflopsów, a koszt - około 2 mln USD. "Nie chcemy płacić wysokich rachunków za prąd, zatem wydajność energetyczna była istotnym czynnikiem. Większość superkomputerów o wydajności rzędu 500 teraflopsów pobiera wiele megawatów. Nasz klaster zadowala się mocą 300 kW, zatem oszczędności związane z energią elektryczną sięgają 1 mln USD za megawat rocznie" - mówi Linderman.