Moc do piątej potęgi

IBM chciałby, aby układy Power5 stały się tak popularne, jak procesory Xeon Intela. Technicznie biją je na głowę, ale...

IBM chciałby, aby układy Power5 stały się tak popularne, jak procesory Xeon Intela. Technicznie biją je na głowę, ale...

W porównaniu z uwagą, jaka towarzyszy zwykle premierom nowych generacji procesorów Intela, ubiegłoroczna inauguracja wprowadzenia do serwerów IBM procesorów Power5 została potraktowana jak jednodniowy news. Szkoda, bo jest to wyjątkowy przykład wysokiego kunsztu projektantów, a także wyraz technologicznego zaawansowania IBM w dziedzinie półprzewodników.

Inżynierskie cacko

Układy Power5 cechują się wysoką wydajnością obliczeniową i I/O, niższym poborem mocy niż poprzedzające je konstrukcje Power4 i Power4+, a także lepszymi osiągami w dziedzinie skalowania w systemach wieloprocesorowych. Do tego dochodzą: sprzętowa wielowątkowość, partycjonowanie oraz wirtualizacja zasobów w sposób, o którym inni producenci mogą na razie co najwyżej pomarzyć.

Co najmniej tak samo interesujące jak technikalia Power5 stały się ostatnio związane z tą architekturą inicjatywy marketingowe. Otóż IBM - firma utrzymująca się z tysięcy patentów i licencjonowania technologii - postanowiła udostępnić specyfikację Power5 i towarzyszących jej narzędzi na otwartej licencji. Czyżby sprzedając dział komputerów PC IBM przypomniał sobie o korzeniach, czy też zrobił to mając przed oczami wciąż rosnące konsorcjum Eclipse? Zapewne i jedno, i drugie.

Niezależnie od tego, co ze specyfikacją uczynią potencjalni partnerzy OEM, IBM zamierza podążać za własną wizją rynkowej pozycji układów Power5. W tej wizji dla układów Power5 jest miejsce nie tylko w serwerach klasy najwyższej, ale także średniej i podstawowej - obok Itanium 2, AMD Opteron oraz Xeon. O tym, że nie są to jedynie pobożne życzenia, świadczy fakt, że to właśnie procesory Power5 zostały wybrane przez Microsoft jako serce kolejnej wersji konsoli do gier XBOX.

Filozofia szybkich kroczków

Moc do piątej potęgi

Mały wielki Power5

W latach 80. naukowcy i inżynierowie IBM opracowali procesory RISC pod nazwą IBM 801. Elementy tej architektury skoncentrowanej na uzyskaniu jak najwyższej wydajności wciąż "żyją" w procesorach Power. Różnica między układami RISC (Reduced Instruction Set Computing) a CISC (Complex Instruction Set Computing) leży w filozofii ich działania.

W układach typu RISC wydajność jest uzyskiwana dzięki zrównolegleniu wykonywania niewielkiego zbioru prostych operacji. Ułożenie tych prostych operacji w skomplikowane ciągi tworzące funkcje to zadanie dla wytrawnego programisty i kompilatora. W architekturze CISC chodzi o to, by procesor zawierał jak najwięcej definicji skomplikowanych funkcji, aby można je było bezpośrednio wywołać i wykonać ze sprzętowym przyspieszeniem zamiast pisać je od podstaw.

Power5 to układ zwierający dwa rdzenie obliczeniowe współdzielące szybką pamięć podręczną L2. Akurat dwa rdzenie nie są tu nowością - poprzednik Power5 noszący nazwę Power4+ też miał ich dwa. Również owe 2 MB L2 nie stanowi dziś wielkiego wyczynu. Znacznie ważniejszy niż sama pojemność jest tu efektywny mechanizm współdzielenia pamięci L2 przez układy znajdujące się na tej samej płytce krzemowej. Dane i instrukcje pobrane przez jeden z rdzeni są natychmiast dostępne dla drugiego. Współdzielenie pamięci L2 zwiększa prawdopodobieństwo, że przy wykonywaniu kolejnej instrukcji jednostka CPU nie będzie musiała sięgać do pamięci zewnętrznych.

Z drugiej strony, mechanizm współdzielenia powoduje, że bardziej prawdopodobna staje się sytuacja żądania jednoczesnego dostępu do pamięci L2 przez obie jednostki obliczeniowe, co jest niepożądane.

IBM obszedł ten problem poprzez mechanizm arbitrażu, pozwalający zarządzać dostępem do współdzielonej pamięci bez powstawania zakleszczeń - mechanizm arbitrażowy rozstrzyga, który z rdzeni ma prawo sięgnąć po dane pierwszy. Taka konstrukcja jest szczególnie użyteczna właśnie na platformie RISC, gdyż realizuje ona wiele krótkich operacji.

Aby ograniczyć czas oczekiwania na dostęp, IBM wprowadził specjalny mechanizm - pamięć została podzielona na trzy segmenty (odczyt danych, zapis danych, odczyt instrukcji). Dodatkowym wsparciem dla pamięci L2 jest gigantyczna pamięć podręczna trzeciego poziomu - po 18 MB dla każdego rdzenia. Tym razem już bez współdzielenia, ale za to z możliwością bezpośredniego odwoływania się poprzez dedykowaną szynę. Tak się bowiem składa, że Power5 zawiera na pokładzie kontroler pamięci cache L3 i pamięci RAM.

Dwa, czyli cztery

Power5 jest układem nie tylko dwurdzeniowym, ale to również dwuwątkowy SMT (Simultaneous Multi-Threading) zaprojektowany wcześniej dla procesorów Power4. Efektywnie układ Power5 może więc równolegle (w pewnych warunkach) obsługiwać 4 wątki. Tom Yager, dyrektor techniczny centrum testowego tygodnika InfoWorld, ocenia, że mechanizm IBM SMT ma nawet 30-proc. przewagę nad Intel HT.

Power5 wykorzystuje też mechanizm Dynamic Resource Balancing. Analizuje on zachowanie poszczególnych wątków obliczeń i przyznaje im priorytety, tak aby zapobiec spowolnieniu przepływu danych przez niektóre instrukcje. Na przykład, jeśli w kodzie programu pojawi się konieczność sekwencyjnego, nieprzerwanego wykonania zestawu instrukcji blokujących inne wątki, procesor stara się to przewidzieć i w pierwszej kolejności wykonać inne, prostsze rozkazy, ograniczając prawdopodobieństwo spadku wydajności systemu.

Dodatkowo układy pozwalają na arbitralne przyznawanie, przez system operacyjny, sterowniki lub aplikacje, priorytetów wykonania dla każdego z wątków. Priorytety te są wykorzystywane przez Dynamic Resource Balancing, m.in. do obliczania czasu aktywności wątków i optymalizacji wydajności. Mechanizmy te umożliwiają również systemowi operacyjnemu kontrolowanie poboru mocy przez zmiany w priorytetach.

Power5 wykorzystuje też zakodowane w procesorze informacje o elementach układu stosowanych przez każdą instrukcję RISC i automatycznie wyłącza zasilanie modułów zbędnych w danym momencie.

Być dobrym nie wystarczy

Wysoka wydajność, względnie prosta, a jednocześnie innowacyjna architektura, brak problemów ze wsteczną zgodnością, zaawansowane i dobrze sprawdzone oprogramowanie narzędziowe oraz wsparcie ze strony technologicznego giganta to trudne do zakwestionowania zalety procesorów Power5. Jeżeli marketing IBM osiągnie kiedykolwiek równie wysoki poziom co kwalifikacje jego inżynierów, to Intel będzie musiał mieć się na baczności. Na razie, mimo potknięć i błędów taktycznych, piłka jest w jego rękach.

Na podst. InfoWorld oprac. wpa

Tom Yager jest dyrektorem technicznym centrum testowego amerykańskiego tygodnika InfoWorld.

Sny o potędze

Intel marzy o rozszerzeniu swoich wpływów na rynek serwerów najwyższej klasy, tymczasem IBM zerka na opanowany przez Intela rynek systemów klasy podstawowej i niższej - średniej. Stąd właśnie decyzje IBM o wprowadzeniu tanich serwerów z Power5 i zainstalowanym systemem Linux, kosztujące ok. 5 tys. USD. Ta sama motywacja przyświecała IBM, gdy ogłosił pod koniec 2004 r., że otwiera specyfikację układów Power i związanych z nimi narzędzi. Pięć tysięcy USD to wciąż sporo.

Na tym rynku cena zmienia wszystko.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200