Sprawdzamy nowego Nehalema

Nowy procesor Intela ma osiem rdzeni, obsługuje dużą ilość pamięci, posiada opcje niezawodności, znane dotąd z maszyn klasy mainframe. Oto test wydajności tego procesora w praktycznych zastosowaniach.

Chociaż procesory Itanium nie mogą równać się pod względem wydajności z dzisiejszymi procesorami x86, mają opcje, o których administratorzy typowego środowiska x86 mogli dotąd tylko marzyć. Procesory z serii Itanium zostały stworzone do zastosowań, w których niezbędne było zapewnienie wysokiej dostępności, zatem wprowadzono tam opcje typowe dla środowiska mainframe. Są nimi, oprócz skalowalności ponad 16 procesorów, między innymi: izolacja uszkodzonych modułów pamięci, wymiana pamięci podczas pracy komputera, mirroring pamięci między gniazdami, ochrona przed naruszeniem integralności danych oraz dodawanie procesorów podczas pracy komputera i systemu operacyjnego. Obecnie te opcje są dostępne w najnowszych procesorach serwerowych Xeon Nehalem-EX, co daje szansę istotnej poprawy wydajności i skalowalności środowiska x86.

Maszyny testowe

Ponieważ w laboratorium nie było serwera z procesorem X7400, wybrano czteroprocesorową maszynę z HL DL580 z czterordzeniowymi procesorami X7350 Tigerton, taktowanymi zegarem 2,93 GHz (rozmiar pamięci podręcznej trzeciego poziomu - 3 MB). Wydajność porównywano z serwerem Dell R810, w którym pracują dwa ośmiordzeniowe Nehalemy-EX z serii X7560 taktowane zegarem 2,26 GHz. Starszy procesor nie korzystał z technologii Hyper-Threading, zatem nie jest to bezpośrednie porównanie poprzedniej generacji procesorów z najnowszą, ale bardzo dobrze odzwierciedla różnice w wydajności w typowych warunkach, gdy platforma serwerowa jest starsza niż rok i korzysta z procesorów z serii X7300. Liczba fizycznych rdzeni w obu przypadkach jest taka sama, ale występuje różnica w częstotliwości taktowania zegara (starsza maszyna ma wyższą).

Zadania testowe

Do testów wybrano zestaw zadań, które odzwierciedlają pracę różnych komputerów. Są nimi: konwersja pliku dźwiękowego (152 MB WAV do MP3 256 kbit/s) za pomocą LAME, kompresja za pomocą gzip i bzip2 (55 MB plik MP3), obliczenie skrótów kryptograficznych MD5 na zbiorze plików o objętości 152 MB oraz transkodowanie 24 MB pliku MP4 do formatu FLV. Testy te są jednowątkowe, ale były uruchamiane równolegle ze stopniowo zwiększaną ilością jednoczesnych zadań. W ten sposób badano zachowanie fizycznych i logicznych rdzeni, pasmo dostępu do pamięci oraz połączenia międzypamięciowe, a także podsystem wejścia/wyjścia. Aby uniknąć wpływu pasma dostępu do dysków na wyniki obliczeń, wykorzystano ramdysk, W procesorach EX powtórzono testy przy włączonym i wyłączonym hyper-threadingu. Do porównań z procesorami starszej generacji wzięto jedynie wyniki z wyłączonym HT, by liczba logicznych rdzeni widocznych w systemie była identyczna.

Im więcej procesów, tym EX jest szybszy

Przy ośmiu równoległych procesach, cztery procesory X7350 miały podobne osiągi do dwóch EX w testach LAME i gzip, ale pozostawały w tyle w innych testach. Przy 16 równoległych operacjach, różnica się zwiększyła, przy czym X7350 jeszcze bardziej wygrywał z EX w testach LAME i gzip, ale znacznie bardziej odstawała od EX w pozostałych. Gdy ilość zadań przekroczyła liczbę logicznych procesorów, przewaga serii EX była widoczna już we wszystkich testach. Po przeprowadzeniu wielu testów z 48, 64 i 96 konkurencyjnymi zadaniami ustalono ponad wszelką wątpliwość, że różnica ta pogłębia się w miarę wzrostu ilości równoczesnych procesów. Dla przykładu, przy 64 procesach dwa procesory EX wykonywały to samo zadanie (konwersja MP4 do FLV) w 2 minuty i 12 sekund, a czteroprocesorowa maszyna z X7350 potrzebowała na te same obliczenia ponad 30 minut. Przewaga procesora EX rośnie wraz ze wzrostem ilości równoległych zadań - przy 768 zadaniach, EX nadal był o 50% szybszy od X7360 przy 64 zadaniach.

W celu komercyjnej reprodukcji treści Computerworld należy zakupić licencję. Skontaktuj się z naszym partnerem, YGS Group, pod adresem [email protected]

TOP 200