HP xw4200, czyli 64 bity Intela

12 stycznia 2005 0 przez Artur Wyrzykowski

Procesory Intela z technologią EM64T są jeszcze zjawiskiem rzadko spotykanym, ale 64-bitowe rozszerzenia w Pentium 4 to prawdziwy unikat. Pierwszym dostępnym w Polsce komputerem z takim procesorem jest stacja robocza HP xw4200, którą możemy dziś zaprezentować. Okazała się ona interesująca także z innych powodów – choćby dlatego, że wykorzystuje nowoczesny chipset desktopowy Intel 925X Express oraz liczne, dość oryginalne rozwiązania konstrukcji mechanicznej, których nie spotkamy nawet w drogich komputerach PC.

Stacje robocze HP przeznaczone są dla najbardziej wymagających użytkowników – projektantów, programistów, grafików czy naukowców. Są to komputery z procesorami Intela lub HP, czyli z pojedynczym Pentium 4, jednym lub dwoma Xeonami, lub też z układami PA-RISC PA-8600/8700/8800 (także w konfiguracjach dwuprocesorowych). Dzięki temu istnieje możliwość używania różnorodnych aplikacji działających pod kontrolą różnych systemów – Windows, Linuksa oraz HP-UX 11. Stacja xw4200, którą otrzymaliśmy do testu, jest przeznaczona dla Windows XP w wersji 32- i 64-bitowej, a także certyfikowana dla Red Hat Enterprise Linux 3 WS (x86 i AMD64/EM64T), SUSE Linux Enterprise Server 9 (AMD64/EM64T) oraz Novell Linux Desktop. My do testów wykorzystaliśmy Windows XP oraz SUSE Linux Professional 9.2, oba systemy w wersjach 32- i 64-bitowych.

Ciekawostki konstrukcyjne

Stacja HP xw4200 z zewnątrz wygląda jak przeciętny pecet w stojącej obudowie. Na przednim panelu widoczny jest włącznik, gniazda USB i audio, także napęd dyskietek i nagrywarka DVD. Nie ma przycisku reset – to dość typowe dla komputerów markowych. Tył obudowy także jest zwyczajny – zasilacz, poniżej wiatrak, panel ze złączami, kilka miejsc do instalacji kart rozszerzeń. Zaskakuje brak wyłącznika sieciowego, nie ma interfejsu FireWire, za to jest 6 gniazd USB. I jeszcze jeden istotny szczegół, który widać na zdjęciu – brak karty graficznej. Ponieważ stacja robocza często służy do specyficznych zastosowań, producent nie oferuje jednej grafiki, by klient mógł dokupić taką, która najlepiej spełnia wymagania. My w testach w Linuksie wykorzystaliśmy kartę z procesorem graficznym NVIDIA GeForce 6800 GT, zaś w testach w Windows XP – kartę z układem ATI RADEON X850 XT Platinum Edition. Wykorzystanie róznych kart było spowodowane m.in. ograniczeniami czasowymi, jednak z drugiej strony daje to możliwość porównania wyników testu z naszymi poprzednimi pomiarami.





        





Stacja HP xw4200 nie jest zwykłym komputerem osobistym. Wykorzystano więc w niej dość niestandardowe rozwiązania konstrukcyjne, które przede wszystkim ułatwiają czynności serwisowe. Wystarczy powiedzieć, że większość elementów można wymienić bez użycia śrubokręta – zarówno dysk, napęd optyczny, karty rozszerzeń, jak i całą płytę główną. Zaczyna się już od obudowy, która została wyposażona w specjalny zamek. Po jego otwarciu (trzeba użyć trochę siły) można zajrzeć do wnętrza, w którym widać kilka oryginalnych rozwiązań. Rzuca się w oczy sposób montowania dysku – bez problemu zmieścił się on w poprzek obudowy, dzięki czemu można go bardzo łatwo wyjąć, bo nie przeszkadzają kable, nie przeszkodziłyby nawet pełnowymiarowe karty rozszerzeń. Zwróciliśmy także uwagę na same kable łączące płytę główną z przednim panelem komputera – choć jest ich kilka (włącznik, USB, audio, głośniczek), to wszystkie zostały tak wykonane, by dało się je podłączyć dosłownie w ciągu kilku sekund. Każdy z nich ma unikalną końcówkę, więc nie można się pomylić.




        





Warto też zwrócić uwagę na zielone elementy wewnątrz obudowy, które umożliwiają szybki demontaż podzespołów. Przede wszystkim chodzi o dyski twarde, napędy optyczne i karty rozszerzeń. Na poniższym zdjęciu widać zatrzaski do mocowania dysków – lekkie odchylenie zatrzasku powoduje, że dysk można wysunąć z obudowy. Takie same mocowania widać przy stacji dyskietek i kieszeniach 5,25″. Również karty rozszerzeń są montowane bez użycia śrub – otwarcie dwóch zatrzasków powoduje zwolnienie wszystkich kart.




        





Rozwiązaniem w ogóle nie spotykanym w komputerach PC jest mechanizm do szybkiego demontażu płyty głównej, co po odłączeniu kabli można wykonać jednym ruchem. Przy krawędzi płyty znajduje się specjalny zaczep, po zwolnieniu którego płyta przesuwa się o kilka milimetrów do przodu obudowy, a następnie całą można wyjąć z komputera.




        





Ze szczegółów ułatwiających diagnostykę i naprawy warto wymienić jeszcze takie jak np. znajdująca się wewnątrz obudowy nalepka z opisem wszystkich złącz płyty głównej, czy też przycisk (zamiast zworek) do przywracania domyślnej konfiguracji BIOS-u.


O procesorze słów kilka

Intel Pentium 4 560 wykorzystany w testowanej przez nas stacji xw4200 to procesor kodowo zwany Prescott, taktowany zegarem 3,6 GHz. Jest wykonany w procesie technologicznym 90 nm z użyciem technologii rozciągania krzemu. Choć początkowo procesor został wprowadzony bez obsługi 64-bitowego rozszerzenia zestawu instrukcji i rejestrów, to obecnie – bez jakiejkolwiek premiery – pojawiły się układy z odblokowanymi możliwościami. Warto pamiętać, że wykonany w tym procesie układ ma powierzchnię krzemu 109 mm2, zaś jego maksymalna wydzielana moc cieplna przekracza 100 W. Wymaga to bardzo dobrego, intensywnego chłodzenia, co konstruktorzy z HP rozwiązali w prosty, ale skuteczny sposób – wiatrak umieszczony na radiatorze procesora nie pcha ciepłego powietrza w zamknięty bok obudowy, lecz skierowany jest tak, by tłoczyć je pod duży wentylator umieszczony na tylnej ściance. Co ważne, regulacja obrotów tych wiatraków jest samoczynna i zależna od obciążenia procesora. Przy jałowej pracy wiatraków prawie nie słychać, ale przy pełnym obciążeniu procesora wiatraki osiągają takie obroty, że komputer pracuje głośniej niż niejedna suszarka do włosów.

Po zainstalowaniu systemu sprawdziliśmy możliwości procesora za pomocą popularnego CPU-Z.





A więc zgodnie z zapowiedziami nasz testowany procesor obsługuje wszystkie zestawy instrukcji występujące obecnie w rodzinie x86. Jednak poza implementacją AMD64 (to jest poprawna nazwa handlowa, na ekranie nieprawidłowo oznaczona jako x86-64) procesor ten niczym nie różni się od Prescotta, którego opis możecie znaleźć tutaj. W skrócie przypomnijmy, że magistrala FSB działa z szybkością 200 MHz z czterema przesłaniami na takt zegara (efektywnie 800 MHz), że pamięć podręczna drugiego poziomu ma wielkość 1 MB i połączona jest 256-bitową magistralą z jądrem procesora, zaś pamięć L1 składa się z dwóch bloków przechowujących zdekodowane mikrooperacje o pojemnościach 12 tys. dla instrukcji i 16 tys. dla danych (odpowiada to mniej więcej 28 KB).


Konfiguracja komputera i zestaw konkurencyjny

Jak widać na ekranach z programu CPU-Z, procesor został osadzony na płycie głównej firmowanej przez HP, która wykorzystuje chipset Intel 925X Express (z mostkiem południowym ICH6R), ze wszystkimi skutkami z tego wynikającymi, a więc m.in. magistralą PCI Express, dwukanałowym kontrolerem pamięci DDR2, 4 portami Serial ATA (z możliwością wykorzystania Intel Martix RAID). Jedyne nasze wątpliwości dotyczyły mostka południowego, który przez CPU-Z oraz system operacyjny został wykryty jako układ 82801FB (czyli ICH6). Jednak pozwolił na utworzenie macierzy RAID 0, a w dodatku ewidentnie naniesiono na niego symbol 82801FR, czyli jest to układ ICH6R. Płyta oferuje też jedno złącze PCI Express x16, 2 złącza PCI Express x1, a także 4 standardowe gniazda PCI (32 bity, 33 MHz). W stacji wykorzystano 2 moduły pamięci DDR2 533 CL4 o łącznej pojemności 1 GB. Wśród elementów nie wchodzących w skład chipsetu, a zintegrowanych z płytą główną, znalazł się interfejs Gigabit Ethernet firmy Broadcom.

Kolejne elementy wyposażenia HP xw4200 to pamięci masowe. W tym przypadku wrażenia są mieszane – z jednej strony jest to nagrywarka DVD (LiteOn SOHC-4832K), a z drugiej – tylko jeden dysk twardy Seagate ST3160023AS (160 GB, Serial ATA). Skoro jest mostek ICH6R, to przydałby się też drugi dysk, co pozwoliłoby na korzystanie z bardzo taniej macierzy (taką możliwość daje wyposażenie opcjonalne). Drugi dysk nie zwiększyłby zbytnio ceny całej stacji roboczej. Jest też oczywiście stacja dyskietek, która jeszcze sporadycznie się przydaje, ale brakuje czytnika kart półprzewodnikowych (nie ma go też w opcjach).

Oczywiście xw4200 nie ma stałej konfiguracji i – jak wszystkie inne stacje HP – może być dostosowana do potrzeb użytkowników. Lista opcji znajduje się na stronie HP, są wśród nich właśnie liczne karty graficzne PCI Express, karty dźwiękowe, dyski ATA, SATA i SCSI, myszki, klawiatury, kontrolery FireWire, ATA i SCSI (także macierzowe), karty sieciowe, modemy, akcesoria i wiele innych elementów. Jest również oprogramowanie oraz dodatkowe opcje serwisowe. Jednak lepszym sposobem doboru komponentów stacji xw4200 jest konfigurator on-line, który od razu oblicza cenę komputera, stację można będzie też dostosować do własnych potrzeb za pomocą konfiguratora Top Config.

Konfiguracja wykorzystana w testach nieco różniła się od dostarczonej przez HP – dodaliśmy własną kartę graficzną oraz zmieniliśmy dyski, co pozwoliło zachować takie warunki, jak w naszych poprzednich pomiarach. Tak więc do większości testów xw4200 (z wyjątkiem linuksowych) wykorzystaliśmy takie podzespoły, jak w tabelce poniżej.





Naturalnym przeciwnikiem jednego z najszybszych procesorów Intela jest testowany niedawno przez nas AMD Athlon 64 FX-55. Procesor ten przedstawialiśmy szerzej w artykule dotyczącym komputera 4MAX. Tym razem jednak zamontowaliśmy go na płycie głównej Gigabyte GA-K8NXP-9, której wkrótce poświęcimy osobny artykuł. Teraz jedynie przedstawimy ją w telegraficznym skrócie.





W modzie u Gigabyte’a jest dualizm.



Gigabyte GA-K8NXP-9 wykorzystuje chipset NVIDIA nForce 4, umożliwiający komputerom z procesorem AMD Athlon 64 korzystanie z kart graficznych z interfejsem PCI Express. Typowymi dla Gigabyte’a rozwiązaniami są: podwójny BIOS, podwójny system zasilania, podwójny kontroler Serial ATA, podwójny interfejs sieciowy. Zasługą procesora jest natomiast dwukanałowy kontroler pamięci. Oprócz tego na płycie znajdziemy złącze PCI Express x16, dwa złącza PCI Express x1 oraz 8-kanałowy układ dźwiękowy. Aż się prosi, by płyta obsługiwała również – dwa procesory AMD Athlon 64… 😉

Ponieważ płyta główna dla Athlona „nieco” się spóźniła w drodze do nas, mieliśmy bardzo mało czasu na jej całkowite przetestowanie. Z tego powodu wyniki testów w Linuksie są wzięte z komputera 4MAX, który niedawno testowaliśmy. Oczywiście, wymusiło to na nas zastosowanie porównywalnej karty graficznej – z układem GeForce 6800 GT. Jedyna różnica polegała na tym, że w 4MAKSIE korzystaliśmy z wersji AGP 8x, w stacji HP z PCI Express x16. Natomiast w testach w Windows mogliśmy już korzystać z tej samej karty graficznej firmy ASUS – modelu X800 XT z podkręconym jądrem i pamięciami do poziomu X850 XT PE. Jest to więc topowa kart graficzna, jaką obecnie można kupić.

Pozostałe komponenty naszej platformy testowej zbudowanej na procesorze AMD stanowiły: dwa dyski twarde WD Raptor 10 000 obr./min (te same zastosowaliśmy w stacji xw4200 do testów Windows XP), dwa moduły pamięci DDR 400 firmy Corsair o opóźnieniach CL2. W przypadku tego komputera korzystaliśmy ze sterowników do chipsetu w wersji 6.34, zaś sterowniki do karty graficznej to Catalyst wersja beta 4.12. W przypadku stacji xw4200 do obsługi chipsetu zainstalowaliśmy sterowniki Intela w wersji 6.2.1.1001.

Oto pełna konfiguracja zestawu 4MAX z Athlonem 64 FX-55, jaka została wykorzystana do większości testów (również z wyjątkiem testów linuksowych).






Testy syntetyczne

Jak zwykle podczas testów komputera, na początku sprawdzamy wydajność, jaką zapewnia mu zastosowany procesor w połączeniu z zestawem układów sterujących oraz pamięciami. Pierwsza część pomiarów odbywa się w testach syntetycznych, które zostały specjalnie napisane do zmierzenia szybkości wybranego podzespołu bądź rozwiązania jakiegoś problemu.

Tradycyjnie rozpoczynamy od DOSowego Cachemema 2.65 MMX, mierzącego szybkość odczytu/zapisu danych z pamięci operacyjnej oraz podręcznej procesora. Na dwóch pozostałych wykresach przedstawiamy minimalne i maksymalne opóźnienia w dostępie do danych przy dostępie do dużych bloków danych.





Zgodnie z przewidywaniami, zintegrowany z procesorem kontroler pamięci procesora AMD pokonuje pod względem szybkości transferu danych kombinację procesora Intel Pentium 4 HT EM64T 3,6 GHz z chipsetem Intel 925X Express. Mimo tego, że procesor Intela przesyła cztery porcje danych z i do pamięci DDR2 533 (CL4) w jednym takcie zegara, wynikowa szybkość jest mniejsza niż w przypadku Athlona 64 FX-55.





Pod względem opóźnień w dostępie do danych najszybsze Pentium 4 ma jeszcze bardzo dużo do nadrobienia. Różnica jest wciąż miażdżąca, a w skrajnym przypadku ponad 2,5-krotnie dłuższe oczekiwanie na dane (mierzone liczbą jałowych taktów zegara) musi się negatywnie odbić na wydajności.

Dla weryfikacji powyższych wyników zawsze uruchamiamy test ScienceMark 2.0, który opracowywany był przy współpracy z firmą Intel.





Pierwsze wskazania tego testu potwierdzają wyniki uzyskane za pomocą Cachemema. Pentium 4 wyraźnie przegrywa z blisko 30 proc. wolniej taktowanym Athlonem 64 FX-55. Sprawdźmy jednak, jak się przedstawia sytuacja przy rozwiązywaniu konkretnych problemów.





Wszystkie trzy zadania (molecular bench, primordia oraz AES Encryption) procesor Pentium 4 wykonuje od 20 do 30 proc. wolniej od konkurenta. Mamy tu do czynienia z ogromną różnicą wydajności w obliczeniach numerycznych, która nas zaskoczyła.

Kolejne wykresy przedstawiają szybkość mnożenia macierzy z liczbami o pojedynczej i podwójnej precyzji w przypadku zastosowania algorytmów w C++, zoptymalizowanych z użyciem instrukcji SSE lub asemblera oraz z wykorzystaniem zestawu instrukcji SSE2.





Pentium 4 HT EM64T wygrywa w ostatnim teście korzystającym z instrukcji SSE2 operującym na upakowanych danych podwójnej precyzji. W pozostałych pomiarach… nie ma czego komentować.

Sprawdźmy jeszcze nasze obserwacje w opensource’owym teście COSBI.





Wykonane przez nas testy syntetyczne nie pozostawiają wątpliwości – praktycznie w żadnym przypadku elementy wykorzystane w stacji HP xw4200 nie dorównują platformie AMD.


Kilofy w dłoń, czyli trudne zadania

Spójrzmy zatem na to, jak sprawuje się nasza stacja robocza w zderzeniu z codziennymi aplikacjami. Na początek SETI@Home – test, który opiera się głównie na szybkości obliczeń wykonywanych przez procesor i nie jest zależny od karty graficznej czy podsystemu dyskowego.



Stacja robocza HP xw4200 całkiem przyzwoicie radzi sobie z poszukiwaniem pozaziemskich cywilizacji, jednak możliwe jest zbudowanie komputera, który radzi sobie z takim zadaniem w czasie krótszym o 10 procent.




Niezależnie od dokładności, z jaką wyznaczamy liczbę Pi, stacja robocza HP ulega o ponad 9 proc. komputerowi zbudowanemu na procesorze Athlon 64 FX-55. Prezentujemy przypadek 1 i 16 milionów wyznaczanych cyfr.



Jedna z najpopularniejszych aplikacji do tworzenia obrazów na podstawie śledzenia biegu promieni światła to 3ds max. Jest ona jedną z nielicznych aplikacji bardzo dobrze wykorzystujących możliwości systemów wieloprocesorowych, a także zoptymalizowanych dla procesorów Intel Pentium 4. Jak więc sprawdzi się HP xw4200 w tym typowym dla stacji roboczych zadaniu?





Spośród sześciu testowych scen komputer HP z procesorem Pentium 4 tylko jedną wygenerował w krótszym czasie, za to jego przewaga sięgnęła blisko 30 proc. Jedna scena zajęła obu komputerom tyle samo czasu, zaś w pozostałych czterech scenach stacja xw4200 ulega komputerowi z Athlonem 64 FX-55 (nawet do 25 proc.).

Ważnym testem, który umożliwia ocenę wydajności stacji roboczych, jest też SPECviewperf 8.01. Zawiera on 8 składowych, opartych na fragmentach rzeczywistych aplikacji i jest silnie zależny od wydajności podsystemu graficznego. Oczywiście przy zastosowaniu tej samej karty i sterowników, możliwe jest porównywanie wydajności różnych komputerów, czego nie omieszkaliśmy uczynić. W systemie Windows wyraźnie lepszy okazał się komputer z Athlonem 64. Warto zauważyć, że dwa spośród ośmiu składników, choć działały poprawnie, to zwróciły zerowe wyniki szybkości. Być może ma to związek z wykorzystaną, testową wersją sterowników ATI, które w momencie przeprowadzania testów znajdowały się w fazie testów beta. Niestety, żadne inne dostępne wówczas sterowniki nie pozwalały na prawidłowe zainstalowanie tej karty graficznej.





We wszystkich składnikach SPECviewperf komputer z procesorem Athlon 64 FX-55 okazał się lepszy od HP xw4200. Warto zauważyć, że różnice wydajności w poszczególnych aplikacjach sięgały ok. 5-13 proc.



Kompresja danych archiwizatorem Minigzip bazującym na najpopularniejszym formacie ZIP przyniosła porównywalny czas działania testu w przypadku obu komputerów – różnica wyniosła 4 proc. na korzyść stacji HP.




Jednak skorzystanie z testu szybkości kompresji wbudowanego w jedną z najnowszych wersji programu WinRAR nieco nas zaskoczyło. Okazało się, że komputer z Athlonem 64 FX-55 w tym teście jest w stanie skompresować o 63 proc. danych więcej w takim samym czasie.



PCMark04 – nadmierny optymizm

Warto przejść teraz do testu Futuremark PCMark04, który ponoć działa z wykorzystaniem fragmentów kodu rzeczywistych aplikacji. Jednak, nie mamy jasności, czy są to fragmenty aplikacji dostępnych na rynku, czy też przygotowanych specjalnie na potrzeby PCMark04. Jest to o tyle ciekawe, że uzyskane w tym teście wyniki nie znajdują raczej potwierdzenia w innych testach, o czym już ostatnio pisaliśmy. Spójrzmy zatem…



Wynik ogólny, wskazuje na lepszą wydajność komputera z procesorem Intel…




… na co zapewne wpływ ma nadspodziewanie dobry wynik testu CPU




…nawet PCMark potwierdza jednak przewagę Athlona 64 w wydajności pamięci…




… oraz w zastosowaniach obciążających kartę graficzną.




Z niewiadomych powodów test wydajności podsystemu dyskowego w przypadku komputera z Athlonem 64 okazał się dużo słabszy, niż korzystającego z tej samej macierzy komputera HP. Niestety, za późno spostrzegliśmy tę różnicę i nie mogliśmy już przeprowadzić tego testu ponownie. Nadrobimy to jednak przy najbliższej okazji.


Przyjrzyjmy się zatem wynikom szczegółowych testów procesora przeprowadzanym przez PCMark04.



36 proc. lepszy wynik w teście kompresji plików. Z jednej strony można by podejrzewać wpływ słabszych osiągów podsystemu dyskowego, z drugiej jednak nie potwierdziły tego kolejne testy tego rodzaju. Wyniki znajdziecie na następnej stronie.




Szyfrowanie plików również wykazuje wyjątkową przewagę PCMark04, której nie zanotowaliśmy w ScienceMark 2.0 w teście szyfrowania danych. Czyżby znów test był bardziej zależny od podsystemu dyskowego?




W teście dekompresji plików Pentium 4 okazuje się znacznie wydajniejsze (o około 30 proc.) od konkurenta.




Wg PCMark04, również w obróbce grafiki procesor firmy Intel lepiej się sprawdza od Athlona 64




Kolejny składnik PCMark04 – kolejne zaskoczenie. Pentium 4, które ma tak rozbudowany system przewidywania skoków i rozgałęzień okazuje się znacznie wolniejsze od Athlona 64. Podejrzewać możemy jedynie wpływ zbyt długiego potoku wykonawczego, którego wad nie jest w stanie zrównoważyć układ branch prediction.




Odszyfrowanie pliku również pokazuje mocną stronę procesorów Pentium 4, których najszybszy model bez problemu pokonuje w tym teście najszybszego Athlona.




Kodowanie plików audio, które powinno stanowić domenę „stworzonego dla multimediów” procesora Pentium 4, bardzo słabiutko wypada w teście PCMark. Athlon 64 oferuje wydajność lepszą o ponad 22 proc.




Pod względem kompresja strumienia wideo obydwa procesory okazują się godnymi siebie rywalami. Pentium 4 jest przy kodowaniu do formatu WMV o ok. 3 proc. wolniejsze od najszybszego Athlona 64…




…oraz o 1,1 proc. szybsze podczas kodowania do formatu DivX.



BAPCo SYSmark 2004

Ten test to jeden z najczęściej wykorzystywanych testów do oceny wydajności komputerów. Choć nie jest wolny od wad, jego podstawową zaletą jest to, że prezentuje wydajność komputerów w połączeniu ze współczesnymi aplikacjami – zarówno biurowymi, jak i służącymi do tworzenia treści multimedialnych. W wersji 2004, oprócz wyniku ogólnego, prezentuje także wyniki szczegółowe – niestety, bez rozbicia na poszczególne aplikacje.



Ogólny wynik stacji roboczej xw4200 jest tylko o ok. 1,5 proc. gorszy niż komputera z procesorem Athlon 64 FX-55.






W teście „multimedialoności”, czyli zdolności do tworzenia grafiki płaskiej, przestrzennej oraz treści internetowych, różnica w osiągach komputerów jest pomijalnie mała.





Druga część testu SYSmark 2004, czyli tworzenie dokumentów biurowych i komunikacja, nie ma w przypadku naszego testu większego znaczenia, ponieważ stacja robocza zazwyczaj nie służy do uruchamiania takich aplikacji. Jednak w tym przypadku różnica pomiędzy porównywanymi komputerami jest już bardziej zauważalna. Mimo znacznie lepszego dostosowania procesorów Pentium 4 do analizy danych (zasługa wspomnianego rozbudowanego systemu przewidywania rozgałęzień), ogólny wynik tej części testu SYSmark 2004 wypada trochę na niekorzyść stacji HP.


Nadal na becie – 64-bitowy Windows

Po blisko dwóch latach obecności na rynku, 64-bitowe rozszerzenie architektury x86 trafia do produktów firmy Intel. Postanowiliśmy więc sprawdzić, jak nowy procesor zachowuje się w praktyce, czyli w nielicznych jak na razie, ale jednak dostępnych aplikacjach 64-bitowych. Zaczęliśmy oczywiście od zainstalowania 64-bitowej wersji systemu Windows XP, dokładniej rzecz biorąc – wersji beta o numerze kompilacji 1218. Sterowniki do chipsetów Intela można już pobrać bezpośrednio z witryny firmy. Szkoda jednak, że nie są jeszcze dostępne odpowiednie sterowniki do obsługi macierzy RAID w tym systemie.

DivXEncoder Benchmark to – jak nietrudno się domyśleć – program służący do pomiaru szybkości konwersji plików wideo do formatu DivX. By móc porównać wydajność aplikacji 32- i 64-bitowej, dostępne są odpowiednio skompilowane dwa programy.



W przypadku uwzględniania czasu straconego na operacje we/wy okazuje się, że HP xw4200 z systemem Windows XP 64-bitowym zwalnia w porównaniu z systemem 32-bitowym. Jednak nie wyciągajmy ostatecznych wniosków, gdyż jest to prawdopodobnie wpływ wolniejszego podsystemu dyskowego… choć z drugiej strony jest to wynik, jaki uzyskamy obecnie w rzeczywistych warunkach.




Po odliczeniu czasu operacji we/wy widzimy wydajność samego procesora. Tym razem Pentium 4 okazuje się o ponad 5 proc. szybszy w systemie 32-bitowym i około 2,5 proc. w 64-bitowym. Porównując natomiast aplikację 64- i 32-bitową widzimy, że po optymalizacji i przekompilowaniu kodu możliwe jest uzyskanie znacznie większej wydajności, niemal o 25 procent.

Java na 64 bity

Kolejny test, który przeprowadziliśmy pozwala ocenić skuteczność Wirtualnej Maszyny Javy. Jest on dość istotny dla oceny szybkości komputera, bowiem w korporacjach Java coraz częściej znajduje powszechne zastosowanie, zaś wciąż ulepszana jakość VMJ pozwala dotrzymać kroku aplikacjom natywnym, kompilowanym na dany procesor.




Spośród wszystkich wyników testów w Javie tylko w przypadku mnożenia dużych macierzy procesor Pentium 4 okazał się wydajniejszy niż Athlon 64. W pozostałych przypadkach okazywał się wyraźnie słabszy, przy czym w niektórych testach (np. Monte Carlo Integration) różnica była po prostu miażdżąca. Jednak z drugiej strony – aż taka różnica w wydajności nie została potwierdzona w żadnym innym teście. Warto także podkreślić to, że zastosowanie 64-bitowej JVM zwiększa wydajność praktycznie w każdym przypadku w porównaniu do edycji 32-bitowej, a w niektórych obliczeniach (np. w przypadku transformaty Fouriera), szybkość obliczeń wzrasta nawet 4-krotnie!


Jaki test, taki wynik – system Linux

Jednym z naszych systemów do testowania komputerów jest także SUSE Linux Professional 9.2 w wersji dla x86 oraz x86-64. Zaczynamy od testów syntetycznych Ubench (Unix Benchmark) oraz Nbench, które poprzednio zostały wykonane dla Athlona 64 FX-55, więc możemy porównać osiągi. Najpierw jednak podamy konfiguracje obu komputerów, ponieważ w Linuksie były nieco inne niż w Windows. Główną różnicę stanowi grafika GeForce 6800 GT, a także dysk Seagate Barracuda 7200.7 ST380011A





Najszybsze porównanie wydajności procesorów i pamięci umożliwia Ubench, który dodatkowo może działać w systemach wieloprocesorowych. Ten szczegół może wydawać się bez znaczenia, ale jest on ważny w przypadku wszystkich procesorów z technologią Hyper-Threadng. Test uruchamia kilka procesów, które w pełni obciążają obie „połówki” procesora takie jak Pentium 4, na których działa Linux z jądrem SMP. Być może dzięki temu stacja robocza HP xw4200 okazała się w tym teście szybsza, niż komputer z procesorem Athlon 64 FX-55. Wyłączenie HT powodowało spadek wydajności o kilkanaście procent, np. w systemie 64-bitowym z 180 do 148 tys. punktów. Natomiast jeśli chodzi o wydajność pamięci przetestowaną za pomocą Ubench, różnice pomiędzy platformą AMD i Intela nie są tak widoczne.





Z kolei test Nbench przechyla szalę na stronę Athlona 64. W systemie 64-bitowym wskaźnik integer index jest lepszy o ponad 30 procent, a w systemie 32-bitowym różnice sięgają 43 procent. W przypadku floating point index różnice są wynoszą odpowiednio 66 i 32 proc. W przypadku systemu SUSE Linux widać spadek wydajności jednostki zmiennoprzecinkowej po instalacji systemu 64-bitowego – jest to szczególnie widoczne w testach fourier, LU decomposition i neural net, które wykonują głównie obliczenia zmiennoprzecinkowe. Z tego powodu też wskaźnik floating point index jest wyraźnie słabszy w systemie 64-bitowym, niż w 32-bitowym.






Aplikacje i Linux

Ponieważ Ubench i Nbench dostarczają sprzeczne wyniki, czas sprawdzić, który z nich lepiej przystaje do rzeczywistej wydajności procesorów. Posłużą nam do tego znane programy Super Pi, Primegen oraz LAME. Ten pierwszy jest w zasadzie niezbyt dobrze przystosowany do testu platform 64-bitowych – jest to program o zamkniętym kodzie źródłowym, skompilowany dla procesorów x86, więc jego wykorzystanie w systemie 64-bitowym nie skraca w jakiś znaczący sposób czasu generacji liczby Pi (w naszym przypadku jest ona generowana w 20 iteracjach, co daje dokładność do ok. 1 mln cyfr).





Z kolei Primegen jest programem z otwartym kodem źródłowym, więc można go skompilować w systemie, na którym będzie działał. Choć nie wykorzystaliśmy żadnych opcji kompilatora w celu optymalizacji programu (a taka możliwość istnieje), to na efekty nie trzeba długo czekać – znalezienie liczb pierwszych z zakresu od 1 do 10 miliardów trwa w systemie 64-bitowym o ok. 11 proc. krócej (dotyczy Pentium 4), jednak Athlon 64 okazuje się jeszcze o 16 proc. szybszy.



Kodowanie MP3 za pomocą LAME to bardzo praktyczny test, w naszym przypadku plik źródłowy WAV ma wielkość ok. 270 MB. Wyniki są jednak nieco dziwne, ponieważ na Pentium 4 są praktycznie niezależnie od wersji systemu operacyjnego, zaś na Athlonie 64 – wręcz przeciwnie. W każdym przypadku LAME 3.96.1 był kompilowany z kodu źródłowego, bez wprowadzania przez nas jakichkolwiek optymalizacji w kodzie.



W przypadku stacji HP xw4200 przeprowadziliśmy też pierwszy test za pomocą Mplayera, a właściwie Mencodera, bo polegał on na kodowaniu fragmentu filmu z płyty DVD do formatu DivX. Na razie nie mamy za bardzo z czym porównać wyników, ponieważ na poprzednio testowanych zestawach nie przeprowadzaliśmy jeszcze tego testu, natomiast możemy podać wyniki z systemu 32- i 64-bitowego. Wynoszą one odpowiednio 98,7 oraz 93,4 sekundy, a więc przyrost wydajności w systemie 64-bitowym jest stosunkowo mały (nieco ponad 5 proc.).

Grafika i Linux

Pozostał nam jeszcze SPECviewperf oraz POV-Ray – aplikacje, które zapewne często będą uruchamiane na stacjach takich jak xw4200. Wyniki tego pierwszego testu bardzo zależą od karty graficznej, w obu przypadkach był to GeForce 6800 GT, w komputerze HP działał na PCI Express, co zapewne ma pewien wpływ na wydajność. Jest też drugi szczegół – dostępność programu w postaci kodu źródłowego, który jest przez nas kompilowany od nowa na każdym systemie służącym do testów. Nie robimy żadnych zmian w kodzie źródłowym, ale zapewne pojawiają się jakieś różnice w kodzie uruchamialnym. W dodatku sterowniki dla kart graficznych NVIDIA również są kompilowane podczas instalacji. Być może te czynniki wystarczą, by komputery takie jak HP xw4200 osiągały w tym teście lepszą wydajność od komputera z Athlonem 64 FX-55. Zobaczymy, czy w przyszłości jakiś test potwierdzi tą prawidłowość.





Natomiast POV-Ray jest zależny głównie od procesora, więc też wyniki są zupełnie inne. Wykresy chyba nie wymagają żadnego komentarza – widać, że 64-bitowa wersja oprogramowania daje duży przyrost wydajności, ale jeszcze lepszy efekt daje wykorzystanie procesora AMD.





Musimy także dodać, że użytkownicy POV-Raya mogą korzystać z dobrodziejstw systemów wieloprocesorowych, a więc i częściowo z Hyper-Threadingu. Procesor Pentium 4, na którym działa POV-Ray w normalnym trybie, wykazuje obciążenie jedynie 50 procent (to tak jak w przypadku większości innych testów). Istnieje jednak łata na POV-Ray 3.1 o nazwie PVMPOV, która pozwala skorzystać z oprogramowania PVM (Parallel Virtual Machine) i uruchamiać wiele wątków programu na kilku procesorach lub nawet wielu komputerach jednocześnie. Bardzo pobieżny test uświadomił nam, że wykorzystanie tych możliwości na komputerze dwuprocesorowym pozwala na skrócenie czasu renderowania scen nawet o 45 proc., a po niewielkich optymalizacjach niemal 50 proc. (101 sekund zamiast 192 na komputerze z Athlonami MP 2200+, dotyczy to sceny wg6 w rozdzielczości 1280×1024 i z antyaliasingiem 0.3).

Specjalnie dla osób, które uważają, że Hyper-Threading to tylko chwyt marketingowy, przeprowadziliśmy dokładnie taki sam test na procesorze Pentium 4. Przyrost wydajności był znacznie mniejszy, ale wyniósł 7-8 procent, co dowodzi, że HT może się przydać nawet w takich zastosowaniach. Niestety, wydajność w tym przypadku okazała się podobna do tej, jaką oferuje wspomniany 2-procesorowy komputer z Athlonami MP sprzed 2 lat.


Intel kontra Intel

Intel Pentium 4 z technologią EM64T nie jest konkurentem Pentium 4 Extreme Editon, jednak wiele osób zastanowi się, jaki jest sens kupowania takiego komputera jak przedstawiony przez nas ostatnio Vobis, skoro można kupić nieźle wyposażoną i tańszą stację roboczą HP. Sięgnęliśmy więc do tych wyników testów, które odnoszą się głównie do procesorów i można je bezpośrednio porównać – przedstawiamy tylko skrót.





Kolejne testy, wykonane za pomocą 3ds max, również wskazują na pewną przewagę Pentium 4 Extreme Edition, choć zależy ona od rodzaju sceny.





Ponieważ w 64-bitowej wersji Windows XP można już uruchamiać pewne testy, porównaliśmy wyniki kilku z nich. Jednoznaczny wynik daje SciMark 2.0, nastawiony głównie na skomplikowane obliczenia – zamiana P4EE na procesor z EM64T wyraźnie poprawia wydajność, natomiast wykorzystanie systemu 64-bitowego daje jeszcze lepsze efekty.





Nieco inaczej jest w teście wykonującym kodowanie DivX – generalnie lepszy jest procesor zastosowany w stacji HP xw4200, ale nie zawsze w systemie 64-bitowym.





Pewna część tekstów linuksowych (np. Super Pi) również potwierdza przewagę układu zastosowanego w stacji HP, choć w niektórych przypadkach dopiero po wykorzystaniu systemu 64-bitowego (np. Primegen). Inne testy (np. LAME) wyraźnie wskazują na przewagę Pentium 4 Extreme Edition.





Jednoznacznej odpowiedzi nie daje także POV-Ray.






Podsumowanie

Wyniki testu stacji roboczej HP xw4200 oferującej rozszerzenia 64-bitowe, a także wyniki poprzedniego testu komputera z Pentium 4 Extreme Edition są dowodem na to, że procesory Intela w niektórych (choć nielicznych) testach mogą dorównywać układom AMD. Wypadają nieźle w testach aplikacyjnych takich jak SYSmark 2004, których wyniki zależą od różnych komponentów komputera. Według pierwszych pogłosek, należało spodziewać się bardzo słabej wydajności Pentium 4 z EM64T w trybie 64-bitowym, jednak w niektórych testach okazała się ona bardzo dobra. Natomiast ogólna wydajność procesorów jest zdecydowanie słabsza niż w przypadku najszybszych Athlonów 64, nadal przegrywają one w większości testów i nie pomaga ani pamięć L3 zintegrowana z Pentium 4 EE, ani rozszerzenia EM64T. Zapewne nie pomogłoby również zwiększenie częstotliwości zegara do 3,8 GHz (być może w najbliższym czasie będziemy mogli przedstawić test tego najszybszego układu Intela).

Natomiast zdecydowanym plusem dla Pentium 4 z implementacją AMD64 jest to, że nie trzeba dodatkowo płacić za tą nową funkcjonalność. Oba procesory 3,6 GHz, zarówno z rozszerzeniami 64-bitowymi, jak i bez nich, kosztują u producenta 417 dolarów, co stanowi połowę ceny Athlona 64 FX-55. W tym świetle „wypasiony” Pentium 4 Extreme Edition, wykorzystany w niedawno opisywanym komputerze Vobis, wypada dość przeciętnie – jest to procesor znacznie droższy od wersji z EM64T (u producenta po 1000 dolarów), również komputer jest ekstremalnie drogi. Mimo to, w wielu testach ustępuje wydajnością, szczególnie jeśli chodzi o testy polegające na intensywnych obliczeniach. Natomiast nieźle wypadł w teście aplikacyjnym SYSmark 2004, POV-Rayu, LAME i niektórych scenach 3ds max. Niestety, stosunek jego wydajności do ceny jest bez porównania gorszy, niż Pentium 4 wykorzystanego w stacji HP xw4200.

Stacja robocza HP xw4200
ZaletyWady
  • Rozwiązania ułatwiające łatwy dostęp do komponentów
  • Cicha praca przy małym obciążeniu
  • Możliwość dopasowania konfiguracji do potrzeb
  • Wydajność procesora wciąż nie dorównująca układom AMD
  • Hałas przy dużym obciążeniu procesora
  • Pamięci DDR2 o dużych opóźnieniach


Do testów dostarczył:

HP

www.hp.pl

Cena procesora Intel Pentium 4 560 (HT, EM64T, 3,6 GHz) – ok. 1720 zł z VAT.

Sugerowana cena stacji w konfiguracji podstawowej (CD-ROM, P4 2,8 GHz, 512 MB RAM, Windows XP Pro) – ok. 5900 zł z VAT.

Sugerowana cena stacji w konfiguracji dostarczonej do testów (bez grafiki, z Windows XP Pro) – 9200 zł z VAT.

Przykładowe ceny brutto (z VAT) kart NVIDIA do stacji HP xw4200: Quadro FX 3400 – 5100 zł, Quadro FX 1400 – 2900 zł, NVIDIA Quadro FX 1300 – 2560 zł, Quadro FX 540 – 1200 zł, Quadro FX 330 – 770 zł, Quadro NVS 280 – 460 zł.

Przykładowe ceny brutto (z VAT) kart ATI do stacji HP xw4200: FireGL V5100 – 3180 zł, FireGL V3100 – 870 zł.