Siemens RX100 S4 User Manual

Version 2.2
Performance Report PRIMERGY RX100 S4
Seiten 27
Juni 2007
Abstract
In diesem Dokument sind alle Benchmarks, die für die PRIMERGY RX100 S4 durchgeführt wurden, zusammengefasst. Ferner werden die Leistungsdaten der PRIMERGY RX100 S4 mit denen anderer PRIMERGY Modelle verglichen und
diskutiert. Neben den Benchmark-Ergebnissen als solchen wird jeder Benchmark und die Umgebung, in der der Benchmark durchgeführt wurde, kurz erläutert.
Inhalt
Technische Daten ...................................................................................................................................................2
SPECcpu2000.........................................................................................................................................................3
SPECcpu2006.........................................................................................................................................................7
SPECjbb2005........................................................................................................................................................10
StorageBench .......................................................................................................................................................12
Terminal Server.....................................................................................................................................................21
Literatur.................................................................................................................................................................27
Kontakt..................................................................................................................................................................27
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007

Technische Daten

Die PRIMERGY RX100 S4 ist wie ihr Vorgänger PRIMERGY RX100 S3 ein Mono-Prozessor Rack Server von einer Höheneinheit. Sie enthält den Intel 3000 Chipsatz, einen Intel Celeron D, Pentium D oder Xeon Prozessor, bis zu 8 GB ECC-geschützten DDR2-533 SDRAM, je nach eingesetztem Prozessor einen mit 533 (Celeron D), 800 (Pentium D) oder 1067 MHz (Xeon) getakteten Front-Side-Bus, einen Broadcom BDC5715 2-Kanal 1-GBit Ethernet-Controller und Platz für 2 Festplatten. Die SAS-Variante der PRIMERGY RX100 S4 besitzt einen 8-Port SAS-Controller, die SATA-Variante einen 2-Port SATA 300 Controller, beide mit RAID-0 und RAID-1 Funktionalität.
Detaillierte technische Informationen finden Sie unter
http://www.fujitsu-siemens.de/products/standard_servers/rack/primergy_rx100s4.html.
© Fujitsu Siemens Computers, 2006-2007 Seite 2 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
SPECcpu2000
Benchmark-Beschreibung
SPECcpu2000 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht aus einer Integer-Testsuite (SPECint2000), die 12 Applikationen enthält, und einer Fließkomma-Testsuite (SPECfp2000), die 14 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht ver­messen.
SPECcpu2000 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und wird vor der eigentlichen Messung kompiliert. Daher gehen die verwendete Compiler-Version und -Optimierungseinstel­lungen in die Messung mit ein.
SPECcpu2000 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2000 bzw. SPECfp2000) ermittelt die Zeit, die für die Bearbeitung einer bestimmten Aufgabe benötigt wird. Die zweite Me­thode (SPECint_rate2000 bzw. SPECfp_rate2000) ermittelt den Durchsatz, d.h. wie oft eine Aufgabe in einer vorgege­benen Zeit erledigt werden kann. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen wer­den immer „base“-Werte verwendet, „peak“-Werte sind optional.
Benchmark Arithmetik Typ
SPECint2000 Integer peak aggressiv SPECint_base2000 Integer base konservativ SPECint_rate2000 Integer peak aggressiv SPECint_rate_base2000 Integer base konservativ SPECfp2000 Fließkomma peak aggressiv SPECfp_base2000 Fließkomma base konservativ SPECfp_rate2000 Fließkomma peak aggressiv SPECfp_rate_base2000 Fließkomma base konservativ
Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die Einzel-Benchmarks ermittelt wurden. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Für das Referenzsystem wurde als SPECint_2000- und SPECfp_2000-Wert 100 festgelegt. Im Falle der rate-Messergebnisse liegt dieser Wert bei 1.16. So bedeutet beispielsweise ein SPECint_base2000-Wert von 200 für das Messsystem, dass es diesen Benchmark mindestens doppelt so schnell wie das Referenzsystem bewäl­tigt hat. Die ungenaue Bezeichnung „mindestens“ deshalb, weil bei der Berechnung des Ergebnisses das geometrische Mittel angewandt wird. Gegenüber dem arithmetischen Mittel führt dies dazu, dass bei unterschiedlich hohen Einzeler­gebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt.
Die SPECcpu2000-Messungen werden von uns in der Regel nur für ausgewählte Systeme und Systemkonfigurationen zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen die meisten der hier vorgestellten Ergebnisse auch nicht auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen. Die so ermittelten Ergebnisse dürfen daher veröffentlicht werden.
Compiler­Optimierung
Messergebnis Anwendung
Geschwindigkeit Monoprozessor
Durchsatz
Geschwindigkeit Monoprozessor
Durchsatz
Mono- und Multiprozessor
Mono- und Multiprozessor
Benchmark-Ergebnisse
Es wurden Messungen mit dem Celeron D Prozessor 352, den Pentium D Prozessoren 925 und 945 sowie den Xeon Prozessoren 3040, 3050, 3060 und 3070 durchgeführt. Die SPECint-Benchmark-Programme wurden als 32-Bit­Versionen mit dem Intel C++/Fortran-Compiler 9.1 kompiliert und unter Windows Server 2003 Enterprise Edition SP1 (32-bit) ausgeführt. Die SPECfp-Benchmark-Programme wurden als 64-Bit-Versionen mit dem Intel C++/Fortran­Compiler 9.0 kompiliert und unter SUSE Linux Enterprise Server 10 (64-bit) ausgeführt.
SPEC®, SPECint®, SPECfp® und das SPEC-Logo sind eingetragene Warenzeichen der Standard Performance
Evaluation Corporation (SPEC).
© Fujitsu Siemens Computers, 2006-2007 Seite 3 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Prozessor Cores/Chip GHz SLC FSB SPECint_base2000 SPECint_rate_base2000
Celeron D 352 1 3.20 ½ MB 533 MHz 1281 Pentium D 925 2 3 2 MB pro Core 800 MHz n/a 34.6 Pentium D 945 2 3.40 2 MB pro Core 800 MHz 1723
*)
*)
14.9
38.7
*)
Xeon 3040 2 1.87 2 MB pro Chip 1067 MHz n/a 39.8 Xeon 3050 2 2.13 2 MB pro Chip 1067 MHz n/a 43.9 Xeon 3060 2 2.40 4 MB pro Chip 1067 MHz 2593 Xeon 3070 2 2.67 4 MB pro Chip 1067 MHz n/a 58.8
*)
53.8
*)
*) nicht veröffentlicht bei
http://www.spec.org
Prozessor Cores/Chip GHz SLC FSB SPECfp_base2000 SPECfp_rate_base2000
Celeron D 352 1 3.20 ½ MB 533 MHz 1569 Pentium D 925 2 3 2 MB pro Core 800 MHz n/a 36.9 Pentium D 945 2 3.40 2 MB pro Core 800 MHz 2135
*)
*)
18.2
39.2
*)
Xeon 3040 2 1.87 2 MB pro Chip 1067 MHz n/a 35.9 Xeon 3050 2 2.13 2 MB pro Chip 1067 MHz n/a 37.6 Xeon 3060 2 2.40 4 MB pro Chip 1067 MHz 2573 Xeon 3070 2 2.67 4 MB pro Chip 1067 MHz n/a 46.4
*)
44.7
*)
*) nicht veröffentlicht bei
http://www.spec.org
© Fujitsu Siemens Computers, 2006-2007 Seite 4 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Leistungszuwächse, die sich allein aus einer höheren Prozessortaktfrequenz generieren, fallen bei der Integer-Testsuite von SPECcpu2000 höher aus als bei der Floating-Point-Testsuite. Dies liegt daran, dass die Floating-Point-Testsuite mehr Speicher benötigt. Gegenüber Cache-Zugriffen wirken sich die langsameren RAM-Speicherzugriffe stärker auf das Messergebnis aus. Daher profitieren Prozessoren mit großen Caches, die den Speicher entlasten, stärker bei der Floa­ting-Point-Testsuite als bei der Integer-Testsuite.
Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bezüglich der Prozessortaktrate. Die im Ver­gleich zum Pentium D 925 höhere Taktrate des Pentium D 945 wurde in der Integer-Testsuite zu 89% und in der spei­cherintensiveren Floating-Point-Testsuite zu 47% in zusätzliche Performance umgesetzt. Die Xeon Prozessoren verfü­gen gegenüber den Pentium D Prozessoren zwar über eine geringere Prozessortaktrate, dafür aber über eine höhere Taktung des Front-Side-Busses. Unterschiedlich ist bei den beiden Prozessortypen auch die Cache-Organisation. Auch der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden sich nur bezüglich der Pro­zessortaktrate. Xeon 3060 und 3070 besitzen gegenüber den Xeon 3040 und 3050 einen doppelt so großen Second Level Cache, der hauptverantwortlich für deren deutlich bessere Performance ist. Die im Vergleich zum Xeon 3060 hö­here Taktrate des Xeon 3070 wurde in der Integer-Testsuite zu 84% und in der speicherintensiveren Floating-Point-Test­suite zu 34% in zusätzliche Performance umgesetzt.
Die beiden folgenden Grafiken zeigen Ergebnisse der PRIMERGY RX100 S4 im Vergleich zu ihren Vorgängern in der jeweils performantesten Ausstattung. Gegenüber der PRIMERGY RX100 S3 wurde die Integer-Performance um 55% und die Floating-Point-Performance um 19% verbessert. Zu beachten ist, dass die Ergebnisse der PRIMERGY RX100 S4 auf Benchmark-Programmen basieren, die mit einer neueren Compiler-Version erstellt wurden. Daher ist das gute Abschneiden der PRIMERGY RX100 S4 im Vergleich zur ihren Vorgängern nicht ausschließlich systembedingt, sondern teilweise auch auf die neuere Compiler-Version zurückzuführen.
© Fujitsu Siemens Computers, 2006-2007 Seite 5 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Benchmark-Umgebung
Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard- und Software-Ausstattung vorgenommen:
Hardware
Model PRIMERGY RX100 S4
Celeron D 352
CPU
Anzahl CPUs 1
Primary Cache
Secondary Cache
Memory 8 GB DDR2-533 SDRAM
Software
Betriebssystem
Compiler
Pentium D 925 und 945 Xeon 3040, 3050, 3060 und 3070
Celeron D: 12 kB instruction + 16 kB data on chip Pentium D: 12 kB instruction + 16 kB data on chip, pro Core Xeon: 32 kB instruction + 32 kB data on chip, pro Core Celeron D: ½ MB (I+D) on chip Pentium D: 2 MB (I+D) on chip, pro Core Xeon 3040 und 3050: 2 MB (I+D) on chip, pro Chip Xeon 3060 und 3070: 4 MB (I+D) on chip, pro Chip
SPECint: Windows Server 2003 Enterprise Edition SP1 (32-bit) SPECfp: SUSE Linux Enterprise Server 10 (64-bit) SPECint: Intel C++/Fortran Compiler 9.1 SPECfp: Intel C++/Fortran Compiler 9.0
© Fujitsu Siemens Computers, 2006-2007 Seite 6 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
SPECcpu2006
Benchmark-Beschreibung
SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer Fließkomma-Testsuite (SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht ver­messen.
SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete Compiler-Version und deren Optimierungseinstellungen das Messergebnis.
SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2006 bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt wird. Die zweite Methode (SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele Aufgaben parallel erledigt werden können. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional.
Benchmark Arithmetik Typ
SPECint2006 Integer peak aggressiv SPECint_base2006 Integer base konservativ SPECint_rate2006 Integer peak aggressiv SPECint_rate_base2006 Integer base konservativ SPECfp2006 Fließkomma peak aggressiv SPECfp_base2006 Fließkomma base konservativ SPECfp_rate2006 Fließkomma peak aggressiv SPECfp_rate_base2006 Fließkomma base konservativ
Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem arithmetischen Mittel dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Der Wert „1“ wurde für die SPECint_base2006-, SPECint_rate_base2006, SPECfp_base2006 und SPECfp_rate_base2006­Ergebnisse des Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base copies] mal so schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele parallele Instanzen des Benchmarks ausgeführt worden sind.
Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen.
Compiler­Optimierung
Messergebnis Anwendung
Geschwindigkeit Singlethreaded
Durchsatz Multithreaded
Geschwindigkeit Singlethreaded
Durchsatz Multithreaded
Benchmark-Ergebnisse
Es wurden Messungen mit den Prozessoren Pentium D 925 und 945 sowie den Prozessoren Xeon 3040, 3050, 3060 und 3070 durchgeführt. Alle Benchmark-Programme wurden mit dem Intel C++/Fortran-Compiler 9.1 kompiliert und unter SUSE Linux Enterprise Server 10 (64-bit) ausgeführt.
SPEC®, SPECint®, SPECfp® und das SPEC-Logo sind eingetragene Warenzeichen der Standard Performance
Evaluation Corporation (SPEC).
© Fujitsu Siemens Computers, 2006-2007 Seite 7 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Prozessor Cores/Chip GHz SLC FSB SPECint_rate_base2006 SPECint_rate2006
Celeron D 352 1 3.20 ½ MB 533 MHz n/a n/a Pentium D 925 2 3 2 MB pro Core 800 MHz 18.7 19.5 Pentium D 945 2 3.40 2 MB pro Core 800 MHz 20.6 21.4 Xeon 3040 2 1.87 2 MB pro Chip 1067 MHz Xeon 3050 2 2.13 2 MB pro Chip 1067 MHz Xeon 3060 2 2.40 4 MB pro Chip 1067 MHz Xeon 3070 2 2.67 4 MB pro Chip 1067 MHz
21.6 22.6
23.4 24.5
27.3 28.7
29.3 30.8
Fett gedruckte Ergebnisse sind veröffentlicht bei
http://www.spec.org.
Die gemessenen SPECint_rate_2006-Ergebnisse liegen durchgängig 4-5% über den SPECint_rate_base2006­Ergebnissen.
Prozessor Cores/Chip GHz SLC FSB SPECfp_rate_base2006 SPECfp_rate2006
Celeron D 352 1 3.20 ½ MB 533 MHz n/a n/a Pentium D 925 2 3 2 MB pro Core 800 MHz 18.4 18.9 Pentium D 945 2 3.40 2 MB pro Core 800 MHz 19.8 20.4 Xeon 3040 2 1.87 2 MB pro Chip 1067 MHz Xeon 3050 2 2.13 2 MB pro Chip 1067 MHz Xeon 3060 2 2.40 4 MB pro Chip 1067 MHz Xeon 3070 2 2.67 4 MB pro Chip 1067 MHz
19.8 20.4
21.1 21.8
23.7 24.3
25.0 25.9
Fett gedruckte Ergebnisse sind veröffentlicht bei
http://www.spec.org.
Die gemessenen SPECfp_rate_2006-Ergebnisse liegen durchgängig 3-4% über den SPECfp_rate_base2006-Ergebnis­sen.
© Fujitsu Siemens Computers, 2006-2007 Seite 8 (27)
White Paper Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bezüglich der Prozessortaktrate. Die im Ver­gleich zum Pentium D 925 höhere Taktrate des Pentium D 945 wurde in der Integer-Testsuite zu 76% (base) bzw. 73% (peak) und in der Floating-Point-Testsuite zu 57% (base) bzw. 60% (peak) in zusätzliche Performance umgesetzt. Die Xeon Prozessoren verfügen gegenüber den Pentium D Prozessoren zwar über eine geringere Prozessortaktrate, dafür aber über eine höhere Taktung des Front-Side-Busses. Unterschiedlich ist bei den beiden Prozessortypen auch die Cache-Organisation. Auch der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden sich nur bezüglich der Prozessortaktrate. Xeon 3060 und 3070 besitzen gegenüber den Xeon 3040 und 3050 einen doppelt so großen Second Level Cache, der hauptverantwortlich für deren deutlich bessere Performance ist. Die im Vergleich zum Xeon 3060 höhere Taktrate des Xeon 3070 wurde in der Integer-Testsuite zu 66% (base und peak) und in der Floating-Point-Testsuite zu 49% (base) bzw. 59% (peak) in zusätzliche Performance umgesetzt.
Benchmark-Umgebung
Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard- und Software-Ausstattung vorgenommen:
Hardware
Model PRIMERGY RX100 S4
CPU
Anzahl CPUs 1
Primary Cache
Secondary Cache
Memory 8 GB PC2-4200 DDR2-SDRAM
Software
Betriebssystem SUSE Linux Enterprise Server 10 (64-bit) Compiler Intel C++/Fortran Compiler 9.1
Pentium D 925 und 945 Xeon 3040, 3050, 3060 und 3070
Pentium D 945: 12 kB instruction + 16 kB data on chip, pro Core Xeon: 32 kB instruction + 32 kB data on chip, pro Core Pentium D 945: 2 MB (I+D) on chip, pro Core Xeon 3040 and 3050: 2 MB (I+D) on chip, pro Chip Xeon 3060 and 3070: 4 MB (I+D) on chip, pro Chip
© Fujitsu Siemens Computers, 2006-2007 Seite 9 (27)
Loading...
+ 18 hidden pages