In diesem Dokument sind alle Benchmarks, die für die PRIMERGY RX100 S4 durchgeführt wurden, zusammengefasst.
Ferner werden die Leistungsdaten der PRIMERGY RX100 S4 mit denen anderer PRIMERGY Modelle verglichen und
diskutiert. Neben den Benchmark-Ergebnissen als solchen wird jeder Benchmark und die Umgebung, in der der
Benchmark durchgeführt wurde, kurz erläutert.
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Technische Daten
Die PRIMERGY RX100 S4 ist wie ihr Vorgänger PRIMERGY RX100 S3 ein Mono-Prozessor Rack Server von einer
Höheneinheit. Sie enthält den Intel 3000 Chipsatz, einen Intel Celeron D, Pentium D oder Xeon Prozessor, bis zu 8 GB
ECC-geschützten DDR2-533 SDRAM, je nach eingesetztem Prozessor einen mit 533 (Celeron D), 800 (Pentium D) oder
1067 MHz (Xeon) getakteten Front-Side-Bus, einen Broadcom BDC5715 2-Kanal 1-GBit Ethernet-Controller und Platz
für 2 Festplatten. Die SAS-Variante der PRIMERGY RX100 S4 besitzt einen 8-Port SAS-Controller, die SATA-Variante
einen 2-Port SATA 300 Controller, beide mit RAID-0 und RAID-1 Funktionalität.
Detaillierte technische Informationen finden Sie unter
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
SPECcpu2000
∗
Benchmark-Beschreibung
SPECcpu2000 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht
aus einer Integer-Testsuite (SPECint2000), die 12 Applikationen enthält, und einer Fließkomma-Testsuite
(SPECfp2000), die 14 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die
CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht vermessen.
SPECcpu2000 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und
wird vor der eigentlichen Messung kompiliert. Daher gehen die verwendete Compiler-Version und -Optimierungseinstellungen in die Messung mit ein.
SPECcpu2000 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2000
bzw. SPECfp2000) ermittelt die Zeit, die für die Bearbeitung einer bestimmten Aufgabe benötigt wird. Die zweite Methode (SPECint_rate2000 bzw. SPECfp_rate2000) ermittelt den Durchsatz, d.h. wie oft eine Aufgabe in einer vorgegebenen Zeit erledigt werden kann. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und
„peak“, die sich in der Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte verwendet, „peak“-Werte sind optional.
Benchmark Arithmetik Typ
SPECint2000 Integer peak aggressiv
SPECint_base2000 Integer base konservativ
SPECint_rate2000 Integer peak aggressiv
SPECint_rate_base2000 Integer base konservativ
SPECfp2000 Fließkomma peak aggressiv
SPECfp_base2000 Fließkomma base konservativ
SPECfp_rate2000 Fließkomma peak aggressiv
SPECfp_rate_base2000 Fließkomma base konservativ
Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die
Einzel-Benchmarks ermittelt wurden. Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit
einem Referenzsystem ist. Für das Referenzsystem wurde als SPECint_2000- und SPECfp_2000-Wert 100 festgelegt.
Im Falle der rate-Messergebnisse liegt dieser Wert bei 1.16. So bedeutet beispielsweise ein SPECint_base2000-Wert
von 200 für das Messsystem, dass es diesen Benchmark mindestens doppelt so schnell wie das Referenzsystem bewältigt hat. Die ungenaue Bezeichnung „mindestens“ deshalb, weil bei der Berechnung des Ergebnisses das geometrische
Mittel angewandt wird. Gegenüber dem arithmetischen Mittel führt dies dazu, dass bei unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt.
Die SPECcpu2000-Messungen werden von uns in der Regel nur für ausgewählte Systeme und Systemkonfigurationen
zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen die meisten der hier vorgestellten Ergebnisse auch nicht
auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren, können wir jederzeit den
Nachweis für die korrekte Durchführung der Messungen erbringen. Die so ermittelten Ergebnisse dürfen daher
veröffentlicht werden.
CompilerOptimierung
Messergebnis Anwendung
Geschwindigkeit Monoprozessor
Durchsatz
Geschwindigkeit Monoprozessor
Durchsatz
Mono- und
Multiprozessor
Mono- und
Multiprozessor
Benchmark-Ergebnisse
Es wurden Messungen mit dem Celeron D Prozessor 352, den Pentium D Prozessoren 925 und 945 sowie den Xeon
Prozessoren 3040, 3050, 3060 und 3070 durchgeführt. Die SPECint-Benchmark-Programme wurden als 32-BitVersionen mit dem Intel C++/Fortran-Compiler 9.1 kompiliert und unter Windows Server 2003 Enterprise Edition SP1
(32-bit) ausgeführt. Die SPECfp-Benchmark-Programme wurden als 64-Bit-Versionen mit dem Intel C++/FortranCompiler 9.0 kompiliert und unter SUSE Linux Enterprise Server 10 (64-bit) ausgeführt.
∗
SPEC®, SPECint®, SPECfp® und das SPEC-Logo sind eingetragene Warenzeichen der Standard Performance
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Leistungszuwächse, die sich allein aus einer höheren Prozessortaktfrequenz generieren, fallen bei der Integer-Testsuite
von SPECcpu2000 höher aus als bei der Floating-Point-Testsuite. Dies liegt daran, dass die Floating-Point-Testsuite
mehr Speicher benötigt. Gegenüber Cache-Zugriffen wirken sich die langsameren RAM-Speicherzugriffe stärker auf das
Messergebnis aus. Daher profitieren Prozessoren mit großen Caches, die den Speicher entlasten, stärker bei der Floating-Point-Testsuite als bei der Integer-Testsuite.
Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bezüglich der Prozessortaktrate. Die im Vergleich zum Pentium D 925 höhere Taktrate des Pentium D 945 wurde in der Integer-Testsuite zu 89% und in der speicherintensiveren Floating-Point-Testsuite zu 47% in zusätzliche Performance umgesetzt. Die Xeon Prozessoren verfügen gegenüber den Pentium D Prozessoren zwar über eine geringere Prozessortaktrate, dafür aber über eine höhere
Taktung des Front-Side-Busses. Unterschiedlich ist bei den beiden Prozessortypen auch die Cache-Organisation. Auch
der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden sich nur bezüglich der Prozessortaktrate. Xeon 3060 und 3070 besitzen gegenüber den Xeon 3040 und 3050 einen doppelt so großen Second
Level Cache, der hauptverantwortlich für deren deutlich bessere Performance ist. Die im Vergleich zum Xeon 3060 höhere Taktrate des Xeon 3070 wurde in der Integer-Testsuite zu 84% und in der speicherintensiveren Floating-Point-Testsuite zu 34% in zusätzliche Performance umgesetzt.
Die beiden folgenden Grafiken zeigen Ergebnisse der PRIMERGY RX100 S4 im Vergleich zu ihren Vorgängern in der
jeweils performantesten Ausstattung. Gegenüber der PRIMERGY RX100 S3 wurde die Integer-Performance um 55%
und die Floating-Point-Performance um 19% verbessert. Zu beachten ist, dass die Ergebnisse der PRIMERGY RX100
S4 auf Benchmark-Programmen basieren, die mit einer neueren Compiler-Version erstellt wurden. Daher ist das gute
Abschneiden der PRIMERGY RX100 S4 im Vergleich zur ihren Vorgängern nicht ausschließlich systembedingt, sondern
teilweise auch auf die neuere Compiler-Version zurückzuführen.
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Benchmark-Umgebung
Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard- und Software-Ausstattung
vorgenommen:
Hardware
Model PRIMERGY RX100 S4
Celeron D 352
CPU
Anzahl CPUs 1
Primary Cache
Secondary Cache
Memory 8 GB DDR2-533 SDRAM
Software
Betriebssystem
Compiler
Pentium D 925 und 945
Xeon 3040, 3050, 3060 und 3070
Celeron D: 12 kB instruction + 16 kB data on chip
Pentium D: 12 kB instruction + 16 kB data on chip, pro Core
Xeon: 32 kB instruction + 32 kB data on chip, pro Core
Celeron D: ½ MB (I+D) on chip
Pentium D: 2 MB (I+D) on chip, pro Core
Xeon 3040 und 3050: 2 MB (I+D) on chip, pro Chip
Xeon 3060 und 3070: 4 MB (I+D) on chip, pro Chip
SPECint: Windows Server 2003 Enterprise Edition SP1 (32-bit)
SPECfp: SUSE Linux Enterprise Server 10 (64-bit)
SPECint: Intel C++/Fortran Compiler 9.1
SPECfp: Intel C++/Fortran Compiler 9.0
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
SPECcpu2006
∗
Benchmark-Beschreibung
SPECcpu2006 ist ein Benchmark, der die Systemeffizienz bei Integer- und Fließkomma-Operationen misst. Er besteht
aus einer Integer-Testsuite (SPECint2006), die 12 Applikationen enthält, und einer Fließkomma-Testsuite
(SPECfp2006), die 17 Applikationen enthält. Beide Testsuiten sind extrem rechenintensiv und konzentrieren sich auf die
CPU und den Speicher. Andere Komponenten, wie Disk-I/O und Netzwerk, werden von diesem Benchmark nicht vermessen.
SPECcpu2006 ist nicht an ein spezielles Betriebssystem gebunden. Der Benchmark ist als Source-Code verfügbar und
wird vor der eigentlichen Messung kompiliert. Daher beeinflussen auch die verwendete Compiler-Version und deren
Optimierungseinstellungen das Messergebnis.
SPECcpu2006 beinhaltet zwei verschiedene Methoden der Performance-Messung: Die erste Methode (SPECint2006
bzw. SPECfp2006) ermittelt die Zeit, die für die Bearbeitung einer einzelnen Aufgabe benötigt wird. Die zweite Methode
(SPECint_rate2006 bzw. SPECfp_rate2006) ermittelt den Durchsatz, d.h. wie viele Aufgaben parallel erledigt werden
können. Beide Methoden werden zusätzlich noch in zwei Messläufe unterteilt, „base“ und „peak“, die sich in der
Verwendung der Compiler-Optimierung unterscheiden. Bei der Publikation von Ergebnissen werden immer „base“-Werte
verwendet, „peak“-Werte sind optional.
Benchmark Arithmetik Typ
SPECint2006 Integer peak aggressiv
SPECint_base2006 Integer base konservativ
SPECint_rate2006 Integer peak aggressiv
SPECint_rate_base2006 Integer base konservativ
SPECfp2006 Fließkomma peak aggressiv
SPECfp_base2006 Fließkomma base konservativ
SPECfp_rate2006 Fließkomma peak aggressiv
SPECfp_rate_base2006 Fließkomma base konservativ
Bei den Messergebnissen handelt es sich um das geometrische Mittel aus normalisierten Verhältniswerten, die für die
Einzel-Benchmarks ermittelt wurden. Das geometrische Mittel führt gegenüber dem arithmetischen Mittel dazu, dass bei
unterschiedlich hohen Einzelergebnissen eine Gewichtung zugunsten der niedrigeren Einzelergebnisse erfolgt.
Normalisiert heißt, dass gemessen wird, wie schnell das Testsystem verglichen mit einem Referenzsystem ist. Der Wert
„1“ wurde für die SPECint_base2006-, SPECint_rate_base2006, SPECfp_base2006 und SPECfp_rate_base2006Ergebnisse des Referenzsystems festgelegt. So bedeutet beispielsweise ein SPECint_base2006-Wert von 2, dass das
Messsystem diesen Benchmark etwa doppelt so schnell wie das Referenzsystem bewältigt hat. Ein
SPECfp_rate_base2006-Wert von 4 bedeutet, dass das Messsystem diesen Benchmark etwa 4/[# base copies] mal so
schnell wie das Referenzsystem bewältigt hat. „# base copies“ gibt hierbei an, wie viele parallele Instanzen des
Benchmarks ausgeführt worden sind.
Nicht alle SPECcpu2006-Messungen werden von uns zur Veröffentlichung bei SPEC eingereicht. Daher erscheinen
auch nicht alle Ergebnisse auf den Web-Seiten von SPEC. Da wir für alle Messungen die Protokolldateien archivieren,
können wir jederzeit den Nachweis für die korrekte Durchführung der Messungen erbringen.
CompilerOptimierung
Messergebnis Anwendung
Geschwindigkeit Singlethreaded
Durchsatz Multithreaded
Geschwindigkeit Singlethreaded
Durchsatz Multithreaded
Benchmark-Ergebnisse
Es wurden Messungen mit den Prozessoren Pentium D 925 und 945 sowie den Prozessoren Xeon 3040, 3050, 3060
und 3070 durchgeführt. Alle Benchmark-Programme wurden mit dem Intel C++/Fortran-Compiler 9.1 kompiliert und unter
SUSE Linux Enterprise Server 10 (64-bit) ausgeführt.
∗
SPEC®, SPECint®, SPECfp® und das SPEC-Logo sind eingetragene Warenzeichen der Standard Performance
White Paper ⏐Performance Report PRIMERGY RX100 S4 Version: 2.2, Juni 2007
Der Pentium D 925 und der Pentium D 945 unterscheiden sich lediglich bezüglich der Prozessortaktrate. Die im Vergleich zum Pentium D 925 höhere Taktrate des Pentium D 945 wurde in der Integer-Testsuite zu 76% (base) bzw. 73%
(peak) und in der Floating-Point-Testsuite zu 57% (base) bzw. 60% (peak) in zusätzliche Performance umgesetzt. Die
Xeon Prozessoren verfügen gegenüber den Pentium D Prozessoren zwar über eine geringere Prozessortaktrate, dafür
aber über eine höhere Taktung des Front-Side-Busses. Unterschiedlich ist bei den beiden Prozessortypen auch die
Cache-Organisation. Auch der Xeon 3040 und der Xeon 3050 sowie der Xeon 3060 und der Xeon 3070 unterscheiden
sich nur bezüglich der Prozessortaktrate. Xeon 3060 und 3070 besitzen gegenüber den Xeon 3040 und 3050 einen
doppelt so großen Second Level Cache, der hauptverantwortlich für deren deutlich bessere Performance ist. Die im
Vergleich zum Xeon 3060 höhere Taktrate des Xeon 3070 wurde in der Integer-Testsuite zu 66% (base und peak) und in
der Floating-Point-Testsuite zu 49% (base) bzw. 59% (peak) in zusätzliche Performance umgesetzt.
Benchmark-Umgebung
Alle SPECcpu2000 Messungen wurden auf einer PRIMERGY RX100 S4 mit folgender Hard- und Software-Ausstattung
vorgenommen:
Hardware
Model PRIMERGY RX100 S4
CPU
Anzahl CPUs 1
Primary Cache
Secondary Cache
Memory 8 GB PC2-4200 DDR2-SDRAM
Software
Betriebssystem SUSE Linux Enterprise Server 10 (64-bit)
Compiler Intel C++/Fortran Compiler 9.1
Pentium D 925 und 945
Xeon 3040, 3050, 3060 und 3070
Pentium D 945: 12 kB instruction + 16 kB data on chip, pro Core
Xeon: 32 kB instruction + 32 kB data on chip, pro Core
Pentium D 945: 2 MB (I+D) on chip, pro Core
Xeon 3040 and 3050: 2 MB (I+D) on chip, pro Chip
Xeon 3060 and 3070: 4 MB (I+D) on chip, pro Chip