Notebookcheck Logo

Viele Kerne, hohe Leistung: AMDs Threadripper in ersten Tests

Teaser
Mit den mit Spannung erwarteten Threadripper-CPUs will AMD seit Jahren einmal wieder die schnellsten Desktop-CPUs anbinden - was ersten Tests nach auch gelungen ist, sofern die verwendete Software mitspielt. Intel kann sich hingegen durch hohe Taktraten und Einzelkern-Leistung abgrenzen.

Mit den Threadripper-Modellen adaptiert AMD Ryzen für extrem anspruchsvolle Anwender: Die beiden Modelle 1950X und 1920X richten sich mit ihren zwölf respektive 16 Kernen, Multithreading und einem 32 MByte großen L3-Cache nicht an gewöhnliche PC-Nutzer und schon gar nicht an Videospieler.

Als sogenannte HEDT-Prozessoren (Highend Desktop) zählen zu den potentiellen Käufern etwa Programmierer, Bild- und Videobearbeiter und Analysten mittelgroßer Datenmengen. Grundvoraussetzung für eine sinnvolle Verwendung der Threadripper-CPUs ist damit zweifellos die hohe Parallelisierbarkeit der entsprechenden Programme - was etwa bei Videospielen nicht zwangsläufig gegeben ist.

Dem Einsatzzweck und Preis entsprechend ergibt sich auch die Konkurrenzsituation: Im direkten Vergleich müssen sich die Threadripper-Modelle mit Skylake-X messen lassen, konkret insbesondere gegen den von uns bereits getesteten, 1.000 Euro teuren Intel Core i9-7900X

Threadripper 1950X im Detail

Wir wollen in diesem Artikel insbesondere das Topmodell in Form des 1950X betrachten. Grundsätzlich ist ein Threadripper quasi aus zwei Ryzen 7-Dies und zwei Dummys aufgebaut, was im Falle des 1950X in insgesamt 16 aktiven Kernen resultiert. Diesen steht ein jeweils 512 KByte großer L2-Cache zur Verfügung, der L3-Cache ist je Die 16 Megabyte, in Summe also 32 Megabyte groß.

Die Basistaktrate des Ryzen Threadripper 1950X liegt bei 3,4 GHz, wobei die maximale Taktrate (mit XFR) bei 4,2 GHz liegt. Werden mehr als 4 Kerne voll belastet, liegt die Turbo-Taktrate bei 3,7 GHz. Dabei muss allerdings sowohl die Leistungsaufnahme als auch die Kühlung mitspielen.

Die quasi-Verdopplung einer Ryzen 7-CPU geht auch mit einer extrem hohen Anzahl an PCIe 3.0-Lanes einher. Von den 64 Lanes stehen insgesamt 60 zur Verfügung, was in einer hohen Flexibilität mündet. So sind etwa Triple-GPUs möglich, bei denen zusätzlich noch zahlreiche NMVe-SSD oder RAID-Controller angebunden werden können. Zum Vergleich: Der Core i9-7900X ist mit 44 Lanes ausgestattet, der Core i7-7740X gerade einmal mit 16.

Eine Besonderheit: Der neue Sockel TR4 ist sehr groß, was sich unter anderem in einer aktuell noch schlechten Verfügbarkeit passender Kühler äußert - immerhin lässt sich der Prozessoren Tests zufolge auch nur zum Teil abgedeckt kühlen und sogar übertakten. Damit keine der 4.096 Pins beschädigt wird, gelingt die Montage mithilfe einer Schiene, ein Schraubendreher mit fixer Drehzahlbegrenzung wird zudem mitgeliefert - löblich. 

Struktur: Zwei Dies mit je zwei CCX mit je vier Kernen, Bild: AMD
Struktur: Zwei Dies mit je zwei CCX mit je vier Kernen, Bild: AMD

Threadripper-Eigenheiten: Latenz, NUMA und UMA

Das Verbinden zweier mehr oder weniger unabhängiger Dies ist allerdings weder trivial noch frei von Nachteilen und kann einen negativen Einfluss auf die Latenz der Kommunikation mehrerer Kerne haben. Dabei profitieren auch die Threadripper-Modelle von einem schnellen Arbeitsspeicher, wie Benchmarks von PC Perspective belegen. Dabei lassen sich vier verschiedene Latenz-Stufen ausmachen: Einmal für die Kommunikation innerhalb eines Kernen, innerhalb eines CCX (jeder CCX besteht aus 4 Kernen), auf einem Die und zwischen den beiden Dies. Die Latenz zwischen zwei Dies ist mit über 250 Nanosekunden mehr als 10 Mal so hoch wie innerhalb eines Kernes (Thread-zu-Thread) und damit auf dem Niveau von Dual-Sockel-Systemen, für die Kommunikation zweier Kerne in unterschiedlichen CCX sind rund 143 Nanosekunden nötig. Der konkurrierende Skylake-X Core i9-7900X benötigt im schlimmsten Fall lediglich knapp über 100 Nanosekunden.


PC Perspective konnte wie erwähnt auch nachweisen, dass ein schnellerer RAM eine signifikante Verbesserung der Latenz zufolge hat - bei einer RAM-Frequenz von 3.200 MHz verbessert sich diese um 14 Prozent (CCX-CCX) respektive 23 Prozent (Die-Die). Zwar unterstützt auch Threadripper offiziell lediglich maximal DDR4-2666, eine höhere Taktfrequenz dürfte in der Praxis allerdings selten ein Problem darstellen. In Anwendungsfällen, die sehr auf eine niedrige Latenz setzen (etwa Videospiele), kann die Struktur des Threadrippers allerdings durchaus zu Performanceeinbußen führen.


AMD ist sich der Problematik offensichtlich sehr bewusst und bietet zwei verschiedene Betriebsmodi und einen Kompatiblitätsmodus. Anwendern von Multi-Sockeln-Systemen dürften UMA und NUMA etwas sagen, vereinfacht gesagt versucht NUMA (Non-Uniform Memory Access), die Speicherlatenz möglich klein zu halten, während UMA auf eine möglich hohe Gesamtbandbreite abzielt. Grundsätzlich ist UMA in typischen HEDT-Anwendungsfällen die wohl sinnvollere Wahl, den ersten Tests zufolge ist aber die korrekte Wahl des Modus in HEDT-fremden Anwendungen (meist Spiele) allerdings mit etwas Trial-and-Error verbunden. Als Brechstange bietet AMD zudem den sogenannten Legacy Compatibility Mode an, welcher schlicht die Hälfte der Kerne deaktiviert - dieser soll AMD zufolge aber in (bestimmten) Spielen sinnvoll sein, laut Computerbase lässt sich die Performance um bis zu 12 Prozent erhöhen. Die Einstellungen lassen sich über die Desktop-Software Ryzen Master vornehmen, eine allzu aufwendige Konfiguration ist also nicht erforderlich. 

Latenzen im Vergleich (weniger ist besser), Bild: PC Perspective
Latenzen im Vergleich (weniger ist besser), Bild: PC Perspective
NUMA erklärt, Bild: AMD
NUMA erklärt, Bild: AMD
Die verschiedenen Profile, Bild: AMD
Die verschiedenen Profile, Bild: AMD

Benchmarks

Wir wollen vor der Analyse mehrerer Benchmarks noch einmal darauf hinweisen, dass letztlich Gaming-Benchmarks auf einer HEDT-Plattform ein wenig unpassend sind, da die Optimierung auch moderner Videospiele auf viele Kerne fraglich ist. Zudem bieten sowohl aktuelle AMD- als auch Intel-Modelle mehr als genug Performance, jedes Spiel bei einer realistischen Kombination aus Auflösung und Detailstufe selbst bei Multi-GPU-Systemen zuverlässig in die Limitierung der Grafikkarte(n) zu treiben. Die anvisierte, professionelle Käufergruppe des Threadripper dürfte insbesondere auf optimierte, parallelisierte Anwendungen setzen, etwa Virtualisierungen. 

Synthetische Benchmarks

Synthetische Benchmarks erlauben die schnelle Einschätzung der Leistungsfähigkeit in verschiedenen Anwendungssituationen. Dabei stellen die Ergebnisse in gewisser Weise (bei guten Benchmarks) eine Art Oberkante dar, die konkrete Anwendungen lediglich bei optimaler Optimierung leisten können.

Einer der bekanntesten Benchmark-Programme ist ohne Zweifel Cinebench, welcher die Leistungsfähigkeit anhand des Rendering von über 300.000 Polygonen mit einem respektive allen Threads quantifiziert. PC Perspective zufolge schafft der 1950X im Single-Thread-Benchmark lediglich 161 Punkte - und bleibt damit deutlich hinter der Intel-Konkurrenz zurück. So ist bereits ein Core i5-7600K mit 179 Punkten signifikant schneller, der Core i9-7900X bringt es schließlich auf beinahe 200 Punkte und ist damit um ein Viertel schneller.

Werden alle Kerne benutzt, kehrt sich das Bild erwartungsgemäß komplett um: Mit einem Score von 3008 deklassiert der 1950X alle Desktop-CPUs von Intel und ist im Vergleich zum Core i9-7900X (2186 Punkten) ein Viertel schneller. Im Vergleich zum Ryzen 7 1800X liegt die Leistungsfähigkeit bei 186 Prozent. Die (rein rechnerische) Differenz von 14 Prozent könnte man in erster Näherung aufgrund der gleichen Turbotaktrate auf allen Kernen als architekturbasierten Performanceverlust ansehen.

Single- und Multi-Thread-Leistung in Cinebench (Mehr ist besser), Bild: PC Perspective
Single- und Multi-Thread-Leistung in Cinebench (Mehr ist besser), Bild: PC Perspective

Verschlüsselungsleistung, PDF-Performance

Ein in der Praxis auch für durchschnittliche Nutzer nicht unrelevantes Szenario bildet die Ver- und Entschlüsselung. Hierbei sind eventuelle Nachteile durch eine unvorteilhafte Implementierung auf Softwareseite bereits sichtbar, es handelt sich also quasi um halb-synthetische Benchmarks. Bei Nutzung des AES-Algorithmus (Rijndael) leistet der Threadripper 1950X AnandTech zufolge 19,1 GByte in der Sekunde - das sind 6,8 GByte/s mehr als der Core i9-7900X. Im Vergleich zum Ryzen 7 1800X verschlüsselt der 1950X um 93 Prozent schneller, skaliert also hervorragend.

Im an sich praxisrelevanten Öffnen eines (sehr großen) PDF-Dokuments mit Adobe Reader DC schneidet die Ryzen-Modelle recht schlecht ab: Am schnellsten ist der Core i7-7740X, welcher lediglich 2,2 Sekunden zum Öffnen benötigt, der 1950X braucht knapp um drei Sekunden und ist damit sogar (ein wenig) langsamer als der Ryzen 7 1800X. Die direkte Threadripper-Konkurrenz in Gestalt des Core i9-7900X ist mit 2,5 Sekunden etwas schneller. 

PDF-Benchmark (Weniger ist besser), Bild: AnandTech
PDF-Benchmark (Weniger ist besser), Bild: AnandTech
Verschlüsselungsleistung (Mehr ist besser), Bild: AnandTech
Verschlüsselungsleistung (Mehr ist besser), Bild: AnandTech

Encoding

Das Encoding kommt in der Praxis nicht nur in der professionellen Videobearbeitung, sondern etwa auch beim Packen und Entpacken von komprimierten Archiven vor - und kann bei einer schwachen CPU zum Geduldsspiel werden. Naturgemäß kommt es auch bei diesem, realistischen Benchmark auf die Güte der verwendeten Software an, grundsätzlich profitiert die Geschwindigkeit beim Encoding aber im hohen Maße von einer hohen Kernzahl.

AnandTech nutzt im Test sowohl 7-Zip als auch WinRar, wobei der Threadripper 1950X am besten abschneidet, auch wenn der Core i9-7900X in 7-Zip ein wenig schneller verpackt - dafür beim Entpacken aber nur 66 Prozent der Leistung des Threadsrippers abrufen kann. Beim Verpacken unter WinRAR 5.40 schneidet der 1950X lediglich ein wenig besser als die Konkurrenz ab, was allerdings an der schlechten Multithreading-Unterstützung des Programms liegen könnte.

Bei der Umwandlung von Videodateien mittels Handbrake zeigt sich ein differenziertes Bild, die konkreten Ergebnisse sind stark von den konkret gewählten Einstellungen abhängig. So erreicht der 1950X bei der LQ-Umwandlung eines Videos (H264, 640 x 266 Pixeln) lediglich mittelmäßige Ergebnisse und wird vom Core i9-7900X um rund 16 Prozent abgehängt. Bei hohen Detaileinstellungen ist der 1950X wiederum ein wenig schneller, bei Nutzung des HEVC- statt des H264-Codecs sind die Ergebnisse des Threadrippers und des i9-7900X faktisch identisch.

Performance beim Komprimieren via 7-Zip (Mehr ist besser), Bild: AnandTech
Performance beim Komprimieren via 7-Zip (Mehr ist besser), Bild: AnandTech
Performance beim Entpacken via 7-Zip (Mehr ist besser), Bild: AnandTech
Performance beim Entpacken via 7-Zip (Mehr ist besser), Bild: AnandTech
Performance beim Encodieren via Handbrake (Mehr ist besser), Bild: AnandTech
Performance beim Encodieren via Handbrake (Mehr ist besser), Bild: AnandTech
Performance beim Encodieren via Handbrake (Mehr ist besser), Bild: AnandTech
Performance beim Encodieren via Handbrake (Mehr ist besser), Bild: AnandTech

Gaming-Benchmarks

Wie bereits dargestellt, ist Threadripper schlicht keine Gaming-CPU und richtet sich auch nicht an Videospieler, für die hohe Latenzen eher nachteilig sind und sich eine allzu hohe Thread-Anzahl im Extremfall sogar negativ auf die Gesamtperformance auswirken kann. AMD-Angaben und Medienberichten zufolge gibt es auch seltene Beispiele von Spielen, die ihren Dienst auf dem großen Threadripper verweigern, darunter F1 2016 und Far Cry Primal -  dann sorgt der Legacy Compatibility Mode immerhin für Abhilfe. 

In den Spielebenchmark hat es der Threadripper so erheblich schwerer, mit der Konkurrenz von Intel auch nur mitzuhalten. So ist der Abstand in GTA V Tom's Hardware zufolge im Auslieferungszustand bereits erheblich: Während der Core i9-7900X durchschnittlich 92,8 Frames in der Sekunde liefern kann, bringt es der 1950X auf lediglich 83,1 Frames, was einem Rückstand von gut 10 Prozent entspricht und auch die Frameratestabilität ist etwas schwächer. Im Durchschnitt bleibt die Leistung des 1950X ähnlich dem seiner technischen Basis, dem Ryzen 7 1800X, falls die richtige Einstellung gewählt wird und technische Probleme zu keiner atypischen Leistungsminderung führen. Hier sei noch einmal darauf hingewiesen, dass auch Hyperthreading einen negativen Einfluss auf die Spieleleistung haben kann.

Frameraten in GTA V (Mehr ist besser), Bild: Tom's Hardware
Frameraten in GTA V (Mehr ist besser), Bild: Tom's Hardware
Verteilung der Frametimes (Je mehr rot, umso besser), Bild: Tom's Hardware
Verteilung der Frametimes (Je mehr rot, umso besser), Bild: Tom's Hardware

Professionelle Workloads

Zusätzlich zu den anspruchsvollen Gaming-Benchmarks nutzt Tom's Hardware auch professionelle Workloads, die dem Anwendungsbereich des Threadrippers am ehesten entsprechen dürften. So handelt es sich bei Solidworks 2015 um ein stark verbreitetes CAD-Tool, dient also der Konstruktion von 3D-Modellen und auch der Simulation von bestimmten Vorgängen - beispielsweise einem Crash-Test. Dahinter steht insbesondere das Lösen von komplexen Differenzialgleichungen. Im Benchmark wird deutlich, dass etwa Solidworks nur schlecht mit einer hohen Threadzahl skaliert - bereits ein Core i7-7700K schlägt den 1950X deutlich.

Dass andere Software im Zweifel anders respektive besser optimiert ist, zeigt sich am Beispiel Blender, einer freien 3D-Grafiksuite. Hier agiert der 1950X über zweieinhalbmal so schnell wie der i7-7700K, der Vorsprung gegenüber dem Core i9-7900X liegt bei respektablen 26 Prozent. Auch andere Benchmarks bestätigen: Der Threadripper 1950X hat nicht nur potentiell hohe Leistungsreserven, sondern kann diese, bei passendender Software, auch abrufen. 

Leistung in Solidworks, Bild: Tom's Hardware
Leistung in Solidworks, Bild: Tom's Hardware
Leistung in Blender, Bild: Tom's Hardware
Leistung in Blender, Bild: Tom's Hardware

Temperatur, Übertaktung

Im Gegensatz zum Core i9-7900X, der in bestimmten Situationen aufgrund des schlechten Wärmedurchgangs von eigentlicher CPU zum Heatspreader von thermischen Problemen geplagt ist, verlötet AMD alle Ryzen-Derivate und damit auch Threadripper generell. Nichtsdestotrotz ist auch Threadripper nicht frei von Startproblemen in Sachen Kühlung: Für die neuen Prozessor sind komplett passende Kühler (noch) nicht verfügbar. AMD liefert zwar aktuell eine Art Adapter für All-in-One-Wasserkühlungen von Asetek mit, allerdings wird der Heatspreader dann nur zu einem Teil bedeckt. Luftkühler können aktuell noch nicht montiert werden.

Erstaunlicherweise sorgt dies bei entsprechenden Testern für keine Probleme, die Kerntemperatur bleibt selbst bei Vollast unter Standardtakt durchgängig bei deutlich unter 70°C. Damit bleibt ein nicht zu unterschätzender Spielraum für Übertaktungen, Computerbase erreichte bereits mit der kruden AiO-Kühllösung 4 GHz auf allen 16 Kernen. Die Leistungsaufnahme des Gesamtsystems sprang dort allerdings von 265 auf bis zu 400 Watt. Im Vergleich zum Core i9-7900X ist die Effizienz des 1950X deutlich höher, zumindest bei Betrachtung von Cinebench und auf Parallelität getrimmte Anwendungen.

Übrigens arbeitet wie Ryzen auch Threadripper mit einem Thermo-Offset von nun 27 Kelvin. Positiv formuliert hat AMD offensichtlich ein hohes Interesse an einer effizienten Kühlung und an der Langlebigkeit der eigenen Produkte, negativ ausgedrückt bedient sich das Unternehmen eines etwa miesen Tricks, um die Kühlsituation zu verbessern. Wirklich problematisch ist der Umstand aber weder bei Ryzen noch bei Threadripper, da sich die Drehzahlkurve der Lüfter im Regelfall justieren lässt.   

Fazit

Die Verkaufsverpackung, Bild: AMD
Die Verkaufsverpackung, Bild: AMD

AMD hat mit dem Threadripper 1950X letztlich gezeigt, dass die Skalierbarkeit des Ryzen bis in den HEDT-Bereich reicht. Zwei zusammengefügte Ryzen 7-Dies bieten bei der Latenz zwar gewisse Nachteile, unterm Strich aber die bessere Leistung und damit auch ein weit besseres Preis-Leistungsverhältnis bei auf viele Threads optimierten Anwendungen. Im Vergleich zum Core i9-7900X ergibt sich bei faktisch gleichem Preis ein Performancevorteil von 25 Prozent in Cinebench, der in optimierten Anwendungen auch in dieser Größenordnung abrufbar ist.

Professionelle Nutzer dürften ein neues System sehr wahrscheinlich mit sehr konkreten Vorstellungen in Bezug auf die benötigten Programme kaufen - kommt diese mit vielen Threads gut zurecht, kann die Empfehlung nur Threadripper lauten. Die in diesem Fall dann höhere Effizienz ist dann ein positiver Nebeneffekt, die EEC-RAM-Unterstützung etwa kann in ganz bestimmten Anwendungsfällen schon eher ein Must-Have sein - diese ist bei Intel den Xeon-Prozessoren vorbehalten.

Für Endanwender sind die Threadripper-Modelle unserer Einschätzung nach schlicht zu viel des Guten, bereits ein halber Threadripper in Form eines Ryzen 7 bietet dort bei weit günstigerem Preis mehr als genug Leistung, zumal die Leistung des 1950X bei ungünstig gewählter Speichereinstellung (UMA/NUMA) bisweilen sogar niedriger ist als die der Prozessoren für Endkunden.  

static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2017-08 > Viele Kerne, hohe Leistung: AMDs Threadripper in ersten Tests
Autor: Silvio Werner, 11.08.2017 (Update: 15.05.2018)