AMD Bulldozer-CPUs mit mehr als 3,5 GHz

AMDAMD wird auf der International Solid-State Circuit Conference 2011 -ISSCC - einen Vortrag über "Design Solutions for the Bulldozer 32nm SOI 2-Core Processor Module in an 8-core CPU" halten. Es geht also um die Beschreibung eines einzelnen Moduls innerhalb des kommenden Acht-Kern-Prozessors Zambezi bzw. Valencia. Dabei gibt die Beschreibung des Vortrags auch Aufschlüsse zu Details von AMDs kommender High-End-Desktop- und Server-CPU-Architektur.

Die Kurzbeschreibung des Vortrags lautet:
"The Bulldozer 2-core CPU module contains 213M transistors in an 11-metal layer 32nm high-k Metalgate SOI CMOS process and is designed to operate from 0.8 to 1.3V. This micro-architecture improves performance and frequency while reducing area and power over a previous AMD x86-64 CPU in the same process. The design reduces the number of gates/cycle relative to prior designs, achieving 3.5GHz+ operation in an area (including 2MB L2 cache) of 30.9mm2."

Die wichtigsten Fakten sind demnach also eine Frequenz von mehr als 3,5 GHz sowie eine Silizium-Fläche von 30,9 mm² pro Modul, das aus zwei Integerkernen plus gemeinsamer FPU und 2 MiB L2-Cache besteht.

Hier zeigt sich damit auch deutlich, dass AMD einen anderen Weg im High-End-Bereich einschlägt als Intel. Denn während Intel auf relativ dicke Kerne setzt, die mittels Symmetrical Multithreading (SMT) zwei - oder später vielleicht mehr - Prozesse gleichzeitig bearbeiten können, teilt AMD einer Fließkomma-Einheit zwei Integerkerne zu. Das ist sinnvoll, weil ein Großteil der Berechnungen bei Desktop- und Server-Anwendungen dem Integer-Bereich angehören und im Rahmen des Fusion-Programms zudem langfristig die GPU-Kerne einen Großteil der Fließkommaberechnungen übernehmen sollen.
So passt es dann auch ins Bild, dass ein AMD Bulldozer-Modul (zwei Kerne plus L2-Cache) mit 30,9 mm² etwa genauso groß ausfällt wie ein einzelner Sandy Bridge-Kern, der inklusive L2-Cache auf 28,5 mm² kommt.
AMD sollte flächenmäßig somit acht Kerne auf etwa der gleichen Fläche unterbringen können, die Intel für vier Kerne braucht.
Damit ist ein Bulldozer-Modul auch kleiner als zwei Llano-Kerne inklusive L2-Cache, bringt aber erhebliche Verbesserungen bei den CPU-Erweiterungen und vor allem dem Decoder mit.

Schon kürzlich hatte es Hinweise gegeben, dass die Bulldozer-CPUs auch einen neuen Turbo mitbringen werden, der alle Kerne um bis zu 500 MHz übertakten kann. Ob dieser Turbo bei der Angabe der Taktfrequenz von mehr als 3,5 GHz schon mit eingerechnet ist, bleibt abzuwarten. Jedenfalls scheint AMD bezüglich der Taktmöglichkeiten bei Bulldozer optimistischer zu sein als bei der geshrinkten K10.5-Architektur, die bei Llano zum Einsatz kommt. Dort hatte AMD nur von mehr als 3 GHz gesprochen, wobei dies auch ohne Einrechnung des Turbomodus' zutreffen dürfte. Der Einsatz kleinerer Strukturen inklusive High-K-Metalgate-Technologie sowie Low-K-Dielektrika bringt hier erfahrungsgemäß allein schon deutliche Fortschritte bei den Taktspielräumen.
AMD wird die ersten Bulldozer-CPUs im zweiten Quartal 2011 vorstellen, wobei vielleicht der 21. April als Geburtstag hier ein gutes Datum wäre, da AMD an diesem Tag acht Jahre zuvor mit dem ersten Opteron den Servermarkt neu aufgerollt hat. Gleiches hofft man nun auch, mit Bulldozer wieder zu schaffen, was gerade im ertragsstarken Serverbereich für AMD auch dringend notwendig wäre.


Kommentar schreiben

  • Loggen Sie sich oben mit ihren Benutzerdaten ein, um Kommentare zu verfassen.
  • Falls Sie noch kein Mitglied sind, können Sie sich in unserem Forum registrieren.

11 Kommentare

11.) Phenocore 25.11.2010 - 08:48 Uhr
Eine CPU nur für Aufrüster? Nein!
Wie viel Prozent der PC-Käufer rüsten ihre CPU auf? 5 Prozent, 8 Prozent? und vom gesamten Weltmarkt hat AMD nur 28 Prozent Marktanteil bei den Desktopprozessoren. Auch wenn AMDs Kunden mehr aufrüsten als der Durchschnitt, eine neue CPU nur für Aufrüster lohnt sich nicht. Für Aufrüster hätte auch der Phenom II X6 1090T in der aktuellen 125W Fassung gereicht und der in Q2 erscheinende Phenom II X6 1065T mit 95W TDP.
Dann kommt noch die Tatsache hinzu, dass AMD ihre AM3+ Plattform kompatibel zu AM3-CPUs machen wird. AMD will also in der Tat AM3-CPUs mit neuer AM3+ Plattform in Q3 2011 verkaufen. Dazu wird man dann wohl die Preise entsprechend so gestalten, dass sowohl AM3 als auch AM3+ CPUs ihre Attraktivität haben. So ist zumindest der Plan, wenn man sich die Roadmaps und die Kompatibilität anschaut.

Noch was zu den taktoptimierten Designs. Pentium 4 hatte ja schon in 90nm seine 3,8 GHz erreicht. Seit dem dümpeln wir drunter. Inzwischen sind wir schon bei 32nm-Transistoren, die auch recht schnell takten können. IBM hatte auch schon ihre Power-Prozessoren mit 5 GHz. Wer weiß, vielleicht ist die Zeit inzwischen reif für 4+ GHz CPUs. Vielleicht gibts rechtzeitig zur Ivy Bridge-Vorstellung, dann auch 4+ GHz CPUs von Globalfoundries mit AMDs Bulldozer Design. Die Hoffnung stirbt ja bekanntlich zuletzt.
10.) isigrim 25.11.2010 - 06:15 Uhr
@Phenocore
Du solltest nicht vergessen, dass man AM3 noch eine Zeit lang weiterbedienen wird. Denn Bulldozer braucht ja AM3+, und man wird potentiellen Aufrüstern nicht alle Wege gleich versperren wollen. Da würde ich also nicht vorschnell Rückschlüsse auf die Performance draus ziehen.
9.) Phenocore 25.11.2010 - 05:22 Uhr
Daedalus:
Prinzipiell glaube ich nicht das AMD die Integerleistung weiter verkleinert.

Insgesamt betrachtet wird die Integerleistung mehr, jedoch nicht pro Thread, da wird sie nach bisherigen Informationen kleiner.

Daedalus:
Man wird sich bewußt sein dass Floitingpoint die eigentliche Stärke war bis Intel die Vorlezte Generation gebracht hatte. Bei Integer war man schon immer hinterher, ergo war genug Auholfbedarf vorhanden. Das die Ausführungseinheiten veringert wurden heißt noch nicht zwangsläufig, dass auch die Integerperformance verringt wurde. Bei einer Optimierung der Peripherie kann die Auslastung erhöht werden, das durchaus auch zur Verbesserung der Performance führen kann.

Ja, es stimmt, AMD hing schon die ganze Zeit hinterher bei Integerleistung. Jedoch kann ich mir nicht vorstellen, dass man über 33 Prozent (eingesparte Pipeline) mehr durch Optimierungen der Peripherie durch Auslastungerhöhung herausholen kann. Vielmehr will man wohl die Taktraten durch Einsparung von Einheiten weiter anheben, aber eine Architekturoptimierung für mehr Takt hat schon beim Pentium 4 nicht funktioniert... ich bin da skeptisch...

Daedalus:
P.S: Das Bulldozer nicht Perfekt ist zeigt sich allein in jetzt schon angekündgten Architetur Bulldozer 2.

Das ist in der Tat kein Parameter, der irgend etwas aufzeigt. Viel interessanter ist aber, dass nach dem in Q2 der Buldozer kommt, in Q3 noch neue K10-Pozessoren im Performancesegement kommen werden. Also so viel mehr traut man wohl dem Buldozer auch nicht zu. Der Sechskerner Phenom II X6 1075 mit 95W TDP kommt erst in Q3 2011, nach dem der Buldozer schon für Q2 2011 angekündigt ist.^^
http://news.ati-forum.de/images/stories ... oadmap.jpg
8.) w0mbat 25.11.2010 - 00:39 Uhr
"P.S: Das Bulldozer nicht Perfekt ist zeigt sich allein in jetzt schon angekündgten Architetur Bulldozer 2."

sry, aber selten so ein blödsinn gelesen. ersten ist es jedem klar, da nichts perfekt ist und 2. wurde bd2 noch nicht angekündigt, es sei denn, du rechnest ein auftreten in der roadmap dazu. dann müsste aber ivy bridge auch schon schlecht sein, da auch deren nachfolger schon fest steht.
7.) Daedalus 25.11.2010 - 00:05 Uhr
Prinzipiell glaube ich nicht das AMD die Integerleistung weiter verkleinert. Man wird sich bewußt sein dass Floitingpoint die eigentliche Stärke war bis Intel die Vorlezte Generation gebracht hatte. Bei Integer war man schon immer hinterher, ergo war genug Auholfbedarf vorhanden. Das die Ausführungseinheiten veringert wurden heißt noch nicht zwangsläufig, dass auch die Integerperformance verringt wurde. Bei einer Optimierung der Peripherie kann die Auslastung erhöht werden, das durchaus auch zur Verbesserung der Performance führen kann.
Auf der anderen Seite werden Profianwendungen immer mehr parallelisiert wovon Bulldozer massiv nutzen zieht. Auch wenn immer alle Hardware Reviewer schreiben, dass die Hardware nicht alle Kerne auslasten kann so ist das immer nur die halbe Wahrheit.
Die Wahrheit ist folgende:
Server: durch Virtualisierung können schon sehr sehr viele Kerne genutzt werden. Bladesysteme seihen hier nur als Beispiel genannt. Dynamische Ressourcenverwaltung fördert das Kernrennen weiter.
Privat: Eine Anwendung wird auch in der jetzigen Zeit kaum mehr als zwei Kerne auslasten. Aber das Betriebsystem braucht zumindest auch einen Kern. Dazu kommen noch paralllel laufende Anwendungen welche die Kerne weiter belasten.
Seit 3 Jahren nenne ich einen Q6600 mein eigen. Natürlich sind im Schnitt nur zwei Kerne ausgelastet. Aber wenn ich Anwendungen laufen lasse, Musik höhre, FTPs betreibe und noch ein bissl Firlefanz läuft (Firewall, Virenscanner) dann bin ich schnell bei 75%. Und die restlichen 25% werden "Stoßweise" fast aufgebraucht. Hätte man die Reserve nicht würde das System ab und zu hängen, was von der Usebility auch nicht so hübsch wäre.

Lange Rede, kurzer Sinn: Ich denke die Architektur wird ganz nett werden.

P.S: Das Bulldozer nicht Perfekt ist zeigt sich allein in jetzt schon angekündgten Architetur Bulldozer 2.
6.) Phenocore 24.11.2010 - 16:44 Uhr
N1truX:
Also sei dir da mal nicht so sicher, dass die Single-Thread Performance so viel schlechter ist. AMD hat ja die Int.-Kerne nicht wirklich geschrumpft (zumindest im Vergleich zum K10.5), sondern zu jedem Kern ein zweites Int-Modul hinzugefügt und dann noch Decoder, FPU etc. aufgepumpt um auch zwei Kerne versorgen zu können und nennt das dann Modul.

Doch, AMD hat die Int.-Kerne die einem Thread zur Verfügung stehen geschrumpft. Von 3 Integerpipilenes auf 2 Integerpilines, also um 1/3= 33 Prozent geschrumpft. Auf die anderen Integer-Kernpipelens im Modul hat der eine Thread ja kein Zugriff, sondern nur auf die gemeinsame FPU.

N1truX:
Intel jagt zur Effizienzsteigerung 2 Threads durch einen etwas aufgeborten Kern, AMD je nach Situation einen Thread durch "1,5" Kerne oder 2 durch "fast 2". Es dürfte aber sehr stark von der Software abhängen was Bulldozer reißen kann, dass ist klar.

Vorprosessing und Nachprosessing sind 1,5 Kerne bei einem Modul. Die tatsächlichen Integer-Ausführungseinheiten sind aber pro Thread nur 2/3 eines K10 Kerns, weil 2 Integerpipelines, statt 3. Bei einem Thread auf dem Modul entsteht eine grobe Unausgeglichenheit zwischen den tatsächlichen Ausführungseinheiten und Vor- und Nachbearbeitenden Einheiten. Die einzige Lösung bei so was wäre, die Integerpipelines höher zu takten als den Rest des Moduls, wenn nur ein Thread darauf ausgeführt wird um die Balance wieder herzustellen. Aber ob AMD so etwas wirklich realisiert hat oder einfach auf Software hofft, die immer alle Kerne mit Threads versorgt, ist die große Frage.... bisher hat AMD zumindest nichts von unterschiedlichen Taktraten innerhalb des Kerns erzählt, (sondern nur von dem inzwischen üblichen Taktunterschied zwischen L3-Cache+Speichercontroller und dem Kern.) oder doch?
5.) N1truX 24.11.2010 - 06:53 Uhr
@Phenocore: Also sei dir da mal nicht so sicher, dass die Single-Thread Performance so viel schlechter ist. AMD hat ja die Int.-Kerne nicht wirklich geschrumpft (zumindest im Vergleich zum K10.5), sondern zu jedem Kern ein zweites Int-Modul hinzugefügt und dann noch Decoder, FPU etc. aufgepumpt um auch zwei Kerne versorgen zu können und nennt das dann Modul.
Im Idealfall wird jedes Modul erstmal nur mit einem Thread versorgt. Der Vorteil wäre, dass der eine Thread bei entsprechenden Aufgaben die Dicken Decode/Fetch-Pfade, bei AVX sogar gleich die ganze FPU als 256-bit breite FPU und den (für einen Core) großen L2-Cache allein nutzen kann.

Intel jagt zur Effizienzsteigerung 2 Threads durch einen etwas aufgeborten Kern, AMD je nach Situation einen Thread durch "1,5" Kerne oder 2 durch "fast 2". Es dürfte aber sehr stark von der Software abhängen was Bulldozer reißen kann, dass ist klar.

Für was man mehr CPU-Power braucht? Alles :) Wenn das Video-Encoding 4 Stunden weniger braucht bei gleicher Leistungsaufnahme spart das gleich mal doppelt. Bei mir auch noch Foto-Rendering (RAW-Konvertierung) oder andere Späße im Multimedia-Bereich. Bei Games braucht man aktuell nicht so viel mehr, aber ich spiele auch nur noch sehr selten am PC und wenn dann meist sehr GPU-fordernd und nicht sowas wie Anno ;)
4.) Flare 23.11.2010 - 20:15 Uhr
am meißten interessiert mich wie die Performance vom nur halb-ausgenutzten 2-core-modul sein wird,
wenn die ratio zwischen full-used BD-modul und halbdeaktiviertem BD-modul genausogut "Single-Thread-Beschleunigt"
wie intel mit smt oder singlethread je Kern was ja gut dynamisch passiert, wäre das super
wenn der prozessor an sich 8-10 threads so schnell bearbeitet wie intel es mit six-core + SMT tut wäre das eine feine sache.
3.) isigrim 23.11.2010 - 15:10 Uhr
Für mich wird Bulldozer bei Raytracing sehr gut werden, zumindest in den Bereichen wo die GPUs noch nicht unterstützt werden. :D Da ist der Thuban auch schon sehr gut, vor allem Preis-Leistungsmäßig und ich denke dank eines modulareren Aufbaus mit Turbo und Modulabschaltung (das hat ja bei Thuban tatsächlich gefehlt, also ein C6 o.Ä.) wird Zambezi erhebliche Übertaktungsspielräume haben, die einiges an SinglethreadLeistung bringen. Wenn alle Kerne +500 Mhz gehen, dann darf man sich ausmalen, was theoretisch bei der Übertaktung eines einzelnen Moduls drin wäre, wenn die anderen drei schlafen.

Gut ist aber schon einmal das Erscheinen im zweiten Quartal, denn gegen Ivy Bridge Ende des Jahres wäre es nochmal ne Schippe schwerer geworden. Im Serverbereich könnte man mit Bulldozer wieder einiges an Boden gut machen, hoffentlich.
2.) Phenocore 23.11.2010 - 13:59 Uhr
Mit Buldoser wird AMD die Multithreadingperformance gut steigern können, sofern die Software so viele Threads zur Verfügung stellen kann. Acht schmale Integereinheiten + Dicke FPU sind hier im Vorteil gegenüber 6 und 4 Kerne + SMT.

Bei Singlethreadperformance bzw. bei Software, die nicht für alle 8 Integereinheiten die Threads zur Verfügung stellen kann, wird Intel weiterhin der König sein, denn hier sind vier breite Kerne den schmalen acht Integereinheiten überlegen. Es sei den AMD kann die Frequenz so weit steigern, dass sie die schlechtere IPC bei schwach Threaded-Aplikationen ausgleichen können. Aber da bin ich skeptisch. Intels Core i7 2600 mit 95W taktet ja bereits mit 3,4 GHz und bringt 4 Kerne +SMT (durchschnittlich 6 Threads). Intels Core i7 990X wird im Januar mit 3,46 GHz takten und bringt auch 6 Kerne + SMT (durchschnittlich 9 Threads)

Damit erwarte ich im Desktopbereich nicht so viel von einem Buldozer. So wie den Core i7 970 mit SMT kaum jemand mit einem Desktopprogramm mit durchschnittlich 9 Threads versorgen kann, so wird diese Schwierigkeit auch beim 8 Integerkernbuldozer bestehen.

Außerdem: Habt ihr schon mal geschaut, wann ihr von der CPU-Performance mehr haben wolltet? Bei Videobearbeitung? Nicht wirklich, da lasse ich es einfach laufen, ich muss nicht dabei sein. Da kann das ganze auch 2 Stunden konvertieren. Wenn ich dagegen eine CAD-Datei im .igs Format finde und will diese in mein Solide Edge Programm importiere, dann ist nur ein Kern ausgelastet und ich warte. Mal als ein Beispiel. Ich hab mal geschaut, immer wenn ich auf den Prozessor warte, braucht die Software mehr Kernpower und nicht mehr Kerne, daher ist für mich die Kernpower wichtig und nicht die Anzahl der Kerne. Damit wäre ich wohl auch mit einem 4 Kerner von Intel besser bedient als mit einem 6-Integerkerner von AMD, es sei den AMD schafft noch 4+ GHz mit 95W TDP oder ähnliche Überraschungen...
1.) N1truX 23.11.2010 - 10:03 Uhr
Klingt auf jeden Fall viel versprechend, wie die ersten Folien zum K10 auch^^ Damals wussten wir aber schon, dass der AMD 65 nm-Prozess nicht gerade die Krönung im Bereich Leistung war, 32 nm SOI HKMG hat da doch gehörig mehr Potential..
Besonders auf das Power-Management bin ich wirklich gespannt, dazu hat man ja schon einiges gehört. Naja am Ende wird man schon ordentlich Takt schaffen müssen um gegen Intel gut dazustehen. Ein "wir sind nah dran" wäre wohl alles andere als befriedigend.