AMD mit Northern- statt Southern Islands

AMDOffenbar liefen die Spekulationen um AMDs kommende zweite DirectX 11-Grafikgeneration in die falsche Richtung. Sollte sich bewahrheiten, was SemiAccurate heute zu berichten weiß, dann werden die kommenden Grafikkarten kein Refresh, sondern tatsächlich eine komplette Überarbeitung und somit eine neue Architektur sein.

Laut SemiAccurate werden die kommenden Grafikkarten nicht Southern Islands heißen, wie bisher angenommen wurde, sondern tatsächlich schon zur Northern Islands-Generation gehören und damit neben einer Veränderung des Uncore-Bereichs auch gleich neue Shader mitbringen, nämlich 4D- statt wie bisher 5D-Einheiten (4 normale Shader + 1 Spezialeinheit). Damit wäre der Weg frei für einen stärkeren Performancezuwachs der neuen GPUs, als bisher angenommen. Denn die bisherigen 5D-Einheiten ließen sich nur in den seltensten Fällen vollständig auslasten, wodurch ein erheblicher Teil der theoretische imposanten Rechenleistung in den meisten Fällen verpuffte. Die neuen Shader sollen pro Shadereinheit zwar etwas größer ausfallen als die bisherigen, was einer stärkeren Flexibilität geschuldet ist, dennoch sollen 4 Stück davon immer noch kleiner ausfallen als die 5 vorherigen. Somit wären die Karten bei gleicher Shaderzahl schneller als bisher, aber nicht erheblich größer. Dafür dürften sie aber auch erheblich leistungsfähiger werden. Im Schnitt könnten allein durch die Shader knapp 20 Prozent mehr Leistung bei gleicher Shaderzahl möglich sein, wobei Verbesserungen im Uncore-Bereich noch nicht eingerechnet sind. Eine Steigerung der Tesselation-Leistung dürfte damit ebenfalls auf dem Programm stehen.

Ursprünglich sollten die Northern Islands in 32 nm gefertigt werden und standen auch schon kurz vor dem ersten Tape-Out, als TSMC angekündigte, seinen 32 nm-Prozess zugunsten der 28 nm-Fertigung zu überspringen. Ein denkbar ungünstiger Zeitpunkt also für AMD. Daher war eine Planänderung notwendig, die Chips doch im bewährten 40 nm-Verfahren zu fertigen, denn 28 nm stand noch in weiter Ferne. Der neue Codename für die Chips war demnach NI-40, also Northern Islands 40 nm. Wären die Chips im 32 nm-Verfahren gefertigt worden, wären sie kleiner ausgefallen als die bisherigen Evergreen-GPUs. Im 40 nm-Prozess werden sie dagegen wohl etwas größer. Damit dürfte wohl auch der maximale Stromverbrauch der kommenden GPUs gegenüber ihren Evergreen-Vorgängern steigen.

Die Southern Islands werden demnach dann der 28 nm-Shrink der aktuellen Generation werden, der aber erst im Laufe des kommenden Jahres erwartet wird. Quelle für die kursierenden Gerüchte um die Southern Islands als einem evolutionären Zwischenschritt zwischen Evergreen und Northern Islands war übrigens SemiAccurate selbst. Damals hatte man dort berichtet, wegen der Verschiebung des 28 nm-Prozesses habe man bei AMD entschieden, die bisherigen Shader der Evergreen-Architektur mit dem Uncore-Bereich der Northern Islands zu kombinieren, um so einen Refresh der aktuellen GPUs mit höherer Tesselation-Leistung zu ermöglichen. Dies war aber offensichtlich falsch.

Ein Hinweis darauf fand sich schon in den kürzlich geleakten Codenamen der neuen GPUs im Catalyst 10.8. Dort waren hinter den Codenamen der neuen Chips teils die Buchstaben NI zu finden, die doch recht eindeutig auf den Codenamen Northern Islands hindeuten. Zu diesem Zeitpunkt hatte man aber noch an den bisherigen Spekulationen festgehalten und war weiterhin von einer Hybrid-Generation ausgegangen. Dies hätte zudem auch gut zu der Aussage des AMD-CEOs Dirk Meyer Anfang des Jahres gepasst, dass man bis Jahresende das komplette Lineup einem Refresh (!) unterziehen wollte. Das Wort Refresh deutet ja eigentlich naturgemäß sanfte Verbesserungen an, keine komplette Überarbeitung. Doch eben dies wäre nun der Fall. Es ist nicht auszuschließen, dass die ursprünglichen Informationen von SemiAccurate eine bewusste Fehlinformation darstellen, die auch darauf abzielen sollte, die Konkurrenz im Dunklen über die neuen GPUs zu halten. Der Nebel wird momentan, kurz vor dem Start der neuen Grafikkarten, jedenfalls angesichts der überbordenden Spekulationen von allen Seiten tendenziell eher dichter.
Die neue Spekulation von SemiAccurate hat allerdings einige Wahrscheinlichkeit für sich. Im Folgenden sollen dies einige Gedanken hierzu erläutern:

  • 1. Für die Kombination des neuen Uncore-Bereichs mit den "alten" Shadern wäre ein aufwendiges Neudesign der Chips erforderlich geworden, wobei nicht klar ist, wie gut sich dieser Uncore-Bereich überhaupt mit verschiedenen Shadern verträgt. Im nun spekulierten Falle war lediglich ein "umgekehrter" Shrink nötig, was ebenfalls nicht trivial ist, aber doch der einfachere Weg sein dürfte, wenn man schon kurz vor dem Tape-Out der Chips stand. Wenn die Chips zudem auf geringe Größe ausgelegt waren, was durchaus zu AMDs aktueller GPU-Strategie passen würde, dann wäre eine Vergrößerung der Fertigungsstrukturen durchaus möglich, auch ohne dadurch Monster-Dies im Bereich eines GF100 zu erhalten.
  • 2. Ein Refresh des kompletten Lineups lediglich mit einem neuen Uncore-Bereich würde immense Investitionen bei wahrscheinlich eher geringem Nutzen bedeuten. Gerade bei der guten Marktposition, die AMD momentan inne hat - auch dank der sehr trägen DirectX 11-Strategie von Nvidia -, wäre das ein sehr kostspieliges Unterfangen. Man würde man sich bei der aktuellen Situation mit einem sanften Komplett-Refresh eher selbst Konkurrenz machen, als Nvidia weiter unter Druck zu setzen. Wenn es nur um den Test des neuen Uncore-Bereichs ginge, könnte man zudem auch eine Art Pipe-Cleaner ala Radeon HD 4770 (RV740) auf den Markt werfen, statt alle Karten zu überarbeiten. (Allerdings wäre es dann hier kein Pipe-Cleaner in dem Sinne, einen neuen Prozess zu testen, sondern umgekehrt, ein Techniktest bei eingefahrener Fertigung).
  • 3. Die Codenamen im Catalyst 10.8 enthalten das Kürzel NI hinter einigen GPUs, womit recht sicher auf Northern Islands, nicht auf Southern Islands angespielt wird.
  • 4. Der 40 nm-Prozess bei TSMC ist inzwischen relativ gut eingefahren und somit wäre die Fertigung leicht größerer Dies nicht mehr so kostenintensiv wie zu Beginn der Fertigung, als es noch erhebliche Probleme gab. Eine leichte Vergrößerung der Chipfläche wäre damit ohne Probleme möglich, ohne die Kosten gleichzeitig extrem in die Höhe zu treiben.


Kommentar schreiben

  • Loggen Sie sich oben mit ihren Benutzerdaten ein, um Kommentare zu verfassen.
  • Falls Sie noch kein Mitglied sind, können Sie sich in unserem Forum registrieren.

6 Kommentare

6.) eXEC 07.09.2010 - 23:15 Uhr
Ich bin der Meinung, dass diese 4D-Technik besser ist, als aktuell. Vor allem dürfte der NI beständiger in der Leistung, als es bisher bei AMD der Fall war. Es gibt Spiele wo AMD richtig gerockt hat, bei anderen wiederum waren sie einfach nur extrem schwach. Bei Nvidia war das imo eher eine regelmäßigere Leistung. Nirgens wirklich schlecht, aber auch nirgens überragend.
5.) Phenocore 07.09.2010 - 17:25 Uhr
N1truX:
"Denn die bisherigen 5D-Einheiten ließen sich nur in den seltensten Fällen vollständig auslasten, wodurch ein erheblicher Teil der theoretische imposanten Rechenleistung in den meisten Fällen verpuffte." Naja eigentlich ist das falsch. Die Auslastung lag im Mittel bei knapp 80 Prozent, eher etwas mehr.

Was soll daran falsch sein? 1D Einheiten lassen sich am besten Auslasten. 5D Einheiten auszulassen ist schon ein schwieriges Unterfangen... Und 80 Prozent ist auch nicht vollständig, wenn wir schon bei der gewählten Wortwahl bleiben. Wie du auf dein 80 Prozent kommst, musst du auch erst mal belegen.

N1truX:
Zudem muss man sehen das 4- statt 5-fach VLIW-Einheiten einen höheren hardwareseitgen Verwaltungsaufwand bedeuten, sprich mehr Leistungsaufnahme. Aber klar, die Auslastung sollte steigen, die Frage ist eben nur in wie weit man das mit mehr Leistungsaufnahme bezahlt.

Der im Prinzip mögliche höhere Verwaltungsaufwand würde ja gerade durch bessere Auslastung mehr als ausgeglichen, damit steigt die Effizienz. Bei gleicher Performance sinkt also die Leistungsaufnahme, wenn der Hersteller sonnst nichts falsch macht. Wäre ja auch sinnlos von einem Hersteller von 5D auf 4D zu gehen, wenn man dadurch nicht an Effizienz gewinnt... ...das nur mal so zu deiner Aussage bezüglich des Verwaltungsaufwandes im Allgemeinen.

Tatsächlich muss man erst mal die Einheiten an sich genauer betrachten, bevor man darüber philosophiert, ob der Verwaltungsaufwand steigt. Wenn die 5-te Einheit nur dazu diente Spezialrechnungen auszuführen und man diese Funktion der 5-ten Einheit in die anderen 4 mitintegriert, kann der Verwaltungsaufwand gleich bleiben, nur die Komplexität der verbleibenden Einheiten, die die 4D-Einheit bilden steigt. Die Zunahme der Komplexität ist aber in Ordnung, da man auf diese Weise eine komplette Einheit einspart.

und genau das steht auch im Text der News:"Die neuen Shader sollen pro Shadereinheit zwar etwas größer ausfallen (weil die Komplexität der Einheiten zunimmt) als die bisherigen, was einer stärkeren Flexibilität (komplexere Einheiten sind flexibler) geschuldet ist, dennoch sollen 4 Stück davon immer noch kleiner ausfallen als die 5 vorherigen."
4.) Weiser 07.09.2010 - 14:37 Uhr
http://www.pcgameshardware.de/aid,77110 ... arte/News/
3.) N1truX 07.09.2010 - 12:45 Uhr
Ein linearer Anstieg wäre wohl schon als Worst-Case zu betrachten. AMDs oberstertes Design Ziel ist ja Performance/Watt/Dollar und bei jedem Generationsupdate ging die Effizienz deutlich nach oben (Man vergleiche HD 2900 mit HD 5800 Karten ;) ), unabhängig davon ob nun ein neuer Node kam oder nicht.
Zumal man ja nun auch schon knapp 18 Monate Erfahrung mit dem TSMC-Prozess in der Massenproduktion hat, also sollte man auch da noch ein paar Prozent herausholen können.
2.) Kellerkind 07.09.2010 - 11:44 Uhr
N1truX:
Zudem muss man sehen das 4- statt 5-fach VLIW-Einheiten einen höheren hardwareseitgen Verwaltungsaufwand bedeuten, sprich mehr Leistungsaufnahme. Aber klar, die Auslastung sollte steigen, die Frage ist eben nur in wie weit man das mit mehr Leistungsaufnahme bezahlt.



Ich wäre auch nicht überrascht, wenn die Leistungsaufnahme linear zur Leistungssteigerung ansteigen würde.
Wichtiger - zumindest für AMD - ist aber dass laut Gerüchten aus China die 4-VLIW-Einheiten ~98% der 5-VLIW-Leistung in 80% der Fläche erreichen, zusammen mit anderen Verbesserungen kann AMD die Leistung merklich steigern ohne dass die Chips dadurch wesentlich größer & teurer herzustellen sind. Also entweder bekommen wir mehr Leistung fürs Geld, oder AMD bekommt bessere Margen. Ich fürchte fast Letzteres ;)
1.) N1truX 07.09.2010 - 06:21 Uhr
"Denn die bisherigen 5D-Einheiten ließen sich nur in den seltensten Fällen vollständig auslasten, wodurch ein erheblicher Teil der theoretische imposanten Rechenleistung in den meisten Fällen verpuffte." Naja eigentlich ist das falsch. Die Auslastung lag im Mittel bei knapp 80 Prozent, eher etwas mehr.
Zudem muss man sehen das 4- statt 5-fach VLIW-Einheiten einen höheren hardwareseitgen Verwaltungsaufwand bedeuten, sprich mehr Leistungsaufnahme. Aber klar, die Auslastung sollte steigen, die Frage ist eben nur in wie weit man das mit mehr Leistungsaufnahme bezahlt.

Die Spekulationen gibt es nun auch seit knapp 2 Monaten und semiaccurate ist eig. auch eine ganz solide Quelle. Hoffen wir das sie wirklich neue Infos hatten und nicht nur alles nochmal aufbereitet haben :)