Nvidia GF100: 128 TMUs und 48 ROPs

NvidiaVorgestern hat Nvidia seinen Next-Generation-Chip GF100 angekündigt. Er setzt auf die so genannte Fermi-Architektur, ist rund 3,0 Millarden Transistoren schwer, besitzt 512 skalare Shadereinheiten und ein 384 Bit breites Speicherinterface, das bis zu 6 GiB GDDR5-Speicher verwalten kann.
Verschwiegen hat man bis dato, wie viele TMUs und ROPs der Chip besitzen wird, weswegen in den letzten Stunden auch das große Rätselraten begann. Uns liegen nun exklusive Informationen vor.

Der GF100 verfügt - wie von vielen erwartet - über insgesamt 128 TMUs. Stutzig hatte zuletzt ein bei Beyond3D aufgetauchtes Dokument gemacht, das 256 Einheiten suggerierte. Dieses ist - wie sich jetzt herausstellt - auch nicht falsch, sondern spiegelt lediglich die Anzahl der Interpolatoren wider, die 256 beträgt. Da zum Texturieren jedoch zwei Interpolatoren notwendig sind, kann man davon sprechen, dass der GF100 effektiv 128 TMUs besitzt.
Im Allgemeinen fallen die TMUs übrigens flexibler aus als noch auf G80 und GT200. So lassen sich beispielsweise anstelle eines billinearen Samples auch zwei Vektoren auf einer TMU laden.

.G80GT200GF100
Fertigung90 nm65 nm40 nm
Transistoren0,7 Millarden1,4 Millarden3,0 Millarden
Shadereinheiten
(Single Precision)
128240512
Shadereinheiten
(Double Precision)
-30256
TMUs6480128
ROPs243248
Speicherinterface384 Bit
GDDR3
512 Bit
GDDR3
384 Bit
GDDR5


Wie wir ebenfalls in Erfahrung bringen konnten, hat sich die Anzahl an ROPs von 32 auf 48 erhöht, obwohl das Speicherinterface um 25 Prozent von 512 auf 384 Bit gekürzt wurde. Es ist naheliegend, dass Nvidia schlichtweg pro Speichercontroller - GF100 verfügt über sechs Speichercontroller mit je 64 Bit Breite - die Anzahl an ROPs von 4 auf 8 verdoppelt hat. Genaue Informationen liegen uns jedoch nicht vor.
Pro ROP sollen 8 Z-Einheiten verbaut sein, so dass insgesamt 384 Z-Tests gleichzeitig durchgeführt werden können.

Bereits lauffähige GF100-Chips sollen mit 650/1700/1000 MHz laufen - gegenüber den 700/1600/1100 MHz beim A1-Stepping also keine allzu große Veränderung, sofern es sich wirklich um ein und denselben Chip handelt.
Noch in diesem Jahr wird man wohl ein Launch-Event inszenieren und mit Glück auch etwas Karten auf den Markt bringen können. Gute Verfügbarkeit scheint es jedoch erst ab 2010 zu geben.


Kommentar schreiben

  • Loggen Sie sich oben mit ihren Benutzerdaten ein, um Kommentare zu verfassen.
  • Falls Sie noch kein Mitglied sind, können Sie sich in unserem Forum registrieren.

10 Kommentare

10.) Sennahos 03.10.2009 - 22:05 Uhr
hmmm das Ati vs. Nvidia Duell wird diesmal eindeutig facettenreicher, beide haben richtig viel Potenzial da was zu reissen. Trotz allem jetzt, glaub ich nicht das Nvidia sich es gefallen lässt, Spieletechnisch abzusacken... Fermi wurde zwar noch nicht als Oberknaller deklariert aber kann ja auch nur Taktik sein, welche auch immer, zudem keiner wirklich die tatsächliche Leistung weiss. Verdammt spannend. Ati hat au noch einiges nach oben offen mit den 5xxxern
9.) eXEC 03.10.2009 - 11:20 Uhr
Ich denke nicht, dass Fermi der überflieger wird, wie ihn viele erwarten. 2TFlops ist alles andere als viel, einzig bei den TMUs scheint man wieder deutlich Punkten zu können. Insgesamt sehe ich hier keine stärkere Verbesserung wie von RV770->RV870, sprich es sollte maximal das Verhältnis rauskommen, dass bereits bei der letzten Generation bestand. ATI hat vor allem die ganz wichtigen Flaschenhälse wieder weeeiit in Ferne gerückt, sprich TMUs und ROPs. Und die 512 SPUs sind auch eine kleine Mogelpackung, immerhin war früher MADD+MUL möglich, nun sind es nur noch ein MADD. Das ist schon ein deutlicher Unterschied, auch wenn bisher das MUL nie perfekt ausgelastet werden konnte.
Und vor allem sollten sie sich lieber mal ein bisschen beeilen. ATI hat bereits seine Karten released, Verfügbar werden sie voraussichtlich nächste Woche. Na hoffentlich wird das nicht so ein Gaskopf, wie die HD2900 XT.... Hier hatten auch alle ENOORME Leistung aufgrund von 320 Shadern erwartet, hahaha Pustekuchen.
8.) KonKorT 02.10.2009 - 20:28 Uhr
iNsuRRecTiON:
Also war zwar schon fast klar, dass die nicht so hoch takten können, wegen dem sehr großen Chip usw., aber ich hätte doch schon mind. 2000 MHz in der Shaderdomäne erwartet, sodass sie 3 TFlops mit dem Chip erreichen können..

Dir ist bewusst, dass es nicht mehr ein MADD und MUL pro ALU gibt, sondern nur noch ein MADD bzw. FMA? Die theoretische Shaderleistung liegt damit gerade einmal bei 2048 Teraflops (512*2*2000), wenn man 2 GHz Shadertakt zugrunde legt, was aber gegenwärtig noch utopisch erscheint.
Man sollte sich aber von dieser theoretischen Zahl nicht verschrecken lassen. Es sieht so aus, als würden selbst 1,5 Teraflop Fermi-ALU-Leistung 2,7 Teraflops Cypress-ALU-Leistung übertreffen. Wie heißt es so schön? Am Ende zählt, was hinten bei herauskommt... ;)
7.) Duplex 02.10.2009 - 19:48 Uhr
naja 2Ghz shader ist ne menge holz

wen ich bedenke das meine GTS250 mit ihreren fast lächerlichen 128shadern knapp 2ghz mitmacht ( genau 1944mhz ) dann kannste dir vorstellen was es für ne arbeit sein muss 512shadern so hoch zu taken was ja das 4fache ist
6.) iNsuRRecTiON 02.10.2009 - 18:18 Uhr
Hi,

hmm, schade, hätte mehr erwartet..
Also war zwar schon fast klar, dass die nicht so hoch takten können, wegen dem sehr großen Chip usw., aber ich hätte doch schon mind. 2000 MHz in der Shaderdomäne erwartet, sodass sie 3 TFlops mit dem Chip erreichen können..

Und die Standardchip und Speicherdomäne ist auch nicht gerade berrauschend angesteuert, d.h. es wird nicht all zu viel Speicherdurchsatz geben, wie vormals angenommen..

Naja, noch ist nix Final, man wird sehen..

Und übrigens, dass die GPU 48 ROPs haben wird, wusste ich spätestens seit dem das Bild hier aufgetaucht war: http://www.hardware-infos.com/bild_grup ... bild=1871#

Dort konnte man die einzelnen ROPs zusammenzählen.

MfG

iNsuRRecTiON
5.) w0mbat 02.10.2009 - 16:10 Uhr
Man hat bei der Tabelle den Eindruck Fermi hätte extra DP Shader, obwohl das nur bei GT200 der Fall ist. Schreib irged was von Loops oder dergleichen dazu, damit man das nicht verwechselt. Auch in DP hat Fermi 512 Shader.
4.) Ares-06 02.10.2009 - 16:02 Uhr
Weiser:
Meiner Meinung nach 10-20% schneller als die GTX 295 - und das als Single-GPU!!!


ich hoffe du hast recht :D
naja 100% schneller als die GTX280 wären schön aber naja is es aber nicht oder? :?
was meint ihr wärs möglich ???

jaja bin eben nur neugierig und kenn mich eben mit so was wie tmus und rops und etc. nicht aus kanns eben nicht einschätzen wie viel schneller die als ......... sind ^^
3.) Weiser 02.10.2009 - 15:54 Uhr
Meiner Meinung nach 10-20% schneller als die GTX 295 - und das als Single-GPU!!!
2.) Ares-06 02.10.2009 - 15:41 Uhr
ist jetzt nur noch die frage wie viel schneller bzw wie viel langsamer das wird als die 285-5870-295....
1.) Weiser 02.10.2009 - 14:51 Uhr
Hört sich doch alles recht gut an! Wenn jetzt noch die Preise stimmen (GTX 380 < 450€; GTX 360 < 350€)...