Vorgestern hat Nvidia seinen Next-Generation-Chip GF100 angekündigt. Er setzt auf die so genannte Fermi-Architektur, ist rund 3,0 Millarden Transistoren schwer, besitzt 512 skalare Shadereinheiten und ein 384 Bit breites Speicherinterface, das bis zu 6 GiB GDDR5-Speicher verwalten kann.
Verschwiegen hat man bis dato, wie viele TMUs und ROPs der Chip besitzen wird, weswegen in den letzten Stunden auch das große Rätselraten begann. Uns liegen nun exklusive Informationen vor.
Der GF100 verfügt - wie von vielen erwartet - über insgesamt 128 TMUs. Stutzig hatte zuletzt ein bei Beyond3D aufgetauchtes Dokument gemacht, das 256 Einheiten suggerierte. Dieses ist - wie sich jetzt herausstellt - auch nicht falsch, sondern spiegelt lediglich die Anzahl der Interpolatoren wider, die 256 beträgt. Da zum Texturieren jedoch zwei Interpolatoren notwendig sind, kann man davon sprechen, dass der GF100 effektiv 128 TMUs besitzt.
Im Allgemeinen fallen die TMUs übrigens flexibler aus als noch auf G80 und GT200. So lassen sich beispielsweise anstelle eines billinearen Samples auch zwei Vektoren auf einer TMU laden.
. | G80 | GT200 | GF100 |
---|---|---|---|
Fertigung | 90 nm | 65 nm | 40 nm |
Transistoren | 0,7 Millarden | 1,4 Millarden | 3,0 Millarden |
Shadereinheiten (Single Precision) | 128 | 240 | 512 |
Shadereinheiten (Double Precision) | - | 30 | 256 |
TMUs | 64 | 80 | 128 |
ROPs | 24 | 32 | 48 |
Speicherinterface | 384 Bit GDDR3 | 512 Bit GDDR3 | 384 Bit GDDR5 |
Wie wir ebenfalls in Erfahrung bringen konnten, hat sich die Anzahl an ROPs von 32 auf 48 erhöht, obwohl das Speicherinterface um 25 Prozent von 512 auf 384 Bit gekürzt wurde. Es ist naheliegend, dass Nvidia schlichtweg pro Speichercontroller - GF100 verfügt über sechs Speichercontroller mit je 64 Bit Breite - die Anzahl an ROPs von 4 auf 8 verdoppelt hat. Genaue Informationen liegen uns jedoch nicht vor.
Pro ROP sollen 8 Z-Einheiten verbaut sein, so dass insgesamt 384 Z-Tests gleichzeitig durchgeführt werden können.
Bereits lauffähige GF100-Chips sollen mit 650/1700/1000 MHz laufen - gegenüber den 700/1600/1100 MHz beim A1-Stepping also keine allzu große Veränderung, sofern es sich wirklich um ein und denselben Chip handelt.
Noch in diesem Jahr wird man wohl ein Launch-Event inszenieren und mit Glück auch etwas Karten auf den Markt bringen können. Gute Verfügbarkeit scheint es jedoch erst ab 2010 zu geben.
Kommentar schreiben
10 Kommentare
Und vor allem sollten sie sich lieber mal ein bisschen beeilen. ATI hat bereits seine Karten released, Verfügbar werden sie voraussichtlich nächste Woche. Na hoffentlich wird das nicht so ein Gaskopf, wie die HD2900 XT.... Hier hatten auch alle ENOORME Leistung aufgrund von 320 Shadern erwartet, hahaha Pustekuchen.
Dir ist bewusst, dass es nicht mehr ein MADD und MUL pro ALU gibt, sondern nur noch ein MADD bzw. FMA? Die theoretische Shaderleistung liegt damit gerade einmal bei 2048 Teraflops (512*2*2000), wenn man 2 GHz Shadertakt zugrunde legt, was aber gegenwärtig noch utopisch erscheint.
Man sollte sich aber von dieser theoretischen Zahl nicht verschrecken lassen. Es sieht so aus, als würden selbst 1,5 Teraflop Fermi-ALU-Leistung 2,7 Teraflops Cypress-ALU-Leistung übertreffen. Wie heißt es so schön? Am Ende zählt, was hinten bei herauskommt...
wen ich bedenke das meine GTS250 mit ihreren fast lächerlichen 128shadern knapp 2ghz mitmacht ( genau 1944mhz ) dann kannste dir vorstellen was es für ne arbeit sein muss 512shadern so hoch zu taken was ja das 4fache ist
hmm, schade, hätte mehr erwartet..
Also war zwar schon fast klar, dass die nicht so hoch takten können, wegen dem sehr großen Chip usw., aber ich hätte doch schon mind. 2000 MHz in der Shaderdomäne erwartet, sodass sie 3 TFlops mit dem Chip erreichen können..
Und die Standardchip und Speicherdomäne ist auch nicht gerade berrauschend angesteuert, d.h. es wird nicht all zu viel Speicherdurchsatz geben, wie vormals angenommen..
Naja, noch ist nix Final, man wird sehen..
Und übrigens, dass die GPU 48 ROPs haben wird, wusste ich spätestens seit dem das Bild hier aufgetaucht war: http://www.hardware-infos.com/bild_grup ... bild=1871#
Dort konnte man die einzelnen ROPs zusammenzählen.
MfG
iNsuRRecTiON
ich hoffe du hast recht
naja 100% schneller als die GTX280 wären schön aber naja is es aber nicht oder?
was meint ihr wärs möglich ???
jaja bin eben nur neugierig und kenn mich eben mit so was wie tmus und rops und etc. nicht aus kanns eben nicht einschätzen wie viel schneller die als ......... sind ^^