Nvidia zeigt taktschwache Fermi-Karten

NvidiaVor drei Tagen hatten wir angekündigt, dass Nvidia im Rahmen der Supercomputing Conference 2009 in Portland, Oregon erste Fermi-Grafikkarten demonstrieren würden. Und in der Tat gibt es seit gestern hochauflösende Bilder Fermi-basierter Grafikkarten, und zwar von den so genannten Profimarkt-Karten Tesla C2050 und C2070.

Vordergründig war auch bei dieser Demonstration die starke Leistungssteigerung der neuen Generation in puncto GPGPU-Computing. Man verwies erneut darauf, dass gegenüber der aktuellen Generation der L1-Cache um ein vielfaches angestiegen sei, zusätzlich ein L2-Cache hinzugestoßen wäre, ECC-Fehlerkorrektur beherrscht wird, komplette C++-Unterstützung geboten wird und Gleitkommaberechnungen gemäß des IEEE 754-2008-Standards ausgeführt werden können.

Nvidia Tesla C2050 und C2070 (4 Bilder)
Nvidia Tesla C2050 und C2070

Besonders interessant waren jedoch die konkreten Angaben zur Shaderleistung, und zwar sowohl die Single- als auch die Double-Precision-Leistung. Letztere klingt dabei natürlich pompös, wenn man sie der aktuellen Generation gegenüberstellt. Hier stehen theoretische 78 Gigaflops 520 und 630 Gigaflops gegenüber.
Mit Wissen über den Architekturaufbau, den Nvidia schon vor einigen Wochen umrissen hatte, weiß man damit aber auch, dass die für 3D-Spiele relevante Single-Precision-Leistung lediglich bei 1040 und 1260 Gigaflops liegt und damit nur unmerklich höher ausfällt als auf den aktuellen Nvidia-Karten. Dies liegt natürlich zum einen daran, dass pro Takt jetzt anstelle von einem MADD und einem MUL zwei FMAs ausgeführt werden können, aber auch verrät diese Angabe mit Wissen darüber, dass ingesamt 512 Shadereinheiten zum Einsatz kommen, dass die Taktfrequenz der Shader lediglich bei 1015 und 1230 MHz angesiedelt ist.

.G80GT200GF100
Fertigung90 nm65 nm40 nm
Transistoren0,7 Millarden1,4 Millarden3,0 Millarden
Shadereinheiten
(Single Precision)
128240512
Shadereinheiten
(Double Precision)
-30256
SMP (L1-Cache)16 KiB24 KiB64 KiB
SMP (L2-Cache)128 KiB256 KiB768 KiB
SMP (SFUs)224
Speicherinterface384 Bit
GDDR3
512 Bit
GDDR3
384 Bit
GDDR5


Offenbar hat Nvidia auch bei der Fermi-Architektur erneut ein Problem mit dem Takt der Shaderdomain. Möglicherweise findet sich auch hier einer der Gründe dafür, dass Nvidia noch ein weiteres Stepping bringt, ehe die Karten zur Marktreife gelangen.
Die These, dass die Tesla-Karten stets etwas niedriger getaktet sind als die Geforce-Karten, gilt zumindest nicht für den Shadertakt. Dieser ist gerade für die Profikarten von hoher Relevanz und insofern üblicherweise auf Desktop-Niveau.
Interessant ist zudem, dass Nvidia für Tesla C2050 und C2070 eine typische Leistungsaufnahme von 190 Watt angibt und eine maximale Leistungsaufnahme (TDP) von 225 Watt.

Die neuen Tesla-Karten möchte Nvidia ab Q2/2010 verkaufen. Dabei visiert man Preise von 2499 und 3999 US-Dollar an. Angemerkt sei noch, dass der Speicher der C2070 mit 6 statt 3 GiB das doppelte Volumen besitzt.


Kommentar schreiben

  • Loggen Sie sich oben mit ihren Benutzerdaten ein, um Kommentare zu verfassen.
  • Falls Sie noch kein Mitglied sind, können Sie sich in unserem Forum registrieren.

12 Kommentare

12.) hmd 20.11.2009 - 14:47 Uhr
Wars das jetzt schon oder kommt noch was von Nvidia (Supercomputing Conference 2009 Portland). Da ich von berufswegen mit 3DS MAX zu tun hab, würde mich mal interessieren wo jetzt der Trend hingeht. Kann ein 3DS MAX von Fermi direkt profitieren indem der Renderingprozess (nicht nur in der Ansicht geshadetes drehen) direkt beschleunigt wird. Von Larabee kann man das sicher erwarten, da dieser fürs OS einfach als x-facher Multicore auftritt.

Auch interessieren würde mich natürlich ob man aus der Rechenpower der DX11-Karten von ATI unter Windows7 in Rendering-Programmen in Zukunft direkten Nutzen ziehen kann, ohne dass man die teuren Ableger (FireGL) kaufen muss. Eigentlich heisst es ja "compute Shader" sei2n unter DX11 nutzbar, da liegt doch jede Menge Potenzial brach. Oder ist es wieder so, dass man Hardware kauft und die dann vom Hersteller abgeklemmt wird, damit sie ihre teuren Exoten verkaufen können.
In diesem Zusammenhang steht und fällt doch auch Fermi und seine zukünftigen Derivate. Wenn die Harwarebeschleunigung im Profibereich auch für Gamerkarten möglich wäre, wie kann man noch die teuren Spezial-Lösungen verkaufen.
11.) Madbomb 18.11.2009 - 16:35 Uhr
Naja so weit stand es ja auch schon in der News, naja wie es genau gerechnet wird wär wahrscheinlich auch zu viel zu erklären ;)

Nur wie gesagt, Golem spricht halt von 4+ Teraflops und hier wird nur von lediglich 1-1,2 Teraflops gesprochen. Andere Seite wiederum wage sich zu garkeine SP Angaben. Und 1-1,2 Teraflops erscheinen mir sehr wenig, da wie in der News erwähnt, das nicht wirklich mehr wäre als in der aktuellen Generation. Drum wie schon gesagt, frage ich mich ob man das so pauschal rechnen kann und nicht noch Informationen fehlen die in diese Werte miteinfließen.

Bzgl. des Release: Auf Golem stand das die Desktop Sparte offiziell auf Q1 verschoben wurde und vermutlich, wie schon oft von Gerüchte verlautbart, zur CES Anfang Januar vorgestellt wird.
http://www.golem.de/0911/71246.html
10.) N1truX 18.11.2009 - 07:49 Uhr
@Madbomb: Mann kann über die DP-Werte auf den Shader-Takt zurück rechnen und aufgrund der Architektur (Shaderanzahl etc.) damit die entsprechende SP-Leistung ausrechnen.

Naja und bei allem Fermi-gehype ist doch noch etwas übertrieben. z.B. wirbt nVidia mit IEEE-754 als wäre das was besonderes. Kann AMDs Cypress auch und sogar theo. für SP und DP. Zudem finde ich es bedenklich das man so wenig über die Gaming-Leistung hört. Nvidia ist ja eher nicht für Zurückhaltung bekannt..
Und der Launch scheint sich auch weiter zu verzögern. Bei 225W TDP (wie real die auch immer sein mögen) und lediglich ~1100 MHz Shadertakt braucht man 100%ig noch eine neue Revision wenn man höher takten wollte ohne die TDP "explodieren" zu lassen.
Und die Karten scheinen ja so auf den Markt kommen zu sollen als Tesla in Q2 / Q3. Wann sollen dann Desktops in einer weiteren Revision kommen?!

Will nichts schwarz malen, aber preissenkende Konkurrenz sieht anders aus.
9.) Madbomb 17.11.2009 - 22:11 Uhr
Wie kommt man den anhand der DP Werte auf die SP Werte?
Nicht das ich die Werte nicht glaube, nur wundert es mich da Golem von 4+ Teraflops spricht und andere Seiten garkeine Werte angeben wollen.
Nun bin ich ein wenig verwirrt, und frage mich ob es überhaupt möglich ist vorab schon Werte anzugeben.
8.) core 17.11.2009 - 17:47 Uhr
ja aber gerade weil die CF unter der single liegt kann da was nicht stimmen...ist auch das erste mal das ich so ein ergebniss bei einem 5870er CF bench sehe...
PS: das es mir egal ist ob rot oder grün,so lange das P/L stimmt solltest gerrade du am besten wissen, war schließlich auch mal kurz davor mir ne 275er anzuschaffen... ;)

und vergebt uns dieses off-toppic geposte!
7.) MacTen 17.11.2009 - 17:39 Uhr
Vollkommen richtig KonKorT, das hab ich vorhin auch ganz vergessen zu erwähnen. Also das man da über den Daumen gepeilt bei 1200Mhz Shader takt landet find auch auch extrem bedenklich, wenn ich sehe das mein G200 hier schon mit 1404MHz shader daherkommt.Also da sollten sie auf alle Fälle nochma ein paar räder in bewegung setzen!

@core
glaub nicht dass der treiber da soviel bringen wird.... die beiden karten zusammen laufen zu lassen scheint selbst eine starke cpu recht zu limitieren, daher würde es auch sehr sinn machen wieso nach bereits so kurzer zeit gleich doppelkarten mit geringerem takt hinterhergeworfen werden.Über single KartenLeistung hat hier niemand geredet, und dass die über der CF Leistung liegt, da kann sich doch jeder drüber freuen oder nicht?Aber der test zeigt glaub ich auch, dass das Spiel mit maxed out einstellungen auf full hd mit aktuellen nvidia karten bestens zu spielen ist. Das freut sicher nicht alle *gg*
6.) core 17.11.2009 - 16:35 Uhr
@MacTen: ja was sollen wir da sehen?
Das die Single core ATI 20% vor der NV lösung liegt(fullHD) ...von den besseren Filtern und Energiebilanz mal abgesehen?! das doch nichts neues... ;)
Oder meinst du das die neuen CF Treiber noch nicht so Arbeiten wie die x-mal weiterentwickelten SLI? Sobald das ausgemerzt ist steht die CF oben, das dürfte klar sein oder?
5.) KonKorT 17.11.2009 - 16:10 Uhr
Mit dieser News will ich nicht aufzeigen, dass die theoretischen Gflop-Werte der neuen Nvidia-Karten nur geringfügig angestiegen sind, denn aufgrund starker, architektonischer Änderungen sind hier eins-zu-eins-Vergleiche eh ausgeschlossen.
Über die theoretischen Leistungswerte lässt sich aber ermitteln, wie hoch die Shader takten und das ist eben mit ~ 1200 MHz viel zu wenig. Man hatte intern targeted clocks von 1600 MHz gesetzt, entsprechend betrüge die theoretische Single-Precision-Leistung auch > 1,6 Teraflops.
4.) Duplex 17.11.2009 - 16:05 Uhr
die Gflops werte sind eh nur Max. Theoretische leistung , das wird zu 100% nicht partisch umsetzbar sein , und somit sind das nur "schaut her" werte
3.) MacTen 17.11.2009 - 15:52 Uhr
Also, um mal kurz auf die Gflops zum sprechen zu kommen. Ich kann denen leider nicht soviel Bedeutung zuschreiben, besonders nicht wenns um 3d gaming geht! Kurze Erklärung: eine 9800GTX+ hatte noch 705Gflops, eine GTX 285 bereits 1063 (das sind einfach mal 50% mehr) , wenn das Fermi top modell tatsächlich nur 1260Gflops bringt( was nicht völlig feststeht) wären das immernoch 18% mehr als ne gtx285. So und nun blicken wir mal rüber zu den roten : HD 4870- 1200Gflops ; hd 5850-2088 Gflops ; HD 5870 - 2720Gflops! Was die Karten können wisst ihr selbst. Jedenfalls spricht das für mich dafür, dass 1260Gflops nix schlimmes sein müssen. Trotzdem könnte Nvidia so langsam mal nen Benchmark ergebnis raushauen.... denn sie lassen sich doch echt ziemlich feiern mit fermi^^. Achso, gehört vielleicht nicht hier her, aber guckt euch doch mal im netz die netten VGA performance tests von COD -Modern Warfare 2 an- Wahnsinn was ATI sich da wieder geleistet hat, jetzt versteh ich auch wieso sie den ganzen 5970 und eventuell auch 5950 quark rausbring.
2.) Duplex 17.11.2009 - 14:22 Uhr
warum heist es eig ein "taktproblem"

wen man bedenkt das die Shader unabhängig vom Kern takten und nicht wie bei AMD am Kern takt fixiert sind sind diese 1000-1200mhz noch deutlich höher

jedoch wirds wohl langsamm ein trend die shader immer niedriger zu takten meine GTS250 mit ihren 128shadern packt fast 2Ghz takt ( 1944mhz )
1.) core 17.11.2009 - 13:32 Uhr
Sehr interessant...was bin ich auf die geforce ableger gespannt....