Schneller als Apple und Qualcomm

Nvidias erste eigene CPU rasiert die Konkurrenz

22. August 2014, 11:16 Uhr | Lars Bube
Bild 1. Code-Übersetzung in Nvidias Denver-CPU. Der Optimierer wandelt ARMv8-Anweisungen in nativen Mikroccode und speichert das Ergebnis in einem Optimierungs-Cache genannten Hauptspeicherblock. (Bild: Elektronik)
© Elektronik

Mit »Denver« hat Nvidia eine 64-bit-CPU vorgelegt, die ihre Konkurrenten wie Apples Cyclone und die ARM-basierenden Chips von Qualcomm und Co. auf Anhieb weit hinter sich lässt.

--- canonical[http://www.elektroniknet.de/halbleiter/prozessoren/artikel/112062/] ---Nvidias erstes eigenes CPU-Design mit dem Codenamen Denver ist ARMv8-kompatibel und liefert hohe Rechenleistung durch eine ungewöhnliche Technik: eine dynamische Befehls-Übersetzung, mit welcher ARM-Instruktionen in Mikro-Ops übersetzt werden. Das Ergebnis: Diese 64-bit-CPU stampft nicht nur Apples Cyclone und alle anderen ARM-basierenden SoCs von Qualcomm & Co. in Grund und Boden, sondern kann sogar mit Low-End-Versionen von Intels aktuellen Haswell-CPUs mithalten.

Nvidias Denver-CPU kann 64-bit-ARMv8-Code auf zwei Arten ausführen: entweder nativ bei einer Spitzengeschwindigkeit von zwei Befehlen pro Taktzyklus oder durch Verwendung einer dynamischen Code-Optimierung, womit eine Spitzenrate von sieben Micro-Ops pro Taktzyklus erreicht wird. Benchmark-Tests zeigen, dass Nvidias erste 64-Bit-CPU schneller als alle anderen angekündigten ARM-Cores und sogar als Low-End-Versionen von Intels Haswell-CPU arbeitet.

Das erste Produkt, das Denver verwendt, ist das Tegra K1-64 genannte SoC, das für Tablets, High-End-Smartphones und Dashboard-Systeme im Automobil ausgelegt ist. Audi ist ja bekanntermaßen ein Nvidia-Fan und setzt für sein virtuelles Instrumentencluster im neuen TT auf einen Tegra-3, der allerdings im Vergleich zum K1-64 hinsichtlich seiner Rechenleistung fast schon lächerlich wirkt. Der K1-64 ist vergleichbar mit dem Tegra K1-32, der Chip setzt jedoch statt vier mit jeweils 2,3 GHz getaktete Cortex-A15 zwei Denver-CPUs mit bis zu 2,5 GHz ein. Die beiden Chips sind pinkompatibel und haben in etwa die gleichen thermische Limits, so dass Tegra-Kunden den K1-64 eindesignen können, sobald er fertig ist. Das SoC gibt es bereits als Muster und wird noch dieses Jahr in die Massenproduktion gehen.

Um hohe Rechenleistung mit möglichst wenig Energie liefern zu können, hat Nvidia den Ansatz der dynamischen Übersetzung gewählt. Er ist ähnlich dem, was Transmeta schon vor einem Jahrzehnt gemacht hat. Im Gegensatz zu diesem Design umfasst Denver einige Hardware-basierte Befehlsdekoder. Damit brauchen nur häufig verwendete Routinen übersetzt zu werden, was zu einer Verringerung des Overheads durch die Übersetzung führt.

Nvidia hat alle vorherigen Tegra-Prozessoren einschließlich des K1-32 auf lizenzierten Original-ARM-Cores aufgesetzt. Denver ist somit das erste interne CPU-Design. Für einen ersten Versuch ist das Ergebnis wahrlich nicht schlecht: Der Tegra K1-64 übertrifft alle konkurrierenden High-End-Prozessoren vor allem bei Single-Thread-Benchmarks. Der K1-64 ist daneben der erste High-End-ARMv8-basierende Mobilprozessor, der allgemein OEMs zugänglich ist (im Gegensatz zu Apples In-House-Prozessor).

Dynamische Befehls-Übersetzung

Wenn ein Programm mit der Ausführung startet, durchlaufen die Anweisungen wie in jeder anderen CPU die Dekoder und dann die Ausführungseinheiten. Zusätzlich zu ihren normalen Aufgaben zählt die Verzweigungseinheit die Anzahl der Routinendurchläufe (dargestellt durch eine identische Verzweigungszieladresse). Wenn diese Zählung einen bestimmten Schwellenwert erreicht, löst die CPU einen Interrupt aus, der in ein Firmware-Programm verzweigt, das als Optimierer bezeichnet wird (Bild 1).


  1. Nvidias erste eigene CPU rasiert die Konkurrenz
  2. Optimierer analysiert den ARM-Code und übersetzt ihn in den CPU-nativen Mikrocode
  3. Front-End verarbeitet zwei Befehlstypen
  4. Mikrokodierte Ausführungs-Engine
  5. Blick auf die Pipeline
  6. Tegra K1 mit Kepler-GPU
  7. Branchenführende CPU-Leistung
  8. Auswirkungen der dynamischen Übersetzung
  9. Die weitere Tegra-Roadmap
  10. Hoch über seine Rivalen

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu NVIDIA Corporate

Matchmaker+