Im Jahr 2012 präsentierte Nvidia mit den Grid-Karten K1 und K2 eine Technologie, die es erstmals ermöglichte, Grafikkarten in virtuellen Rechnern flexibel an die Bedürfnisse der Anwender anzupassen. Mit der Version Grid 2.0 verdoppelt Nvidia nun (unter anderem) die Leistung und die Anzahl der Anwender.
Bis Nvidia Grid vorstellte, gab es bei virtuellen Workstations immer eine 1:1-Beziehung, das heißt, ein Anwender arbeitete auf einer virtuellen Workstation, die mit einer realen Grafikkarte ausgestattet war – und diese Grafikkarte stand genau diesem einen Anwender exklusiv zur Verfügung. Die Grid-Karten und die zugehörige Software beherrschen das Kunststück, dass eine Grafikkarte von mehreren Anwendern parallel genutzt werden kann. So ließen sich bisher je nach Grid-Karte 8 oder 16 User auf eine Grafikkarte schalten, zudem bietet Grid die Möglichkeit, Usern mit höherem Leistungsbedarf mehr Anteile an der Leistung der Karte zuzuweisen, so dass beispielsweise ein Poweruser die Hälfte der Rechenleistung einer Grid K2 erhält, während sich acht Usern mit geringeren Anforderungen die andere Hälfte der Performance teilen.
Gestern stellte Nvidia nun die zweite Version seiner Grid-Technologie vor. Nvidia Grid 2.0 ist zum einen eine neue Softwareplattform, die grundsätzlich auch mit den bestehenden Karten nutzbar ist und deren Funktionalität erweitert, zum anderen präsentiert Nvidia zwei neue GPU-Karten, die interessanterweise unter dem Tesla-Markennamen laufen: Die Tesla M60 und die Tesla M6. In einer Webex-Pressekonferenz letzte Woche war vor allem von der Softwareseite die Rede, ich habe jedoch bei Anandtech weitere Informationen gefunden, die ich hier gerne weitergebe.
Neue Karten beschleunigen Nvidia Grid 2.0
Während die K1 und K2 auf der Kepler-Generation der Nvidia-Grafikchips basierten, sind auf den neuen Karten die GPUs GM204 aus der aktuellen Maxwell-Generation verbaut. Während die Tesla M60 zwei dieser GPUs und 2x 8GByte Grafikspeicher besitzt und diese auch voll ausnutzt, sind bei der einzelnen GM204 in der Tesla M6 nur 12 der 16 Kerne aktiv, was 1536 Cuda-Kernen entspricht, im Gegensatz zu den zweimal 2048 Cuda-Kernen der M60. Die M6 besitzt 8GB GDDR5-Speicher.
Was widersinnig erscheint – eine GPU künstlich zu verlangsamen – wird klar, wenn man sich die Karte insgesamt anschaut. Die Tesla M6 ist nämlich keine große, zwei Slots belegende PCIe-Karte, sondern ein Kärtchen im MXM-Format. Das MXM (Mobile PCI Express Module) wurde von Nvidia eigentlich als Standard für austauschbare Grafikkarten in Notebooks entwickelt und wird in diesem Fall als Grafikschnittstelle für Bladeserver genutzt.
Damit lassen sich extrem dicht gepackte Rechner bauen, die beispielsweise in einem einzigen 19-Zoll-Rack 84 Server mit bis zu 5376 CPU-Kernen unterbringen. Mit der M6 lassen sich so sehr platzgünstig sehr viele virtuelle CAD-Workstations implementieren, allerdings erlaubt die enge Packungsdichte keine großen Kühlkörper, weswegen die Reduzierung der Kernzahl in diesem Fall durchaus Sinn macht.
Die eigentliche Botschaft drehte sich jedoch um die Plattform Grid 2.0. Will Wade, Director GRID Product Management bei NVIDIA, brachte sie auf den Punkt „viermal doppelt“: Doppelt so viele Anwender auf einer Karte, doppelte Performance, doppelt so viele Hardwareplattformen und doppelt so viele Betriebssystemplattformen. Letztere beide meinen herkömmliche Rechner mit der PCIe-Karte und Bladeserver sowie die Unterstützung von Linux als Gastsystem neben dem bisher verfügbaren Windows – übrigens auch schon Windows 10.
Die neuen Karten ermöglichen es, 16 beziehungsweise 32 Anwender parallel zu bedienen, was bei der M60 eine Verdopplung der maximalen Userzahl in Relation zur Vorgängerkarte Grid K2 bedeutet. Und die Leistung hat sich ebenfalls verdoppelt, jedenfalls wenn man den – für CAD-Anwendungen sehr aussagekräftigen – SPECviewperf als Maßstab nimmt.
CUDA jetzt auch in vGPU-Umgebungen
Eine sehr gute Nachricht für alle Anwender, die beispielsweise Simulationssoftware mit CUDA-Unterstützung nutzen: Mit Grid 2.0 ist CUDA in der vGPU-Umgebung verfügbar. Bisher konnte CUDA bei virtuellen Workstations nur mit exklusivem Zugriff auf die Grafikhardware genutzt werden, nun auch, wenn mehrere User auf einer Grid-Karte laufen. Und nicht zuletzt meldet Anandtech, dass Grid 2.0 nun auch 4k-Monitore unterstützt – und davon bis zu vier pro virtueller Workstation.
Mit Grid 2.0 bietet Nvidia zum einen aktuelle Hardware, zum anderen hat man das inzwischen bewährte Konzept clever erweitert – an den Stellen, die wirklich Mehrwert bringen, wie der Blade-Tauglichkeit, CUDA-Unterstützung und 4k-Monitore. Ansonsten gilt, was ich in meinem ersten Grid-Artikel geschrieben habe, nach wie vor: Grid ist eine extrem interessante Möglichkeit, „Black Boxes“ zu implementieren, die der Kunde eines CAD-Resellers nur noch einstöpseln muss, um sofort bis zu 32 vorkonfigurierte CAD-Arbeitsplätze zur Verfügung zu haben.