NVIDIA bringt generative AI zu Millionen, mit Tensor-Core-GPUs, LLMs, Tools für RTX-PCs und -Workstations

Von

9. Januar 2024

Quelle: NVIDIA

NVIDIA hat heute GeForce-RTX(™)-SUPER Desktop-GPUs für höchste generative AI-Leistung, neue AI-Notebooks aller führenden Hersteller sowie neue NVIDIA-RTX(™)-beschleunigte AI-Software und -Tools für Entwickler und Endkunden angekündigt.

Aufbauend auf der jahrzehntelanger Führungsposition im PC-Bereich und über 100 Millionen RTX-Grafikprozessoren, die die Ära der künstlichen Intelligenz auf dem PC vorantreiben, bietet NVIDIA jetzt diese Tools an, um PC-Erlebnisse mit generativer AI zu verbessern: NVIDIA-TensorRT™-Beschleunigung des beliebten Stable-Diffusion-XL-Modells für Text-zu-Bild-Workflows, NVIDIA RTX Remix mit generativen AI-Texturtools, NVIDIA-ACE-Microservices und weitere Spiele, die DLSS-3-Technologie mit Frame Generation nutzen.

Darüber hinaus unterstützt NVIDIA TensorRT-LLM (TRT-LLM) jetzt weitere voroptimierte Modelle für PCs. NVIDIA TensorRT-LLM ist eine Open-Source-Bibliothek, die die Inferenzleistung der neuesten großen Sprachmodelle (LLMs) beschleunigt und optimiert. Beschleunigt durch TRT-LLM ermöglicht Chat with RTX, eine ebenfalls in diesem Monat erscheinende NVIDIA-Tech-Demo, AI-Fans die Interaktion mit ihren Notizen, Dokumenten und anderen Inhalten.

“Generative AI ist der bedeutendste Plattformwechsel in der Geschichte der Computertechnik und wird jede Branche verändern, auch die Spieleindustrie”, sagt Jensen Huang, Gründer und CEO von NVIDIA. “Mit über 100 Millionen RTX-AI-PCs und -Workstations bietet NVIDIA eine massive Installationsbasis für Entwickler und Gamer, um die Magie der generativen AI zu genießen.”

Die lokale Ausführung generativer AI auf einem PC ist entscheidend für Datenschutz-, Latenz- und kostensensitive Anwendungen. Dies erfordert eine große Anzahl von AI-fähigen Systemen sowie die richtigen Entwickler-Tools, um AI-Modelle für die PC-Plattform abzustimmen und zu optimieren.

Um diesen Anforderungen gerecht zu werden, liefert NVIDIA Innovationen über den gesamten Technologie-Stack, die neue Erfahrungen ermöglichen und auf den über 500 AI-fähigen PC-Anwendungen und Spielen aufbauen, die bereits von der NVIDIA RTX-Technologie beschleunigt werden.

RTX-AI-PCs und -Workstations

NVIDIA-RTX-GPUs, die eine breite Palette von Anwendungen mit höchster Leistung ausführen können, erschließen das volle Potenzial der generativen AI auf PCs. Die Tensor Cores in diesen Grafikprozessoren beschleunigen die AI-Leistung in den anspruchsvollsten Anwendungen für Arbeit und Spiel dramatisch.

Die neuen Grafikkarten der GeForce-RTX-40er-SUPER-Serie, die ebenfalls heute auf der CES angekündigt wurden, umfassen die GeForce RTX 4080 SUPER, 4070 Ti SUPER und 4070 SUPER für höchste AI-Leistung. Die GeForce RTX 4080 SUPER erzeugt AI-Videos 1,5-mal schneller – und Bilder 1,7-mal schneller – als die GeForce-RTX-3080-Ti-GPU. Die Tensor Cores in den SUPER-GPUs liefern bis zu 836 Billionen Daten pro Sekunde und bringen transformative AI-Fähigkeiten für Spiele, Kreation und tägliche Produktivität.

Führende Hersteller – darunter Acer, ASUS, Dell, HP, Lenovo, MSI, Razer und Samsung- bringen eine neue Reihe von RTX-AI-Notebooks auf den Markt, die den Anwendern direkt nach dem Auspacken eine ganze Reihe von generativen AI-Funktionen bieten. Die neuen Systeme, die eine 20- bis 60-fache Leistungssteigerung im Vergleich zur Verwendung neuronaler Verarbeitungseinheiten bieten, werden ab diesem Monat ausgeliefert.

Auf mobilen Workstations mit RTX-Grafikprozessoren kann die NVIDIA-AI-Enterprise-Software ausgeführt werden, darunter TensorRT und NVIDIA RAPIDS™ für eine vereinfachte, sichere generative AI- und Data-Science-Entwicklung. Eine Dreijahreslizenz für NVIDIA AI Enterprise ist im Lieferumfang enthalten. Jede NVIDIA-A800-40GB-Active-GPU enthält und bietet eine ideale Workstation-Entwicklungsplattform für AI und Data Science.

Neue PC-Entwickler-Tools für die Erstellung von AI-Modellen

Um Entwicklern das schnelle Erstellen, Testen und Anpassen von vortrainierten generativen AI-Modellen und LLMs mit der Leistung und dem Speicherbedarf eines PCs zu erstellen, kündigte NVIDIA kürzlich NVIDIA AI Workbench an, ein vereinheitlichtes, einfach zu bedienendes Toolkit.

AI Workbench, das noch in diesem Monat als Beta-Version veröffentlicht wird, bietet einen optimierten Zugriff auf beliebte Repositories wie Hugging Face, GitHub und NVIDIA NGC™ sowie eine vereinfachte Benutzeroberfläche. Diese ermöglicht es Entwicklern, Projekte einfach zu reproduzieren, gemeinsam zu bearbeiten und zu migrieren.

Projekte können praktisch überall skaliert werden – ob im Rechenzentrum, in einer öffentlichen Cloud oder in der NVIDIA DGX™ Cloud – und dann auf lokale RTX-Systeme auf einem PC oder einer Workstation zurückgebracht werden, um Inferenzen zu erstellen und leichte Anpassungen vorzunehmen.

In Zusammenarbeit mit HP vereinfacht NVIDIA auch die Entwicklung von AI-Modellen durch die Integration von NVIDIA AI Foundation Models and Endpoints, die RTX-beschleunigte AI-Modelle und Software Development Kits enthalten, in das HP AI Studio, eine zentrale Plattform für Data Science. Dies ermöglicht es Anwendern, optimierte Modelle auf PCs und in der Cloud einfach zu suchen, zu importieren und bereitzustellen.

Nach der Erstellung von AI-Modellen für PC-Anwendungsfälle können Entwickler diese mit NVIDIA TensorRT optimieren, um die Vorteile der Tensor-Cores der RTX-GPUs voll auszuschöpfen.

NVIDIA hat kürzlich TensorRT mit TensorRT-LLM für Windows, einer Open-Source-Bibliothek zur Beschleunigung von LLMs, auf textbasierte Anwendungen erweitert. Das neueste Update von TensorRTLLM, das jetzt verfügbar ist, fügt Phi-2 der wachsenden Liste von voroptimierten Modellen für den PC hinzu, die im Vergleich zu anderen Inferenz-Backends bis zu 5x schneller laufen.

RTX-beschleunigte generative AI sorgt für neue PC-Erlebnisse

Auf der CES stellen NVIDIA und die Entwicklerpartner neue generative AI-gestützte Anwendungen und Dienste für PCs vor, darunter:

NVIDIA RTX Remix, eine Plattform zur Erstellung beeindruckender RTX-Remaster von Spieleklassikern. Sie wird noch in diesem Monat als Beta-Version veröffentlicht und bietet generative AI-Tools, die grundlegende Texturen aus klassischen Spielen in moderne, physikalisch basierte Rendering-Materialien mit 4K-Auflösung verwandeln können.
NVIDIA ACE Microservices, einschließlich generativer AI-gestützter Sprach- und Animationsmodelle, die es Entwicklern ermöglichen, intelligente, dynamische digitale Avatare in Spiele einzubauen.
TensorRT-Beschleunigung für Stable Diffusion XL (SDXL) Turbo und latente Konsistenzmodelle, zwei der beliebtesten Stable Diffusion-Beschleunigungsmethoden. TensorRT verbessert die Leistung für beide um bis zu 60 % im Vergleich zur vorherigen schnellsten Implementierung. Eine aktualisierte Version der Stable Diffusion WebUI TensorRT-Erweiterung ist nun ebenfalls verfügbar, einschließlich Beschleunigung für SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) und verbesserter LoRA-Unterstützung.
NVIDIA DLSS 3 mit Frame Generation, das mithilfe von AI die Framerates im Vergleich zum nativen Rendering um das Vierfache steigert, wird in einem Dutzend der 14 angekündigten neuen RTX-Spiele zum Einsatz kommen, darunter Horizon Forbidden West, Pax Dei und Dragon’s Dogma 2.
Chat with RTX, eine NVIDIA Tech-Demo, die noch in diesem Monat verfügbar sein wird, ermöglicht es AI-Enthusiasten, PC-LLMs auf einfache Weise mit ihren eigenen Daten zu verbinden und dabei eine beliebte Technik zu verwenden, die als Retrieval-Augmented Generation (RAG) bekannt ist. Die durch TensorRT-LLM beschleunigte Demo ermöglicht es Benutzern, schnell mit ihren Notizen, Dokumenten und anderen Inhalten zu interagieren. Sie wird auch als Open-Source-Referenzprojekt verfügbar sein, so dass Entwickler die gleichen Fähigkeiten leicht in ihre eigenen Anwendungen implementieren können.

Kommentieren Sie den Artikel

Star Citizen / Ashes of Creation

HIGHLIGHTS der Woche

Gewinnspiele

Aktuelle Testberichte