NVIDIA vereinfacht mit CUDA 6 parallele Programmierung signifikant

logo_nvidia_trans_wideUnified Memory und Drop-In Libraries erweitern die Programmierfunktionen für GPU-Entwickler  

Santa Clara, Kalifornien, 14. November 2013 – NVIDIA stellt heute mit CUDA 6 eine neue Version der weltweit einflussreichsten parallelen Computing-Plattform vor.

CUDA 6 macht parallele Programmierung einfacher als je zuvor. Software-Entwickler können mit ihr maßgeblich den notwendigen Aufwand und die erforderliche Zeit für die Beschleunigung von wissenschaftlichen und konstruktionstechnischen Anwendungen, Enterprise-Applikationen sowie sonstigen Anwendungen für GPUs reduzieren.

Durch die Verbesserungen in CUDA 6 können Entwickler Applikationen umgehend um den Faktor 8 beschleunigen, indem sie einfach die vorhandenen CPU-basierten Libraries ersetzen. Schlüsselfunktionen von CUDA 6 sind:

– Unified Memory – Vereinfacht die Programmierung, da Applikationen Zugriff auf den Speicher von CPU und GPU erhalten, ohne manuell Daten jeweils hin und her kopieren zu müssen. Dadurch wird auch die Unterstützung von GPU-Beschleunigung in vielen Programmiersprachen vereinfacht.

– Drop-in Libraries – Beschleunigen automatisch die BLAS- und FFTW-Berechnungen in Applikationen um bis zu 8X durch den Austausch der vorhandenen CPU-Libraries durch die GPU-Varianten

– Multi-GPU Scaling – Neu angelegte BLAS- und FFT-GPU-Libraries skalieren automatisch über bis zu acht GPUs in einem Single Node und liefern über neun Teraflops Double-Precision-Leistung  pro Node. Es werden größere Workloads als je zuvor unterstützt (bis zu 512GB). Multi-GPU Scaling lässt sich auch mit der neuen BLAS Drop-in Library nutzen.

„Durch das automatische Datenmanagement des Unified Memory, können wir Kernels für die GPU sehr schnell erzeugen. Die Komplexität des Codes reduziert sich und Entwicklungszeiten werden bis zu 50 Prozent kürzer“, sagt Rob Hoekstra, Manager of Scalable Algorithms Department bei den Sandia National Laboratories. „Diese Möglichkeiten sind äußerst hilfreich, um künftige Programmierungsmodelle festzulegen und anspruchsvollere, größere Codes auf GPUs zu portieren.“

„Unsere Technologien haben großen Studios, Spieleentwicklern und Animateuren geholfen, beeindruckende 3D-Animationen und Effekte zu erschaffen“, sagt  Paul Doyle, CEO bei Fabric Engine, Inc. „Sie alle haben uns dringend gebeten, NVIDIA-GPU-Beschleunigung zu unterstützen, aber das Speichermanagement stellte sich bei komplexen Anwendungsszenarien in der Produktion als zu schwierig heraus. Mit Unified Memory wird dies automatisch abgewickelt und der Fabric-Compiler kann so die NVIDIA-GPUs ansteuern. Die Applikationen unsere Kunden laufen damit bis zu zehnmal schneller.“

Zusätzlich zu den neuen Funktionen bietet die CUDA-6-Plattform eine komplette Suite mit Programmier-Tools, GPU-beschleunigten Mathematik-Libraries, Dokumentationen und Programmier-Anleitungen.

Leave a comment