Calcul : Nvidia optimise Cuda pour ses GPU Kepler

Nvidia Tesla K20

Cuda 5 est capable de tirer la quintessence des GPU Kepler. Il fournit également plus de souplesse aux développeurs.

Nvidia vient de sortir la préversion de Cuda 5, une technologie permettant d’exploiter la puissance des cartes graphiques dans le cadre de calculs massivement parallèles. Une annonce importante.

Rappelons en effet que Cuda et les GPU Nvidia sont utilisés dans un nombre croissant de supercalculateurs, dont certains sont parmi les plus rapides de la planète.

Un support avancé de Kepler

La première et plus importante nouveauté de cette version est le support de l’architecture GPU Kepler. En particulier la future carte Tesla K20.

Notez ainsi la gestion du parallélisme dynamique dans Cuda 5. C’est une des nouveautés de l’architecture Kepler, qui – en conjonction avec les technologies Hyper-Q et SMX – permet d’exploiter plus efficacement et de façon plus souple le GPU.

En plus du support des GPU de nouvelle génération, Cuda 5 apporte de nouvelles fonctionnalités, comme la possibilité d’être utilisé au sein de librairies, qui pourront par la suite être utilisées par des développeurs tiers dans le cadre de logiciels « classiques ». Ceci ouvre la voie à des utilisations plus massives de cette technologie.

D’autres améliorations sont constatées dans GPUDirect, qui permet aux cartes de calcul de communiquer en réseau sans passer par le CPU du serveur (éliminant ainsi un goulot d’étranglement classique), et dans l’environnement de développement Nsight Eclipse Edition (accessible sous Linux et OS X).

Notez enfin l’apparition d’une nouvelle librairie cuBLAS (CUDA Basic Linear Algebra Subroutines).

K10 – K20 ?

Le Tesla K10 est aujourd’hui le seul produit de la firme en base Kepler. Il affiche une puissance de 4,58 téraflops en double précision, mais de seulement 190 mégaflops en double précision, ce qui en limite les applications pratiques à des secteurs spécifiques.

Le Tesla K20 devrait pour sa part proposer une puissance supérieure au téraflops en double précision, pour probablement 2 téraflops en simple précision. Ce produit plus équilibré devrait connaitre un large succès dans les supercalculateurs.

Crédit photo : © Nvidia