Comment le GPGPU va révolutionner le calcul parallèle

Les constructeurs de cartes graphiques, NVIDIA en tête, sont en train de bouleverser le monde des supercalculateurs. Vue d’ensemble de ce marché et de son évolution. Attention : dossier sur six pages !

Mais la compagnie ne s’arrête pas là. Viser le marché des superordinateurs n’est pas suffisant : NVIDIA considère qu’il faut aussi permettre l’exploitation de solutions logicielles GPGPU sur les ordinateurs personnels.

À cet effet, CUDA est disponible sur toutes les cartes graphiques du constructeur, depuis la GeForce 8. À contrario, Stream d’AMD n’est utilisable que sur la dernière génération de cartes graphiques du fondeur, ainsi que sur quelques modèles professionnels. Plus de 100 millions de machines intègrent ainsi une carte graphique NVIDIA exploitable sous CUDA. C’est une opportunité pour les solutions de calcul distribué et pour les applications personnelles… dans l’attente d’une adoption massive de l’OpenCL.

Trois produits phares de la stratégie NVIDIA

Nous avons sélectionné trois produits de la firme, très représentatifs de sa vision. Commençons par la Quadro FX 5800. Cette machine de guerre comprend 240 processeurs de flux. La compagnie n’est pas très précise sur les caractéristiques de ce produit. Nous pouvons toutefois présumer qu’il adopte une puissance similaire à celle de la GeForce GTX 280, soit 933 gigaflops en simple précision et environ 78 gigaflops en double précision. Là où la compagnie se démarque de la concurrence, c’est sur la quantité de mémoire qu’embarque cette carte : 4 Go, pour une bande passante de 102 Go/s. NVIDIA l’a bien compris : la quantité de mémoire disponible est essentielle pour tirer le maximum d’une telle puissance de calcul.

Avec le Tesla S1070, oubliez tout usage dans le monde de la 3D traditionnelle : ce serveur lame 1U est conçu exclusivement pour du calcul parallèle. À la clé, un maximum de 4,14 téraflops en simple précision et de 345 gigaflops en double précision. C’est de 1,6 à 18 fois mieux qu’un IBM BladeCenter QS22, pourtant pourvu de deux processeurs PowerXCell 8i.

Cinq armoires 42 U pourvues de ces machines déploieraient 869,4 téraflops en simple précision pour 72,45 téraflops en double précision. Un tel ‘mini-supercalculateur’ serait ainsi directement catapulté en 35e position du TOP500, tout en concurrençant parfois des machines du top 5 (pour certains types de tâches). Pas mal pour un ensemble occupant ‘5 m² bruts’ au sol ! La consommation électrique maximale serait également très mesurée au regard de la puissance déployée : 168 kWh.

teslas1070.jpg