Nvidia met 5,3 téraflops DP de puissance dans un unique GPU

Nvidia Pascal

Nvidia profite de sa GPU Technology Conference pour présenter le Tesla P100. Un accélérateur de calculs basé sur un GPU de nouvelle génération, le GP100 « Pascal ».

Gravé en 16 nm, ce GPU intègre un record de 15,3 milliards de transistors, avec 3584 cœurs CUDA à 1,33 GHz (1,48 GHz en pointe). La carte Tesla P100 propose 16 Go de mémoire rapide (720 Go/s de bande passante, sur un bus à 4096 bits !) avec une consommation de 300 W.

Le résultat se traduit – sans surprise – par des performances extrêmes : 5,3 téraflops en double précision (FP64) ; 10,6 téraflops en simple précision (FP32) ; 21,2 téraflops en demi-précision (FP16). À noter, l’utilisation de mémoire à correction d’erreur et un lien Nvidia NVLink (permettant de relier des GPU entre eux) à 160 Go/s.

Avec un tel bond en avant dans la puissance de calcul en double précision, le Tesla P100 devrait être la star des supercalculateurs. Mais aussi des machines Power, IBM n’ayant pas caché souhaité proposer un lien NVLink sur ses machines. De quoi faire les yeux doux aux acteurs du monde de la finance.

170 téraflops dans un serveur

Les nombres flottants en demi-précision sont bien adaptés au secteur de l’intelligence artificielle. A cet effet, Nvidia propose le DGX-1, un serveur comprenant 8 cartes Tesla P100 et capable de déployer 170 téraflops de puissance de calcul en demi-précision. À comparer aux 3 téraflops proposés par un serveur comprenant deux Xeon 14 cœurs cadencés à 2,6 GHz.

Attention toutefois, car à 129 000 dollars, ce serveur n’est pas des plus accessibles. Il est cependant livré avec deux Xeon 16 cœurs à 2,3 GHz, 512 Go de RAM, 4 SSD de 1,92 To en Raid, deux prises Ethernet à 10 Gb/s et 4 connecteurs InfiniBand EDR. Le tout dans un format 3U plutôt compact… mais avec une consommation gargantuesque : jusqu’à 3200 W.

Nvidia DGX-1