Nvidia profite de sa GPU Technology Conference pour présenter le Tesla P100. Un accélérateur de calculs basé sur un GPU de nouvelle génération, le GP100 « Pascal ».
Gravé en 16 nm, ce GPU intègre un record de 15,3 milliards de transistors, avec 3584 cœurs CUDA à 1,33 GHz (1,48 GHz en pointe). La carte Tesla P100 propose 16 Go de mémoire rapide (720 Go/s de bande passante, sur un bus à 4096 bits !) avec une consommation de 300 W.
Le résultat se traduit – sans surprise – par des performances extrêmes : 5,3 téraflops en double précision (FP64) ; 10,6 téraflops en simple précision (FP32) ; 21,2 téraflops en demi-précision (FP16). À noter, l’utilisation de mémoire à correction d’erreur et un lien Nvidia NVLink (permettant de relier des GPU entre eux) à 160 Go/s.
Avec un tel bond en avant dans la puissance de calcul en double précision, le Tesla P100 devrait être la star des supercalculateurs. Mais aussi des machines Power, IBM n’ayant pas caché souhaité proposer un lien NVLink sur ses machines. De quoi faire les yeux doux aux acteurs du monde de la finance.
Les nombres flottants en demi-précision sont bien adaptés au secteur de l’intelligence artificielle. A cet effet, Nvidia propose le DGX-1, un serveur comprenant 8 cartes Tesla P100 et capable de déployer 170 téraflops de puissance de calcul en demi-précision. À comparer aux 3 téraflops proposés par un serveur comprenant deux Xeon 14 cœurs cadencés à 2,6 GHz.
Attention toutefois, car à 129 000 dollars, ce serveur n’est pas des plus accessibles. Il est cependant livré avec deux Xeon 16 cœurs à 2,3 GHz, 512 Go de RAM, 4 SSD de 1,92 To en Raid, deux prises Ethernet à 10 Gb/s et 4 connecteurs InfiniBand EDR. Le tout dans un format 3U plutôt compact… mais avec une consommation gargantuesque : jusqu’à 3200 W.
À lire aussi :
GPU Nvidia versus Xeon Phi : la bataille tourne en faveur d’Intel
Nvidia met un ordinateur de 1 téraflops dans une carte de crédit
Résultats : Nvidia progresse, malgré un marché PC atone
Un temps pressenti pour constituer le socle d'une suite bureautique AWS, Amazon WorkDocs arrivera en…
Eviden regroupe cinq familles de serveurs sous la marque BullSequana AI. Et affiche le supercalculateur…
Le dernier Magic Quadrant du SSE (Secure Service Edge) dénote des tarifications et des modèles…
Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…
À la grogne des partenaires VMware, Broadcom répond par diverses concessions.
iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.