Calcul : AMD FirePro, Intel Xeon Phi ou Nvidia Tesla ?

Nous avons placé côte à côte les AMD FirePro S10000, Intel Xeon Phi 5110P, Intel Xeon Phi SE10P/X, Nvidia Tesla K20 et Nvidia Tesla K20X. Des cartes proposant une puissance de calcul dépassant le téraflops. Comparaison et analyse.

Les offres d’accélérateurs dédiés au calcul se multiplient. Après l’annonce hier de la carte AMD FirePro S10000, c’est au tour de Nvidia de dégainer avec sa gamme K20, et Intel avec ses Xeon Phi.

Toutes ces cartes se présentent sous la forme d’extensions PCI Express double hauteur. Comparons-en les caractéristiques, en nous concentrant sur les modèles proposant une puissance de calcul sur les nombres flottants en double précision supérieure au téraflops.

La technologie : Nvidia affiche sa maitrise

Commençons tout d’abord par quelques généralités : nombre de cœurs, fréquence de chacun d’entre eux et finesse de gravure :

AMD FirePro S10000 : 3584 cœurs, 825 MHz, 28 nm
Intel Xeon Phi 5110P : 60 cœurs, 1053 MHz, 22 nm
Intel Xeon Phi SE10P/X : 61 cœurs, 1100 MHz, 22 nm
Nvidia Tesla K20 : 2496 cœurs, 705 MHz, 28 nm
Nvidia Tesla K20X : 2688 cœurs, 735 MHz, 28 nm

Les choix sont ici différents, et tous visiblement très bien assumés.

AMD : c’est la course en avant… Toujours plus de cœurs, afin de proposer une puissance brute maximale. Il faudra une excellente bande passante mémoire pour alimenter le tout, mais le constructeur y a veillé. Reste que la puissance réellement utilisable risque d’être un peu faible. Côté programmation, la firme favorise l’OpenCL. Un choix classique.

Intel : la complexité des cœurs en diminue le nombre, mais permet aussi de proposer une puissance unitaire supérieure. De plus, la finesse de gravure en 22 nm permet de passer le cap du gigahertz de fréquence de fonctionnement. Côté programmation, des outils maison sont utilisés, en attendant la montée de l’OpenMP. Permettra-t-il d’exploiter toute cette puissance ?

Nvidia joue la sécurité, en gardant une bonne marge côté fréquence de fonctionnement. C’est sur un autre plan que le constructeur joue : celui de l’exploitation maximale de la puissance brute offerte. Via des astuces architecturales, mais aussi via Cuda, plus proche du matériel que l’OpenCL. Les scientifiques devraient apprécier.

Mémoire : Intel le mieux équipé, AMD le plus rapide

Passons maintenant à la capacité mémoire et, plus important encore, à sa bande passante :

AMD FirePro S10000 : ~~3 Go~~ 6 Go, 480 Go/s
Intel Xeon Phi 5110P : 8 Go, 320 Go/s
Intel Xeon Phi SE10P/X : 8 Go, 352 Go/s
Nvidia Tesla K20 : 5 Go, 208 Go/s
Nvidia Tesla K20X : 6 Go, 250 Go/s

AMD : la firme a été forcée de mettre de la mémoire très rapide pour alimenter les nombreux cœurs des deux GPU présents sur sa carte. ~~Problème, afin de réduire la consommation énergétique de l’ensemble, la capacité mémoire reste faible. Le constructeur atteint ici les limites de l’exercice.~~ AMD nous informe que la carte est en fait pourvue de 6 Go de mémoire vive. Toutefois, deux GPU étant présents, le tout est partagé en 2 x 3 Go. La quantité de mémoire par GPU reste donc en retrait face aux offres de Nvidia.

Intel : bravo au fondeur, qui fournit à la fois une grosse quantité de mémoire et une bande passante appréciable. Reste que ce dernier avantage pourrait rapidement être réduit à néant si le code Xeon Phi s’avérait moins compact ou moins facile à gérer que le code GPU utilisé par ses concurrents.

Nvidia : la capacité mémoire est bonne. Nous n’en dirons pas autant de la bande passante, assez limitée. La firme promet toutefois une gestion avancée des transferts entre cœurs, voire une communication directe entre cartes (y compris séparées par un réseau). De quoi faire la différence ?

La suite en page deux : rapport puissance sur watt, rapport performance prix et conclusion.

Lire aussi : Comment Nvidia capitalise sur le développement de l’IA générative