Xeon Phi et Omni-Path, fers de lance d’Intel dans le HPC

Intel Omni-PathSwitch

Les Xeon Phi « Knights Landing » et la connectique Omni-Path sont au cœur de la nouvelle architecture HPC d’Intel, le Scalable System Framework (SSF).

Intel dévoile sa stratégie dans le monde du calcul de hautes performances (HPC), laquelle se concrétise au travers du Scalable System Framework (SSF), une solution permettant de créer des clusters, du plus abordable au plus massif.

« Nous entrons dans une nouvelle ère où les supercalculateurs sont transformés d’un outil dédié à un problème spécifique à un outil général accessible au plus grand nombre », explique Charlie Wuischpard, vice-président et directeur général de l’HPC Platform Group chez Intel.

Des mots choisis avec soin. Il existe en effet aujourd’hui deux grands types de supercalculateurs. Les premiers emploient des processeurs classiques (en général des puces Xeon d’Intel). Adaptés à tous types de tâches, ces clusters demeurent toutefois chers à l’acquisition comme en frais d’exploitation, du fait d’une consommation électrique peu avantageuse. Les seconds utilisent des accélérateurs, GPU ou FPGA, qui permettent de proposer une puissance de calcul appréciable, mais limitée à des usages plus spécifiques.

Intel entend se placer entre les deux avec ses Xeon Phi. Des accélérateurs utilisant des cœurs x86 classiques, et donc plus facilement exploitables que des cœurs de GPU. Le tout allié à des avancées en termes de mémoire, de stockage, de connectivité réseau et de logiciel.

Du calcul et du réseau

L’architecture SFF se veut du clés en main, prenant en compte l’ensemble de la problématique liée à la création d’un cluster HPC. À commencer par le compute, avec le Xeon Phi, dont la nouvelle génération – nom de code « Knights Landing » – est en cours de test au sein de plusieurs supercalculateurs, dont un qui sera opéré par le CEA, signé ATOS/Bull.

Les Xeon Phi de génération actuelle (22 nm) comprennent jusqu’à 61 cœurs (244 threads) cadencés à 1,24 GHz. Les Xeon Phi x200 « Knights Landing » seront gravés en 14 nm avec jusqu’à 72 cœurs Atom de nouvelle génération (288 threads). Nous pouvons nous attendre à une consommation électrique plus faible, mais également à une puissance de calcul en forte hausse, grâce à la présence d’unités vectorielles. La capacité mémoire sera boostée. Dernière annonce, ces composants ne seront plus uniquement accessibles en tant qu’accélérateurs de calcul. Ils pourront remplacer le CPU d’un nœud de calcul, évitant ainsi de recourir à un Xeon classique.

La puissance des prochains Xeon Phi devrait dépasser les 3 téraflops en double précision, pour 8 téraflops en simple précision, contre respectivement 1,2 et 2,4 téraflops précédemment.

Autre élément de l’architecture SFF, l’offre réseau OPA (Omni-Path Architecture). Une solution complète proposant composants, cartes PCI Express, câbles, switches et logiciel. Le tout avec un débit de 100 Gb/s. L’OPA se veut une alternative à l’InfiniBand EDR, mais avec un coût moins élevé et une consommation électrique plus réduite. Ainsi, Intel indique que l’utilisation de son switch OPA 48 ports permet de créer des infrastructures réseau avec un coût 21 % inférieur à celui d’une solution InfiniBand EDR (à nombre de serveurs identique), pour une consommation électrique 60 % moindre. Le tout avec une latence 17 % plus faible.

Tout un écosystème

L’architecture SFF sera soutenue par du logiciel et un large écosystème. Intel proposera des pilotes Open Source dédiés à Linux pour son offre OPA. Côté stockage, nous retrouvons le système de fichiers Lustre, fer de lance de la firme dans ce domaine. Pour la mise au point du code HPC, Intel propose Parallel Studio XE et des compilateurs C++ et Fortran.

Colfax, Cray, Dell, Fujitsu Systems Europe, Hitachi, Huawei, HPE, Inspur, Lenovo, Penguin Computing, NEC, SGI, Sugon et Supermicro sont parmi les premiers constructeurs qui devraient proposer des switches OPA, des serveurs Xeon Phi et des solutions SSF, précise Intel

SuperMicro vient d’annoncer un TwinPro2 SuperServer Xeon Phi. Cette machine 2U comprend quatre nœuds de calcul extractibles à chaud. Chaque nœud est équipé d’un Xeon Phi x200 (autonome) épaulé par un maximum de 384 Go de RAM et de deux cartes réseau Omni-Path à 100 Gb/s.

À lire aussi :
Surprise : Intel présente des résultats financiers… en baisse !
Intel lève le voile sur un Core i7 à 10 cœurs
Intel booste ses puces Skylake avec du cache L4