Supercalculateurs : Adastra et Jean Zay, vitrines de HPE en France

HPE Adastra Jean Zay supercalculateurs

HPE vient d’annoncer son supercalculateur Champollion. Non sans faire un clin d’œil à Adastra et Jean Zay, deux de ses vitrines petascale en France.

Dans la famille des supercalculateurs, on demande Champollion. HPE a ouvert la communication à son sujet la semaine dernière. Le système est installé dans le centre de compétences HPC du groupe américain à Grenoble. Il est pour le moment en accès restreint. On nous promet sa disponibilité « dans un futur proche » pour le secteur industriel et la communauté scientifique. Sont mentionnés, en particulier, quatre instituts interdisciplinaires établis dans le cadre de la stratégie IA nationale.

On en sait pour le moment peu sur Champollion. Sinon qu’il reposera sur un cluster de 20 serveurs Apollo 6500 Gen10 Plus avec des GPU NVIDIA A100. On en sait davantage à propos de trois autres supercalculateurs que HPE évoque dans le cadre de son annonce. L’un d’entre eux se trouve sur le plateau de Saclay. Son nom : Jean Zay, en hommage au cofondateur du CNRS, ministre de l’Éducation nationale dans l’avant-guerre, assassiné par la Milice en 1944 et entré au Panthéon en 2015.

Le ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation avait fait l’acquisition du système début 2019. On nous le présentait alors comme « le premier supercalculateur national convergé pour les usages hybrides ». En d’autres termes, associant CPU/GPU et HPC/IA.

37 Pflops pour Jean Zay

Sur base SGI 8600, Jean Zay est hébergé et opéré par l’IDRIS (Institut du développement et des ressources en informatique scientifique) – l’un des trois grands centres nationaux de calcul avec le CINES et le TGCC. Sa puissance crête initiale avoisinait 16 Pflops. Après plusieurs extensions, on en est à un peu moins de 37 Pflops, avec 3152 GPU et 89382 cœurs CPU. L’ensemble pèse quelque 60 tonnes, occupe 320 m² et consomme 2100 kWh.

La partition scalaire (CPU) comporte 1528 nœuds dotés chacun de 2 Xeon Cascade Lake 6248 (20 cœurs à 2,5 GHz) et 192 Go de RAM.
La partition « accélérée » (GPU) regroupe 612 nœuds quadri-GPU. Ils ont la même base que les nœuds scalaires, avec en plus du NVIDIA V100 16 Go (351 nœuds) ou 32 Go (261 nœuds). S’y ajoutent quelques dizaines de nœuds octo-GPU, dont la majorité sur EPYC Milan 7543 avec A100 SXM4 80 Go.

L’ensemble tourne sous RHEL 8.1 Il accède à 33 Po de stockage (dont 2,2 Po sur SSD GridScaler GS18K), avec l’appui de 2840 cassettes LTO8. D’autres partitions sont disponibles, pour le pré et le post-traitement ainsi que la visualisation. Au niveau du réseau, on est sur un lien 100 Gb/s par nœud scalaire et quatre par nœud convergé.

On peut réserver, sur le portail eDARI de l’IDRIS, un accès dynamique pour moins de 50 kh GPU ou 500 kh CPU. Ou un accès régulier pour les demandes plus importantes. Une vingtaine de personnes sont actuellement au support applicatif. Des travaux ont démarré sur un dispositif de recyclage de la chaleur fatale. Objectif : une couverture thermique équivalente à la consommation de 1000 logements neufs du campus Paris-Saclay.

Bridge, Covid-19 et processeurs optiques

En début d’année, on passait officiellement la barre des 1000 projets expérimentés sur Jean Zay. Parmi eux :

– Celui de la start-up française NukkAI, qui s’est distinguée avec son IA joueuse de bridge

– L’Institut Curie autour du cancer du sein (segmentation d’images médicales par tomographie d’émission de positons)

– La simulation des interactions moléculaires pour identifier des composés inhibant le virus du Covid-19

– Le challenge IA-Biodiv de l’Agence nationale de la recherche

– L’AI-Cup, défi numérique franco-bavarois

– L’évaluation du potentiel des processeurs optiques de la start-up française LightOn

Adastra : vingt fois plus puissant qu’Occigen ?

Adastra n’est pas encore opérationnel. Annoncé en novembre 2021, il est en cours d’installation à Montpellier, au CINES (Centre informatique national de l’enseignement supérieur).

Sur base Cray EX, Adastra remplacera Occigen. Lequel avait été acquis auprès d’Atos. Sa partie Haswell a été décommissionnée en début d’année, ramenant le supercalculateur à 40 % de sa puissance initiale.

Occigen a atteint 3,57 Tflops en crête. Adastra devrait tutoyer les 75 Tflops, avec une consommation d’énergie multipliée par 1,5. Il est question de mettre la partie accélérée à disposition mi-2022, puis la partie scalaire en fin d’année.

La partie accélérée exploitera des nœuds EPYC Milan avec 256 Go de DDR4, 4 GPU AMD Instinct MI250X (128 Go) et 4 liens 200 Gb. La partie scalaire reposera sur des EPYC Genoa (768 Go de DDR5 et un lien 200 Gb par nœud). Pour le stockage, on est sur 24 Po de disque magnétique (250 Go/s) et environ 2 Po de flash (1,3 To/s).

Un supercalculateur « régional » à Sophia Antipolis

Le troisième supercalculateur auquel HPE fait référence exploite des serveurs Apollo 6500 Gen10 et des cartes Quadro RTX 6000. Lieu d’accueil : la Maison de l’IA ouverte en 2020 à Sophia Antipolis. Parmi les projets évoqués à l’annonce du contrat :

– Algorithmes de reconnaissance de la signalisation routière pour les véhicules autonomes

– Appel à projets du conseil général des Alpes-Maritimes sur le cancer

– Comptage et suivi des loups dans le parc national du Mercantour

Illustration principale © HPE