IT Life – Nicolas Monnier (Cerfacs) : «Diminuer l’empreinte énergétique des supercalculateurs»

CERFACS Toulouse, Nicolas Monnier, DSI

Nicolas Monnier, DSI du Cerfacs de Toulouse, spécialiste des supercalculateurs, se préoccupe toujours plus de la consommation énergétique de ces monstres du calcul scientifique. Il espère aussi beaucoup de l’émergence de techniques permettant la reprise sur panne.

A Toulouse, le campus de Météo France héberge un centre de recherche dont il est actionnaire: le CERFACS (Centre Européen de Recherche et de Formation Avancée en Calcul Scientifique). Cet organisme de recherche (*) développe des méthodes avancées pour la simulation numérique par le calcul hautes performances, et adresse la solution algorithmique des grands projets scientifiques et technologiques qui intéressent la recherche et l’industrie.

Ses travaux vont des études climatologiques à la simulation, en 3D, des chambres de combustion des moteurs d’avions…
Fin 2012, ce centre s’est doté d’un nouveau supercalculateur de toute dernière génération, au nom de code ‘Neptune’: il s’agit d’un système Bull B510, qui intègre pas moins de 154 noeuds constitués de processeurs Intel Sandy Bridge. Au total, ce ‘supercomputer’ compte 2000 coeurs, ce qui lui vaut une capacité de calcul de 51 téraflops (soit la capacité d’opérer 51 milliards d’opérations à la seconde!).

Les besoins de calcul du centre doublent pratiquement tous les ans. Au cours des années passées, son DSI, Nicolas Monnier, a enchaîné une série d’appels d’offres, orientées supercalculateurs et baies de stockage – en sélectionnant les meilleurs acteurs du moment – que ce soit chez SGI, chez Cray, chez IBM (Blue Gene), chez HP et AMD, chez EMC et, tout récemment, fin 2012, chez Bull.

Silicon.fr – Quel projet vous a récemment mobilisé ?

N.M. : J’ai été appelé pour contribuer aux choix découlant du renouvellement des calculateurs de Météo-France. En pratique, j’ai été sollicité pour être membre du jury technique qui a statué sur l’appel d’offres – une phase de sélection qui s’est déroulée entre la fin 2011 et  le 3e trimestre 2012. [NDLR: le choix s’est porté en faveur de serveur Bull B700 DLC à refroidissement liquide]. A partir de cette année 2013, cette nouvelle configuration doit apporter une puissance de calcul d’environ 1 pétaflops et jusqu’à 5 pétaflops d’ici à 2016. Cf. notre article :Calculs en pétaflops chez Météo France‘]

CERFACS Toulouse, Nicolas Monnier, DSI
CERFACS Toulouse, Nicolas Monnier, DSI

Qu’est-ce qui vous a le plus motivé, personnellement ?

C’est clairement la taille du projet. Mais également l’intérêt d’un travail mené au sein d’une équipe structurée et motivée, avec des interlocuteurs techniques de très haute qualité chez l’ensemble des fournisseurs. Et l’intérêt également de travailler pour une entité proche de la nôtre, puisque Météo France est l’un de nos 7 actionnaires (*).

Quelle(s) avancée(s) technologique(s) vous citeriez comme remarquables ces dernières années ?

Les derniers processeurs Intel continuent à améliorer le ratio prix/performance des unités de calcul permettant de maintenir les progressions de la loi de Moore (doublement des performances à budget constant tous les 18 mois). Cela ne suffit toutefois pas, il ne suffit pas de calculer plus vite mais également d’amener plus vite les données aux unités de calcul et les renvoyer tout aussi rapidement sur les services de stockage.
Les technologies SSD [Solid State Drive] qui se répandent dans les premiers niveaux de stockage des baies participent grandement à cette amélioration, le renforcement de l’efficacité des systèmes de fichiers parallèle (Lustre et GPFS – pour n’en citer que deux principaux) sont essentiels à l’amélioration des entrés-sorties des grands clusters de calcul.

A quelle(s) technologie(s) vous êtes-vous intéressé ces 2 ou 3 ans passés ?

C’est, bien sûr, le calcul à hautes performances. Les architectures de calcul massivement parallèle. Et, d’une manière générale, les serveurs de données, qui viennent en périphérie de ces calculateurs, les techniques d’exploitation des résultats générés par ces machines propres à simuler de plus en plus près le réel.

Sur quelle (s) technologie(s) imaginez-vous travailler dans 5 voire 10 ans ?

Parmi les nouvelles technologies qui vont compter dans les années à venir, je mettrais en avant les co-processeurs de calcul (GPU et Xeon/Phi) ou assimilés qui ont une chance de percer et d’amener la rupture technologique dont auront besoin les calculateurs de la fin de la décennie, c’est un peu le retour du vectoriel associé au parallélisme massif. Les interconnexions optiques au plus près des processeurs, accélérant les échanges.
Et d’une manière plus générale, le traitement efficace des données générées par les supercalculateurs.

Quels sont, selon vous, les principaux enjeux ‘high tech’ actuels ?

L’une des priorités qui s’imposent aujourd’hui c’est de diminuer l’empreinte énergétique des serveurs. C’est une évidence pour tous. Un autre centre d’intérêt nous occupe au CERFACS : la reprise sur panne dans les grands calculateurs parallèles. Comment se prémunir de la panne d’un cœur de calcul lorsque l’on implique plusieurs centaines de milliers de cœurs dans une seule simulation ? La probabilité est forte de rencontrer un incident. Comment diminuer son impact ? Nous n’avons pas encore de réponse…

_____

CERFACS, Toulouse
CERFACS, Toulouse

(*) Le CERFACS, installé à Toulouse, compte 130 chercheurs et ingénieurs, originaires d’une dizaine de pays dans le monde. Ce sont des physiciens, mathématiciens, numériciens et informaticiens qui coopèrent en totale interdisciplinarité. Ils travaillent dans 9 principaux domaines : les algorithmes parallèles, le couplage de codes, l’aérodynamique, les turbines à gaz, la combustion, le climat, l’impact environnemental, l’assimilation de données, l’électromagnétisme et l’acoustique.  Il fournit donc des « méthodes et des outils avancés pour la simulation numérique et la résolution algorithmique de programmes scientifiques et technologiques ». Ses travaux intéressent autant la recherche que l’industrie. Il s’agit donc d’élaborer des modèles de calcul très sophistiqués que ces chercheurs désignent souvent comme des « éprouvettes numériques ».
Ce centre de recherche compte 7 actionnaires: le CNES, EADS, EDF, Météo France, Onera, Safran, Total. Une partie de ses activités est associée au CNRS sous la forme d’une unité de recherche.
_______
A lire en rubrique IT Life :
Diane Rémond: le défi de créer une base de données uniques‘**

Jean-Marc Prost, Volvo IT mise sur le collaboratif et la mobilité

Stephen Roux, L’Occitane, une future révolution, le M2M

Catrena Blanco, Europcar, Comment réussir sans budget