IT Life : Olivier Rouchon, CINES, partager, c’est faire des économies !

CINES, Olivier Rouchon

Olivier Rouchon, responsable de l’archivage au CINES, explique ici l’enjeu de sa mission, liée au Big data. Partager pour mieux économiser. Un témoignage ‘IT Life’.

Le monde universitaire en France gère son propre centre de calcul, le CINES ou Centre Informatique National de l’Enseignement Supérieur. Depuis sa création en 1999, à Montpellier (*), il accueille l’un des plus importants supercalculateurs en France : ‘Jade’, un système SGI qui atteint une puissance crête de 267 téraflops, qui a représenté un investissement dépassant les 10 millions d’euros à partir de 2008.

Depuis 2009, ce centre de calcul s’est vu attribuer la responsabilité de l’archivage de l’ensemble des productions scientifiques réalisées sur le territoire, notamment les principales bibliothèques universitaires de France. Depuis fin 2012, une autre mission lui a été ajoutée, élargissant encore sa volumétrie très ‘Big data’ : il est le ‘tiers archiveur’ de la Cour des comptes.

A l’issue d’un appel d’offres (lié à l’agrément du SIAF, Service Interministériel des Archives de France), le CINES a choisi la solution d’archivage d’Arcsys. Le déploiement de la nouvelle plateforme, très évolutive, a été réalisé en 5 mois. L’infrastructure retenue repose sur deux serveurs applicatifs reliée à deux baies de stockage connectées en ‘fibre channel‘  pour une capacité totale de 40To évolutive jusqu’à 150To. En quelques mois d’exploitation, ce sont près de 600.000 documents qui ont été ainsi archivés.

Avec ces ressources, le périmètre du CINES ne devrait pas s’arrêter là. Il devrait prendre une dimension européenne. Comme l’explique ici Olivier Rouchon, responsable IT de ce programme, cette mission a évolué pour répondre à un impératif d’économie budgétaire : partager les ressources et réaliser des économies d’échelle.

Quels sont les enjeux de ce programme d’archivage très ‘Big data’ ?

CINES, Olivier Rouchon_
CINES, Olivier Rouchon

[Olivier Rouchon]: Un de nos axes stratégiques, c’est l’archivage à long terme d’informations scientifiques brutes, c’est-à-dire toutes les données produites dans le cadre de simulations, mesures, calculs, etc.

La volumétrie générée par les chercheurs et les membres de la communauté Enseignement Supérieur et Recherche en France explose.

C’est sans commune mesure avec celle de nos partenaires historiques, comme les bibliothèques universitaires ou les institutions collectant des fonds patrimoniaux (ils utilisent nos services depuis plus de cinq ans).

Là, on parle d’un nouvel enjeu, devant la valeur de ce nouveau type de données, car ces données peuvent être réutilisées par d’autres chercheurs. C’est aussi une question de volume et de masse critique à atteindre, à partir de laquelle des économies d’échelle sont possibles…

Qu’est-ce qui a été le plus motivant pour vous ?

La perspective de préserver le patrimoine scientifique français est déjà en soi une mission particulièrement excitante. Le challenge posé par les coûts de la préservation de données numériques s’est aussi avéré extrêmement intéressant.

La volumétrie progresse de manière exponentielle. Et nous avons aussi des exigences imposées par l’état de l’art en matière d’archivage électronique : il a fallu trouver des solutions techniques permettant de stocker toujours plus d’information, et de façon sécurisée. Et cela, en maintenant un niveau de performances acceptable pour le versement ou l’accès, tout en baissant les coûts.

Quelles avancées technologiques vous paraissent remarquables ?

Les progrès dans la capacité de stockage des librairies de bandes magnétiques. Et ceci couplé à des prouesses en terme de consommation énergétique – électricité, refroidissement. Ce média est redevenu très attractif et compétitif pour un archivage massif de données.

Quels acteurs de l’univers high-tech vous ont le plus impressionné récemment ?

Au-delà des constructeurs de matériel informatique ? Ce sont les spécialistes de la préservation numérique à long terme. Je suis impressionné par le niveau de maturité des suites logicielles, par exemple. Ces solutions sont à présent alignées sur les standards du domaine – dont la norme ISO 14721 – ce qui n’était pas le cas il y a encore quelques années.

Et dans les couches basses des infrastructures d’archivage, je vois de nouvelles possibilités, notamment au niveau de l’abstraction des systèmes de stockage, ce qui permet une utilisation de ressources sur un mode ‘cloud’, en panachant des équipements locaux ou distants.

Sur quelles technologies imaginez-vous travailler dans 5 voire 10 ans ?

Nous projeter sur une durée de cinq à dix ans, c’est vrai, cela fait partie de nos prérogatives d’archiveurs. En fait, nous devons conserver des documents sur des durées bien supérieures. C’est d’ailleurs un exercice auquel nous sommes rodés, puisque c’est à peu près la durée de vie d’une technologie ou d’un matériel.

En revanche, anticiper les changements sur 15 voire 20 ans, ça c’est un exercice beaucoup plus périlleux, notamment pour les technologies de stockage. On sait que les capacités des médias doublent tous les 18 mois, à prix constant. Il est donc possible que des technologies similaires à celles utilisées aujourd’hui soient toujours d’actualité dans plus de 10 ans.

De la même façon, on voit apparaître de nouveaux supports, comme la mémoire de masse réinscriptible à semi-conducteurs, qui sont prometteurs et pourraient compléter les technologies classiques – disques durs et bandes magnétiques – voire les supplanter.

Quels sont, selon vous, les principaux enjeux high-tech du moment ?

Au-delà des coûts d’investissement et humains, c’est la question énergétique qui fatalement se posera un jour de façon cruciale. Les infrastructures sont toujours plus gourmandes en électricité et en sources de refroidissement.

Il faut croire aux technologies « vertes », probablement « off-line » – c’est à dire ne fonctionnant qu’à la demande – permettront un archivage électronique écolo-responsable, au même titre que son équivalent papier…
____
(*) Le C.I.N.E.S. (Centre Informatique National de l’Enseignement Supérieur), établissement public national, basé à Montpellier,  est sous la tutelle du ministère de l’Enseignement Supérieur et de la Recherche. Il met à la disposition de la communauté scientifique de l’Enseignement Supérieur et de la Recherche publique, des moyens informatiques pour le calcul de haute performance et l’archivage de documents électroniques. Grâce à ces investissements, la France a rattrapé son retard, passant depuis fin 2007, de la 5e place mondiale en termes de calcul intensif à la 3e. La capacité de calcul a quasiment été multipliée par 25. La capacité totale de la recherche académique en France avoisine les 500 téraflops. L’essentiel des équipements est acheté par le GENCI (Grand Equipement National du Calcul Intensif), l’entité qui finance et déploie le parc des supercalculateurs publics en France.

______
À lire, en rubrique IT Life:
Emmanuelle Verschelde, AREVA: innover, c’est sortir des sentiers battus
Stéphane Roux, L’Occitane: le M2M, une future révolution