Open Source : GitHub déploie son projet Arctic Code Vault

GitHub a initié l’archivage à long terme du code source de logiciels libres. Le dépôt officiel dans l’Arctic World Archive en Norvège est prévu pour le printemps 2020.

La plateforme de développement et de code partagé GitHub a lancé cette semaine la mise en production d’Arctic Code Vault. Cette initiative d’archivage à long terme du code source de logiciels libres et open source avait été présentée aux développeurs l’an dernier.

En novembre 2019, lors de la conférence GitHub Universe, l’entreprise acquise l’année précédente par Microsoft, dévoilait le programme GitHub Archive de préservation de logiciels open source pour les générations futures, et le projet associé Arctic Code Vault.

Le GitHub Arctic Code Vault est un référentiel de données (code source) qui sera conservé dans l’Arctic World Archive (AWA). Cet espace d’archivage « à très long terme » de données a été ouvert, le 27 mars 2017, à l’initiative des entreprises norvégiennes Piql et Store Norske Spitsbergen Kulkompani (SNSK), la compagnie minière détenue par l’État norvégien.

L’AWA est ainsi installée dans une ancienne mine de charbon sur l’île norvégienne de Spitzberg, dans le Svalbard, un archipel situé dans l’océan Arctique, à mi-chemin entre la Norvège et le Pôle Nord. C’est là que GitHub a choisi de stocker le code source de logiciels open source « dans une archive construite pour durer 1000 ans », selon ses promoteurs.

Un instantané, des bugs et un guide

« Le 02/02/2020, nous avons pris un instantané de tous les référentiels (repositories) publics actifs sur GitHub à archiver dans le coffre-fort (vault) », a expliqué dans un billet de blog Julia Metcalf, responsable du management produit chez GitHub.

« L’instantané inclut les repositories : avec commits déposés entre le 13 novembre 2019 (date de l’annonce à Universe) et le 2 février 2020 ; avec au moins une étoile et un commit de l’année précédant l’instantané entre le 3 février 2019 et le 2 février 2020. [Et ceux] ayant au moins 250 étoiles, quelle que soit la date de leur dernière activité. »

Bugs inclus, donc.

Par ailleurs, un guide sera associé à chaque archive pour fournir du contexte à celles et ceux qui seront susceptibles de s’y intéresser dans un avenir très lointain.

GitHub s’est également entouré de spécialistes de différentes disciplines (anthropologie, archéologie, archivage, histoire, linguistique et sciences). Tous sont réunis au sein d’un conseil consultatif. L’objectif de GitHub est ainsi de « maximiser la valeur des archives. »

Patience. La mise en production de l’Arctic Code Vault prendra « environ deux mois ». Le dépôt officiel de l’ensemble dans l’Arctic World Archive est donc prévu pour le printemps 2020. GitHub en dira davantage lors de son événement Satellite qui se tiendra en mai à Paris.