Stockage sur ADN, Microsoft en route pour le datacenter

Microsoft et l’Université de Washington ont réussi à écrire 200 Mo de données sur des brins d’ADN synthétiques. Une avancée qui entrouvre les portes du datacenter.

Cela peut apparaître peu au regard de la capacité de stockage actuelle. Mais ce que viennent de réaliser les équipes de Microsoft et de l’Université de Washington à Seattle est un sacré bond en avant. En effet, les chercheurs ont réussi à écrire 200 Mo de données sur des brins d’ADN synthétiques. Le record précédent était de 22 Mo. Soit presque 10 fois moins de données qu’aujourd’hui.

Les chercheurs ont réussi à placer sur les brins d’ADN des clips vidéo du groupe OK Go, la déclaration universelle des droits de l’homme en 100 langues, les 100 premiers livres du projet Gutenberg et la base de données de l’initiative Crop Trust (préservation des variétés de plantes et légumes). Ils ont été capables de lire à nouveau correctement les données en utilisant le code de correction d’erreur développé par Microsoft. Un procédé inusable ? « Nous avons découvert que ce processus devrait rester intact pendant des milliers d’années », précise Karin Strauss, responsable du projet pour Microsoft à nos confrères de The Register. Elle ajoute que « l’encapsulation synthétique est très dépendante de la température, mais conserver à 10° Celsius, l’ADN ne se dégradera pas pendant environ 2000 ans et à -18°C, la conservation peut durer des millions d’années ».

Pour intégrer les données sur l’ADN, les chercheurs ont utilisé un synthétiseur d’ADN qui code les données sur les quatre bases de l’ADN, adénine (A), cytosine (C), guanine (G) ou thymine. Cela permet de stocker des grands volumes de données sur des éléments microscopiques. Les 200 Mo ont été stockés sur un morceau d’ADN de la taille d’un grain de sucre.

L’archivage dans les datacenters en ligne de mire

Lors de précédentes recherches, l’Université de Washington et Microsoft ont estimé que la limite de stockage « brut » sur l’ADN était de 1 exaoctet par millimètre cube. Un grand volume de données, mais le problème est que la lecture des informations pourrait prendre beaucoup de temps.

Pas de quoi remplacer le stockage flash qui a aujourd’hui le vent en poupe. Mais cette technologie pourrait trouver sa place dans les datacenters et notamment pour le stockage capacitif comme la sauvegarde ou le stockage froid. « Les coûts de séquençage de l’ADN baissent beaucoup plus rapidement que la loi de Moore a réduit le coût de l’informatique. De même, les processus de lecture s’améliorent pour gagner en rapidité. Donc il n’y a aucun obstacle à ce que cette technologie devienne une réalité commerciale », explique Luis Ceze, professeur en informatique à l’Université de Washington. Pour lui, les premiers cas d’usage seront probablement les datacenters. Ces derniers pourraient se doter d’un synthétiseur ADN in situ pour archiver des grands volumes de données dans un espace limité.

A lire aussi :

Microsoft investit dans l’ADN

Apple ResearchKit s’intéresse à l’étude de l’ADN

Credit Photo:  Tara Brown Photography / UW