La déduplication des données: chère ou économique?

Face à l’inflation colossale des données qu’il faut toujours et toujours stocker, la déduplication est-elle la panacée ? Oui, et non…

Cette année, le Nouveau Monde numérique va créer une déferlante de données qui remplirait 400 millions de disques durs de 1 To (tera-octets, ou 1000 gigas) . Mis bout à bout, ces supports de stockage feraient plus de 14 fois le tour de la Terre !

Au centre de la plupart des échanges financiers et humains, cette muraille colossale vit et grandit sans cesse pour constituer la plus formidable des problématiques jamais gérée par les systèmes d’informations.

Il ne fait aucun doute que pour y répondre, de nombreuses DSI de grandes et petites organisations sont aujourd’hui à la recherche d’outils de gestion afin de minimiser les impacts financiers de cette marée de données.

Au début de ce siècle, des start-up se sont penchés sur cette question et ont découvert la pierre philosophale du stockage: la déduplication des données.

Un peu de pédagogie pour comprendre leur découverte

Si l’on transforme un disque dur en un énorme chaudron d’un million de billes dispatchées inégalement dans 10.000 sachets (les fichiers), la déduplication va permettre de « factoriser » toutes les billes similaires contenues dans les sachets pour n’en garder qu’une réelle (le facteur) dans une cuve prévue à cet effet. Chaque sachet disposera d’autant de pointeur(s) vers cette cuve qu’il possédait de bille(s) factorisée(s).

Cette opération pourrait réduire jusqu’à 20 fois le poids du million de billes …

A l’échelle d’une organisation, l’économie semble considérable et l’investissement dans ce type de technologie pourrait avoir une indéniable rentabilité. Oui, mais à condition de toujours bien sauvegarder les données dédupliquées sur un autre support

C’est peut-être ce qui explique les doutes de certains sur l’utilité d’une technique coûteuse en termes d’acquisition et de gestion : pressentant le danger sur leurs ventes en volume, les grandes enseignes du stockage ont toutes acquis la technologie en absorbant les ‘start-ups’ du secteur et la proposent alors directement intégrée à leurs systèmes respectifs, mais à des tarifs élevés….

Par exemple, dans le domaine des données non structurées telles que les vidéos, photos, MP3 , les occurrences ont des chances d’être moins nombreuses et la déduplication pourrait être alors considérée comme un luxe alors que la duplication des données est indispensable pour la sauvegarde et l’archivage.

En conclusion,

les avantages économiques de la déduplication sont aujourd’hui réservés à de riches entités, gérant des données structurées et susceptibles d’être présentes sur de nombreux disques durs d’utilisateurs (présentations, plans, vidéos, etc…). Pour les autres, il vaudra mieux attendre l’arrivée de technologies Open Source à faible coût d’acquisition

___

(*) Intellique