Pour gérer vos consentements :
Categories: Réseaux

La déduplication des données: chère ou économique?

Cette année, le Nouveau Monde numérique va créer une déferlante de données qui remplirait 400 millions de disques durs de 1 To (tera-octets, ou 1000 gigas) . Mis bout à bout, ces supports de stockage feraient plus de 14 fois le tour de la Terre !

Au centre de la plupart des échanges financiers et humains, cette muraille colossale vit et grandit sans cesse pour constituer la plus formidable des problématiques jamais gérée par les systèmes d’informations.

Il ne fait aucun doute que pour y répondre, de nombreuses DSI de grandes et petites organisations sont aujourd’hui à la recherche d’outils de gestion afin de minimiser les impacts financiers de cette marée de données.

Au début de ce siècle, des start-up se sont penchés sur cette question et ont découvert la pierre philosophale du stockage: la déduplication des données.

Un peu de pédagogie pour comprendre leur découverte

Si l’on transforme un disque dur en un énorme chaudron d’un million de billes dispatchées inégalement dans 10.000 sachets (les fichiers), la déduplication va permettre de « factoriser » toutes les billes similaires contenues dans les sachets pour n’en garder qu’une réelle (le facteur) dans une cuve prévue à cet effet. Chaque sachet disposera d’autant de pointeur(s) vers cette cuve qu’il possédait de bille(s) factorisée(s).

Cette opération pourrait réduire jusqu’à 20 fois le poids du million de billes …

A l’échelle d’une organisation, l’économie semble considérable et l’investissement dans ce type de technologie pourrait avoir une indéniable rentabilité. Oui, mais à condition de toujours bien sauvegarder les données dédupliquées sur un autre support

C’est peut-être ce qui explique les doutes de certains sur l’utilité d’une technique coûteuse en termes d’acquisition et de gestion : pressentant le danger sur leurs ventes en volume, les grandes enseignes du stockage ont toutes acquis la technologie en absorbant les ‘start-ups’ du secteur et la proposent alors directement intégrée à leurs systèmes respectifs, mais à des tarifs élevés….

Par exemple, dans le domaine des données non structurées telles que les vidéos, photos, MP3 , les occurrences ont des chances d’être moins nombreuses et la déduplication pourrait être alors considérée comme un luxe alors que la duplication des données est indispensable pour la sauvegarde et l’archivage.

En conclusion,

les avantages économiques de la déduplication sont aujourd’hui réservés à de riches entités, gérant des données structurées et susceptibles d’être présentes sur de nombreux disques durs d’utilisateurs (présentations, plans, vidéos, etc…). Pour les autres, il vaudra mieux attendre l’arrivée de technologies Open Source à faible coût d’acquisition

___

(*) Intellique

Recent Posts

Étude Trends of IT 2024 : comment les managers IT développent leurs projets

Silicon et KPMG lancent la deuxième édition de l'étude Trends of IT. Cette édition 2024…

10 minutes ago

Atos : l’Etat veut acquérir les activités souveraines

Le ministère de l'économie a adressé une lettre d'intention à la direction d'Atos pour racheter…

2 heures ago

Arnaud Monier – SNCF Connect & Tech : « Notre moteur, c’est l’innovation et nous procédons par incrémentation »

Directeur Technologie de SNCF Connect & Tech, Arnaud Monier lance une campagne de recrutement pour…

4 heures ago

Etats-Unis : les grands de l’IT licencient au nom de l’IA

Les grands de l'IT suppriment des milliers de jobs au nom du déploiement de. Une…

4 heures ago

Appel de Rome : Cisco rejoint Microsoft et IBM pour une IA éthique

Quatre ans après l’appel de Rome - un pacte présenté en 2020 par le Vatican…

5 heures ago

Legapass : comment protéger ses données privées jusque dans l’au-delà

Comment gérer les données numériques après la mort de son détenteur ? La jeune pousse…

3 jours ago