La déduplication passe à l’open source avec Opendedup

Le projet Opendedup vise à développer une solution de déduplication sous licence open source. Focus sur cette solution ouverte et évolutive.

La déduplication est une technique de sauvegarde des informations permettant d’économiser de l’espace de stockage en n’enregistrant qu’une seule fois les données inchangées ou identiques. L’arrivée d’Opendedup est une bouffée d’air frais pour le monde des logiciels libres, les solutions open source de déduplication n’étant pas légion.

Le projet Opendedup comprend un système de fichiers gérant la déduplication et conçu pour Linux, SDFS, aujourd’hui disponible en version 0.8.9. Ce dernier se place au-dessus des périphériques locaux ou réseau (CIFS, NFS et iSCSI). Le tout semble solide, avec des performances de déduplication annoncées comme étant supérieures à 150 Mo/s et la possibilité de traiter plus de 1000 To de données (3 To par gigaoctet de mémoire).

Un ou plusieurs moteurs de stockage prendront place au-dessus de cette première couche, afin d’enregistrer les données sauvegardées sur des périphériques locaux ou distants (par exemple une instance Amazon S3 ). Chaque moteur de stockage peut gérer 32 To de données dédupliquées, 256 d’entre eux pouvant être couplés au sein d’une même solution… soit un total de 8192 To d’informations gérées.

Bon point, cette solution est compatible avec les hyperviseurs KVM, VMware et Xen. Vous pourrez télécharger cet outil directement sur le site web du projet Opendedup. Notez que la présence de Fuse et de Java est nécessaire pour pouvoir exploiter cette solution.

opendedup.png