Big Data : Red Hat Storage Hadoop, alternative à HDFS

Avec son plug-in, Red Hat propose une alternative (encore !) open source à Hadoop Distributed File System.

Déjà incorporée à son produit Red Hat Storage Server, l’éditeur entend étendre la portée de la technologie Gluster File System, en particulier pour contourner les difficultés associées à HDFS (Hadoop Distributed File System), et en faire un projet de l’Apache Software Foundation.

Système de fichiers scale-out

C’est en 2011 que Red Hat a fait l’acquisition de Gluster, pour 131 millions de dollars, et de sa technologie de Gluster File System (GlusterFS). Il s’agit d’un système de fichiers scale-out destiné aux NAS (Network Attached Storage), reposant sur un composant à la fois client et serveur sous protocole TCP/IP, InfiniBand ou SDP, basé sur un design empilable de l’espace utilisateur.

Un système de briques de stockage, en quelque sorte, qui exploite des ‘traducteurs’ (expression avancée par Gluster) pour réunir des espaces de stockage disponibles sur des serveurs distants en volumes composites de stockage virtuel.

L’utilisateur voit un volume global de stockage via des mécanismes FUSE sous protocole NFS v3. À noter que ces volumes virtuels peuvent être exportés via le kernel NFS v4, SAMBA, ou encore sous la forme d’objets OpenStack Storage (dans le projet Swift).

Red Hat Storage Hadoop

GlusterFS est un produit gratuit proposé sous licence GNU GPL v3. Mais Red Hat a d’autres ambitions pour ce produit et lorgne avec intérêt vers le Big Data et Hadoop. Devenue Red Hat Storage Hadoop, la solution open source se présente comme une alternative au Hadoop Distributed File System.

La solution est plus avancée que celle de la communauté Hadoop. En particulier elle offre un certain nombre de fonctionnalités avancées, dans la gestion, la réplication, la haute disponibilité, la compliance POSIX, ou encore pour le plan de reprise d’activité.

Des fonctionnalités plus particulièrement recherchées par les acteurs du Big Data qui misent sur le stockage unifié, la scalabilité et les clusters Hadoop.

À multiplier les offres…

Si l’initiative de Red Hat est appréciée, nous pouvons en revanche nous inquiéter de la profusion des contributeurs qui adressent la problématique HDFS. Chacun y va de son plug-in, open source pour Red Hat ou Quantcast, propriétaire pour EMC ou NetApp. À multiplier les initiatives, l’utilisateur ne sait plus où tourner la tête, ni quelle solution choisir…

D’autant que ces alternatives à HDFS ont aussi pour but d’étendre les solutions de stockage des éditeurs ou des constructeurs, souvent bien au-delà de leurs solutions de Big Data. Dans ces conditions, le risque est grand d’éloigner l’utilisateur de l’approche de standardisation qui pourtant domine dans tous ces secteurs.

L’avenir du Big Data demeure encore incertain dans sa formulation comme dans ses technologies.


Voir aussi

Quiz Silicon.fr – Le vocabulaire du cloud

Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes