Pour gérer vos consentements :
Categories: Big DataCloud

Big Data : Red Hat Storage Hadoop, alternative à HDFS

Déjà incorporée à son produit Red Hat Storage Server, l’éditeur entend étendre la portée de la technologie Gluster File System, en particulier pour contourner les difficultés associées à HDFS (Hadoop Distributed File System), et en faire un projet de l’Apache Software Foundation.

Système de fichiers scale-out

C’est en 2011 que Red Hat a fait l’acquisition de Gluster, pour 131 millions de dollars, et de sa technologie de Gluster File System (GlusterFS). Il s’agit d’un système de fichiers scale-out destiné aux NAS (Network Attached Storage), reposant sur un composant à la fois client et serveur sous protocole TCP/IP, InfiniBand ou SDP, basé sur un design empilable de l’espace utilisateur.

Un système de briques de stockage, en quelque sorte, qui exploite des ‘traducteurs’ (expression avancée par Gluster) pour réunir des espaces de stockage disponibles sur des serveurs distants en volumes composites de stockage virtuel.

L’utilisateur voit un volume global de stockage via des mécanismes FUSE sous protocole NFS v3. À noter que ces volumes virtuels peuvent être exportés via le kernel NFS v4, SAMBA, ou encore sous la forme d’objets OpenStack Storage (dans le projet Swift).

Red Hat Storage Hadoop

GlusterFS est un produit gratuit proposé sous licence GNU GPL v3. Mais Red Hat a d’autres ambitions pour ce produit et lorgne avec intérêt vers le Big Data et Hadoop. Devenue Red Hat Storage Hadoop, la solution open source se présente comme une alternative au Hadoop Distributed File System.

La solution est plus avancée que celle de la communauté Hadoop. En particulier elle offre un certain nombre de fonctionnalités avancées, dans la gestion, la réplication, la haute disponibilité, la compliance POSIX, ou encore pour le plan de reprise d’activité.

Des fonctionnalités plus particulièrement recherchées par les acteurs du Big Data qui misent sur le stockage unifié, la scalabilité et les clusters Hadoop.

À multiplier les offres…

Si l’initiative de Red Hat est appréciée, nous pouvons en revanche nous inquiéter de la profusion des contributeurs qui adressent la problématique HDFS. Chacun y va de son plug-in, open source pour Red Hat ou Quantcast, propriétaire pour EMC ou NetApp. À multiplier les initiatives, l’utilisateur ne sait plus où tourner la tête, ni quelle solution choisir…

D’autant que ces alternatives à HDFS ont aussi pour but d’étendre les solutions de stockage des éditeurs ou des constructeurs, souvent bien au-delà de leurs solutions de Big Data. Dans ces conditions, le risque est grand d’éloigner l’utilisateur de l’approche de standardisation qui pourtant domine dans tous ces secteurs.

L’avenir du Big Data demeure encore incertain dans sa formulation comme dans ses technologies.


Voir aussi

Quiz Silicon.fr – Le vocabulaire du cloud

Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes

Recent Posts

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

8 heures ago

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

12 heures ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

14 heures ago

ChatGPT : le Financial Times signe avec OpenAI

FT Group, éditeur du Financal Times, a signé un accord avec OpenAI afin d'utiliser ses…

3 jours ago

Les hyperscalers renforcent leurs recherches et datacenters pour l’IA

Au premier trimestre, Microsoft, Meta/Facebook et Alphabet/Google ont déjà investi plus de 32 milliards $…

3 jours ago

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…

3 jours ago