Hortonworks crée un groupe sur la sécurisation de Hadoop

Avec des clients et le fournisseur de solutions analytiques SAS, Hortonworks vient de créer le groupe Data Governance Initiative pour sécuriser les données dans Hadoop.

Hortonworks, spécialiste du Big Data et récemment introduit en bourse, s’empare du problème de la sécurisation des données au sein de la plateforme Hadoop. La société n’est pas seule dans cette aventure et embarque avec elle des clients comme Target (distribution), Merck (pharmacie) ou Aetna (assurances), ainsi que l’éditeur de solutions analytiques SAS. Le projet prend la forme d’un groupe qui se dénomme Data Governance Initiative (DGI). Il va fonctionner comme un projet Open Source pour répondre aux préoccupations des entreprises qui veulent stocker plus de données dans Hadoop, notamment en matière de sécurité et de respect de la conformité.

Hortonworks entend mener cette initiative dans le même esprit que la Fondation Open Compute lancée en 2011 sous l’impulsion de Facebook. Ce projet vise à élaborer des équipements ouverts et optimisés pour les datacenters (switchs, routeurs, serveurs, etc.). Plusieurs contributeurs ont mis la main à la pâte dont Microsoft. Pour DGI, Tim Hall, vice-président de Hortonworks et en charge du projet, a mis à contribution les premiers intéressés. Les clients (Target, Merck et Aetna) partageront leur expertise technique et commerciale mais aussi le développement et le déploiement du code. Un moyen pour Hortonworks de donner une image d’innovation sans abandonner son modèle Open Source.

S’adosser à des solutions Open Source

Hortonworks prévoit de publier plus d’informations sur la feuille de route technique de DGI le mois prochain. On sait cependant que les projets Apache Falcon (en charge de la gestion du cycle de vie des données) et Apache Ranger (outil de sécurité des clusters Hadoop développé par Hortonworks) seront des éléments clés du projet (cf schéma ci-dessous). Un effort particulier sera mis sur la persistance des politiques de conformités pour les déplacements des données entre Hadoop et d’autres systèmes de traitement de données. Le code élaboré sera mis à disposition de la communauté via l’Apache Software Fondation.

falcon-architecture

Cette ouverture implique selon Tim Hall que d’autres entreprises puissent participer aux travaux y compris des concurrents comme MapR ou Cloudera qui ont leur propre projet pour sécuriser Hadoop. « Il n’y a aucun frein à ce que Cloudera intègre son projet Sentry à DGI. » Un appel du pied qui risque de rester lettre morte tant la concurrence est vive sur ce marché.

A lire aussi :

Pivotal et Hortonworks s’associent dans la gestion de Hadoop
Big Data : Hortonworks planche sur le futur de Hive avec Stinger.next

Crédit photo : agsandrew / Shutterstock