Big Data décisionnel : Pentaho se rapproche de MapR

La version communautaire de Pentaho Data Integration est directement intégrée à la distribution Hadoop de MapR. Cet outil d’intégration de données se veut simple d’emploi.

Nouveau succès pour la distribution Hadoop de MapR. Après avoir été validée pour les offres d’intégration de données d’Informatica et de Talend, elle se rapproche aujourd’hui de celle de Pentaho.

Pentaho Data Integration Community Edition est la version communautaire de l’offre d’intégration de données de l’éditeur (aussi connue sous le nom de Kettle). Placée sous licence Apache, elle est maintenant directement intégrée à la distribution Hadoop de MapR.

Kettle sera en mesure de se connecter à des sources Hadoop, mais également à des bases de données traditionnelles. En plus de sa capacité à extraire des données, il pourra donc former un pont entre ces différentes offres.

Un outil facile d’utilisation

Pentaho Data Integration permet d’extraire des données de plusieurs sources de données, puis de les manipuler (intégration, traitement, visualisation, exploration, etc.), le tout depuis une interface graphique simple d’emploi. Pour l’accès Hadoop, les technologies suivantes sont supportées : HBase, HDFS, Hive, Pig et NFS. Un large ensemble.

Plus de détails sur le support de MapR intégré à l’offre de Pentaho se trouvent sur cette page web du wiki de l’éditeur. Notez que d’autres distributions Hadoop (par exemple celle de Cloudera) sont également supportées en standard par Kettle.