Les solutions d’intégration de Talend partent à l’assaut du big data

Talend Studio for Big Data est une nouvelle offre, compatible avec Hadoop, qui s’axe sur un générateur de code Pig et des connecteurs HDFS, HBase, Hive et Sqoop.

Talend lance aujourd’hui ses solutions big data. Un secteur stratégique pour l’éditeur, qui – rappelons-le – œuvre dans le monde de l’intégration (de données et applicative). Le support du big data passe ici par celui d’Hadoop, une technologie largement plébiscitée.

« Hadoop redistribue complètement les cartes, explique Fabrice Bonan, cofondateur et directeur général de Talend (notre photo). Cette technologie gratuite fait aussi bien que des solutions coutant des millions de dollars. C’est une vraie rupture. Toutefois, son utilisation reste complexe. Nous sommes là pour mettre Hadoop à la portée des utilisateurs. »

Par défaut, le support d’Hadoop dans Talend passe par celui du langage Pig. Le logiciel propose ainsi trois moteurs : un moteur ETL classique, qui génère du Java, un moteur de base de données, qui génère du SQL, et le moteur Hadoop, qui génère du code Pig. Dans les trois cas, l’ensemble des outils de la suite reste inchangé : définition des jobs, déploiement des projets et monitoring de la solution.

Mais ce n’est pas tout : le système de fichiers HDFS est également supporté, tout comme l’outil d’accès semi SQL Hive, la base de données HBase, ou encore l’interface SQL Sqoop.

Des liens avec les plus grandes distributions Hadoop

« Talend Studio for Big Data est une offre open source sous licence Apache, et non GPL, afin de mieux s’adapter à la licence d’Hadoop. Elle contient le générateur de code Pig et les différents connecteurs, » poursuit Fabrice Bonan.

Cette licence permettra à Talend Open Studio for Big Data de se faire une place au sein les distributions Hadoop. L’éditeur travaille dans ce sens avec les plus connues d’entre elles, c’est-à-dire celles signées Cloudera, Hortonworks et MapR. L’éditeur annonce d’ores et déjà que son offre sera intégrée à Hortonworks Data Platform.

La version commerciale de cette solution, Talend Enterprise Data Integration for Big Data, proposera des outils complémentaires, permettant de gérer le déploiement et la surveillance des projets, et de travailler de façon collaborative. Une offre adaptée aux larges équipes travaillant sur de grosses infrastructures. « Les versions gratuite et commerciale de Talend proposent une compatibilité ascendante et descendante », rappelle Fabrice Bonan.

Le tout sera accessible en mai, avec – pour la version commerciale – en modèle de licence indépendant du nombre de processeurs (lequel serait par essence incompatible avec le principe même du big data). Notez que cet outil serait déjà en production chez certaines grandes compagnies, dont un célèbre site de ventes aux enchères. Enfin, une préversion de Talend Open Studio for Big Data peut être téléchargée ici (attention, c’est un lien direct).

Crédit photo : © Talend