Laurent Bride,Talend : « Une approche hybride pour le Big Data et le Cloud en 2015 »

Le spécialiste de l’intégration (données et applications) open source compte plus de 1700 clients dans le monde. Ses solutions sur site arrivent sur Cloud. Laurent Bride son directeur technique nous dévoile sa feuille de route.

En moins de 10 ans, Talend s’est imposée dans le paysage de l’intégration en France puis aux Etats-Unis. Elle a levé plus de 100 millions de dollars de financement, et emploie aujourd’hui plus de 400 personnes. Désormais installée, on peut lui reprocher son absence sur le cloud. Une situation qui devrait évoluer très vite, comme l’explique Laurent Bride, son directeur technique.

Laurent Bride, CTO chez Talend
Laurent Bride, CTO chez Talend

Pouvez-vous retracer le parcours qui a amené Talend de l’intégration de données à l’intégration d’application?
Talend a été créée en 2006 en se positionnant sur l’intégration de données open source, avec une plate-forme d’administration Talend Administration Center intégrant tous les outils nécessaires aux entreprises. Il s’agissait de concurrencer des acteurs historiques installés.
Progressivement la plate-forme a été enrichie en connecteurs et en compte actuellement plus de 800. Nous proposons également l’Open Studio permettant de créer des jobs et des dataflows jouant le rôle d’ETL.
Puis progressivement nous avons évolué vers la gouvernance des données en proposant le Master data management (MDM), et des fonctions de qualité des données (Data Quality).
En 2010, nous avons racheté le spécialiste de l’intégration d’applications et du temps réel SOPERA [NDLR : pour 34 millions de dollars, voir notre article]. Il existait déjà une version open source de cet ESB, dont le projet avait été initié par la Deutsche Post.
Talend propose aujourd’hui une plate-forme unifiée d’intégration donnée d’intégration applicative et de MDM/qualité des données.

Talend s’adresse donc exclusivement aux développeurs et spécialistes des données?
Le client Studio de Talend a longtemps été orienté uniquement vers les développeurs ETL. Désormais, il s’adresse aussi aux opérationnels métiers (BusOps). Il s’agit par exemple d’un employé du marketing qui doit importer des données provenant de Marketo vers Salesforce, ou depuis une feuille Excel… il peut le réaliser selon un mapping assez simple, via les connecteurs intégrés. Bien entendu, nous proposons aussi des fonctions basiques pour définir des métadonnées dans la couche des connecteurs, ainsi qu’une prévisualisation « légère ».
Puis, il est également possible d’exposer ces données ou les résultats de ces traitements, avec des accès sécurisés, des outils d’administration, et des fonctions de supervision.

Sur votre feuille de route des six prochains mois, quelles évolutions majeures annoncez-vous? Enfin le cloud?
Aujourd’hui nous proposons effectivement nos solutions uniquement sur site. Pour le Studio, l’utilisateur a le choix entre le client lourd et le client léger Web (HTML basé sur Google Web Toolkit).
Il semble évident que l’informatique évolue vers un monde hybride conjuguant les diverses technologies cloud. C’est pourquoi nous annoncerons fin mars Talend Integration Cloud (TIC). Dans cette version 1.0, la solution sera proposée sous forme d’instance de containers, “à la manière des offres SaaS”. Et les connecteurs seront proposés en mode SaaS.
TIC sera donc une offre de type ETL as a service, intégrant également les fonctions de qualité des données. Plus précisément, il n’y aura pas de stockage des données (cible ou source, hors tampon intermédiaire), puisqu’il s’agira réellement de traitements d’extraction et de transformation.

Quid du Big Data et du cloud?
Mi 2015, nous ajouterons l’offre Big Data et la possibilité d’architecture hybride. L’entreprise pourra choisir l’offre sur site ou sur le cloud via Amazon Web Services. Et pour les entreprises ne souhaitant pas exposer les données résidant sur site, nous proposons également une passerelle de sécurité avec le déploiement de “smart agents” sur les systèmes.
Bien entendu il sera possible d’intégrer les applications sur cloud et sur site réciproquement.

Quelques détails sur les fonctions Big data?
Dans la première version (A1), les fonctions Big Data s’installeront sur les clusters de l’infrastructure du client.
Fin 2015, Talend Integration Cloud 2.0 proposera sur le cloud l’intégration en temps réel, l’API Gateway (exposition, gestion des accès, utilisation, etc.), et la Security Gateway.
La fonction Data as API permettra d’exposer les résultats des jobs en temps réel.
Nous avons choisi la technologie Spark, qui semble vraiment s’imposer comme le remplaçant à terme de MapReduce. Il est également plus simple à mettre en place est possible à superviser (Shell), contrairement à MapReduce qu’il faut commencer à faire tourner (et laisser s’exécuter) pour voir quelque chose.
La plate-forme Talend génère du code Java pouvant être exécuté partout nativement, y compris au-dessus d’Hadoop (Spark, Storm, MapReduce…). Et ce, sans nécessiter l’installation ni le déploiement du moteur Talend, comme c’est le cas avec des solutions de type Informatica.

A lire aussi :