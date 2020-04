Want create site? Find Free WordPress Themes and plugins.

Le fournisseur franco-américain de solutions Talend a confirmé consolider l’intégration de son offre avec celle de Databricks, la société fondée par des créateurs d’Apache Spark, moteur de traitement de données massives.

Depuis la version Winter’20 de la plateforme d’intégration de données (iPaaS) Talend Data Fabric sortie en février dernier, Talend prend officiellement en charge Delta Lake.

Cette solution de gestion du cycle de vie des lacs de données (datalakes) est devenue en 2019 un projet open source porté par la Fondation Linux, à l’initiative de Databricks.

Alimenter le machine learning

« Le support de Delta Lake combiné aux capacités d’intégration et d’intégrité de Talend Data Fabric permet une acquisition rapide et un traitement optimal de données fiables et de haute qualité pour les utilisateurs de Databricks », a souligné Talend dans un communiqué.

Il s’agit, selon le fournisseur, « d’alimenter les projets de machine learning » et d’analyses avancées en mettant rapidement à disposition des clients les données nécessaires.

En plus du support étendu de Delta Lake, Talend Data Fabric (depuis la v. Winter’20) prend en charge Apache Spark 2.4 et Databricks Runtime 5.5 LTS (long term support). Côté Cloud, Talend est intégré aux plateformes Azure Databricks et Databricks pour AWS.

Enfin, Talend a rappelé que l’outil d’acquisition de données Stitch Data Loader est désormais intégré au programme partenaires Data Ingestion Network de Databricks.

(crédit photo © shutterstock)