Big Data : Azure Data Factory de Microsoft pleinement opérationnel

Microsoft a annoncé la disponibilité d’Azure Data Factory, un service Cloud pour l’intégration des données. Cette solution permet d’agréger des données issues de sources multiples pour les analyser plus tard.

Azure Data Factory (ADF) sort donc de son statut de preview (depuis octobre 2014) pour être disponible officiellement sur le Cloud de Microsoft. ADF se définit comme un service Cloud d’intégration de données qui a pour vocation à orchestrer et automatiser la collecte et la transformation des informations. Cette solution est une des composantes de la brique analytique en mode Cloud élaborée par Microsoft. Cette brique comprend Azure Data Catalog, Azure Machine Learning, HDInsight, Power BI et Azure Stream Analytics.

Dans un blog, Joseph Sirosh, vice-président de la gestion de l’information et du machine learning chez Microsoft, explique qu’« avec ADF, les services de traitements de données existants peuvent constituer des pipelines de données qui sont hautement disponibles et pilotables dans le Cloud ». Il ajoute que « ces pipelines de données peuvent être prévus pour collecter, préparer, transformer, analyser et publier des données. ADF est capable de gérer et orchestrer toutes les données et les traitements complexes sans intervention humaine. Les solutions peuvent être construites et déployées rapidement dans le Cloud. Elles peuvent se connecter à un nombre croissant de sources de données aussi bien en on-premise ou dans le Cloud ».

Un composant de Cortana Analytics Suite

Ces derniers temps, Microsoft avait focalisé l’attention sur l’assistant vocal Cortana et plus particulièrement sur l’offre Cortana Analytics Suite. On sait peu de chose sur cette dernière, sinon qu’il y a un soupçon de Business Intelligence, une bonne dose de machine learning… et la possibilité de formuler des requêtes en langage naturel, à la voix ou au clavier. Le lancement est prévu à l’automne – avec un atelier découverte les 10 et 11 septembre prochains à Redmond, au siège social de l’éditeur – pour cette offre cloud de big data analytique qui regroupe plusieurs services Azure déjà commercialisés ou accessibles en préversion. ADF est donc une composante de Cortana Analytics Suite.

Sur le front de la concurrence, ADF trouve devant lui des offres de Talend ou Informatica. Par ailleurs, les autres fournisseurs de Cloud dispose d’outils pour l’intégration de données. AWS propose Pipeline Data et l’on trouve DataFlow du côté de Google.

A lire aussi :

MapR adapte sa distribution Hadoop à Spark et Azure
Azure Data Lake, du stockage Hadoop sur le Cloud de Microsoft

Crédit Photo : agsandrew- Shutterstock