Intégration de données : du data mesh à la data fabric, les fournisseurs qui se distinguent

Magic Quadrant 2023 intégration données

Le dernier Magic Quadrant de l’intégration de données illustre la densité de l’offre sur ce marché. Qui s’y distingue et à quels titres ?

Pas de bon outil d’intégration de données sans exploitation des métadonnées actives ? Gartner a en tout cas « nettement » pris en compte cette dimension pour élaborer son dernier Magic Quadrant consacré à ce segment de marché.

Le cabinet américain a aussi tenu compte de la capacité à supporter le modèle data mesh… et à l’équilibrer avec l’approche centralisée de la data fabric. Il a également inclus, dans son évaluation, l’aspect DataOps, reflet de la demande de « portabilité » des pipelines.

Pour prétendre figurer au Quadrant, les fournisseurs devaient aussi, entre autres, avoir intégré une logique FinOps (capacité à suivre et à prédire le coût des workloads d’intégration). Airbyte ne respectait pas ce critère ; ni, d’ailleurs, celui de la prise en charge des métadonnées actives. L’entreprise américaine bénéficie toutefois d’une « mention honorable ».

Neuf autres entreprises sont dans ce cas. Il est rare que Gartner en décerne autant, et cela reflète la densité du marché. Le Quadrant lui-même l’illustre : on dépasse la limite théorique des 20 fournisseurs classés.

La « vision » de Microsoft, la « capacité d’exécution d’AWS »

Gartner juge les offreurs sur deux axes. L’un prospectif (« vision »), centré sur les stratégies (sectorielle, géographique, commerciale, marketing, produit…). L’autre centré sur la capacité à répondre effectivement à la demande (« exécution » : expérience client, performance avant-vente, qualité des produits/services…).

Sur l’axe « vision », la situation est la suivante :

Fournisseur Évolution 2022-2023
1 Informatica =
2 Oracle =
3 IBM =
4 Qlik (Talend) + 1
5 Microsoft + 4
6 Palantir – 1
7 SnapLogic =
8 Ab Initio Software =
9 SAP – 3
10 Denodo – 2
11 K2view =
12 Qlik =
13 Google =
14 AWS =
15 TIBCO Software – 5
16 Matillion – 1
17 Confluent =
18 Safe Software + 2
19 Fivetran – 3
20 Software AG (StreamSets) – 3
21 Precisely – 8

Sur l’axe « exécution » :

Fournisseur Évolution 2022-2023
1 Informatica =
2 Oracle =
3 Microsoft + 1
4 IBM – 1
5 Qlik + 1
6 AWS + 6
7 Denodo + 1
8 Google =
9 Qlik (Talend) – 2
10 TIBCO Software – 1
11 Fivetran + 3
12 SAP – 7
13 Matillion + 2
14 Precisely – 4
15 Ab Initio Software =
16 Palantir – 3
17 SnapLogic – 1
18 Confluent =
19 Safe Software – 1
20 K2view + 1
21 Software AG (StreamSets) – 4

 

En croisant les deux axes, 9 fournisseurs se trouvent dans le carré des « leaders ». Nommément, Ab Initio Software, Denodo, IBM, Informatica, Microsoft, Oracle, Qlik, SAP et Talend. Les offres de Qlik et Talend restent différenciées au sein de ce Quadrant, Gartner ayant arrêté ses relevés au 30 avril 2023, soit deux semaines avant que le premier boucle l’acquisition du second.

Microsoft est celui qui gagne le plus grand nombre de places sur l’axe « vision ». AWS, sur l’axe « exécution ».

Ab Initio : approche « disruptive », tarification complexe

Nouvel entrant au Quadrant, Ab Initio fait partie des fournisseurs dont l’offre se distingue positivement sur la question des métadonnées actives. Gartner salue aussi, d’une part, la capacité à combiner les styles d’intégration (par lots, réplication, virtualisation ou orienté événements). De l’autre, une approche « disruptive » axée sur les cas d’usage complexes, à renfort de PoC détaillés.

Revers de la médaille, les « petits » déploiements ne sont pas le focus d’Ab Initio. Ses modules (intégration de données, gestion des métadonnées, gouvernance), bien que disponibles de manière individuelle, sont d’ailleurs souvent achetés ensemble. Autres points vigilance : une documentation et un partage des bonnes pratiques à améliorer, mais aussi la complexité de la tarification, fondé sur une unité spécifique de compute.

Denodo : vigilance sur déploiement et gestion

Denodo a pour lui un haut niveau de satisfaction client. Les capacités de son offre en matière de virtualisation lui valent aussi un bon point. Même chose pour la prise en charge des architectures multiclouds/hybrides (recommandations de distribution des workloads pour améliorer coûts et performances).

L’appréciation n’est pas aussi positives sur la prise en charge de l’IA, qui en est « à ses débuts ». L’offre de Denodo manque plus globalement de certaines capacités, dont la capture de données modifiées fondée sur les logs. Gartner souligne aussi, chez certains clients, des soucis de déploiement et de gestion, y compris en cas de mise à jour.

IBM salué sur la data fabric, moins sur l’exploitation

Le Cloud Pak for Data vaut à IBM un bon point en matière de modularité… et d’ouverture, avec l’introduction de composants open source comme Airflow et Kafka. Gartner signale aussi ses avancées sur l’optimisation des workloads avec le moteur DataStage. Ainsi que sur l’approche data fabric (par exemple, avec la redescente de notifications aux applications en cas de dérivé de schéma).

Les solutions d’IBM représentent un certain défi d’exploitation : beaucoup de paramétrage initial… et, globalement, une courbe d’apprentissage. Elles restent en outre perçues comme chères et leur adoption est souvent le fruit d’une clientèle existante – en tout cas pour le Cloud Pak. La migration vers celui-ci depuis les projets DataStagr est un autre point à surveiller (manque de clarté sur la portabilité des licences et sur la roadmap, surtout lorsque les data stores cibles changent durant la migration).

Informatica, entre « vision forte » et manque de cohérence

Informatica se distingue lui aussi sur l’approche data fabric, avec son moteur d’apprentissage automatique CLAIRE. Gartner apprécie aussi sa « vision forte » des écossytèmes de données, incarnée par un large portefeuille de services de data management. Ains que son modèle économique à la consommation, impliquant des IPU utilisables sur ses principales lignes de produits.

Le support et la maintenance ne satisfont pas tous les clients. Certains rapportent un manque de cohérence. D’autres, de longs cycles de correction ou une documentation insuffisante des problèmes connus. Attention aussi au manque de visibilité sur les migrations de l’offre PowerCenter vers IDMC Cloud Data Integration.

Microsoft peut progresser sur les architectures hybrides

Microsoft se distingue par sa vision « de bout en bout » du data management, associant OneLake, Data Factory, Azure Synapse et Power BI. L’intégration avec l’écosystème Azure réduit par ailleurs la complexité et améliore l’interopérabilité. Bon point également pour la capacité à toucher à la fois les populations techniques et métiers.

En matière de gestion des métadonnées, l’offre de Microsoft manque de capacités. Purview, en particulier, s’intègre mal avec les composantes Fabric et Azure Data Factory. La gestion des architectures hybrides est un axe de progression (difficile de déterminer le placement optimal des workloads). La gestion des cas d’usage complexes en est un autre (ADF, par exemple, manque de capacités pour l’automatisation de data warehouses).

Oracle : les capacités de GoldenGate… et son manque de notoriété

Au-delà de la clarté des roadmaps cloud et on-prem d’Oracle, Gartner apprécie les capacités de réplication basse latence de l’offre GoldenGate (API de capture multithreadée, déploiements en périphérie, architecture en microservices). C’est positif également sur les aspects data fabric et data mesh.

GoldenGate manque encore de notoriété au-delà de l’univers des bases de données Oracle. L’offre du groupe américain reste globalement perçue comme onéreuse, malgré le lancement d’une version gratuite de GoldenGate. Les clients ont aussi tendance à demander de meilleures ressources de documentation et de formation aux produits.

Qlik distingué sur la GenAI ; pas sur la virtualisation

L’offre de Qlik se distingue sur la partie réplication, en particulier pour l’expérience utilisateur. Les briques IA sont un autre point de satisfaction, entre la brique de conception de pipelines, la gestion automatisée des dérives de schéma et les investissements en GenAI pour la préparation de données. L’acquisition de Talend ouvre par ailleurs des pistes de développement.

Cette acquisition a pour le moment un revers : une roadmap d’intégration peu claire, estime Gartner. Qui souligne aussi le manque de focus sur l’intégration des données d’exploitation. Et la prise en charge limitée de la virtualisation de données (pas de création de data hubs ou de data marts, entre autres ; pas non plus d’optimisation dynamique des requêtes).

SAP au rendez-vous… dans son écosystème

SAP aussi a droit à des bons points sur l’approche data fabric (à travers son offre Datasphere) et la gestion des métadonnées lui en vaut un autre. L’éditeur allemand a aussi une capacité sans égale à couvrir… son propre écosystème (beaucoup de clients S4/HANA optent d’ailleurs pour les solutions d’intégration de données de SAP).

L’intégration de sources hors de l’écosystème SAP reste, au contraire, un problème ; y compris au niveau du licensing. Sur ce point, Gartner relève des coûts élevés et des prix difficiles à interpréter. S’y ajoute une innovation limitée sur les produits historiques (les investissements se concentrent sur Data Intelligence et Datasphere).

Talend : une richesse fonctionnelle, mais peu d’innovation

Talend a pour lui la profondeur de son portefeuille : richesse de la composante DataOps, prise en charge de tous les principaux types d’intégration, couverture des différentes populations d’utilisateurs, etc. Gartner salue aussi ses briques de gouvernance et de qualité des données, ainsi que la réplication temps réel.

Outre les inquiétudes que peut engendrer l’acquisition par Qlik, Talend n’a pas livré de fonctionnalités « différenciantes » en 2022. Et sa roadmap n’en prévoit pas, considère Gartner. Qui mentionne aussi des défis liés au support (temps de réponse, difficulté à comprendre quels canaux utiliser).

Illustration © alphaspirit – Shutterstock