Recherche

Intégration de données : quand les CSP reconfigurent le marché

Le mouvement vers les fournisseurs cloud contribue à réduire la concentration du marché des solutions d'intégration de données. Qui s'y distingue ?

Publié par Clément Bohic le - mis à jour à
Lecture
10 min
  • Imprimer
Intégration de données : quand les CSP reconfigurent le marché
© alphaspirit - Shutterstock

Les CSP, incontournables pour l'intégration de données ?

Leurs solutions deviennent en tout cas plus visibles à la faveur des migrations cloud. En parallèle, la concentration du marché se réduit : les cinq principaux fournisseurs en détiennent 53 %, contre 71 % en 2017, fait remarquer Gartner. Et Informatica, quoique toujours en pole position dans le Magic Quadrant de l'intégration de données, voit sa part de marché diminuer.

AWS est un emblème de la progression des CSP sur ce segment. Positionné l'an dernier parmi les "challengers", le groupe américain est cette fois chez les "leaders". Il y rejoint Ab Initio Software, Denodo, IBM, Informatica, Microsoft, Oracle, Qlik et SAP.

Vingt fournisseurs, neuf "leaders"

Gartner mène son évaluation sur deux axes. L'un prospectif ("vision"), centré sur les stratégies (sectorielle, géographique, commerciale, marketing, produit...). L'autre porté sur la capacité à répondre effectivement à la demande ("exécution" : expérience client, performance avant-vente, qualité des produits/services...).

La situation sur l'axe "exécution" :

RangFournisseurÉvolution annuelle
1Informatica=
2Microsoft+1
3Oracle-1
4AWS+2
5Ab Initio Software+10
6Qlik-1
7IBM-3
8Google=
9Denodo-2
10Fivetran+1
11Matillion+2
12Confluent+6
13SAP-1
14Palantir+2
15SnapLogic+2
16Precisely-2
17Safe Software+2
18CDatanouvel entrant
19K2view+1
20TIBCO-10

Sur l'axe "vision" :

RangFournisseurÉvolution annuelle
1Informatica=
2Oracle=
3IBM=
4Microsoft+1
5Ab Initio Software+3
6Palantir=
7SnapLogic=
8Qlik+4
9Denodo+1
10SAP-1
11Google+2
12K2view-1
13AWS+1
14Confluent+3
15Matillion+1
16Safe Software+2
17Fivetran+2
18TIBCO-3
19CDatanouvel entrant
20Precisely+1

Ab Initio et sa "courbe d'apprentissage"

Gartner salue la capacité d'Ab Initio à gérer des cas d'usages complexes de gestion des données dans les grandes entreprises. Bon point également pour l'expérience client, portée par une approche de relation en direct. Et pour l'exploitation d'un graphe de connaissances - modelé à renfort de LLM - qui facilite la connexion des indicateurs business aux modèles physiques de données.

Le paramétrage et la mise à niveau des solutions d'Ab Initio peut être chronophage, et la courbe d'apprentissage pour les équipes techniques est importante. La clientèle a par ailleurs tendance à trouver les prix élevés et la gestion des accords de licence, difficile. Gartner note aussi une faible pénétration sur les usages "simples" (type ETL autonome).

D'Apache Iceberg à Spark, les marges de progression d'AWS

Du "zero-ETL" entre S3, Redshift et Aurora à la connexion Glue-SageMaker pour l'inférence en passant par DataZone pour la gestion des métadonnées, AWS se distingue sur la notion d'écosystème. Idem sur le support de multiples profils d'utilisateurs (Glue associe notebooks, GUI, interface tableur et NLP avec Amazon Q). Et sur l'architecture serverless, que la clientèle accueille favorablement, en particulier pour l'efficacer de l'autoscaling.

AWS Glue peut néanmoins présenter des coûts élevés, surtout sur de gros volumes de données. En outre, bien qu'il puisse se connecter à des bases de données externes, il ne propose pas le niveau d'intégration des pure players - et n'est pas déployable sur d'autres cloud publics. Gartner souligne aussi la complexité d'usage sur les avancés de data engineering exigeant du code. AWS a une marge de progression entre autres sur l'intégration avec Apache Iceberg et la gestion des jobs Spark.

Les déploiements distribués, un défi avec Denodo

Denodo a pour lui la notoriété de sa marque sur la partie virtualisation de donénes. Il se distingue aussi par le niveau d'extension de son réseau de partenaires. Et par sa croissance "nettement supérieure" à celle du marché. Bon point également pour l'expérience client, en premier lieu sur la partie fonctionnelle.

Les produits de Denodo sont, en revanche, rarement utilisés pour les intégrations de type bulk/batch ou réplication. Surtout en présence de SLA de performance. Gartner évoque aussi un défi d'optimisation et de maintenance sur les déploiements distribués. Ainsi que l'absence d'accélérateurs ou de modèles sectoriels.

Google et son offre encore fragmentée

Google se distingue par le niveau d'intégration de Gemini dans son offre, de la génération de pipelines à la migration de données. Gartner salue aussi ses capacités de gouvernance à l'échelle (découverte automatique, lineage, exploitation des métadonnées...). Ainsi que des produits plus faciles à utiliser que la moyenne pour les data engineers (et assortis d'une documentation exhaustive).

Vigilance pour qui n'est pas pleinement engagé dans l'écosystème de Google : son offre d'intégration de données est largement axée sur ses services. Attention aussi au manque d'unification du portefeuille : qui souhaite plusieurs modes d'intégration (bulk/batch, réplication, streaming...) aura potentiellement besoin de plusieurs outils.

Chez IBM, des points d'interrogation sur le Cloud Pak for Data

De la gestion des déploiements hybrides à l'exploitation des métadonnées actives en passant par la mise à contribution de l'IA watsonx, IBM se distingue pour sa "vision". L'étendue de sa présence géographique et de son réseau de partenaires lui vaut aussi un bon point. Comme l'acquisition de StreamSets, qui a amélioré la capacité à gérer les pipelines complexes en environnements multicloud.

À cas d'usage comparables, IBM est plus cher que ses concurrents. La mise en action de la scalabilité et des capacités de gouvernance peut impliquer un paramétrage complet. Gartner relève aussi un manque de clarte sur la portabilité des licences DataStage et sur les bonnes pratiques associées à la migration vers le Cloud Pak for Data.

Informatica et les incertitudes du modèle à l'usage

Salué l'an dernier, le moteur IA CLAIRE d'Informatica l'est à nouveau. La vision data fabric d'Informatica l'est aussi. Tout comme "la vision et la compréhension claires" des besoins de préparation des données pour l'IA (catalogage et classification automatiques, chunking et embedding du non structuré). Au global, l'offre est mature (variété des connecteurs, des cas d'usage couverts et des styles d'intégration de données).

Comme sus-évoqué, la percée des CSP, entre autres, est un "défi" à la croissance d'Informatica. Par ailleurs, une grande partie de la clientèle est encore sur l'offre PowerCenter et la migration vers IDMC peut se révéler chère comme chronophage. En outre, la tarification à l'usage peut ne pas s'avérer avantageuse pour qui n'utiliserait que partiellement le produit. Et pour les autres, prédire l'usage reste délicat.

Microsoft, pas le plus adapté aux déploiements hybrides

Depuis son lancement commercial il y a un an, Microsoft Fabric a fait l'objet d'une adoption significative, autant par des clients nouveaux qu'existants. Comme chez AWS, le niveau d'intégration avec le reste du cloud Azure (OneLake, Power BI...) est notable. L'injection des capacités de Copilot l'est aussi, comme leur niveau d'intégration dans l'UI.

L'approche essentiellement Microsoft-centric n'est pas la plus adaptée aux déploiements hybrides/multicloud. Les capacités de réplication et de virtualisation des données manquant encore de maturité, l'offre a tendance à être envisagée pour des scénarios simples. Et les utilisateurs expriment une satisfaction relativement faible pour ce qui est du support.

Oracle, toujours perçu comme cher

Oracle a pour lui une approche "agnostique", OCI jouant le rôle de hub entre CSP (partage de métadonnées, FinOps...). Autre bon point : le niveau de prise en charge des scénarios complexes, dont l'intégration en environnement hybride. Gartner y ajoute les capacités de réplication et de streaming de l'outil GoldenGate.

Oracle tend à apparaître moins fréquemment dans les shortlists que les autres acteurs de ce marché. En dépit de son catalogue de connecteurs, il est plus souvent envisagé lorsque ses bases de données sont la source ou la destination des intégrations. Ses solutions restent par ailleurs perçues comme chères.

Qlik peut mieux faire sur la virtualisation des données

La robustesse des briques réplication et préparation de données vaut un bon point à Qlik. Même chose pour son catalogue de connecteurs. Et pour la partie gouvernance, renforcée par l'acquisition de Talend.

Cette acquisition a potentiellement pesé sur la R&D, qui a ralenti, constate Gartner. En parallèle, la clientèle Talend a vu les prix augmenter, avec un manque de communication à ce sujet. Qlik peut aussi gagner en maturité sur la virtualisation des données.

SAP, envisagé surtout par ses clients

Bon point pour SAP : ses connecteurs qui évitent de répliquer la logique métier depuis les systèmes sources. Gartner apprécie aussi la vision unifiée qu'incarne l'offre Datasphere. Il salue également les capacités de gestion des métadonnées et de gouvernance.

L'approche SAP-centric fait que l'éditeur n'est généralement pas envisagé par qui n'est déjà pas son client sur d'autres segments. Gartner note aussi des incertitudes autant sur la roadmap que sur le cycle de vie des composants Data Services et Data Intelligence Cloud. Ainsi qu'un retard sur les autres "leaders" sur la mise en oeuvre de l'IA, encore embryonnaire.

Illustration © alphaspirit - Shutterstock

Sur le même thème

Voir tous les articles Data & IA

Livres Blancs #security

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

Voir tous les événements

S'abonner
au magazine
Se connecter
Retour haut de page