La gouvernance des données est-elle soluble dans des plates-formes ?
La notion de plate-forme apparaît demeurer émergente sur le marché des solutions de gouvernance data & analytics. Sous cet angle, qui se distingue néanmoins ?

L'IT, une histoire de plates-formes ?
La notion s'est répandue ces derniers temps dans les analyses de Gartner, traduisant, du DevOps au stockage primaire, un mouvement vers des offres intégrées.
Le Magic Quadrant des solutions de gouvernance data & analytics ne fait pas exception. Mais le cabinet américain tempère : sur ce marché, les "plates-formes", telles qu'il les entrevoit, restent une "tendance émergente". Historiquement axés sur le data management (exécution des politiques de gouvernance) plus que sur la data stewardship (mise en place de ces politiques), les outils manquent encore de liant.
Dans ce contexte, Gartner a plutôt orienté son évaluation sur la "vision" des fournisseurs (compréhension du marché, stratégie produit, innovation...) que sur leur capacité de réponse à la demande ("exécution").
Pour figurer au Magic Quadrant, il fallait commercialiser une solution ciblant spécifiquement la gouvernance data & analytics. Et s'adressant à au moins 5 profils d'utilisateurs parmi :
Lire aussi : La GenAI s'affirme dans les stratégies data
- Data steward
- Data architect
- Data quality analyst
- Data engineer
- Admin base de données
- Analytste intégration data
- Data scientist
- Data analyst
- Analyste BI
- Utilisateur "citoyen" (= autres fonctions, ne relevant pas de la technologie)
Entre autres critères, il fallait permettre de greffer de l'IA/ML ou de l'analyse de graphe ou de métadonnées à au moins 5 composantes fonctionnelles jugées standards. Parmi elles :
- Gestion des accès
- Métadonnées actives
- Glossaire métier
- Intégrations pour import/export de métadonnées
- Catalogue de données
- Classification de données
- Dictionnaire de données
- Data lineage
- Gestion des modèles
- Orchestration/automatisation
- Profilage de jeux de données
- Gestion des tags
- Gestion des tâches
- Gestion des workflows
L'observabilité des données (supervision continue des incidents) était facultative.
16 fournisseurs, 3 "leaders"
Sur l'axe "exécution", les fournisseurs classés au Magic Quadrant des plates-formes de gouvernance data & analytics se positionnent ainsi :
Rang | Fournisseur |
1 | Informatica |
2 | IBM |
3 | Collibra |
4 | Precisely |
5 | Atlan |
6 | Alation |
7 | Alex Solutions |
8 | Ataccama |
9 | DataGalaxy |
10 | erwin by Quest |
11 | data.world |
12 | OvalEdge |
13 | Ab Initio |
14 | Solidatus |
15 | Arjana Data |
16 | Global Data Excellence |
Sur l'axe "vision"
Rang | Fournisseur |
1 | Informatica |
2 | IBM |
3 | Collibra |
4 | Atlan |
5 | Alation |
6 | data.world |
7 | Alex Solutions |
8 | Ataccama |
9 | erwin by Quest |
10 | DataGalaxy |
11 | OvalEdge |
12 | Precisely |
13 | Ab Initio |
14 | Solidatus |
15 | Arjana Data |
16 | Global Data Excellence |
Microsoft est absent du classement, faute d'une offre en disponibilité générale au moment où Gartner a arrêté ses relevés (Purview attint ce stade le 1er septembre 2024, soit trois mois après la date butoir).
Trois fournisseurs sont suffisamment avancés sur les deux axes pour figurer dans le carré des "leaders" :
- Collibra, par ailleurs classé chez les "acteurs de niche" dans le dernier Magic Quadrant de la data quality (mars 2024)
- IBM, "leader" dans ce même Magic Quadrant de la data quality comme dans celui de l'intégration de données (décembre 2024)
- Informatica, lui aussi "leader" dans l'un et l'autre*
Chez Collibra, vigilance sur la documentation
Principale offre de l'entreprise belge sur ce marché, Collibra Data Intelligence Platform est disponible en tant que service managé sur AWS et Google Cloud. On peut lui coupler la solution on-prem Collibra Data Quality & Observability.
Outre sa viabilité (croissance annuelle de 15 % pour le CA et de 37 % pour la base client), Collibra a pour lui une "vision forte" de la gouvernance de bout en bout, y compris pour l'IA. Gartner apprécie sa capacité à couvrir une diversité de politiques data ainsi que l'ampleur de son réseau de partenaires et de ses intégrations natives.
Le cabinet américain apprécie moins que l'observabilité et la data quality fassent l'objet d'un module séparé - lequel suppose une licence et des travaux d'intégration supplémentaires. Autre point de vigilance : les compétences nécessaires à l'utilisation du concepteur de workflows et une documentation pas toujours claire voire, parfois, qui ne suit pas le rythme des mises à jour (mensuelles).
Un point d'interrogation pour les clients sur site d'IBM...
La plate-forme de gouvernance data & analytics d'IBM s'étend à travers le Cloud Pak for Data et l'offre watsonx.
Big Blue se distingue sur le volet innovation (ajout de "technologies émergentes clés", notamment dans la gouvernance des modèles d'IA et l'exécution temps réel des règles de data quality). Même chose sur sa stratégie d'offre (architecture data fabric commune entre ses solutions, favorisant un déploiement flexible sur OpenShift). Ainsi que sur le packaging (amélioration sur la base de profils d'utilisateurs + nouveaux bundles en entrée de gamme).
On n'en dira pas autant du fait que l'offre est diluée entre des produits issus pour certains d'acquisitions (Databand, Manta) ou de plug-in (DataStage). Gartner s'interroge aussi sur les conditions de migration pour les nombreux clients qui utilisent encore la solution sur site InfoSphere Information Server. Il note par ailleurs que certains prospects trouvent la solution complexe et chère.
... et d'Informatica
Proposé en SaaS sur AWS, Azure, Google Cloud et OCI, Informatica Cloud Data Governance and Catalog fait partie de la suite IDMC (Intelligent Data Management Cloud).
Au-delà de sa capacité à s'adapter aux évolutions du marché et à coordonner son positionnement commercial/marketing en conséquence, Informatica a pour lui un large écosystème qui accroît tant son expertise que son support sectoriel. Gartner le crédite également d'un bon point pour l'assistant CLAIRE GPT qui complète son offre de data management et pour le plug-in CLAIRE AI axé sur l'automatisation des tâches côté tech.
En miroir d'un investissement limité sur ses produits on-prem (comme Axon et Data Catalog), Informatica a du retard sur la concurrence dans la prise en charge des modèles hybrides. Gartner relève aussi qu'il ne propose pas de migration en self-service des catalogues et des métadonnées depuis les outils legacy. Attention également au modèle économique, qui impose de prévoir l'usage (les unités de consommation ne peuvent être reportées d'une année sur l'autre).
* Ataccama figure aussi parmi les "leaders" dans le Magic Quadrant de la data quality (Precisely étant "challenger"). Ab Initio Software l'est dans celui de l'intgégration de données (Precisely figurant chez les "acteurs de niche").
Illustration principale © TensorSpark - Adobe Stock
Sur le même thème
Voir tous les articles Data & IA