Qualité des données : qui se distingue dans le mouvement d’automatisation ?

qualité des données Magic Quadrant 2022

Qui sont les têtes d’affiche dans la gestion de la qualité des données et comment se caractérisent les offres référentes ? Éléments de réponse sur la base du Magic Quadrant.

Attention au pricing quand on recherche des solutions de gestion de la qualité des données ? L’an dernier, cet aspect avait valu un mauvais point à quatre des sept « leaders » du Magic Quadrant dédié à ce segment de marché. Nommément, Ataccama, IBM, Informatica et Talend.

Cette année, on prend les mêmes et on recommence. Il n’y a certes plus que six « leaders » (Precisely a rétrogradé dans le carré des « visionnaires »), mais ce sont toujours les mêmes que Gartner pointe sur le sujet des prix.

Chez Ataccama, la question de la transition vers le modèle de l’abonnement suscitait des craintes en 2021. Le processus achevé, voilà que Gartner s’inquiète, au contraire ou presque, pour les licences perpétuelles, devenues l’exception chez le fournisseur américain.

Critiqué l’an dernier pour l’articulation des licences entre ses produits, IBM l’est toujours cette année. Avec, en prime, le constat de prix « relativement élevés » qui ont tendance à éloigner le mid-market.

Concernant Informatica, le discours a évolué. En 2021, le point noir était le packaging de l’offre, nécessitant d’assembler de nombreux modules. En 2022, c’est le pricing on-prem et l’interrogation sur la capacité à maintenir les conditions contractuelles lors des migrations vers le cloud.

Pointé l’an dernier pour le peu de modularité de son offre Data Fabric, Talend a droit à la même remarque cette année. La facturation, par utilisateur, se fait pour l’ensemble du produit, même lorsqu’on ne souhaiterait utiliser que les briques data quality.

Qualité des données : des produits tous publics…

D’une année sur l’autre, les critères pour figurer au Quadrant n’ont quasiment pas évolué. Sur la partie fonctionnelle, par exemple, il fallait toujours, entre autres, des capacités de profilage, de visualisation, de création de règles (et de validation sur leur base), de décomposition, de standardisation, de nettoyage et de rapprochement. Le tout à la fois en mode planifié et interactif, dans au moins deux langues, sur site et en cloud.

Autre exigence, déjà d’actualité l’an dernier : toucher au moins quatre métiers des données parmi l’architecte, l’ingénieur, le data scientist, l’analyste (BI, intégration, qualité des données), le coordinateur et l’utilisateur casual.

Gartner juge les offreurs sur deux axes. L’un prospectif (« vision »), centré sur les stratégies (sectorielle, géographique, commerciale, marketing, produit…). L’autre centré sur la capacité à répondre effectivement à la demande (« exécution » : expérience client, performance avant-vente, qualité des produits/services…).

Sur l’axe « vision », les fournisseurs classés au Quadrant se placent dans cet ordre :

  Fournisseur
1 IBM
2 Informatica
3 SAP
4 Ataccama
5 Talend
6 TIBCO Software
7 SAS
8 Precisely
9 Syniti
10 Collibra
11 Experian
12 MiOsoft
13 Redpoint
14 Innovative Systems
15 Datactics
16 Melissa

Sur l’axe « exécution » :

  Fournisseur
1 Informatica
2 IBM
3 SAP
4 Talend
5 Experian
6 SAS
7 Ataccama
8 Innovative Systems
9 Redpoint
10 Collibra
11 Precisely
12 Syniti
13 TIBCO Software
14 MiOsoft
15 Datactics
16 Melissa

… et tout automatisés ?

Portée par les métadonnées, les graphes et le machine learning, l’automatisation reste une tendance émergente dans les solutions de gestion de la qualité des données, estime Gartner.

Ataccama fait partie des fournisseurs crédités d’un bon point dans le domaine. Entre autres pour son moteur de création de règles et sa détection d’anomalies dans les séries temporelles.

IBM se distingue aussi sur la création automatisée de règles. Ainsi que par la disponibilité d’un catalogue « prêt à l’emploi » limitant les besoins de configuration.

Toujours en matière d’automatisation, mêmes points positifs pour Informatica que pour Ataccama. À ceci près qu’ils valent pour la détection d’anomalies dans son ensemble. Et, concernant les règles, également pour la capacité à les réutiliser sur plusieurs briques du produit phare de l’éditeur.

Chez SAS, l’IA a contribué à améliorer plusieurs compartiments, dont l’étiquetage de données, l’analyse de texte et l’assignation sémantique. Chez Talend, elle a amélioré la décomposition, le nettoyage et le rapprochement. Tout en introduisant des modèles « explicables » et personnalisables.

Photo d’illustration © Vitalii Vodolazskyi – Adobe Stock