DSML : prédictif et génératif, une association à concrétiser
Gartner appelle à surveiller le mariage du prédictif et du génératif au sein des plates-formes DSML. Aperçu du paysage concurrentiel.

Dans le brouhaha de la GenAI, attention à ne pas perdre de vue l'aspect décisionnel.
L'an dernier, Gartner avait soulevé ce point dans son Magic Quadrant des plates-formes DSML (data science & machine learning). Il ne le fait pas en tant que tel cette année, mais souligne qu'un des fournisseurs classés parmi les "leaders" a su trouver l'équilibre. En l'occurrence, Dataiku.
SAS n'est plus "leader", IBM le devient
Ils sont 7 autres à figurer dans le carré des "leaders". Nommément, Altair, AWS, Databricks, DataRobot, Google, Microsoft... et IBM, nouvel entrant.
Big Blue était effectivement classé "challenger" en 2024. En un an, il a progressé sur l'axe "vision" du Magic Quadrant, axé sur les stratégies (sectorielles, géographiques, commerciales, marketing, produit...).
À l'inverse, SAS quitte le cercle des "leaders". Il rétrograde chez les "visionnaires", en conséquence d'un recul sur l'axe "exécution", qui reflète la capacité à répondreà la demande (expérience client, performance avant-vente, qualité des produits/services...).
Sur l'axe "exécution", la situation est la suivante :
Rang | Fournisseur | Évolution annuelle |
1 | Databricks | = |
2 | AWS | +2 |
3 | = | |
4 | Microsoft | -2 |
5 | Dataiku | = |
6 | DataRobot | +4 |
7 | IBM | = |
8 | Altair | -2 |
9 | Alibaba Cloud | -1 |
10 | SAS | -1 |
11 | Snowflake | nouvel entrant |
12 | Domino Data Lab | +1 |
13 | Cloudera | -1 |
14 | Alteryx | +1 |
15 | H2O.ai | -4 |
16 | MathWorks | = |
Sur l'axe "vision" :
Rang | Fournisseur | Évolution annuelle |
1 | Databricks | +3 |
2 | Dataiku | -1 |
3 | -1 | |
4 | Microsoft | -1 |
5 | Altair | +4 |
6 | AWS | +2 |
7 | DataRobot | -1 |
8 | H2O.ai | -3 |
9 | Snowflake | nouvel entrant |
10 | Domino Data Lab | = |
11 | IBM | +1 |
12 | Cloudera | -1 |
13 | SAS | -6 |
14 | Alibaba Cloud | = |
15 | Alteryx | = |
16 | MathWorks | -3 |
Des opportunités dans la combinaison prédictif-génératif
L'an dernier, Gartner avait insisté sur la complémentarité entre plates-formes. Difficile de faire avec une seule dans un contexte de décentralisation des activités de data science, avait expliqué le cabinet américain.
Il n'en dit pas moins cette année... et insiste sur les passerelles qui se sont créées entre fournisseurs. Il constate, en parallèle, une tendance croissante à cibler des profils d'utilisateurs alignés sur des BU et des domaines fonctionnels. AutoML reste, dans ce cadre, une composante essentielle, désormais complétée par des assistants GenAI. En toile de fond, des opportunités de différenciation pour les vendeurs, dans la manière dont ils combinent prédictif et génératif.
Sur le volet fonctionnel, il fallait, dans les grandes lignes, fournir les briques suivantes :
- Importation ou connexion de données tabulaires
- Préparation de données
- Environnement de développement pro-code
- Création, évaluation et déploiement de modèles + gestion de leur cycle de vie
- Collaboration et gestion de projets
- Administration des rôles, des permissions et de l'allocation de ressources
Le catalogage, le data lineage et le support des GPU étaient optionnels. Idem, entre autres, pour la prise en charge des outils et process MLOps, la fourniture d'une interface de développement low code et les techniques accroissant la transparence des modèles.
Altair absorbé par Siemens : et maintenant ?
L'an dernier, Gartner avait salué la flexibilité du modèle économique d'Altair, basé sur des unités consommables à travers l'ensemble de sa gamme. Il lui avait aussi accordé un bon point pour sa compréhension du marché - dont témoignait la mesure de réussite à l'aune des déploiements achevés plutôt qu'à l'usage de la plate-forme. Comme pour son approche sectorielle, l'acquisition de RapidMiner ayant ouvert des portes, en particulier dans les applications scientifiques.
Cette année encore, Altair se distingue par sa compréhension du marché, mais plutôt au titre de sa vision data fabric. Gartner y ajoute son centre d'excellence (qui fournit un programme d'implémentation structuré) et l'acquisition de Cambridge Semantics, un spécialiste des bases de données de graphes.
En 2024, Gartner avait relevé la friction causée par l'acquisition de RapidMiner, affectant la cohérence du catalogue d'Altair. Lequel se trouvait, par ailleurs, loin des autres "leaders" sur l'indicateur d'intérêt client.
Depuis lors, Altair est passé dans le giron de Siemens (mars 2025). Une opération qui pose des questions sur son avenir. S'y ajoute un manque de notoriété sur le concept de l'AI fabric (qui "doit être communiqué plus efficacement"). Vigilance également quant à la confusion et aux défis d'intégration qu'est susceptible de poser la largeur du portefeuille produits d'Altair, y comprishors du segment IA/analytics.
Le FinOps, un écueil chez AWS
L'an dernier, Gartner avait salué la communauté constituée autour de l'offre DSML d'AWS, ainsi que les services d'infrastructure adossés. Il avait également souligné les garanties de sécurité/privacy associées aux modèles de fondation auxquels Amazon Bedrock donne accès.
Cette année, la lumière est sur l'offre SageMaker Unified Studio. À la fois pour son statut d'offre intégrée favorisant la collaboration et pour la possibilité qu'ont les fournisseurs tiers d'y intégrer leurs produits sans fournir ou exploiter d'infrastructure. Gartner y ajoute un bon point sur l'IA responsable, avec Bedrock Guardrails et sa vérification par raisonnement automatique (validation mathématique de la précision des réponses générées).
En 2024, Gartner avait pointé la notoriété limitée des modèles maison Titan. Il avait aussi averti que l'exhaustivité du portefeuille pouvait être synonyme de complexité de choix. Tout en notant qu'AWS accordait davantage d'attention à l'ingéniere ML qu'au décisionnel.
Cette fois, ce n'est seulement plus la famille Titan qui vaut un point de vigilance à AWS, mais l'ensemble de son catalogue de modèles de fondation : pour les acheteurs, il n'est pas encore déterminant dans le choix de son offre DSML. Le FinOps reste par ailleurs un défi autant sur les services que sur l'infra IA. Et SageMaker Unified Studio doit encore progresser en matière d'intégration avec les autres plates-formes cloud.
Une courbe d'apprentissage pour Databricks
L'an dernier, Gartner avait salué les investissements de Databricks dans la GenAI et le low-code. Il avait également noté l'approche unifiée lakehouse + DSML et l'acquisition de MosaicML, qui "permet d'utiliser des LLM rapidement, pour moins cher que chez la concurrence".
Cette année, Databricks a droit à un bon point pour la popularité de son offre chez les publics visés (ce qui accroît le viver de compétences disponibles sur le marché). Il se distingue aussi par la stabilité de son équipe dirigeante... et sur sa vision d'un écosystème agentique (adapté en particulier à la finance et à la gestion de réputation).
Attention en cas d'usage d'architectures data hybrides et/ou composables, avait averti Gartner en 2024. Il avait aussi mentionné les retours négatifs de certains utilisateurs concernant la gestion de performance. Et la nécessité d'un certain "suivi" pour assurer la stabilité des workloads face à l'évolution rapide du produit.
Cette fois, Gartner met en avant la courbe d'apprentissage nécessaire pour utiliser la plate-forme. Il y ajoute la concurrence accrue sur l'approche unifiée lakehouse + DSML et l'absence de fonctionnalités infra disponibles chez les CSP, comme les GPU serverless.
Un usage souvent partiel de la plate-forme Dataiku
L'an dernier, Dataiku avait eu des bons points sur la collaboration entre équipes, la gestion du changement et la vision dans le domaine de la GenAI (avec l'initiative LLM Mesh comme emblème).
Cette fois encore, LLM Mesh fait mouche auprès de Gartner, notamment pour ce qu'il apporte en matière de gouvernance. Bon point également pour la constance du support client dans le paramétrage et dans les use cases initiaux. Comme sus-évoqué, Dataiku n'a pas perdu de vue le coeur data science, tout en lançant des éléments comme Dataiku Stories (data storytelling).
En 2024, la complexité de la tarification (modèle associant frais de plate-forme et licences par utilisateur sur la base de 4 personas) avait valu un mauvais point à Dataiku. Tout comme la communauté (pas au niveau des principaux concurrents) et la maintenance de l'offre on-prem (susceptible d'exiger beaucoup de ressources).
Cette année, Gartner avance un manque de notoriété, en tout cas au sens où les clients tendent à avoir un usage "tactique" de la plate-forme Dataiku pour des besoins spécifiques. Autre limite : le fonctionnement au-dessus des produits d'autres fournisseurs... qui proposent souvent des fonctionnalités concurrentes.
DataRobot, peu adapté à la data science : une perception qui demeure
L'an dernier, DataRobot s'était différencié sur la facilité d'usage de ses produits et sur sa compréhension du marché (focus sur les équipes multidisciplinaires).
Cette fois, il se distingue par son repositionnement récent vers un écosystème agentique d'applications métier. Une vision que portera notamment l'acquisition d'Agnostiq et sa plate-forme d'orchestration d'infrastructure Covalent.
En 2024, DataRobot avait des prix parmi les plus élevés du Magic Quadrant. Gartner avait par ailleurs exprimé des doutes sur sa stratégie produit (promotion en tant que plate-forme d'IA mais focus sur la gestion des données) et sur ses pratiques opérationnelles (changements dans le top management, turnover des équipes).
Cette fois, se pose la question de l'adhésion des éditeurs de logiciels au pivot agentique de Dataiku. En parallèle, son offre reste perçue comme peu adaptée aux besoins des data scientists. Et les mises à jour fréquentes ont rendu les interfaces - avec et sans code - difficiles à utiliser.
Le coeur de l'offre de Google, possiblement difficile à prendre en main
L'an dernier, Google avait eu des bons points pour son catalogue de modèles de fondation (y compris ceux de tiers), l'équilibre de ses investissements entre GenAI et DSML, ainsi que sa cadence de livraison de fonctionnalités.
Cette fois, Gartner insiste sur les capacités de gouvernance qu'apporte l'intégration de Dataplex à Vertex AI. Il y ajoute l'aspect co-innovation avec certains clients et les avancées sur le RAG (ancrage sur Google Search et sur les données d'entreprise, gestion du structuré et du non structuré...).
Lire aussi : Le SSE devient un marché de commodités
En 2024, Google était en retard sur la concurrence en matière de gouvernance. Il avait en outre tendance à privilégier les cas d'usage ML au coeur data science. Par ailleurs, utiliser Vertex AI faisait moins de sens pour qui n'investissait pas dans GCP, à commencer par le stockage et le traitement de données.
Cette année, Gartner note que le support tiers de l'offre DSML de Google n'est "pas aussi important" que chez la concurrence. Il ajoute que le coeur de Vertex AI peut se révéler difficile à utiliser sans couches d'abstraction. Et y ajoute la confusion que la multiplicité des solutions RAG est susceptible d'engendrer.
IBM : sans Gemini ni ChatGPT, un défi de notoriété
IBM se distingue sur la flexibilité apportée par sa large gamme d'outils (frameworks, modèles de fondation, GPU). Même chose sur l'innovation (modèles Granite, implémentation d'AutoRAG et d'InstructLab...). Gartner y ajouteles bénéfices liés à l'acquisition de DataStax sur la partie RAG.
L'offre manque toutefois globalement de notoriété, en particulier face aux fournisseurs qui ont aussi des produits grand public. Sur le volet multicloud, le niveau d'intégration avec GCP n'est pas le même qu'avec AWS et Azure. IBM met par ailleurs peu en avant le potentiel de SSPS comme coeur data science au sein de Watson.
OpenAI, un avantage plus si sensible pour Microsoft
L'an dernier, Microsoft avait pour lui la qualité de ses ressources de formation et de sa R&D (SLM, frameworks de prompt engineering, architectures RAG...). Ainsi que le niveau d'innovation au sein d'Azure ML (modèles, options de déploiement, tarifications).
Le bon point sur l'innovation demeure, avec comme emblème Azure AI Foundry Labs, qui permet d'expérimenter des frameworks IA. Autres points forts : l'écosystème de partenaires et la tarification flexible pour la GenAI.
En 2024, la composante exploration de données avait valu un mauvais point à Microsoft. Comme la séparation des lignes de produits au sein d'Azure ML, en plus de rebrandings fréquents. S'y ajoutait les travaux que supposait l'intégration de GitHub Copilot pour en tirer tout le potentiel.
Cette fois encore, les rebrandings déplaisent à Gartner ; comme, plus globalement, les "multiples itérations d'offres IA". Autre écueil : la réduction de l'écart de performance entre les modèles d'OpenAI et ceux des autres fournisseurs, ce qui donne davantage de liberté d'exploration d'offres alternatives. Quant à Copilot pour la data science, sa diffusion est très progressive (initialement uniquement au sein des notebooks).
Illustration © Gaihong - Adobe Stock
Sur le même thème
Voir tous les articles Data & IA