Bases de données cloud : entre écosystèmes et data fabrics

Magic Quadrant DBaaS bases de données cloud 2023

Garter a actualisé son Magic Quadrant des bases de données cloud (dbPaaS). D’écosystèmes en data fabrics, quelle vision donne-t-il de ce marché ?

Cloudera, IBM, SAP et Teradata, « leaders » dans les bases de données cloud managées ? Tous les quatre avaient cette étiquette dans l’édition 2022 du Magic Quadrant consacré à ce marché.

Plus aucun ne l’a dans l’édition 2023, publiée mi-décembre. Tous se retrouvent dans le carré des « visionnaires ». La conséquence d’un recul sur l’axe « exécution », censé refléter leur capacité à répondre effectivement à la demande (expérience client, performance avant-vente, qualité des produits/services…).

Sur cet axe, les fournisseurs classés au Quadrant se positionnent comme suit :

Fournisseur Progression 2022-2023
1 AWS =
2 Microsoft =
3 Google + 1
4 Oracle – 1
5 Alibaba Cloud + 3
6 Databricks + 3
7 MongoDB + 3
8 InterSystems + 7
9 Snowflake – 4
10 Teradata + 1
11 SAP – 5
12 IBM + 1
13 Cloudera – 1
14 Redis – 7
15 EDB non classé
16 Neo4j + 1
17 Cockroach Labs + 3
18 Couchbase =
19 Yugabyte non classé

La situation sur l’axe « vision », centré sur les stratégies (sectorielle, géographique, commerciale, marketing, produit…) :

Fournisseur Évolution 2022-2023
1 Google + 3
2 AWS – 1
3 Oracle =
4 Microsoft – 2
5 Databricks + 2
6 Teradata – 1
7 SAP + 1
8 IBM – 2
9 Snowflake =
10 Alibaba Cloud + 1
11 MongoDB + 2
12 Cloudera – 2
13 Redis + 2
14 Neo4j + 4
15 InterSystems – 1
16 Cockroach Labs =
17 Couchbase =
18 Yugabyte non classé
19 EDB non classé

Les fournisseurs classés sur l’« intérêt généré »

Dans certains Quadrants, les critères d’inclusion comprennent des paliers de revenus annuels et/ou de clientèle. Pas dans celui-ci. Gartner a privilégié un autre de ses indicateurs traditionnels : l’« intérêt généré ». Ce dernier se fonde, « entre autres », sur le volume d’offres d’emploi liées à un fournisseur et sur le nombre de demandes à son sujet auprès du cabinet américain.

Aiven ne figurait pas dans le top 20 du marché sur cet indicateur, ce qui leur a coûté une place potentielle au Quadrant. Même chose pour ClickHouse, Huawei Cloud, OceanBase, OpenText, PingCAP et SingleStore. Ainsi que pour Progress (MarkLogic), Tencent Cloud et TigerGraph, qui figuraient tous trois au classement 2022.

Sur le plan fonctionnel, il s’agissait toujours essentiellement de satisfaire au moins un cas d’usage entre :

> Le transactionnel
> Les transactions « légères » (simples, à fort volume)
> L’«intelligence opérationnelle » (grand nombre de requêtes analytiques concurrentes)
> Les data warehouses traditionnels
> Les data warehouses logiques (données physiquement réparties sur plusieurs plates-formes)
> Data lake et machine learning

Depuis plusieurs années, Gartner met en avant le mouvement vers les « écosystèmes de données ». C’est-à-dire la tendance des fournisseurs à s’inscrire dans une logique d’intégration de services – à commencer par les leurs. Cette fois encore, il n’y déroge pas.

La complexité des offres… et des tarifications

La prise en charge de multiples modèles et types de données (relationnel, non relationnel, géospatial, temporel…) était cette année encore facultative. Elle a néanmoins valu un bon point à AWS. Le groupe américain se distingue aussi par la couverture de son offre et sa capacité à intégrer ses solutions, en particulier à partir du socle Amazon DataZone (gestion des données). Reste que la profondeur du catalogue peut engendrer de la complexité à l’usage, souligne Gartner.

Databricks a droit à une remarque comparable. Autres points négatifs : du retard par rapport aux autres « leaders » sur le relationnel et une tarification pas toujours évidente à associer à des cas d’usage. Côté positif, il y a les développements sur le volet data science / IA, l’élasticité de l’offre et la brique de gouvernance Unity Catalog.

Le pricing vaut, au contraire, un bon point à Oracle. Notamment sur Autonomous Database et de par l’absence de coûts d’egress initiaux. Autres points forts : la couverture fonctionnelle de l’offre et la flexibilité de déploiement (offre Exadata Cloud@Customer, partenariat Azure…).
Dans la pratique, les coûts restent un « facteur négatif important » dans le discours des clients, explique Gartner. Oracle manque par ailleurs de notoriété sur le segment cloud, où il est arrivé plus tard que ses principaux concurrents.

Google a droit à une appréciation plus positive sur l’aspect cloud. Plus précisément pour le SLA de produits comme Cloud Spanner, Cloud BigTable et Firestore. La data fabric Dataplex lui vaut un autre bon point, comme le niveau d’ouverture de son offre, incarnée en premier lieu par BigLake.
On ne peut pas en dire autant de sa gamme, « moins vaste » que chez d’autres CSP. Les clients ont, en outre, parfois tendance à percevoir GCP comme inadapté à des applications complexes.

L’ancrage des « écosystèmes de données »

Chez Alibaba Cloud, c’est la cohérence de la gamme qui pose problème. En tout cas par rapport au reste du marché. On surveillera aussi la restructuration du groupe. En cours, elle est source d’incertitudes sur la stratégie à moyen terme.
Sur le plan positif, Alibaba Cloud se distingue par ses investissements dans le FinOps et le cloud hybride. Ainsi que par son approche sectorielle et son écosystème de partenaires.

L’écosystème vaut aussi un bon point à Microsoft, salué plus globalement pour l’étendue de sa présence sur ce marché. Le groupe américain fait, en parallèle, des progrès sur l’ouverture. D’une part vis-à-vis de ses autres produits. De l’autre, vis-à-vis des systèmes externes à travers la solution Fabric. Gartner note aussi sa roadmap « gestion des données augmentée par IA ».
Microsoft a une marge d’amélioration sur la prévisibilité des coûts. Vigilance également sur la livraison – et l’éventuel chevauchement – des nombreuses offres annoncées ces dernières années, entre évolutions fonctionnelles et simples rebrandings.

La prévision des coûts est aussi un défi chez Snowflake. Gartner regrette aussi l’absence d’une offre sur site et la cadence de mise en prod, qui « peut paraître lente ». Revers de la médaille : la facilité d’usage (implémentation et exploitation), la notoriété croissante et l’écosystème « robuste » (marketplace et partage de données).

Si MongoDB a progressé en « vision », il le doit notamment à l’introduction d’une technologie de chiffrement homomorphique. Sa feuille de route – sur laquelle figurent par exemple traitement en flux et recherche vectorielle – fait aussi mouche auprès de Gartner. Idem pour la flexibilité de déploiement et la popularité de MongoDB dans les stacks de développement.
Outre la courbe d’apprentissage quand on vient du relationnel, le modèle orienté document n’est plus l’avantage qu’il fut : la concurrence s’est adaptée, en proposant des interfaces compatibles.

Illustration © Julien Eichinger – Fotolia