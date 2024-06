Entre Amazon, Google et NVIDIA, qui vaut le plus cher ? Sur la foi de leur capitalisation boursière, les trois sociétés étaient dans un mouchoir de poche il y a encore quelques semaines.

Depuis lors, un écart s’est creusé entre Google et Amazon. Le premier vaut désormais environ 2100 Md$, contre 1900 pour le second. Dans le même temps, NVIDIA a pris une – grande – longueur d’avance. Le voilà désormais au-dessus des 3000 milliards.

Le cours de son action a connu une nette progression ces deux dernières semaines. Le contexte s’y est prêté : d’importantes conférences se sont tenues, organisées par des sociétés technologiques clientes. Parmi elles, Dell Technologies World, IBM Think, Snowflake Summit, SAP Sapphire et Cisco Live.

Du IaaS aux stations de travail

Du côté de Dell, on s’appuie sur NVIDIA pour développer la marque AI Factory. Celle-ci a fait l’objet d’annonces à l’occasion de Dell Technologies World, dont :

– Disponibilité, au deuxième semestre 2024, de serveurs PowerEdge XE9860L (4U) avec GPU Blackwell, DPU BlueField et réseau Spectrum

– Même échéance pour la disponibilité, sur la plate-forme d’orchestration NativeEdge, de blueprints pour les services d’inférence NIM et pour des microservices CUDA-X (en l’occurrence, Riva pour le traitement de la parole et Metropolis pour l’analyse vidéo)

– Disponibilité, initialement aux USA, de services RAG sur les stations de travail Precision à travers NVIDIA AI Workbench

La conférence Think fut l’occasion, pour IBM, de promettre l’arrivée de H100 et de H200 cette année sur son cloud d’infrastructure. Tout en se projetant sur les Blackwell pour 2025… et en rappelant l’extension du catalogue de GPU (L4, L40S) pour faire tourner les assistants watsonx.

Entre autres annonces faites au Snowflake Summit, il y eut l’intégration de NeMo Retriever (récupérateur pour le RAG) dans Cortex AI. En parallèle, le LLM Snowflake Arctic est devenu disponible dans le catalogue NIM. Pour le moment par API ; prochainement téléchargeable.

Qui n’a pas ses GPU NVIDIA ?

SAP a, pour sa part, mis en avant les connexions entre NVIDIA et sa gamme d’assistants Joule. Aussi bien pour aider à l’implémentation de l’offre RISE with SAP que pour alimenter la génération de code ABAP. L’éditeur allemand a aussi évoqué l’intégration des API Omniverse Cloud dans son service Intelligent Product Recommendation.

Du côté de Cisco, on a dévoilé une solution d’infra convergée associant switchs Nexus, GPU H200, DPU BlueField-3, datastore VAST Data… et logiciels NVIDIA. La disponibilité n’est pas pour tout de suite (premiers accès anticipés au quatrième trimestre 2024).

En matière de convergence, NetApp a lui aussi récemment communiqué. Pour annoncer une solution fondée sur des serveurs NVIDIA OVX (hardware Lenovo). En parallèle, avec Viva Tech en toile de fond, Scaleway déclarait livrer 1000 GPU H100 supplémentaires. OVH allait répondre peu après en rappelant proposer aussi des L4 et des L40S, ces derniers équipant de nouveaux serveurs dédiés AMD. Entre-temps, Opera avait officialisé un partenariat avec Google Cloud pour utiliser Gemini dans son navigateur. Et rappelé, dans ce cadre, avoir récemment ouvert, en Islande, un cluster DGX.