Pour gérer vos consentements :
Categories: CloudDatacenters

IA : vers une flambée des prix des GPU ?

La demande d’accélérateurs d’intelligence artificielle (IA) pour former, tester et exécuter des modèles d’apprentissage automatique (machine learning, ML) augmente.

Un tel engouement impacte les tarifs de processeurs dédiés au traitement graphique (GPU) de terminaux, des ordinateurs aux serveurs pour datacenters, a relevé The Next Platform.

Les GPU peuvent être adaptés aux calculs massivement parallèles qui accélèrent les opérations de traitement qu’implique l’entraînement de grands modèles de langage (LLM).

40 000 $ pièce la carte GPU de qualité serveur

L’inadéquation entre la demande exprimée par le marché et l’offre fait grimper la cote.

Le mouvement entraîne même une « flambée des prix » des GPU de qualité serveur. Certaines puces dédiées, dont des cartes graphiques haut de gamme Nvidia (la version PCI Express des GPU Nvdia H100), peuvent atteindre 40 000 $ pièce sur les places de marché du e-commerce.

Un prix dont s’est fait l’écho dans un tweet John Carmack, programmeur et développeur de jeux vidéo. CNBC relevait à ce propos : « les développeurs utilisent le H100 pour construire de grands modèles de langage qui sont au cœur d’applications d’IA comme ChatGPT d’OpenAI. Exécuter ces systèmes est coûteux et nécessite des ordinateurs puissants pour traiter des téraoctets de données […] Ils dépendent également d’une puissance de calcul importante pour que leurs modèles d’IA puissent générer du texte, des images ou des prévisions. »

En outre, « l’entraînement de modèles d’intelligence artificielle, particulièrement les plus volumineux comme le modèle de langage pré-entraîné GPT (generative pre-training transformer), nécessite d’activer de concert des centaines de GPU haut de gamme. »

Or, les attentes d’acheteurs en entreprise peuvent surpasser les capacités de production de fournisseurs.

De surcroît, les hyperscalers et d’autres opérateurs cloud rationnent l’accès aux capacités GPU de leurs propres développeurs. Aussi, les prix des GPU Cloud – les instances répondant aux exigences de traitement de tâches parallèles – pourraient à leur tour augmenter.

(crédit photo © railwayfx – Adobe Stock)

Recent Posts

Pixtral, un premier modèle multimodal pour Mistral AI

Mistral AI donne un premier aperçu de ses travaux sur la multimodalité en publiant Pixtral,…

7 heures ago

Aides d’État illégales : Apple doit rembourser 13 Md€

La CJUE a confirmé une décision de la Commission européenne imposant à l'Irlande de récupérer…

13 heures ago

AWS se renforce au Royaume-Uni

8 milliards de livres, soit 9,5 milliards d'euros, au Royaume-Uni sur cinq ans.Le leader mondial…

13 heures ago

Oracle héberge un peu d’OCI chez Google Cloud

Comme il l'a déjà fait avec Microsoft, Oracle va héberger de l'infrastructure OCI chez Google…

14 heures ago

DevOps : le marché sous l’angle des plates-formes

Périmètre resserré pour le deuxième Magic Quadrant des plates-formes DevOps, concentré sur les offres «…

1 jour ago

QuestioNR : où en êtes-vous sur les bonnes pratiques Green IT ?

L’Alliance Green IT et l’Institut du Numérique Responsable lancent QuestioNR, pour aider les entreprises à…

1 jour ago