IaaS : la bataille des GPU embraye sur Ampere

Google Cloud est le premier des « trois grands » à intégrer dans son offre commerciale des instances reposant sur 16 GPU Ampere.

Passage en phase commerciale acté pour les VM A2. Après quasiment un an d’expérimentation, elles entrent au catalogue public de Google Cloud.

La gamme comprend cinq types d’instances. Toutes reposent sur des cœurs de processeur Xeon Cascade Lake. Et surtout, sur des GPU A100. Jusqu’à 16 en l’occurrence, avec la possibilité de leur assortir un maximum de 3 To de SSD local.

Google specs des VM A2

Les VM A2 sont pour le moment disponibles dans trois régions Google Cloud. Dont une en Europe (Pays-Bas). Le coût des GPU s’ajoute à celui des instances et des autres ressources (disques et images, mise en réseau). Ceux associés à des ressources préemptives sont facturés sur le même modèle. Ceux qui ne le sont pas peuvent bénéficier de remises passé une certaine durée d’utilisation mensuelle.

Les prix ci-dessous valent pour les ressources GPU, RAM et CPU à la demande dans la région Pays-Bas (europe-west-4).

Google prix des GPU

Google prix des VM A2
(cliquer sur les images pour les agrandir)

On trouve aussi des instances en A100 sur Azure, mais en préversion (depuis novembre 2020). Plus précisément un modèle : la ND96asr, dans la série ND A100 v4. Elle embarque 8 GPU.
Les tarifs qui suivent valent pour la région Europe de l’Ouest. Les premiers sont pour des VM Linux ; les seconds, pour des VM Windows (non pris en charge sur les A2 de Google Cloud).

Microsoft VM ND A100 Linux

Microsoft VM ND A100 Windows

AWS aussi a lancé une instance sur base A100 en novembre dernier, mais pas en préversion : la p4d. Comme les A2, elle repose sur des Xeon Cascade Lake (fréquence de base : 2,2 GHz ; Turbo : 2,9 GHz en monocœur et 3,7 en multicœur).

AWS specs VM p4d GPU

AWS prix des instances p4d GPU

Illustration principale © NVIDIA