Un système de machine learning, ça consomme combien d’énergie ? L’an dernier, MLPerf avait publié ses premières statistiques à ce sujet, dans le cadre d’un de ses benchmarks. En l’occurrence, celui qui mesure les performances en inférence.
L’initiative n’englobe pas encore les deux autres benchmarks MLPerf. À savoir celui dédié au HPC et celui qui mesure les performances en entraînement. Pour ce dernier, une nouvelle série de résultats – la cinquième depuis son lancement en 2018 – vient de paraître. Au menu, huit tests. Soit un de plus que dans la vague précédente. Le « petit nouveau » porte sur la détection d’objets, avec le modèle RetinaNet sur le jeu de données Open Images.
Les résultats sont présentés selon deux catégories « Closed » et « Open ». La première impose d’utiliser, pour la mise à l’épreuve, un modèle équivalent à celui de l’implémentation de référence. La seconde autorise des modifications non seulement du modèle, mais aussi des opérations pré- et post-traitement.
Comme à l’accoutumée, la quasi-totalité des résultats sont dans la catégorie « Closed ». Trois systèmes se distinguent en cumulant deux premières places.
En tête sur la classification d’images (fork de ResNet 1.5 ; dataset ImageNet) et le NLP (BERT sur Wikipédia), il y a un système H3C composé de :
– 2 CPU Intel Xeon Platinum 8380 (40 cœurs à 2,3 GHz)
– 1 GPU NVIDIA A100 PCIe 80 Go
– 1 To de RAM
– 7,68 To sur SSD
– Les versions NGC (NVIDIA) de MXNet, PyTorch et TensorFlow ; Ubuntu 20.04.2
En tête sur la détection d’objets (Mask R-CNN avec backbone ResNet50 sur MS-COCO) et la reconnaissance vocale (RNN-T sur le corpus LibriSpeech), il y a un système NVIDIA composé de :
– 2 CPU AMD EPYC 7742 (64 cœurs)
– 2 GPU NVIDIA A30 24 Go
– 1 To de RAM
– 4 To sur SSD
– PyTorch NVIDIA 20.04 ; Ubuntu 20.04.4
En tête sur la détection d’objets (RetinaNet sur Open Images) et la recommandation (DLRM sur un volume de 1 To de clics), il y a un autre système H3C, composé de :
– 2 CPU Xeon Platinum 8358 (32 cœurs à 2,6 GHz)
– 4 GPU NVIDIA A100 PCIe 80 Go
– 512 Go de RAM
– 2 x 4 To + 1 x 2 To sur SSD
– Les versions NGC de MXNet, PyTorch et TensorFlow 20.04 ; Ubuntu 20.04.2
À la première place sur la segmentation d’images médicales (3D U-Net ; dataset KiTS19, Kidney Tumor Segmentation 2019), un système Nettrix avec :
– 2 CPU Xeon Platinum 8380 (40 cœurs à 2,3 GHz)
– 8 GPU NVIDIA A30 PCIe 24 Go
– 2 To de RAM
– 15,36 To + 1,92 To sur SSD
– MXNet ; Ubuntu 20.04.4
Sur l’apprentissage par renforcement (fork de Minigo sur le jeu de Go 19 x 19), un autre système H3C se retrouve en tête. Sa configuration :
– 2 CPU Xeon Platinum 8362 (32 cœurs à 2,8 GHz)
– 4 GPU NVIDIA A100 SXM 80 Go
– 1 To de RAM
– 2 x 4 To + 1 x 2 To sur SSD
– Les versions NGC de MXNet, PyTorch et TensorFlow 22.04 ; Ubuntu 20.04.2
Illustration principale © KanawatVector – Adobe Stock
OVHCloud partage ses efforts environnementaux au sommet de l’Open Compute Project qui se tient à…
Avec Phi-3-mini, Microsoft lance un SLM conçu pour attirer une clientèle disposant de ressources financières…
La Commission européenne serait sur le point d'approuver la proposition d'Apple visant à fournir à…
Le Premier ministre a précisé les usages de l'IA dans les services de l'administration et…
Sous la marque Horizon OS, Meta va ouvrir le système d'exploitation des casques Quest à…
Après avoir essaimé dans 145 pays, la communauté de femmes de la tech Women Who…