Pour gérer vos consentements :
Categories: Cloud

AWS annonce deux nouvelles puces IA

Amazon Web Services a annoncé la prochaine génération de deux familles de puces  – AWS Graviton4 et AWS Trainium2 – qui apporteraient « des avancées en termes de performances, de prix et d’efficacité énergétique pour un large éventail de charges de travail , y compris la formation en apprentissage automatique (ML) et les applications d’intelligence artificielle (IA) générative.

Cela intervient après qu’AWS et Nvidia ont annoncé « une expansion de leur collaboration stratégique pour fournir l’infrastructure, les logiciels et les services les plus avancés pour alimenter les innovations en matière d’intelligence artificielle (IA) générative des clients ».

AWS lance Graviton4 et Trainium2

AWS Graviton4 et AWS Trainium2 (prototype) (Photo: Business Wire)

Selon AWS,  le nouveau Graviton4, basé sur une architecture ARM, offre des performances de calcul jusqu’à 30 % supérieures, 50 % de cœurs en plus et 75 % de bande passante mémoire en plus que les processeurs Graviton3 de la génération actuelle.

De son côté, Trainium2 d’Amazon est  jusqu’à  quatre fois plus rapide que les puces Trainium de première génération et pourra être déployé dans des UltraClusters EC2 comprenant jusqu’à 100 000 puces. AWS affirme que cela permettra de former des modèles de fondation (FM) et des modèles de langage étendus (LLM) en une fraction du temps, tout en améliorant l’efficacité énergétique jusqu’à 2 fois.

« Le silicium sous-tend chaque charge de travail client, ce qui en fait un domaine d’innovation essentiel pour AWS »,  déclare David Brown, vice-président « Compute and Networking » chez AWS.
« En concentrant nos conceptions de puces sur des charges de travail réelles qui comptent pour les clients, nous sommes en mesure de leur fournir l’infrastructure cloud la plus avancée. »

À l’heure actuelle, AWS propose plus de 150 types d’instances Amazon EC2  alimentées par Graviton, a construit plus de 2 millions de processeurs Graviton et compte plus de 50 000 clients.

Tom Jowitt, Silicon.co.uk

Recent Posts

Oracle choisit l’expertise Java et SQL pour son « IA qui code »

Le voile est levé sur Oracle Code Assist. Présenté comme spécialisé en Java et SQL,…

5 jours ago

EPEI (Daniel Kretinsky) vise Atos : les axes directeurs de sa proposition

EPEI, la société d'investissement de Daniel Kretinsky, a déposé une offre de reprise d'Atos. En…

5 jours ago

Onepoint veut reprendre Atos : les grandes lignes de son offre

Onepoint, l'actionnaire principal d'Atos, a déposé une offre de reprise du groupe. En voici quelques…

5 jours ago

AWS prend ses distances avec VMware version Broadcom

Broadcom a repris seul la main sur la vente de l'offre VMware d'AWS... qui, dans…

6 jours ago

Avec ZTDNS, Microsoft essuie les plâtres du zero trust appliqué au DNS

Microsoft expérimente, sous la marque ZTDNS, une implémentation des principes zero trust pour le trafic…

6 jours ago

Atos sur la voie d’un sauvetage ? Point de situation

Accord de principe entre créanciers, propositions de reprise, discussions avec l'État... Le point sur le…

6 jours ago