Pour gérer vos consentements :

Samsung intègre des capacités de calcul dans sa mémoire HBM

Et si on intégrait des capacités de calcul dans la mémoire HBM ? Samsung travaille sur ce sujet. Il en donnera un aperçu à l’occasion de l’International Solid-State Circuits Conference. La démarche repose sur l’intégration, dans chaque banque, d’un PCU capable d’exécuter des opérations en demi-précision (FP16).

La mise en œuvre de ces unités de calcul ne requiert aucune modification matérielle, ni logicielle. Leur présence diminue toutefois la surface disponible. Les puces qui en embarquent ont une capacité maximale de 4 Gb, contre 8 Gb pour les modules HBM standard de dernière génération.
Samsung a coupé la poire en deux. En combinant quatre dies de 4 Gb et autant de 8 Gb, il obtient des modules de 6 Go.

Des expérimentations sont en cours, notamment avec le laboratoire national d’Argonne (États-Unis). Il est prévu des les finaliser d’ici à la fin du 1er semestre 2021. En attendant, Samsung livre quelques indicateurs de performances, basés sur des PCU à 20 nm.
À 2,4 Gbps par broche, la bande passante théorique dépasse 300 Go/s sur le bus 1024 bits de la HBM 2e génération. Dans la pratique, avec le modèle de reconnaissance vocale Deep Speech 2, la latence est divisée par près de 3 sur le jeu de données Librispeech par rapport à la HBM Aquabolt de Samsung. On nous annonce aussi une nette augmentation du rapport performance/watt.

Samsung présente sa technologie sous le nom HBM-PIM (processing-in-memory). Ses chercheurs, eux, parlent de FIMDRAM (function-in-memory).

La HBM (mémoire à haute bande passante) repose sur l’empilement de barrettes au-dessus d’une puce logique connectée à l’unité de calcul (CPU, GPU, SoC) via un « interposeur » (source du schéma : AMD).

Illustration principale © Samsung

Recent Posts

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

17 heures ago

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

21 heures ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

22 heures ago

ChatGPT : le Financial Times signe avec OpenAI

FT Group, éditeur du Financal Times, a signé un accord avec OpenAI afin d'utiliser ses…

3 jours ago

Les hyperscalers renforcent leurs recherches et datacenters pour l’IA

Au premier trimestre, Microsoft, Meta/Facebook et Alphabet/Google ont déjà investi plus de 32 milliards $…

3 jours ago

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

La société britannique de cybersécurité Darktrace a accepté une offre de rachat de 5,32 milliards…

4 jours ago