Pour gérer vos consentements :

APOLLO : quand l’IA vient en aide à l’IA

De l’IA pour améliorer l’IA : c’est le sens d’APOLLO. Ce framework vise plus précisément à optimiser la conception des puces dédiées à l’apprentissage automatique. Google Research en est à l’origine.

APOLLO doit adapter le plus efficacement possible l’architecture des puces en question (c’est-à-dire la manière dont leurs blocs fonctionnels s’agencent) à des ensembles de tâches. Il utilise pour cela diverses méthodes d’exploration.

Il s’agit de consacrer le moins possible de ressources à cette exploration. Cela implique, pour chaque ensemble de tâches, d’éviter au maximum les combinaisons inadaptées. Mais il faut aussi s’assurer que les combinaisons « valables » soient le plus performantes possible.

Sur ces deux critères associés, la méthode « évolutionniste » – illustrée ci-dessous) se révèle particulièrement efficace. Elle représente les configurations de puces sous forme de séquences correspondant à des « génomes » qu’on peut croiser.

Y coupler une approche d’optimisation basée sur les modèles permet de maintenir un haut niveau d’efficacité à mesure qu’on introduit des contraintes (ici, de surface exploitable).

Les méthodes évolutionniste et P3BO (évolutionniste + basée sur les modèles) offrent les meilleures performances sous contrainte de surface exploitable (4,8 mm²).

APOLLO comporte aussi un mécanisme d’apprentissage par transfert. Cela lui permet d’assurer la reproduction de configurations « idéales » entre des architectures cibles soumises à des contraintes différentes. Toutes les méthodes d’optimisation mises à l’épreuve (sur 7 modèles, dont 2 variations de MobileNet) en bénéficient.

L’optimisation basée uniquement sur le modèle (MBO) affiche le meilleur taux de combinaisons « valables ». Mais elles sont rarement uniques.

Les équipes de Google avaient déjà appliqué le machine learning à la conception de composants, mais à plus bas niveau. En l’occurrence, pour déterminer l’agencement des circuits qui constituent une puce, comme on ferait le plan d’un immeuble.

Illustration principale © Jakub Jirsk – Fotolia

Recent Posts

Eviden structure une marque de « serveurs IA »

Eviden regroupe cinq familles de serveurs sous la marque BullSequana AI. Et affiche le supercalculateur…

3 heures ago

SSE : l’expérience se simplifie plus que les prix

Le dernier Magic Quadrant du SSE (Secure Service Edge) dénote des tarifications et des modèles…

5 heures ago

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

23 heures ago

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

1 jour ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

1 jour ago

ChatGPT : le Financial Times signe avec OpenAI

FT Group, éditeur du Financal Times, a signé un accord avec OpenAI afin d'utiliser ses…

3 jours ago