Triton : le langage dédié d’OpenAI pour le deep learning

L’heure de la maturité pour Triton ? Le projet, que porte OpenAI, vient de passer en version 1.0. Sa principale brique : un langage dédié ciblant le deep learning. Objectif : faciliter l’implémentation d’opérations non optimisées pour les bibliothèques de référence.

Triton arrive sur un terrain déjà bien occupé. Deux approches majeures s’y sont développées. D’un côté, la compilation polyédrique, adoptée notamment par Tiramisu et Tensor Comprehensions. Elle représente les programmes de sorte que le flux de contrôle est prédictible. Cela favorise les transformations lors de la compilation, en intégrant le parallélisme et la localité des données.
La méthode permet par ailleurs de contrôler la préservation sémantique. Elle présente en revanche une consommation importante de ressources – doublée de procédures coûteuses d’autotuning – et une certaine inertie face au codage parcimonieux.

L’autre approche, adoptée entre autres par Halide et TVM, implique les langages de planification. Ces derniers mettent en œuvre le principe de séparation des préoccupations : ils dissocient l’implémentation de la conception. On n’a donc à écrire qu’une seule fois un algorithme, puis on l’optimise à part. Avec la possibilité de spécifier des éléments qu’un compilateur polyédrique n’aurait pas pu déterminer à partir de l’analyse statique des flux de données.
Les systèmes fondés sur ce paradigme présentent eux aussi des limites face au codage parcimonieux. Il peut en résulter des contraintes importantes dans la planification.

Triton vs CUDA : une histoire de blocs

Triton repose sur une variante du modèle d’exécution SMPD (Single Program, Multiple Data). Avec elle, ce sont pas les tâches qui sont architecturées en blocs, mais les programmes. Soit l’inverse de CUDA (à gauche sur l’exemple ci-dessous, une multiplication matricielle).

Cette approche se révèle particulièrement flexible lorsqu’on a à traiter des matrices creuses (qui comportent beaucoup de coefficients nuls). En analysant les flux de données au niveau des blocs, le compilateur Triton est capable d’automatiser un certain nombre d’opérations importantes. Dont la coalescence (agrégation des transferts DRAM), la vectorisation et la planification des cœurs.

(benchmark en multiplication matricielle)

Triton fonctionne pour le moment sur des GPU NVIDIA. Des travaux sont en cours pour l’adapter aux GPU AMD et aux CPU. On évitera la confusion avec un autre projet du même nom, made in NVIDIA. Il s’agit d’un moteur d’inférence. La plate-forme de cybersécurité Morpheus, actuellement en accès anticipé, en fait usage.

Illustration principale © kras99 – Adobe Stock

NextCloud : combien pèsent les hyperscalers en 2021 ? »

Previous « Cigref : décès de Jean-François Pépin, son ex-délégué général

Published by

Clément Bohic

Tags: triton

3 années ago

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

17 heures ago

Business

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

21 heures ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

23 heures ago

ChatGPT

Triton : le langage dédié d’OpenAI pour le deep learning

Triton vs CUDA : une histoire de blocs

Recent Posts

IA générative : les lignes directrices de l’ANSSI

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

iPadOS finalement soumis au DMA

ChatGPT : le Financial Times signe avec OpenAI

Les hyperscalers renforcent leurs recherches et datacenters pour l’IA

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo

Triton : le langage dédié d’OpenAI pour le deep learning

Triton vs CUDA : une histoire de blocs

Related Post

Recent Posts

IA générative : les lignes directrices de l’ANSSI

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

iPadOS finalement soumis au DMA

ChatGPT : le Financial Times signe avec OpenAI

Les hyperscalers renforcent leurs recherches et datacenters pour l’IA

Cybersécurité : Darktrace dans l’escarcelle de Thoma Bravo