Pour gérer vos consentements :

IA : Apple croit à l’apprentissage par renforcement

Se souvenir comme un humain est un enjeu crucial pour le développement de l’intelligence artificielle. C’est la thèse avancée par Ruslan Salakhutdinov, directeur de recherche sur l’IA chez Apple. Lors d’une conférence organisée par la revue technologique du MIT, il a donné quelques indications sur les travaux menés par la firme de Cupertino dans le domaine de l’intelligence artificielle.

Focus sur l’apprentissage par renforcement

Dans son discours, le chercheur, qui a rejoint Apple en octobre dernier, se focalise sur un type d’IA connu sous le vocable de ‘reinforcement learning’ ou apprentissage par renforcement. Celle-ci « fait référence à une classe de problèmes d’apprentissage automatique, dont le but est d’apprendre, à partir d’expériences, ce qu’il convient de faire en différentes situations, de façon à optimiser une récompense quantitative au cours du temps », peut-on lire sur Wikipedia. Les chercheurs utilisent cette méthode pour apprendre de manière répétitive aux ordinateurs des actions et leur permettre de trouver le meilleur résultat.

Apple n’est pas seul dans ces travaux. Google, par exemple, se sert de l’apprentissage par renforcement pour aider ses ordinateurs à adapter les meilleures configurations de refroidissement et d’exploitation de ses datacenters. L’université de Carnegie Mellon, d’où est issu Ruslan Salakhutdinov, s’appuie aussi sur cette technique pour entraîner des ordinateurs à des anciens jeux comme Doom. Mais, selon le dirigeant d’Apple, « ces systèmes spécialisés dans Doom n’arrivent pas à se souvenir correctement des dispositions des labyrinthes, bloquant ainsi toute planification et construction de stratégies ».

Travaux sur Doom

Une partie des recherches de Ruslan Salakhutdinov porte précisément sur Doom, et vise à créer un logiciel basé sur l’IA capable de mémoriser l’agencement virtuel des labyrinthes et des points de référence pour parvenir à localiser des emplacements spécifiques dans ce shoot’em up, en l’occurrence des tours. Ainsi, pendant le jeu, le logiciel peut détecter une torche rouge ou verte et faire correspondre la couleur de cette torche à celle d’une tour. Au final, le logiciel a appris à naviguer dans les labyrinthes pour atteindre la bonne tour. Si le système se trompe, il repart dans le labyrinthe pour trouver le chemin adéquat. « Ce qui est particulièrement remarquable, c’est qu’il se souvienne de la couleur de la torche à chaque passage d’une tour », s’enthousiasme Ruslan Salakhutdinov.

Mais ce type d’IA nécessite « beaucoup de temps d’entraînement et nécessite des énormes capacités de puissance de calcul. Ce qui rend difficile une industrialisation à grande échelle ». Et d’ajouter : « aujourd’hui, c’est encore très fragile ».

Apprendre plus avec moins

Le spécialiste ne s’arrête pour autant pas uniquement à l’apprentissage par renforcement, il souhaite explorer la capacité d’une IA à apprendre rapidement à partir de « quelques exemples et quelques expériences ». Un moyen pour la firme de Cupertino d’avancer un peu plus vite dans le domaine. Plusieurs analystes pointent du doigt le retard d’Apple dans les technologies d’IA par rapport à Google ou Microsoft. Une des raisons avancées est la politique stricte de confidentialité d’Apple, qui limiterait la quantité de données disponibles pour entraîner les ordinateurs.

A lire aussi :

Face aux GAFA, France IA pose les jalons de son développement

L’IA DeepMind peut-elle réduire la consommation électrique d’un pays entier ?

Crédit photo : Lightspring-Shutterstock

Recent Posts

Meta Horizon OS sera-t-il le Windows ou l’Android de la VR ?

Sous la marque Horizon OS, Meta va ouvrir le système d'exploitation des casques Quest à…

1 heure ago

Treize ans après, fin de parcours pour Women Who Code

Après avoir essaimé dans 145 pays, la communauté de femmes de la tech Women Who…

7 heures ago

Broadcom : la grogne des fournisseurs et des utilisateurs converge

Les voix du CISPE et des associations d'utilisateurs s'accordent face à Broadcom et à ses…

8 heures ago

Numérique responsable : les choix de Paris 2024

Bonnes pratiques, indicateurs, prestataires... Aperçu de quelques arbitrages que le comité d'organisation de Paris 2024…

1 jour ago

Programme de transfert au Campus Cyber : point d’étape après un an

Le 31 mars 2023, le PTCC (Programme de transfert au Campus Cyber) était officiellement lancé.…

1 jour ago

Worldline fait évoluer sa gouvernance des IA génératives

Nicolas Gour, DSI du groupe Worldline, explique comment l’opérateur de paiement fait évoluer sa gouvernance…

1 jour ago