Harry Shum – Microsoft : « l’IA va bouleverser tous les secteurs d’activité »

Microsoft Experiences 2017 : le patron de la division AI Research Harry Shum a présenté la vision du groupe sur l’intelligence artificielle et quelques cas d’applications.

« Le contraire de l’intelligence artificielle est la bêtise naturelle. » C’est par cette boutade que Harry Shum a ouvert sa participation à la plénière « L’intelligence artificielle pour tous » ce mercredi 4 octobre à l’occasion de l’événement Microsoft Experiences’17 à Paris.

Il y a un an à peine, le patron de Microsoft Research créait la division Artificial Intelligence (AI). Laquelle compte aujourd’hui 8 000 ingénieurs et data scientistes. Dire que l’IA est stratégique pour Redmond est désormais un pléonasme.

« C’est un important moment pour l’IA aujourd’hui car elle va bouleverser tous les secteurs d’activité », confirme le responsable.

Et comme « la mission de Microsoft est de renforcer les entreprises et individus », l’éditeur va désormais le faire en « introduisant de l’IA dans toutes ses solutions ».

C’est aujourd’hui le cas avec des briques de machine learning dans des produits phares comme Office 365 ou Dynamics 365 récemment présentés à Ignite 2017.

L’IA chez Microsoft touche naturellement de nombreux domaines. Harry Shum s’est particulièrement attardé sur celui du langage que la firme de Redmond traite à travers la reconnaissance vocale (avec 5,1% d’erreur « seulement » pour Switchboard), le langage naturel et la traduction (avec 60 langues prises en compte) en s’appuyant sur l’architecture ResNet (Residual Network) introduite en 2015 et composée aujourd’hui de 152 couches.

Reconnaissance, traduction et transcription temps réel dans PowerPoint

Plus largement, Microsoft met ses outils d’IA à disposition à travers sa plate-forme Azure IA.

A partir des données collectées, de la puissance du Cloud et des algorithmes dédiés, la plate-forme s’organise autour de services (machine learning, cognitivité, framework de chatbot), de l’infrastructure, et des outils (codage et frameworks d’apprentissage), l’offre se compose autour de trois grands secteurs : « data » « Cloud » et « nouvelles expériences ».

Et de joindre le geste à la parole. Laurent Bussard, Software Senior Engineer chez Microsoft, s’est fendue d’une démonstration de reconnaissance vocale en français, traduite à la volée en anglais qui s’affichait en temps réel sous forme de sous-titres intégrés à une présentation Powerpoint.

Sous-titres qu’il est d’ailleurs possible de diffuser sur les ordinateurs portables et smartphones de l’auditoire. Une extension Powerpoint aujourd’hui téléchargeable qui, fort des composants de machine learning, enrichit son vocabulaire au fil de son usage.

Jean-Sébastien Dupuy, Evangéliste technique chez l’éditeur, a démontré comment exploiter la puissance de la reconnaissance vocale et sa transcription pour analyser, indexer et annoter les contenus d’une session vidéo.

Il est ainsi possible de retrouver instantanément les différentes occurrences d’un mot clé dans une conférence enregistrée, de créer un index de contenus dans la vidéo ou encore générer une compilation de différents passages du terme recherché.

Par exemple, une conférence sur la navigation Internet permettra de retrouver instantanément les différents points d’entrée des passages où sont cités des références au contrôle parental.

Bing for Business en version preview privée

Autre cas d’application avec l’usage des chatbots, « la prochaine grande étape de l’interaction homme-machine », considère Harry Shum.

Un agent conversationnel a ainsi été réalisé pour le site Stack Overflow dédié aux développeurs. Intégré à Visual Studio, le « stackbot » permet notamment de générer du code à partir d’une requête orale.

L’IA sert également la recherche. Celle en ligne pour tous mais aussi pour faciliter l’accès aux données de l’entreprise.

Avec Bing for Business, les utilisateurs peuvent par exemple trouver le profil d’un collaborateur en tapant son nom et avoir accès à une déclinaison d’informations comme l’emplacement de son bureau, son agenda, ses contacts, etc. Ou encore faciliter la gestion des notes de frais, celles de l’utilisateur comme celles des collaborateurs.

Un moteur de recherche interne à l’organisation que les administrateurs IT peuvent optimiser en ayant accès à des tableaux de bord des requêtes et qui, là encore, viennent enrichir les résultats.

Bing for Business est aujourd’hui disponible en préversion privée.

Trouble du langage : Microsoft soutient Helpicto

Terminons les cas d’usage avec le projet Helpicto de la société toulousaine Equadex.

A partir des outils de reconnaissance vocale de Microsoft, Equadex a développé une solution de communication pour les personnes présentant une déficience de compréhension orale et d’expression.

Le logiciel transforme en pictogrammes des phrases en langage naturel. Des scénettes dessinées de la vie courante s’affichent sur une tablette ou un smartphone au fil de la saisie vocale et viennent ainsi remplacer les classeurs d’images moins riches et plus lourds à utiliser (temps de recherche du carton illustré dans les pages du classeur, risques de pertes des pictogrammes, etc.).

Un mode visuel qui facilite la communication entre les responsables adultes et des personnes frappées de pathologies handicapantes tels les autistes, les victimes d’Alzheimer, dysphasiques, etc.

Un projet soutenu par Microsoft. « Plus la solution est utilisée et mieux elle fonctionne car le système apprend », conclut Harry Shum.


Lire également
Pour Microsoft, la stratégie c’est maintenant IA First
Microsoft Build : le futur se décline en IA et en Azure
Avec Brainwave, Microsoft traite l’IA en temps réel dans Azure