Open Voice Network : le salut de Microsoft dans les assistants vocaux ?

Open Voice Network

Microsoft est l’un des maillons forts de l’Open Voice Network, qui a récemment soufflé sa première bougie sous l’égide de la Fondation Linux.

Comment basculer d’Alexa au call center de Target en restant identifié ? Ou payer sur Etsy via la skill PayPal de l’Assistant Google ? Le comité technique de l’Open Voice Network travaille sur ce genre de cas.

Cette association à but non lucratif de droit américain s’était officiellement constituée il y a un peu plus d’un an. Son objectif n’a pas changé depuis lors : contribuer au développement de standards technologiques et éthiques pour les systèmes d’assistance vocale. Elle dispose notamment, pour cela, de l’appui de la Fondation Linux. Et d’un budget R&D de 162 millions de dollars sur l’année 2021.

L’Open Voice Network doit l’essentiel de ce financement à ses membres « sponsors ». Ils sont actuellement six : Microsoft, Schwarz Gruppe, Target, Wegmans Food Markets, Deutsche Telekom et Veritone. L’adhésion de ces deux derniers est récente. Il était question d’en faire une annonce publique. Cela a bien été le cas, mais pas forcément sous la forme attendue. À commencer par le titre : « La Fondation Linux annonce Open Voice Network ».

L’Open Voice Network penche pour Rust et Azure

Le GitHub de l’association en dit davantage sur l’avancée des projets. En particulier au travers des comptes rendus des réunions du comité technique. Lors de la dernière s’est notamment posée la question des recrutements et de l’extension de la communauté, afin d’amorcer la phase « opérationnelle ». Beaucoup d’éléments restent néanmoins à définir. Entre autres :

  • Quel sera le langage de programmation de référence (l’Open Voice Network pense à Rust) ?
  • Doit-on définir séparément l’interopérabilité matérielle et logicielle ?
  • Où héberger les PoC (Azure est en bonne position, Microsoft étant sponsor) ?

Les standards techniques auxquels l’Open Voice Network entend contribuer englobent les procédures d’identification et d’authentification, la découverte de services, les UI ou encore les back-ends. L’un de ses groupes de travail se concentre sur la partie sécurité et privacy.

À l’origine de l’initiative, il y a des recherches du MIT, d’Intel et de Capgemini sur le vocal appliqué plus particulièrement au commerce. Elles remontent à 2016. Premier directeur exécutif de l’association, Jon Stine (ancien d’Intel) l’est toujours. Target est le plus représenté au comité de pilotage, avec trois membres.

Pour aller plus loin sur le sujet :

Reconnaissance vocale : Mozilla restructure

Microsoft acquiert Nuance : pourquoi ce scénario fait sens

Photo d’illustration © Dan Farrell – Unsplash