La reconnaissance vocale de Microsoft fait jeu égal avec les humains

voix-téléphone-smartphone-parler

Cortana devrait bientôt être en mesure de mieux comprendre les utilisateurs, via une technologie optimisée de reconnaissance vocale.

Microsoft est fier d’annoncer sur son blog que sa technologie de reconnaissance vocale est maintenant aussi efficace qu’un humain. Le taux d’erreurs de transcription est passé de 6,3 % à 5,9 % en un mois, permettant ainsi à la solution de reconnaissance vocale de l’éditeur de passer devant toutes les autres offres du marché, pour se hisser au niveau des meilleures transcriptions manuelles d’une conversation.

« Cela rendra Cortana plus puissant, ce qui permettra l’émergence d’un assistant vraiment intelligent », se réjouit Harry Shum, vice-président Artificial Intelligence and Research group chez Microsoft.

Intelligence artificielle et réseau de neurones sont au cœur de l’offre de Microsoft, qui n’a pas été ici refondue par les chercheurs, mais tout simplement optimisée pour réduire le taux d’erreurs. L’objectif est maintenant de dépasser le taux moyen d’erreurs d’une transcription manuelle. Mais aussi de proposer une meilleure qualité de reconnaissance vocale dans des environnements bruyants.

Prochaine étape : comprendre

Cortana devra également être capable de saisir plus finement le sens des phrases. Si une transcription manuelle est parfois source d’erreurs, le sens est en général préservé, alors même qu’un ordinateur aura tendance à buter sur certains mots isolés.

« La prochaine frontière est de passer de la reconnaissance à la compréhension », confirme Geoffrey Zweig, responsable du groupe de recherche Speech & Dialog chez Microsoft.

À lire aussi :

Quelles nouvelles fonctionnalités pour Windows 10 Redstone 2 ?
Windows 10 Anniversary : Cortana impossible à débrancher
Hello Cortana Bots ! le futur de Windows selon Microsoft

Crédit photo : © Egor Tetiushev – Shutterstock