La reconnaissance vocale, prochaine ‘killer app’ du mobile ?

Piloter son téléphone à la voix, dicter vocalement un mail ou un SMS: autant
d’applications qui se développent aujourd’hui. Trouveront-elles leur public ?

La reconnaissance vocale a fait son entrée dans les mobiles depuis pas mal de temps déjà. Microsoft a ainsi intégré son outil maison dans Windows Mobile, il permet de piloter l’essentiel des fonctions de téléphone : chercher un contact, passer un appel, ouvrir un fichier ou exécuter une application. Outre un meilleur confort dans l’ergonomie, cette fonction est désormais accessible sans apprentissage, c’est-à-dire qu’il est inutile de pré-enregistrer des mots ou des chiffres lors de la première utilisation.

Mais aujourd’hui, quelques éditeurs poussent plus loin le concept, estimant que la reconnaissance vocale pourrait devenir la prochaine killer application du mobile. Nuance, qui édite déjà des logiciels de dictée vocale pour PC (Dragon Naturally Speaking), décline sa technologie sur mobile.

Outre le pilotage du mobile ou les appels, l’éditeur se démarque avec la possibilité de dicter vocalement un mail ou un SMS qui est retranscrit en temps réel sur l’écran et de l’envoyer en mode texte ou oral. Il est également possible de piloter des applications en ligne comme Google (demander vocalement une recherche). Idéal pour les travailleurs nomades.  » Il y a un vrai besoin pour ce type de service, notamment dans l’industrie automobile « , explique Guillaume Luzé, sales manager Speech Technologies pour Nuance.

Techniquement, ça marche plutôt pas mal. Il y a peu de latence entre la dictée et le passage en mode texte et les erreurs sont rares à partir du moment où l’utilisateur articule bien et que l’environnement sonore extérieur est favorable.

Concrètement, la brique logicielle de Nuance se décline en deux modes. Localement (offre embarquée), le logiciel pilote le mobile à la voix. En ligne (offre serveur), le logiciel envoie au destinataire des SMS ou des mails dictés vocalement. Le correspondant peut écouter le message ou retrouver la transcription écrite du SMS ou du mail.

« Les opérateurs sont très friands de ce type de services, car ils représentent un levier de valeur. En effet, l’envoi vocal est facturé comme un envoi de data. Par ailleurs, cette fonction permet de se différencier. Mais les opérateurs ont le choix : ils peuvent proposer les deux modes (local et serveur) ou un seul », ajoute Guillaume Luzé.

Cependant Nuance prospecte d’abord les fabricants pour qu’ils intègrent la solution en marque blanche. A eux ensuite d’évangéliser les opérateurs.  » Notre solution est adaptable à quasiment tous les terminaux sous Symbian ou Windows. Les fabricants et les opérateurs sont très enthousiastes ». L’éditeur annonce avoir signé des contrats avec Nokia et LG.

L’idée à de quoi séduire. Mais va-t-elle révolutionner le secteur ? « On apporte surtout un nouveau confort, une nouvelle ergonomie, on améliore le quotidien des abonnés, surtout les professionnels », précise le sale manager.

En effet, la dictée vocale de messages ou de mails est d’abord un gain de temps pour la cible professionnelle. Les jeunes, accrocs aux SMS classiques apprécient la saisie manuelle du texte. Et payer pour transformer un message texte en message vocal n’est pas évident à faire passer : autant directement laisser un message sur la boîte vocale du destinataire.

L’offre se décline d’ailleurs au sein d’applications métiers spécifiques comme la logistique (vocal picking). Il s’agit de permettre aux préparateurs de commandes en entrepôt de travailler les mains libres, les ordres et la validation des ordres se faisant vocalement. Les bénéfices sont multiples: un gain de productivité estimé à 10%, une baisse de la pénibilité et la quasi-suppression des erreurs.

« Cela fait deux ans que l’on travaille sur cette question, notre technologie est prête. C’est une vraie évolution pour le secteur. On la vend à des éditeurs qui réalisent des interfaces dédiées qui sont ensuite proposées aux fabricants de terminaux et de hardware », précise Guillaume Luzé.

Deuxième grand marché pour ce type de solutions, celui du handicap visuel. Permettre aux aveugles et aux mal-voyants de mieux utiliser leurs mobiles et d’envoyer des SMS vocaux représente une véritable innovation. Le système peut par ailleurs d’adapter aux distributeurs de billets (excepté la saisie du code secret bien sûr).

Evidemment, Nuance n’est pas seul sur le coup. Acapela Group développe également des solutions de synthèse vocale. Ici, il s’agit de faire parler les applications mobiles. Acapela Mobility 7.1 pour WinCE, Linux, Symbian s’intègre dans les mobiles, PDAs, smartphones etc. et permet d’écouter les SMS, les emails, des contenus web etc. L’éditeur fournit notamment ses solutions à Neuf/Cegetel, Bouygues, SFR, Orange.

Selon Jean-Paul Haton, professeur au LORIA INRIA, spécialiste de l’intelligence artificielle et de la reconnaissance vocale « Le traitement de la parole arrive à maturité, mais nous continuons de faire évoluer les techniques de reconnaissance vocale. Le taux d’erreurs est décroissant au fur et à mesure que les technologies évoluent. Nous sommes aujourd’hui proches d’un taux d’erreurs de 10 %. »

Et pour l’avenir ? On imagine déjà des outils de traduction automatique qui permettraient de dicter une phrase en français et de l’écouter en anglais. « Ce n’est pas pour demain », préviennent les observateurs. Nuance confirme : « Nous n’avons pas encore énormément investi sur cette question «