Nuance : la reconnaissance vocale se fait industrieuse

L’époque du gadget vocal laisse la place à une approche professionnelle de la reconnaissance vocale, outil au service de l’entreprise

Longtemps considérée comme un gadget aux résultats souvent aléatoires, la reconnaissance vocale a acquis au fil des années une légitimité et atteint aujourd’hui une maturité reconnue.

Nuance, issu du rachat de Nuance par Scansoft, s’affirme le leader de ce marché qui affiche son potentiel. L’éditeur compte aujourd’hui 1700 salariés et ses produits prennent en charge plus de 50 langues. Plus connu pour son produit phare et grand public Dragon Naturaly Speaking, l’éditeur se tourne de plus en plus vers le marché professionnel, où la reconnaissance vocale s’impose comme un outil de productivité. Mais dans quels domaines ? Les besoins les plus forts portent sur la qualification des appels en self service. C’est le premier marché de la reconnaissance vocale, nous confirme Patrice Vielpeau, responsable des ventes du réseau ‘speech solution‘ de Nuance. « L’appelant préfère se voir proposer quelque chose plutôt que d’attendre. Nos solutions permettent de qualifier les appels avec une capacité d’orientation quasi illimitée. Par exemple, le transporteur TNT traite ainsi 30 % de ses appels. » La voix de synthèse sur mesure est le second marché de la reconnaissance vocale. « Les entreprises disposent de plus en plus d’une charte vocale. Sa communication orale s’organise autour d’une voix commune et uniforme. » Troisième domaine professionnel, les solutions d’annuaires et d’automatisation des services de renseignement. « Chez les professionnels de la santé et les hôpitaux, par exemple, les solutions d’annuaires représentent un important marché. Sur les serveurs, nos produits permettent de s’affranchir des opératrices« , continue Patrice Vielpeau. Enfin, quatrième domaine en forte croissance, les solutions de reconnaissance et de synthèse vocale embarquées, comme la téléphonie, le GPS ou l’automobile. « Sur ce marché, nous sommes soumis à de fortes contraintes CPU et mémoire, liées à la taille des plates-formes qui embarquent un moteur de reconnaissance et/ou un moteur de synthèse vocale« , nous confie Guillaume Luzé, responsable Emea des ventes du secteur ‘Embedded‘ de Nuance. Mais la demande est forte pour communiquer avec les produits sans y toucher, à l’exemple des ‘kits main libre‘. « Dans l’automobile, la demande de technologies vocales est sur une pente exponentielle, qu’il s’agisse des plates-formes télématiques sur les ordinateurs de bord ou des systèmes de navigation, sept millions d’unités vendues ces derniers mois en Europe rien que pour le GPS !. » Comme le démontre l’expérience de Nuance en Europe comme en France – sur les marchés des télécoms, de la finance, de l’industrie (en particulier les transports), de la distribution et des ‘utilities’ administrations, santé, etc.) – la demande est forte dans les multiples domaines où la reconnaissance vocale peut apporter une valeur ajoutée. Mais ce marché reste en devenir et l’attente reste forte sur les prochains développements. R&D et standards

Dans le domaine de la reconnaissance vocale, la recherche reste un budget important et différentiateur à long terme. Avec 350 personnes qui se consacrent à la R&D, Nuance cumule à lui seul presque autant de chercheurs que ses concurrents réunis. Les grands axes de la R&D sont tout d’abord d’évoluer vers une interface utilisateur plus naturelle, la ‘human touch‘, d’évoluer vers plus de langage naturel et de proposer des outils de développement. Concernant la dictée vocale, l’objectif est d’être de moins en moins lié à la personne et de proposer des applications plus ouvertes et qui soient liées à des environnements professionnels identifiés. La gestion des dialogues sera plus élaborée et le locuteur pourra s’exprimer plus librement (‘speak freely‘). Reste la question des standards… Ils existent. Nuance participe activement au développement de Voice XML 2.0, et la version 2.1 est en cours de certification par le W3C. Et avec ce même organisme, Nuance est tête de file du projet SC XML, pour rendre les dialogues plus naturels.