Pour gérer vos consentements :

Contact Center AI : Google muscle la reconnaissance vocale

Google a mis à niveau et enrichi sa suite de solutions de reconnaissance vocale basées sur l’intelligence artificielle pour centres d’appels.

L’ensemble est regroupé au sein du portefeuille Contact Center AI depuis l’été 2018.

Le service est orienté développeurs et chatbots. Les améliorations et mises à jour annoncées concernent les technologies socles de l’offre.

Ainsi, Dialogflow, la plateforme de développement d’interfaces conversationnelles de Google, inclut désormais la fonctionnalité Auto Speech Adaptation (en version bêta).

Celle-ci peut être activée par le développeur dans la console Dialogflow.

Avec elle, les agents virtuels devraient pouvoir « comprendre rapidement ce dont les clients ont besoin », y compris dans des environnements bruyants, a indiqué Google dans un billet de blog. La fonctionnalité améliorerait la précision de ces bots de plus « de 40% ».

SpeechContext

D’autres amélorations, toutes en version bêta, concernent Cloud Speech-to-Text, l’API de Google qui permet aux développeurs de convertir du son en texte en exploitant des modèles de réseaux de neurones. La solution intègre dorénavant un modèle de base de reconnaissance vocale amélioré pour les solutions de serveur vocal interactif (Interactive Voice Response – IVR) et les agents virtuels « phone-based ».

Renforcer la reconnaissance vocale dans les centres de contact pour une expérience client améliorée.

La solution inclut également une fonction étendue de streaming (Endless streaming). « Jusqu’à présent, Cloud Speech-to-Text prenait en charge la diffusion audio uniquement par sessions d’une minute. Ce qui posait problème pour les transcriptions de longue durée comme les réunions, la vidéo en direct et les appels téléphoniques. » C’est la raison pour laquelle cette durée « a été portée à 5 minutes », a souligné Google.

Par ailleurs, le support natif du format de fichier MP3 est activé dans Cloud Speech-to-Text.

Enfin, pour Dialogflow et Cloud Speech-to-Text, des mises à jour des paramètres de SpeechContext de Google sont proposés. Avec elles, les développeurs doivent pouvoir compléter leurs applications d’informations contextuelles supplémentaires permettant d’améliorer la précision de la transcription. Et, par extension, l’expérience client.

(crédit photo © Shutterstock)

Recent Posts

FinOps : la spécification FOCUS dépassera-t-elle le IaaS ?

Premier stade de maturité atteint pour le projet FOCUS (FinOps Open Cost & Usage Specification),…

6 heures ago

CentOS en fin de vie : quelques portes de sortie

Le 30 juin 2024, c'en sera fini du projet CentOS. Parallèlement aux initiatives de Red…

9 heures ago

GenAI : Anthropic lance Claude 3.5 Sonnet

Trois mois après le lancement de Claude, sa gamme de LLM, Anthropic lance une mise…

10 heures ago

Kaspersky banni aux États-Unis : les grandes lignes du dispositif

Déjà banni des réseaux fédéraux étasuniens, Kaspersky l'est désormais dans tout le pays. Que prévoit…

12 heures ago

HP adhère avec modération au concept du PC Copilot+

HP lance ses premiers PC Copilot+, mais les met en avant sous une marque spécifique…

1 jour ago

Controversé, l’index de transparence LLM de Stanford passe en v2

Stanford a récemment actualisé son index de transparence des LLM, l'étendant à 14 fournisseurs dont…

1 jour ago