Pour gérer vos consentements :

Contact Center AI : Google muscle la reconnaissance vocale

Google a mis à niveau et enrichi sa suite de solutions de reconnaissance vocale basées sur l’intelligence artificielle pour centres d’appels.

L’ensemble est regroupé au sein du portefeuille Contact Center AI depuis l’été 2018.

Le service est orienté développeurs et chatbots. Les améliorations et mises à jour annoncées concernent les technologies socles de l’offre.

Ainsi, Dialogflow, la plateforme de développement d’interfaces conversationnelles de Google, inclut désormais la fonctionnalité Auto Speech Adaptation (en version bêta).

Celle-ci peut être activée par le développeur dans la console Dialogflow.

Avec elle, les agents virtuels devraient pouvoir « comprendre rapidement ce dont les clients ont besoin », y compris dans des environnements bruyants, a indiqué Google dans un billet de blog. La fonctionnalité améliorerait la précision de ces bots de plus « de 40% ».

SpeechContext

D’autres amélorations, toutes en version bêta, concernent Cloud Speech-to-Text, l’API de Google qui permet aux développeurs de convertir du son en texte en exploitant des modèles de réseaux de neurones. La solution intègre dorénavant un modèle de base de reconnaissance vocale amélioré pour les solutions de serveur vocal interactif (Interactive Voice Response – IVR) et les agents virtuels « phone-based ».

Renforcer la reconnaissance vocale dans les centres de contact pour une expérience client améliorée.

La solution inclut également une fonction étendue de streaming (Endless streaming). « Jusqu’à présent, Cloud Speech-to-Text prenait en charge la diffusion audio uniquement par sessions d’une minute. Ce qui posait problème pour les transcriptions de longue durée comme les réunions, la vidéo en direct et les appels téléphoniques. » C’est la raison pour laquelle cette durée « a été portée à 5 minutes », a souligné Google.

Par ailleurs, le support natif du format de fichier MP3 est activé dans Cloud Speech-to-Text.

Enfin, pour Dialogflow et Cloud Speech-to-Text, des mises à jour des paramètres de SpeechContext de Google sont proposés. Avec elles, les développeurs doivent pouvoir compléter leurs applications d’informations contextuelles supplémentaires permettant d’améliorer la précision de la transcription. Et, par extension, l’expérience client.

(crédit photo © Shutterstock)

Recent Posts

GPT-4o : où, quand et pour qui ?

OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.

2 jours ago

Nom de domaine : Twitter définitivement remplacé par X

Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…

2 jours ago

Microsoft propose une délocalisation hors de Chine à ses ingénieurs IA et Cloud

Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…

2 jours ago

Du « Monde » à Reddit, le point sur les partenariats data d’OpenAI

Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?

2 jours ago

Comment Younited a appliqué la GenAI au crédit conso

Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…

2 jours ago

Processeurs : les États-Unis fabriqueront 30 % des puces avancées d’ici 2032

Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…

3 jours ago