Pour gérer vos consentements :

Google Meet vs Microsoft Teams : deux approches de l’IA

Cloud ou edge ? Google et Microsoft n’ont pas la même approche. En tout cas au sujet de la réduction de bruit par IA qui alimentera bientôt leurs logiciels respectifs de visioconférence.

L’un et l’autre avaient abattu leurs cartes il y a quelques semaines.
Google vient d’amorcer le déploiement sur Meet, à destination des clients G Suite Entreprise et Éducation. Microsoft n’a pas encore actionné le levier sur Teams, mais a promis de le faire sous peu.

La méthode « traditionnelle » utilisée de longue date dans ce domaine élimine essentiellement les bruits continus distinctement captables entre les temps de parole – par exemple, le soufflement d’un ventilateur.

Pour aller plus loin, Google et Microsoft impliquent des réseaux de neurones, entraînés en particulier à partir de vidéos YouTube.

L’expérience a un coût

Recourir ainsi à de l’apprentissage machine est censé favoriser la suppression des bruits émis à des fréquences proches de celle de la voix humaine.

La démarche suppose une grande attention portée aux jeux de données exploités. Microsoft – qui en a publié un en open source – reconnaît avoir soumis son modèle IA à plusieurs milliers de voix et plus d’une centaine de types de bruits.

Du côté de Google*, on insiste sur l’importance d’une approche multilingue. Tout en admettant qu’on ne peut parfois échapper aux faux positifs, notamment lorsque la source du bruit se trouve près du micro.

Google estime que sa technologie est en mesure de filtrer des éléments tels qu’un stylo qui clique, une porte qui claque, un frottement sur un sac plastique ou un aspirateur robot.
Le travail de calcul se fait dans les datacenters du groupe américain. La voix y est déchiffrée et traitée sur un TPU (processeur IA), puis rechiffrée et envoyée au destinataire. L’ensemble induit un délai d’environ 20 ms.

Pourquoi avoir choisi le cloud ? Au nom d’une « expérience harmonisée » entre des terminaux qui n’ont pas les mêmes capacités de calcul.

Microsoft, au contraire, tend vers une exécution en périphérie. La firme de Redmond invoque des questions de latence et de coûts. Elle souligne aussi que sur Teams, pour les discussions en face à face, ni l’audio, ni la vidéo ne passe pas par le cloud.
Le client de messagerie téléchargera régulièrement les mises à jour du modèle IA, en arrière-plan.

* La technologie que propose Google repose en partie sur l’acquisition de Limes Audio, annoncée début 2017.

Photo d’illustration © Lightspring – Shutterstock

Recent Posts

Arm-NVIDIA : de la Chine aux USA, les barrières se dressent

Aux États-Unis, un nouvel obstacle se dresse face au projet de fusion Arm-NVIDIA. Quelles autres…

2 jours ago

Géolocalisation en entreprise : un suivi proportionné ?

Utilisés dans le cadre professionnel, smartphones et véhicules peuvent être géolocalisés par l'employeur. Qu'en pensent…

2 jours ago

Salesforce : avec Bret Taylor, Marc Benioff prépare sa succession

Promu co-CEO, Bret Taylor pilote avec Marc Benioff le prochain chapitre de Salesforce. Leurs mots…

2 jours ago

Data et cybersécurité : les métiers les plus mouvants du SI ?

Les métiers de la data et de la cybersécurité concentrent une part importante des évolutions…

2 jours ago

Teams Essentials : une réponse à la Commission européenne ?

Microsoft dégaine une offre qui permet d'accéder à Teams indépendamment de sa suite bureautique cloud.…

3 jours ago

« Convergences numériques 2022 » : le Cigref, Numeum et d’autres interpellent les présidentiables

Cigref, Numeum, Cinov, Afnum... L'industrie numérique française sert les rangs pour peser sur les programmes…

3 jours ago