Baidu propose en Open Source Warp-CTC (CTC pour Connectionist Temporal Classification). Cet outil d’intelligence artificielle a été conçu pour améliorer le niveau de reconnaissance vocale du programme Deep Speech 2 en anglais et en mandarin. Les développements ont été initiés dans le Silicon Valley AI Lab (SVAIL) de Baidu Research, qui a annoncé le lancement dans un billet de blog. « Pour des phrases courtes, sorties de leur contexte, [le programme] semble surpasser les niveaux humains de reconnaissance », a déclaré Andrew Ng, un responsable scientifique du projet.
Warp-CTC s’appuie sur une approche connexionniste de l’intelligence artificielle. Le logiciel inclut une bibliothèque en C et une intégration pour Torch, le framework de calcul scientifique. La start-up californienne Nervana, par ailleurs, utilise Warp-CTC pour son programme neon, une bibliothèque de Deep Learning écrite en Python.
Le code source de Warp-ctc est disponible sur Github sous licence Apache. Baidu est loin d’être le seul acteur du Net à rendre ses solutions Open Source. LinkedIn a notamment rendu Open Source FeatureFu, sa boîte à outils dédiée à l’apprentissage automatique, l’an dernier. Et Google a fait de même en novembre 2015 avec son outil de machine learning (ML) TensorFlow.
Lire aussi :
TensorFlow, le machine learning de Google passe en Open Source
LinkedIn rend Open Source FeatureFu, boîte à outils du Machine Learning
OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.
Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…
Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…
Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?
Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…
Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…