Jusqu’où la déduplication des données d’entraînement améliore-t-elle la performance des modèles d’apprentissage automatique ? Le projet BigCode, dont nous nous sommes récemment fait l’écho, a abordé cet aspect. Il en va de même chez Anthropic.

Cette start-up de San Francisco a traité bien d’autres sujets dans le cadre de ses travaux sur l’IA. Ses publications en témoignent. Elles touchent, par exemple :

– Aux capacités de généralisation des réseaux de neurones

– À l’impact sociétal de l’évolution des performances des grands modèles de langage

– Au « conditionnement » de ces mêmes modèles par des ensembles de principes éthiques

– À la supervision des IA… par les IA

Anthropic, la riposte à ChatGPT

Anthropic a aussi tenté de définir des « lois de mise à l’échelle » pour entraîner les réseaux neuronaux plus efficacement et de manière plus prédictible. Il va pouvoir les mettre en œuvre dans le cadre de son partenariat avec Google Cloud.

Ce dernier devient le « fournisseur cloud préféré » d’Anthropic… et y investit, au passage, près de 400 M$*. Il en dit peu sur les travaux à venir, sinon qu’il s’agira de « codévelopper des systèmes IA ».

Anthropic a récemment ouvert l’accès – expérimental, avec liste d’attente – à un assistant nommé Claude. Disponible par API et intégrable dans Slack, il met en œuvre la technique de « conditionnement » sus-évoquée.

En toile de fond, un événement « recherche et IA » que Google organise ce 8 février 2023. Il est pressenti pour y dévoiler des éléments de riposte face à ChatGPT.

* Anthropic avait levé plus de 100 M$ en 2021. Il avait bouclé un autre tour de table au printemps 2022. Montant 580 M$. Une opération emmenée par le patron de FTX, plate-forme d’échange de cryptomonnaies… tombée depuis en faillite.

