Recherche

Pourquoi Meta fait face à un exode de ses chercheurs en IA

Le départ de plusieurs chercheurs majeurs dans la création de LLama soulève des questions sur la capacité de Meta à conserver et attirer les talents dans un secteur hautement concurrentiel.

Publié par Philippe Leroy le | Mis à jour le
Lecture
4 min
  • Imprimer
Pourquoi Meta fait face à un exode de ses chercheurs en IA
Getting your Trinity Audio player ready...

Yann le Cun, le Chief AI Scientist de Meta, est-il la figure qui cache la crise de rétention des talents de l'IA dans l'empire de Mark Zuckerberg ? Unanimement reconnu par ses pairs, le prix Turing 2018 est très actif dans le débat public et scientifique sur l'IA et porte haut les couleurs de FAIR (Facebook AI Research), l'un des plus importants centres de recherche du monde dans le domaine.

Mais derrière la figure du chef charismatique qui tient le devant de la scène, c'est le départ de chercheurs majeurs qui interroge. Meta a-t-il la capacité à conserver ses meilleurs talents dans un secteur hautement concurrentiel ? Selon Business Insider, sur les 14 chercheurs crédités dans l'article scientifique fondateur de 2023 qui a introduit le modèle Llama au monde, seuls trois travaillent encore pour l'entreprise : le chercheur Hugo Touvron, l'ingénieur de recherche Xavier Martinet et le responsable technique Faisal Azhar. Les onze partants avaient, en moyenne, passé plus de cinq ans chez Meta.

Le mois dernier. c'est la canadienne Joëlle Pineau, qui dirigeait FAIR depuis huit ans, qui quittait ses fonctions. Elle sera remplacée par Robert Fergus, cofondateur de FAIR en 2014, qui avait ensuite passé cinq ans chez DeepMind de Google avant de rejoindre Meta ce mois-ci.

À qui profite cette fuite ? Majoritairement à la concurrence. Et beaucoup chez Mistral AI. Deux de ses cofondateurs - Guillaume Lample et Timothée Lacroix - comptent parmi les architectes clés du modèle Llama original. Accompagnés de plusieurs autres anciens de Meta comme Thibaut Lavril et Marie-Anne Lachaux, ils développent désormais leurs LLM open source qui concurrencent directement les projets de Meta.

D'autres ont essaimé chez Microsoft AI, Anthropric, Google DeppMind, Cohere, Thinking Machines Lab et Kuytai.

Défis stratégiques et retards technologiques

Les difficultés de Meta ne se limitent pas aux départs. Selon le Wall Street Journal, l'entreprise retarde son plus important modèle d'IA, baptisé Behemoth, en raison de préoccupations internes concernant ses performances et son leadership. Cette situation intervient alors que Llama 4, la dernière version du modèle, a reçu un accueil mitigé de la part des développeurs, beaucoup se tournant désormais vers des concurrents open source plus rapides comme DeepSeek et Qwen.

Un gap technologique significatif s'est également creusé : malgré des investissements de plusieurs milliards de dollars dans l'IA, Meta ne dispose toujours pas d'un modèle de "raisonnement" dédié, spécialement conçu pour gérer les tâches nécessitant une réflexion en plusieurs étapes ou la résolution de problèmes complexes. Cette lacune devient de plus en plus notable alors que des concurrents comme Google et OpenAI priorisent ces fonctionnalités dans leurs derniers modèles.

L'article scientifique de 2023 sur Llama représentait bien plus qu'une simple avancée technique. Il a contribué à légitimer les grands modèles de langage à poids ouverts (open-weight large language models) avec un code sous-jacent et des paramètres librement disponibles, comme alternatives viables aux systèmes propriétaires de l'époque tels que GPT-3 d'OpenAI et PaLM de Google.

Meta avait entraîné ses modèles uniquement avec des données publiquement disponibles et les avait optimisés pour l'efficacité, permettant aux chercheurs et développeurs d'exécuter des systèmes de pointe sur une seule puce GPU. Pour un moment, Meta semblait pouvoir mener la frontière ouverte de l'IA.

Deux ans plus tard, cette avance s'est estompée et Meta ne donne plus le rythme, selon Business Insider. Le Wall Street Journal révèle par ailleurs que les modèles Llama ultérieurs au premier ont été développés par une équipe différente, soulignant la rupture organisationnelle consécutive aux départs.

Controverses sur l'évaluation des performances

Les difficultés récentes de Meta ont été exacerbées par une controverse concernant l'évaluation de ses modèles. Selon le Wall Street Journal, deux modèles publiés en avril avaient initialement bien performé sur un classement populaire de chatbots IA. Cependant, il s'est avéré par la suite que le modèle soumis au classement n'était pas le même que celui publié au grand public.

Les représentants du classement ont déclaré que Meta aurait dû préciser plus clairement qu'elle avait soumis un modèle personnalisé conçu pour bien performer sur ce test de référence spécifique. Mark Zuckerberg a reconnu que Meta avait soumis une version de son modèle d'IA optimisée pour le test de performance tiers.

La réussite de la stratégie IA de Meta dépendra de sa capacité à fidéliser ses équipes de recherche pour retrouver son avantage concurrentiel face à des rivaux de plus en plus agiles sur le marché de l'IA open-source.

Sur le même thème

Voir tous les articles Data & IA

Livres Blancs #bigdata

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

Voir tous les événements

S'abonner
au magazine
Se connecter
Retour haut de page