Pour gérer vos consentements :
Categories: DéveloppeursProjets

CodeWhisperer vs GitHub Copilot : cap sur les codebases internes

À quand un assistant de codage capable de contextualiser ses recommandations en fonction d’une codebase interne ? AWS vient d’émettre une forme de déclaration d’intention à ce sujet : l’édition Enterprise de CodeWhisperer inclura une telle fonctionnalité.

Le groupe américain ne répond pas à la question du « quand ». Pour le moment, il invite les utilisateurs intéressés à se signaler en prévision du lancement d’une phase expérimentale.

Des tests ont déjà été conduits dans certaines entreprises. AWS en mentionne une : Persistent Systems, groupe indien de services et conseil en informatique. Les développeurs utilisant CodeWhisperer ont, en moyenne, bouclé leurs tâches « 28 % plus vite » grâce à cette nouvelle option, nous affirme-t-on.

À ce stade, on nous en dit peu sur le socle technique. La promesse, dans les grandes lignes : connectez les ressources internes que vous souhaitez, planifiez des tâches pour créer les personnalisations, puis gérez-les et distribuez-les aux devs à partir de la console AWS.

GitHub expérimente aussi pour Copilot

GitHub travaille également sur ce volet, dans le cadre d’un projet dénommé Copilot View.

Le défi est identifié : trouver un équilibre entre pertinence (quelles ressources sont pertinentes vis-à-vis de la tâche en cours ?) et performance (comment ne pas ajouter trop de latence ?).

La réponse, elle, n’est pas fixée. GitHub laisse plusieurs pistes ouvertes. En particulier entre l’approche REALM et celle de kNN-LM. La première consiste, sur le principe du RAG, à intégrer les informations pertinentes dans les requêtes faites à Copilot. La seconde ne fait intervenir ces informations que par après, pour influencer la probabilité de générer tel ou tel résultat.

Le recours à un index vectoriel ne fait en revanche pas de doute. GitHub a identifié plusieurs bibliothèques qu’il juge performantes pour la recherche par la méthode des plus proches voisins. Nommément, SPANN, FAISS et ScaNN.

Pour ce qui est de la vectorisation même, GitHub n’a pas encore tranché entre le recours à un modèle externe ou à l’intégration de capacités d’embedding dans Copilot. Il hésite sur d’autres points comme la localisation de l’index (côté serveur ou client ?).

À consulter en complément :

Bases de données : la bataille de la recherche vectorielle
Ce que les devs utilisent… et ce qu’ils plébiscitent
GitHub Copilot produit-il du code sécurisé ?
Bard, ChatGPT et leurs limites de raisonnement

Illustration ©

Recent Posts

La Suite Numérique : les errements d’un projet d’État

La Cour des comptes pointe les résultats insuffisants de La Suite Numérique (ex-SNAP) et évoque…

8 minutes ago

Apple Pay : l’UE valide l’ouverture à la concurrence sur les iPhone

La Commission européenne approuve la proposition d’Apple permettant à des concurrents de proposer des solutions…

4 heures ago

Que d’eau ! Les engagements d’AWS pour en économiser

AWS entend devenir « water-positive » pour 2030. Que recouvre cet objectif ?

1 jour ago

PC : le marché renoue avec la croissance au deuxième trimestre

Après sept trimestres consécutifs de baisse, le marché mondial des PC traditionnels affiche un rebond…

1 jour ago

Le CISPE et Microsoft trouvent un accord : et maintenant ?

Le CISPE s'est engagé à retirer sa plainte contre Microsoft. Quelle monnaie d'échange le groupe…

1 jour ago

Silo AI, une nouvelle prise pour AMD dans le vivier européen de l’IA

Après avoir acquis Mipsology en France, AMD s'empare de Silo AI, tête de pont de…

1 jour ago