Pour gérer vos consentements :

Développeurs : Stack Overflow peaufine sa recherche avec Crokage

Stack Overflow revendique plus de 10 millions d’utilisateurs inscrits dans le monde. En onze ans d’activité, la communauté de développeurs aurait généré plus de 18 millions de questions et près de 28 millions de réponses concernant la programmation informatique.

Ces douze derniers mois uniquement, 2 millions de questions auraient été déposées. Pour trouver des réponses, certains développeurs utilisent le moteur de recherche interne, quand d’autres passent par des moteurs généralistes comme Google et Bing, en limitant leur recherche au domaine stackoverflow.com.

« La plupart du temps, ils trouvent le code pertinent recherché, mais pas l’explication claire sur la façon de l’implémenter », a souligné dans un billet de blog Ben Popper, directeur de contenu chez Stack Overflow. « Dans d’autres cas, ils trouvent une explication claire sur la façon dont le problème pourrait être résolu, mais pas le code réel. »

Pour permettre aux développeurs de s’y retrouver, une équipe de chercheurs en informatique travaille depuis 2017 au développement de l’outil Crokage (Crowd Knowledge Answer Generator). Le projet de recherche a depuis progressé.

Crokage, un outil expérimental orienté Java

Crokage prend pour requête une courte description d’une tâche de programmation, puis fournit des réponses qui contiennent à la fois des extraits de code et leurs explications.

« Notre approche étend la description de tâches aux classes d’API pertinentes depuis le flux de questions/réponses de Stack Overflow, et limite ensuite les problèmes d’écart lexical », ont indiqué dans un document d’étude les chercheurs d’établissements brésilien et canadien.

« De plus, [l’outil] effectue un traitement en langage naturel sur les réponses de qualité supérieure, puis retourne les réponses de programmation contenant des exemples et explications de code, contrairement aux initiatives antérieures », ont-ils ajouté.

L’outil Crokage est actuellement proposé dans une version expérimentale. De plus, il est limité aux requêtes de programmation sur Java, pour le moment. Mais ses createurs prévoient de fournir une version étendue, ouverte au public, « prochainement ».

Un pack (replication package) est également disponible sur GitHub.

Recent Posts

Ce que Llama 3 dit de l’évolution des LLM

Diverses tendances animant l'univers des LLM transparaissent en filigrane du discours de Meta sur Llama…

14 heures ago

APT44, bras armé cyber de la Russie

Mandiant a attribué un APT à Sandworm, considéré comme le principal groupe cybercriminel à la…

1 jour ago

Cybersécurité : HarfangLab et Filigran connectent EDR et CTI

Les deux startup proposent un connecteur entre la platefome OpenCTI de Filigran et l’EDR de…

1 jour ago

Le hacking autonome, capacité émergente de GPT-4 ?

Des chercheurs ont mis des agents LLM à l'épreuve dans la détection et l'exploitation de…

1 jour ago

Les applications de messagerie se mettent au chiffrement post-quantique

Dans la lignée de Signal, iMessage intègre une couche de chiffrement post-quantique.

2 jours ago

Infrastructures LAN : une photo du marché avant la fusion HPE-Juniper

Douze fournisseurs sont classés dans le dernier Magic Quadrant des infrastructures LAN.

2 jours ago