L’Insee lance un défi à la communauté de data scientists

Pour améliorer la qualité de saisie en ligne des libellés de profession, l’Insee organise un challenge via la plateforme Datascience.net, mais n’offre pas de prix.

La plateforme francophone Datascience.net propose un nouveau challenge à la communauté de data scientists. Ils sont appelés à fournir à l’Institut national de la statistique et des études économiques (Insee) un algorithme pour améliorer la qualité de saisie en ligne des libellés de profession dans les formulaires d’enquête. Et ce sans contrepartie.

Une contribution participative de data scientists

L’initiative offre la possibilité à l’Insee de bénéficier à moindre frais de l’expertise de data scientists. Le candidat doit fournir pour chaque libellé de profession non traité automatiquement, trois propositions de libellés alternatifs. Au moins un doit donner le bon code directement utilisable par l’Insee pour réaliser des analyses. Mais contrairement aux concours organisés jusqu’ici via la plateforme, ce challenge n’est pas assorti d’un prix. La contribution est purement participative.

« L’esprit est différent. Nous avons voulu proposer un challenge ludique à la communauté, sans contrainte au niveau des langages utilisés, ni livrables à proposer », explique à la rédaction Nicolas Minelle, co-fondateur du site. « Les data scientists sont demandeurs. Ils ont la possibilité de s’exercer, d’échanger et de gagner en visibilité », a-t-il ajouté. À l’issue du challenge, une rencontre (meetup) organisée par Datascience.net et l’Insee permettra au vainqueur et aux participants qui le souhaitent de présenter leurs méthodes et algorithmes utilisés. Le challenge s’achèvera le 19 mars 2015.

À noter : les activités de recherche et d’enseignement de l’Insee sont rassemblées au sein du Genes (Groupe des écoles nationales d’économie et de statistique), co-créateur en 2013 de Datascience.net avec la société de conseil Bluestone.

Lire aussi
« Avec Datascience.net, une vraie communauté de data scientists se crée »
Polémique imprévue sur la prime d’un concours Datascience.net et SNCF