Data.gouv.fr : de l'UI à la recherche, un défi d'accessibilité des données publiques
D'enquêtes de satisfaction en indicateurs d'impact, data.gouv.fr apparaît confronté à des défis en matière d'accessibilité des données. Sa roadmap s'en ressent.

Super-admins, prière d'utiliser ProConnect.
Sur data.gouv.fr, on envisage cette option dans le cadre d'une réflexion sur le renouvellement des mots de passe des comptes d'administration. L'idée est de planifier cette opération à intervalle régulier, en se basant sur la fonctionnalité de rotation existante.
Sur la roadmap du produit, cet élément est pour le moment dans la section "todo" (développement non amorcé). Il y côtoie d'autres features ciblant les admins. Dont l'ajout de l'onglet "Réutilisation" sur les pages des jeux de données et la mise à disposition d'une "vraie" page d'édition d'une ressources (lien direct vers le formulaire).
Il est aussi question d'établir un rôle intermédiaire qui aurait le droit de modérer des contenus, mais pas d'en créer ni d'en supprimer. L'occasion d'évaluer qui, dans l'équipe data.gouv.fr, peut/doit effectivement rester super-admin.
Mieux mettre en valeur les données "essentielles"
Parmi les fonctionnalités signalées en cours de développement ("doing") figure un outil d'extraction de données via photo. Le ticket, ouvert en mars 2024, préconise de se servir d'outils IA existants.
On trouve également, dans cette section, des parcours de publication et d'édition de ressources communautaires.
À un stade plus avancé ("review"), il y a, entre autres, l'amélioration des discussions. En la matière, plusieurs items ont déjà été livrés, comme l'édition de messages (indicateur + remplacement de la date de création), le signalement de commentaires et la possibilité de répondre en tant qu'organisation. Il est prévu d'y ajouter une fonctionnalité de recherche (à partir de 10 discussions pour éviter le bruit sur faibles volumes) et les statistiques de l'organisation (taux de réponse et temps moyen).
Dans cette même section se trouve un dashboard des jeux de données étiquetés HVD (high-value datasets). Il s'accompagnera d'un label destiné à identifier les données "à fort impact".
Parmi les tickets clos ces dernières semaines, on recense :
- Envoi d'un avertissement aux utilisateurs inactifs avant suppression de leur compte
La politique de confidentialité impose cette action 3 ans après le dernier contact. - Gestion des multiproducteurs
Différenciation entre "créateurs", "producteurs" et "diffuseurs". - Renseignement, directement sur l'interface d'admin, de schéma externe en complément de ceux présents dans le catalogue de schema.data.gouv.fr
- Filtrage des datasets par statut (deleted, archived, private, public)
Un tri plutôt qu'un filtrage a été envisagé, mais les statuts pouvant s'additionner, cela posait la question de la priorité à leur accorder.
Climat, réseaux, mobilité : 10 exemples de réutilisations de jeux de données
De ses évolutions 2024, data.gouv.fr retient, en particulier, l'accès par API aux données tabulaires, le téléchargement des données massives au format Parquet, le catalogage (reposant sur Grist), l'amélioration du moissonnage des données géographiques, l'intégration d'api.gouv.fr et la catégorisation des organisations à partir des SIRET.
Au cours de l'année, 630 réutilisations de données auront été partagées. Data.gouv.fr en donne dix exemples :
- Célébrations et commémorations nationales en France depuis 1970 (par Maïwenn Bourdic, des Archives nationales)
- Jeux d'argent et de hasard, tickets à gratter... Pourquoi nous sommes toujours perdants (par Le Monde)
- Accès aux projections climatiques de référence à l'échelle locale (par Callendar, start-up française spécialisée dans l'évaluation des risques climatiques)
- Datavisualisation des comptes de l'État (par la Direction générale des finances publiques)
- Diagnostic mobilité (par Bruno Iratchet, spécialisé dans l'information géographique)
- Calculateur des aides à la rénovation énergétique (par Mes Aides Réno)
- Moteur de recherche des thèses (par Arno Cellarier, de SNCF Connect & Tech)
- Climat France (par Omar Shrit, de Renesas Electronics)
- Dataviz Petites Villes de Demain (par SPALLIAN, PME française spécialisée dans les données géographiques)
- Carte de l'état des réseaux (par l'ARCEP)
Le fichier des personnes décédées (INSEE) fut le jeu de données le plus consulté en 2024. Suivent les demandes de valeurs foncières (ministère de l'Économie), le répertoire national des associations (ministère de l'Intérieur), la liste publique des organismes de formation (ministère du Travail) et la base Sirene (INSEE).
Il y a une certaine corrélation avec les réutilisations les plus vues. Parmi elles, l'explorateur de biens vendus de Meilleurs Agents, l'explorateur de données de valeur foncière de data.gouv.fr et le moteur de recherche des personnes décédées matchID.
"Avez-vous trouvé ce que vous recherchiez ?" : un taux de satisfaction à améliorer
Data.gouv.fr suit, à cadence mensuelle, quatre indicateurs d'impact. Nommément :
- Score de qualité moyen des 1000 jeux de données les plus vus
- Délai moyen de réponse aux discussions relatives aux datasets (que ce soit par un membre de l'organisation productrice ou de data.gouv.fr)
- Nombre de jeux de données du top 100 associée à une réutilisation que data.gouv.fr juge "de qualité"
- Pourcentage d'utilisateurs ayant répondu positivement à la question "Avez-vous trouvé ce que vous recherchiez ?"
Depuis début 2024, le premier indicateur est relativement stable (entre 70 et 75/100 en fonction des mois). Le deuxième l'est aussi (systématiquement entre 18 et 19 jours). Le troisième a progressé (autour de 55 % début 2024 ; près de 70 % au dernier pointage). Le quatrième est resté, sur toute la période, remarquablement bas (entre 5 et 6 %). Il fait écho à quelques-uns des constats ressortis de la dernière enquête de satisfaction de data.gouv.fr :
- Interface complexe, notamment pour les utilisateurs non experts
- Moteur de recherche peu performant et manquant de filtres efficaces
- Documentation insuffisante (en particulier, métadonnées pas toujours à jour ni très fournies)
- Besoin de solutions de datavisualisation et d'un système d'alerte par e-mail pour être prévenu des mises à jour de datasets
Illustration principale générée par IA
Sur le même thème
Voir tous les articles Data & IA