Recherche

Data.gouv.fr : de l'UI à la recherche, un défi d'accessibilité des données publiques

D'enquêtes de satisfaction en indicateurs d'impact, data.gouv.fr apparaît confronté à des défis en matière d'accessibilité des données. Sa roadmap s'en ressent.

Publié par Clément Bohic le | mis à jour à
Lecture
5 min
  • Imprimer
Data.gouv.fr : de l'UI à la recherche, un défi d'accessibilité des données publiques
© généré par IA

Super-admins, prière d'utiliser ProConnect.

Sur data.gouv.fr, on envisage cette option dans le cadre d'une réflexion sur le renouvellement des mots de passe des comptes d'administration. L'idée est de planifier cette opération à intervalle régulier, en se basant sur la fonctionnalité de rotation existante.

Sur la roadmap du produit, cet élément est pour le moment dans la section "todo" (développement non amorcé). Il y côtoie d'autres features ciblant les admins. Dont l'ajout de l'onglet "Réutilisation" sur les pages des jeux de données et la mise à disposition d'une "vraie" page d'édition d'une ressources (lien direct vers le formulaire).

Il est aussi question d'établir un rôle intermédiaire qui aurait le droit de modérer des contenus, mais pas d'en créer ni d'en supprimer. L'occasion d'évaluer qui, dans l'équipe data.gouv.fr, peut/doit effectivement rester super-admin.

Mieux mettre en valeur les données "essentielles"

Parmi les fonctionnalités signalées en cours de développement ("doing") figure un outil d'extraction de données via photo. Le ticket, ouvert en mars 2024, préconise de se servir d'outils IA existants.

On trouve également, dans cette section, des parcours de publication et d'édition de ressources communautaires.


À un stade plus avancé ("review"), il y a, entre autres, l'amélioration des discussions. En la matière, plusieurs items ont déjà été livrés, comme l'édition de messages (indicateur + remplacement de la date de création), le signalement de commentaires et la possibilité de répondre en tant qu'organisation. Il est prévu d'y ajouter une fonctionnalité de recherche (à partir de 10 discussions pour éviter le bruit sur faibles volumes) et les statistiques de l'organisation (taux de réponse et temps moyen).
Dans cette même section se trouve un dashboard des jeux de données étiquetés HVD (high-value datasets). Il s'accompagnera d'un label destiné à identifier les données "à fort impact".

Parmi les tickets clos ces dernières semaines, on recense :

  • Envoi d'un avertissement aux utilisateurs inactifs avant suppression de leur compte
    La politique de confidentialité impose cette action 3 ans après le dernier contact.

  • Gestion des multiproducteurs
    Différenciation entre "créateurs", "producteurs" et "diffuseurs".

  • Renseignement, directement sur l'interface d'admin, de schéma externe en complément de ceux présents dans le catalogue de schema.data.gouv.fr

  • Filtrage des datasets par statut (deleted, archived, private, public)
    Un tri plutôt qu'un filtrage a été envisagé, mais les statuts pouvant s'additionner, cela posait la question de la priorité à leur accorder.

Climat, réseaux, mobilité : 10 exemples de réutilisations de jeux de données

De ses évolutions 2024, data.gouv.fr retient, en particulier, l'accès par API aux données tabulaires, le téléchargement des données massives au format Parquet, le catalogage (reposant sur Grist), l'amélioration du moissonnage des données géographiques, l'intégration d'api.gouv.fr et la catégorisation des organisations à partir des SIRET.

Au cours de l'année, 630 réutilisations de données auront été partagées. Data.gouv.fr en donne dix exemples :

Le fichier des personnes décédées (INSEE) fut le jeu de données le plus consulté en 2024. Suivent les demandes de valeurs foncières (ministère de l'Économie), le répertoire national des associations (ministère de l'Intérieur), la liste publique des organismes de formation (ministère du Travail) et la base Sirene (INSEE).
Il y a une certaine corrélation avec les réutilisations les plus vues. Parmi elles, l'explorateur de biens vendus de Meilleurs Agents, l'explorateur de données de valeur foncière de data.gouv.fr et le moteur de recherche des personnes décédées matchID.

"Avez-vous trouvé ce que vous recherchiez ?" : un taux de satisfaction à améliorer

Data.gouv.fr suit, à cadence mensuelle, quatre indicateurs d'impact. Nommément :

  • Score de qualité moyen des 1000 jeux de données les plus vus
  • Délai moyen de réponse aux discussions relatives aux datasets (que ce soit par un membre de l'organisation productrice ou de data.gouv.fr)
  • Nombre de jeux de données du top 100 associée à une réutilisation que data.gouv.fr juge "de qualité"
  • Pourcentage d'utilisateurs ayant répondu positivement à la question "Avez-vous trouvé ce que vous recherchiez ?"

Depuis début 2024, le premier indicateur est relativement stable (entre 70 et 75/100 en fonction des mois). Le deuxième l'est aussi (systématiquement entre 18 et 19 jours). Le troisième a progressé (autour de 55 % début 2024 ; près de 70 % au dernier pointage). Le quatrième est resté, sur toute la période, remarquablement bas (entre 5 et 6 %). Il fait écho à quelques-uns des constats ressortis de la dernière enquête de satisfaction de data.gouv.fr :

  • Interface complexe, notamment pour les utilisateurs non experts
  • Moteur de recherche peu performant et manquant de filtres efficaces
  • Documentation insuffisante (en particulier, métadonnées pas toujours à jour ni très fournies)
  • Besoin de solutions de datavisualisation et d'un système d'alerte par e-mail pour être prévenu des mises à jour de datasets

Illustration principale générée par IA

Sur le même thème

Voir tous les articles Data & IA

Livres Blancs #security

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

Voir tous les événements

S'abonner
au magazine
Se connecter
Retour haut de page