Que devient le projet de Health Data Hub européen ?
En octobre 2022 débutait HealthData@EU, projet destiné à poser les bases du futur Espace européen des données de santé. Censé durer 2 ans, où en est-il ?

Combien de temps faut-il pour mettre en place une version de test de l'Espace européen des données de santé (EHDS) ?
À son démarrage en septembre 2022, le projet HealthData@EU devait durer deux ans. Aux dernières nouvelles, il est encore en cours. Toujours sous la conduite d'un consortium que la France emmène par l'intermédiaire du Health Data Hub.
Ce consortium, d'une quinzaine de membres, avait été retenu à l'issue d'un appel à candidatures effectué dans le cadre du programme EU4Health, lancé en mars 2021 pour "aider les États membres à construire des systèmes de santé plus robustes, plus résilients et plus accessibles". Il devait, à l'appui d'une enveloppe de 8 M€, "établir des fondations concrètes" pour le futur EHDS, destiné à favoriser la réutilisation transnationale des données de santé.
Lire aussi : HPE, nouvelle victime d'IntelBroker ?
Cinq cas d'usage ciblés
On ne partait pas de zéro. Dans une logique d'économie de temps et de coûts, Bruxelles avait suggéré d'utiliser des briques de la CEF (Connecting Europe Facility). Et d'exploiter, pour assurer l'interopérabilité, la spécification DCAT-AP. Cette dernière est basée sur un standard W3C (l'ontologie Data Catalogue Vocabulary). Maintenue dans le cadre du programme ISA² ("Europe interopérable"), elle fournit un socle commun pour le partage de jeux de données. Il en existe des extensions pour les données statistiques (StatDCAT-AP) et géographiques (GeoDCAT-AP). HealthData@EU cherche à en développer une spécifique aux données de santé, face à l'hétérogénéité des schémas actuellement utilisés (MIABIS, GSIM, CESSDA CMM, DDI...). Une mission dévolue à l'un de ses 5 groupes de travail "verticaux". Les quatre autres s'occupent de l'infrastructure, de la conformité juridique et réglementaire, de la qualité et de la protection des données, ainsi que de la gestion des cas d'usage.
Ces cas d'usage sont au nombre de cinq. Ils concernent, dans les grandes lignes :
- Surveillance des maladies infectieuses
Axé sur la résistance aux antibiotiques. Emmené par le Centre européen de prévention et de contrôle des maladies. Implique des données de Belgique, de Croatie, de Finlande et de Norvège. - Compréhension des risques de thrombose chez les malades du COVID-19
Emmené par l'Agence européenne des médicaments. Implique des données de France, de Croatie, du Danemark et de Finlande. - Comparaison des tests, des vaccinations et des hospistalisations COVID entre la population en général et diverses populations vulnérables (plus de 65 ans, patients présentant des comorbidités, résidents des maisons de retraite, travailleurs du secteur de la santé...)
Emmené par Sciensano (institut national belge de santé publique). Implique des données de France, de Belgique, de Croatie, du Danemark, de Finlande et de Hongrie. - Comparaison des parcours de soins pour les maladies cardiométaboliques dans les pays européens et construction de modèles prédictifs
Emmené par le Health Data Hub. - Mobilisation et chaînage de données cliniques et génomiques pour améliorer la compréhension du cancer colorectal
Emmené par l'organisation intergouvernementale ELIXIR. Implique des données de Belgique, du Danemark et de Hongrie.
En mars 2023, le projet ayant cadré son PoC, il avait fourni un premier aperçu à haut niveau de l'architecture cible. Il était alors question d'avoir, pour décembre 2023, un MVP couvrant les deux premières étapes du parcours utilisateur. À savoir, d'une part, la découverte de données (exposition d'un catalogue public de datasets). Et de l'autre, les demandes d'accès. L'objectif était d'enrôler trois noeuds (France, Danemark, Finlande) et de les centraliser au niveau d'un catalogue européen.
Un comité consultatif à forte coloration française
En avril 2023, à l'issue d'un appel à candidatures, HealthData@EU avait sélectionné 49 membres pour son comité consultatif externe. Parmi eux :
- Agathe Arlotti, responsable des partenariats chez Owkin (biotech franco-américaine)
- Ségolène Aymé, médecin et généticienne, directrice de recherche à l'Inserm
- Pauline Bosco-Lévy, alors directrice médicale chez Horiana, société de conseil spécialisée en épidémiologie et biostatistiques (l'intéressée est désormais chez Novartis)
- Raja Chiky, directrice des projets innovants chez 3DS OUTSCALE
- Rémy Choquet, directeur médical chez Roche
- Hugo Crochet, DSI du centre de lutte contre le cancer Léon Bérard (Lyon)
- Arthur Dauphin, chargé de mission numérique en santé chez France Assos Santé
- Bertrand de Neuville, alors directeur stratégie et conseil en données de santé chez Accenture (il est désormais directeur du digital et des données de santé chez Heva)
- Matthieu Doutreligne, data scientist à la Haute Autorité de santé
- Grégoire Ficheur, épidémiologiste au Centre hospitalier universitaire de Lille
- Pierre-Antoine Gourraud, professeur des universités et praticien-hospitalier de la faculté de médecine de l'université de Nantes
- Pauline Granger, conseillère juridique chez Sanofi
- Julien Guérin, directeur des données de l'Institut Curie
- Agata Hidalgo, directrice des affaires européennes de France Digitale
- Marco Lorenzi, scientifique chez Inria Sophia Antipolis, dans l'équipe EPIONE (e-médecine)
- Catherine Quantin, directrice du service de biostatistiques et information médicale du CHU de Dijon
- Linda Thieulon, adjointe à la DPO de l'AP-HP
Cadres juridiques : l'exception CNIL
À l'été 2023, le projet avait publié une analyse des cadres juridiques de collecte et d'utilisation des données sous-jacents à ses cinq cas d'usage. Entre autres constats :
- Rares sont les catalogues de métadonnées exhaustifs (la France en propose un... partiel).
- Dans la plupart des cas, un comité éthique/scientifique est impliqué. Mais les rôles sont assez hétérogènes en fonction des États membres.
- Les autorités nationales de protection des données ne sont généralement pas sollicitées pour la délivrance d'autorisations, à l'exception notable de la CNIL française.
- La mise à disposition des données après obtention d'une autorisation peut prendre jusqu'à un an (cas de la Norvège ; en France, c'est plutôt 6 mois, comme en Belgique).
- Beaucoup de mesures pour l'exercice des droits des citoyens au nom du RGPD sont encore en implémentation, voire en débat.
Harmoniser les demandes d'accès
Parmi les livrables produits en 2024 figurent des formulaires destinés aux demandes d'accès à deux niveaux de granularité. L'un, pour les données anonymes agrégées. L'autre pour les données anonymes ou pseudonymes rattachées à des individus. Une approche en ligne avec les modèles finlandais et norvégien... et surtout avec le règlement EHDS. L'idée était de structurer autant que possible ces documents pour permettre une automatisation partielle de leur traitement et faciliter leur traduction. Quant aux éléments portés à la connaissance du public à propos de ces demandes, il a été décidé d'une approche plus "restrictive" que celle du Health Data Hub : le nom du projet et de son directeur, les finalités poursuivies, une description des données qui seront utilisées, et un résumé du projet.
Fin 2024 fut publié l'ultime livrable du groupe de travail chargé de l'infrastructure. L'architecture proposée exploite, entre autres ressources CEF, Domibus, implémentation de référence du protocole eDelivery. Les "CB engines" (cross-border engines, moteurs transfrontières) sont des extensions des SI des organismes d'accès aux données de santé. Elles permettent, par exemple, de synchroniser automatiquement les changements sur le catalogue européen et de mettre à jour le statut des demandes.
Les "connecteurs nationaux" (en violet ci-dessus) sont architecturés en microservices.
Le projet promet, pour début 2025, des recommandations à l'adresse de qui souhaite opérer un noeud EHDS. Il en prévoit d'autres concernant l'application de technologies améliorant la privacy, la sécurité des données et les capacités de calcul des noeuds.
Illustration principale © your123 - Adobe Stock
Sur le même thème
Voir tous les articles Data & IA