Une initiative européenne dédiée au Data-as-a-Service

LEADS (Large-scale Elastic Architecture for Data-as-a-Service) est un projet européen d’interrogation en temps réel des données accessibles publiquement.

Initiative de l’Union Européenne destinée aux entreprises, LEADSLarge-scale Elastic Architecture for Data-as-a-Service ou architecture élastique à grande échelle dédiée données-as-a-service – vise à créer une architecture d’extraction et d’analyse des données publiées sur la totalité du web public, augmentées des données privées des entreprises. Un service destiné aux PME .

« D’importantes quantités de données pourront être compilées grâce au partage des collections, des stockages et des requêtes de nombreux utilisateurs », précise le projet.

Consortium universitaire européen

Ce projet (Programme FP7, réf. 318809, durée 36 mois, budget 4,05 millions d’euros) est porté par le consortium LEADS composé d’universités et de centres de recherche européens, Université de Neuchâtel (IIUN) en Suisse (coordinateur), Technische Universität Dresden en Allemagne, Telecommunication Systems Institute de l’Université technologique de Crète en Grèce, la Fundació Barcelona Media Universitat Pompeu Fabra en Espagne.

Projet open source, il est ouvert à des contributeurs entreprises, qui peuvent apporter de nouvelles technologies et méthodes. C’est ainsi qu’Adidas et AoTerra (écoconsommation énergétique) ont rejoint le projet. Mais dans le domaine qui nous intéresse, c’est plutôt la présence de Yahoo – qui a fourni des serveurs à l’IIUN afin de permettre aux chercheurs de prendre en compte la localité des accès et des traitements – et surtout de Red Hat qui a retenu notre attention.

Red Hat dans la boucle

L’idée qui a motivé la présence de Red Hat est la possibilité offerte par LEADS de stocker les données analysées dans une collection de micro-clouds – des micro-centres de calcul plus proches à la fois de la source des données et de l’utilisateur – évolutifs (élasticité), ce qui est à la fois une solution plus ouverte, plus économique et plus écologique que celle de datacenters dédiés dans les entreprises. Soit une architecture construite sur un framework DaaS (Data-as-a-Service) décentralisé, ce qui correspond à l’objectif d’infrastructure du projet.

Les processus de traitement en temps réel de la donnée peuvent être enrichis de données privées stockées dans l’entreprise ou chez ses clients et cryptées par une clé qui n’est pas connue de LEADS, voire augmentés de versions historiques de données publiques ou privées. L’enrichissement analytique de l’information provient de la mutualisation volontaire des données sur l’infrastructure partagée.

Des projets open source autour de LEADS

La participation de Red Hat au projet procède de deux logiques. Tout d’abord, la plateforme repose sur les technologies open source de l’éditeur, ce qui pour Mark Little, vice-président Middleware Engineering de Red Hat, vient confirmer l’engagement de la Communauté européenne sur l’open source.

Mais l’intérêt du géant du monde Linux est plus large, les travaux menés par LEADS et les outils développés peuvent être déployés dans d’autres projets open source. Red Hat cite Infinispan (data grids open source), GlusterFS (file system cluster), Hibernate (framework relationnel persistent), HibernateOGM (persistance pour base de données NoSQL), et OpenShift Origin (Platform-as-a-Service auto-scaling), tous projets par ailleurs sponsorisés par l’éditeur.


Voir aussi

Silicon.fr étend son site dédié à l’emploi IT

Silicon.fr en direct sur les smartphones et tablettes