Analytique : SAP propose de marier Hadoop et Hana

SAP reprend à son compte l’outil analytique Open Source Spark pour proposer des traitements croisant les données de Hadoop avec celles de sa base de données maison, Hana.

SAP dote sa plate-forme Hana d’un outil de requête permettant d’analyser des données stockées tant sur un cluster Hadoop que dans sa base In-Memory. Cet outil, baptisé Hana Vora, s’appuie sur le framework de calcul distribué Open Source Apache Spark. Contrairement à Map Reduce, ce dernier exploite le In-Memory, accélérant grandement les traitements.

Sans surprise, le premier éditeur européen présente son nouvel outil comme une passerelle entre le monde Hadoop et sa base de données In-Memory Hana, réceptacle des données de l’ERP maison et/ou du datawarehouse d’entreprise. Dans son communiqué, SAP cite ainsi des cas où le rapprochement des données structurées issues des progiciels et d’informations moins structurées issues de systèmes externes, de partenaires ou d’objets connectés fait sens : détection des fraudes dans la banque, optimisation de la bande passante dans les télécoms, maintenance prédictive…

Hadoop, l’argument low cost

Pour SAP, offrir un outil permettant d’interroger toutes les sources de données tout en tirant parti du In-Memory permet de raffermir la légitimité de Hana dans l’analytique, en renforçant l’intégration avec Hadoop, déjà entamée via des partenariats avec les principaux éditeurs de distributions du marché. Les DSI exploitent en effet souvent ce framework Open Source pour ses atouts économiques : utilisable avec des architectures x86 d’entrée de gamme, il permet de décharger le datawarehouse d’entreprise et de positionner le framework en agrégateur de données (on parle alors de data lake ou data hub), sans recourir aux fastidieux processus d’ETL. Selon les sociétés qui proposent des distributions commerciales de Hadoop, le coût au To serait divisé par un facteur allant jusqu’à 100 par rapport à un datawarehouse du marché.

Un argument qui pèse dans les environnements SAP, car la plate-forme Hana est réputée chère, même si, après s’être arc-bouté sur une tarification au volume jugée excessive par nombre d’entreprise, l’éditeur a depuis fait des efforts (offre Cloud, certification dans les environnements virtualisés…). Il n’en reste pas moins que, en production, Hana s’appuie sur des appliances fournies par des partenaires de l’éditeur, des machines dédiées qui restent coûteuses. Hana Vora permettra aux entreprises d’exploiter les capacités de ces appliances pour des traitements In-Memory avec des données issues de clusters Hadoop. Pour l’éditeur, l’outil analytique apparaît aussi comme une façon d’étendre la portée de sa plate-forme In-Memory au monde non SAP. « Avec cette annonce, SAP reconnaît la rapidité d’adoption de Spark. Depuis deux ans maintenant, nous affirmons que ce dernier va remplacer Map Reduce », commente Romain Picard, qui dirige les activités de Cloudera en Europe du Sud.

Hana Vora sera disponible d’ici à la fin du mois ; trois licences différentes seront proposées, dont une version Cloud gratuite réservée aux développeurs. A cette échéance, SAP mettra aussi sur le marché Hana Cloud Platform for the IoT, sa plate-forme In-Memory en mode Saas pour l’Internet des objets annoncée en mai dernier. Concernant cette dernière, l’éditeur ne précise pas, dans sa communication, le mode de licensing retenu.

A lire aussi :

Big Data : Teradata embrasse Hadoop… faute de pouvoir l’éviter
Hadoop sur le déclin ? Cloudera, Hortonworks et MapR répondent