Microsoft et Hortonworks offrent Hadoop à Excel

Hortonworks développe pour Microsoft un connecteur ODBC permettant d’accéder à la plateforme analytique big data Hadoop, puis de télécharger et analyser les données dans Excel.

L’incontournable tableur Excel ne lâchera pas le morceau. Quelque peu oublié jusqu’à présent par la vague du big data et de la communauté open source Hadoop, il revient sur le devant de la scène, poussé par Microsoft et Hortonworks. Les nombreux fans d’Excel pourront continuer de pratiquer l’analyse des données issues du big data Apache Hadoop sur leur tableur préféré.

Le lien d’interaction d’Excel avec Haddop sera établi via un connecteur ODBC (Online Database Connector) au travers du système d’entrepôt de données (datawarehouse) Hive. Les données seront téléchargées depuis Hive dans Excel à l’aide d’outils comme Excel PowerPivot.

Microsoft s’investit dans Hadoop

C’est certainement une annonce majeure pour Microsoft. Les utilisateurs du tableur Excel et de PowerPivot se comptent par millions, tandis que le big data sur base Apache Hadoop s’impose comme une solution de premier plan pour le traitement analytique des données non structurées.

Le connecteur ODBC pour Hive est issu du partenariat engagé récemment par Microsoft et Hortonworks – cette dernière est une « spin out » de Yahoo! qui réunit les principaux contributeurs à Hadoop et MapReduce – pour adapter Hadoop à l’écosystème Microsoft. Développé par Hortonworks sur le modèle open source, il sera également ouvert à la communauté Apache Hadoop, tout comme les précédents développements de la start-up pour Microsoft, le connecteur pour SQL Server et l’instance pour le service cloud Azure, ainsi que le framework JavaScript pour Hadoop. Le but final du partenariat est de disposer d’une distribution et d’outils de développements Hadoop compatibles Windows Server.