Microsoft et Big Data avec Hortonworks Data Platform for Windows (Server et Excel)

Accéder aux données Big Data sur Microsoft Excel via Windows Server, telle est la promesse de l’intégration de Hadoop par Microsoft.

Issu d’une année de collaboration entre Microsoft et Hortonworks, dont la distribution Hadoop est encore en développement, Hortonworks Data Platform for Windows est désormais disponible en téléchargement.

Après avoir travaillé sur son projet de base de données Dryad – un framework de data warehouse abandonné en 2011 -, Microsoft s’est finalement tourné vers la plateforme Hadoop et Hortonworks, la start-up développant une distribution open source historique de Hadoop.

Deux plateformes Big Data pour Microsoft

Hortonworks Data Platform for Windows, et prochainement Hortonworks Data Platform for Windows Azure en cours de développement, s’annoncent comme le bras armé de l’éditeur pour répondre à la vague du Big Data, mais sans faire de concession à Windows Server. Les requêtes SQL vont pouvoir interroger directement HDFS (Hadoop Distributed File System).

Avantage pour les utilisateurs, ces deux produits sont des déclinaisons de la distribution Apache Hadoop, auquel Hortonworks est le principal contributeur. Qu’elles soient en version Windows ou Windows Azure, les distributions de Microsoft devraient pouvoir tourner sur Windows Server et présenter une alternative à l’exécution native de Hadoop sur Linux.

En revanche, se posera certainement la question du coût de Hadoop. En version Windows Server, il sera plus élevé que sur Linux. En revanche, les serveurs Windows (73% selon IDC en 2012) sont plus répandus que les serveurs Linux. Les clusters Windows Hadoop pourraient bien rapidement envahir (une petite partie de…) la planète.

Big Data sur Excel

Ce n’est pas là que s’annonce le plus grand intérêt de ces solutions, le support de Windows Server est à ce titre une évidence… Mais ce qui retiendra certainement l’attention des acteurs du Big Data, c’est l’apport de Hadoop à Excel, à moins que ce ne soit l’inverse !

Excel est de très loin le principal outil de BI dans l’entreprise. Le mariage de Hadoop et du tableur est donc logique et pour cela Microsoft a travaillé aux évolutions de sa plateforme bureautique Office. Les démonstrations de l’usage d’Excel aux derniers TechDays, à la mi-février, ont été spectaculaires et ont démontré les capacités du tableur en tant que terminal dynamique pour afficher les données Big Data.

Est-ce un bien ? Certes Excel est un outil de démocratisation de l’analyse, mais cela n’en fait pas un outil analytique pour autant. Évidemment le tableur est un incontournable de la stratégie de Microsoft et de nos bureaux numériques. Mais il n’est pas certain que son usage ne restreigne la communauté Microsoft à un environnement finalement mal maitrisé et exploité qu’à une part réduite de ses capacités.


Voir aussi

Silicon.fr étend son site dédié à l’emploi IT
Silicon.fr en direct sur les smartphones et tablettes