Accéder à mon infrastructure Big Data depuis Excel. Possible ?

Grâce à Power Query, Excel est capable d’accéder aux flots de données issus du Big Data. Le tableur de Microsoft fait toutefois face à la concurrence de Power BI Desktop, qui reprend les mêmes technologies, mais dans un outil gratuit mieux adapté à l’analytique et la DataViz.

La possibilité donnée au tableur Excel de traiter des sources de données externes ne date pas d’hier. Excel 97 pouvait déjà se connecter à des bases de données SQL. Et Excel 2010 a eu droit à Power Pivot, qui lui offrait d’accéder à des sources de données encore plus volumineuses.

« Mais Power Pivot avait des limites et c’est pourquoi Power Query a été proposé comme add-in d’Excel 2010, explique Franck Mercier, Technical Evangelist ISV, Microsoft France. Power Query donne accès à un plus grand nombre de types de données, structurées ou non structurées. Il permet de capter, nettoyer, transformer et enrichir la donnée avant de l’envoyer vers Excel. »

Power Query est maintenant intégré en standard dans Excel 2016. Au fil du temps, le nombre de connecteurs proposés est devenu impressionnant, avec des passerelles classiques (ODBC, SQL Server, Oracle), d’autres plus originales (Facebook, Salesforce) et jusqu’à la capacité de se connecter à un Data Lake Hadoop.

Power Query est livré avec son propre langage, M, chargé de décrire les transformations de données. Les transformations peuvent être définies en mode graphique. Des scripts M sont alors automatiquement créés, lesquels pourront être modifiés par la suite.

Deux modes d’accès aux données sont proposés. Un classique, par importation. Et direct query, pour accéder aux données en direct. Une option requise pour se connecter à des sources de données de type Big Data. La vitesse dépendra bien entendu des traitements demandés. Pour 6 milliards de lignes de logs, le temps de réponse se fixe à quelques dizaines de secondes lors du premier accès et quelques secondes par la suite. Du solide donc.

Power BI Desktop : la suite logique d’Excel pour l’analyse de données

La suite analytique de Microsoft, c’est Power BI. « La data est au centre de tout, constate Franck Mercier. C’est l’or noir de notre génération. Toutefois, si on veut en tirer quelque chose d’intelligent, il faut pouvoir la comprendre. Et pour la comprendre, il faut des outils adaptés et simples d’emploi. » C’est ce que propose l’offre Power BI, qui se veut le remplaçant naturel d’Excel pour les travaux d’analyse de données.

Power BI se compose de divers produits : les Power BI Services, une solution SaaS freemium de consommation de données ; Power BI Desktop, un logiciel gratuit d’analyse de données ; les add-ins Power BI pour Excel – Power Query, Power Pivot, Power View (création de rapports interactifs) et Power Map (cartographie 3D).

Power BI Desktop est un produit intéressant, car accessible gratuitement. « Dans le secteur de l’analyse de données, ce que sait faire Excel, Power BI Desktop le fait. Toutefois, Power BI Desktop est gratuit, en évolution rapide et profite de mises à jour mensuelles. Ainsi que d’une passerelle pour récupérer les fichiers Excel. »

Ce logiciel pourra donc reprendre les travaux commencés sous Excel, tout en permettant d’aller bien plus loin dans le domaine de la DataViz. « Les rapports créés à l’aide de Power BI Desktop pourront être partagés sur les Power BI Services, ajoute notre expert. Avec une diffusion possible en mode desktop ou mobile, et l’intégration avec Cortana, pour une interrogation des rapports en langage naturel. »