Big Data : comment SoLocal apprivoise Hadoop

Chez SoLocal, le framework Hadoop a d’abord été utilisé par les équipes gérant les sites Web. Mais s’étend aujourd’hui à d’autres usages au sein de la régie publicitaire. Y compris à des applications radicalement nouvelles.

Arrivé chez SoLocal (précédemment Pages Jaunes Groupe) en novembre 2013, Abed Ajraou trouve un panorama analytique scindé en deux. Avec, d’un côté, les applications développées pour le Web et, de l’autre, une BI plus classique, dédiée au pilotage, au suivi des performances des commerciaux… « Le Big Data vient souvent avec les problématiques du Web. Chez SoLocal, la distribution Hadoop de Cloudera était déjà employée en 2013 par les équipes gérant les sites Web du groupe », détaille le responsable de la BI au sein du groupe SoLocal. « A mon arrivée, je me suis intéressé au croisement de ces deux mondes », glisse-t-il.

Concrètement, l’idée est d’exploiter le potentiel de Hadoop hors des seules équipes chargées de la gestion des sites Web. C’est ainsi que nait une application permettant de cartographier la France pour y détecter les marchés où peu d’entreprises annoncent. Un outil mis à disposition des managers commerciaux du groupe.

Abed Ajraou
Abed Ajraou

« L’objectif est de pousser les entreprises à investir dans les zones où le retour sur investissement est le plus intéressant », résume Abed Ajraou. Pour ce faire, SoLocal analyse les données issues de son audience Web et mobile (notamment les recherches effectuées par les internautes) et les croisent avec sa propre base de données renfermant les entreprises françaises. « Ce sont les données de l’Insee enrichies par nos commerciaux. Pagesjaunes s’oblige à afficher sur son site l’ensemble des entreprises de France », résume le responsable de la BI de la régie publicitaire (936 millions d’euros de chiffre d’affaires en 2014, à 68 % sur Internet).

Hadoop pour préparer l’avenir

« Sur cette application, le volume de données manipulé aurait été trop lourd pour une architecture traditionnelle, ajoute-t-il pour expliquer pourquoi la société a choisi, là encore, de recourir à un cluster Hadoop Cloudera. Et le choix de Hadoop permet aussi de préparer l’avenir, car on ne va pas se limiter aux seules données structurées ! Nous prévoyons d’intégrer par exemple les flux d’actualité sur les entreprises ou ceux relatifs à l’activité économique dans les villes ou régions. » Des contraintes pour lesquelles les bases de données relationnelles classiques sont inadaptées.

Sur le même principe, les équipes BI de SoLocal ont imaginé une autre application, assurant un suivi en quasi temps réel des ventes pour les membres du comité exécutif. Là encore, la régie exploite la distribution Cloudera pour agréger les données des différents systèmes commerciaux, et y greffe Impala (une base de données In-Memory pensée pour les architectures Hadoop).

De premiers développements qui donnent à Abed Ajraou de nouvelles idées. « On pourrait imaginer ouvrir l’application géographique directement aux entreprises clientes, afin qu’elles puissent optimiser leurs implantations. Ce serait une alternative aux approches statistiques du géo-marketing basées sur des échantillons. Car le Big Data remet en cause le besoin d’échantillonner, besoin lié à des problématiques de coûts et de moyens qui ne sont plus d’actualité. »

Révolution culturelle pour la BI

Pour Abed Ajraou, ce changement de paradigme technique doit s’accompagner d’une révolution culturelle dans l’entreprise. « L’équipe BI doit devenir force de proposition pour créer des applications à vocation métier, via des croisements de données, explique Abed Ajraou. Dans certaines organisations, cette approche peut perturber le département IT. Mais la DSI n’est pas la seule concernée ; le marketing doit aussi se transformer avec le Big Data. »

En parallèle, c’est aussi la méthode de développement qui doit être repensée. « Nous débordons d’idées de nouvelles applications. Mais reste à savoir celles qui sont envisageables – celles pour lesquelles on disposera bien des données espérées – et celles qui se révéleront utiles », dit Abed Ajraou. Pour tester ces idées, un mode de travail basé sur une définition des besoins n’est plus envisageable. « On travaille donc par itération en présentant un prototype aux sponsors de l’initiative afin qu’ils le manipulent et le commentent », ajoute le responsable.

En plus d’amener l’organisation dans une culture Big Data, l’équipe en charge de l’analytique dans l’entreprise doit aussi apprivoiser le rythme de l’innovation. « Hadoop s’impose certes comme un standard. Mais tout autour, l’environnement évolue très vite. Ainsi le framework Apache Spark est déjà remis en cause par un autre framework d’origine allemande, Flink. Ces communautés Open Source vont très vite. Si on veut suivre, une veille technologique active s’impose ».

A lire aussi :
Big Data : pourquoi le Stade Toulousain veut transformer l’essai
Big Data Paris : la SNCF et ses drones autonomes récompensés
Big Data : ça avance… mais en ordre dispersé

crédit : McIek Shutterstock