Le Machine Learning améliore la productivité de la PME Conexance

Big DataBusiness IntelligenceCloudData & StockageDSIIAASProjets

Spécialisé dans l’analyse de données pour des entreprises de la distribution, de l’assurance ou des télécoms, Conexance se tourne vers le Machine Learning pour gagner en productivité et en performances.

Mise à jour à 14h22

Remplacer un long processus manuel par des algorithmes qui découvrent seuls les relations les plus significatives entre différentes variables. Cette approche, qui est au cœur du Machine Learning, ne pouvait pas laisser la PME lilloise Conexance indifférente. Regroupant une quarantaine de personnes, ce prestataire spécialiste de statistiques propose à des sociétés d’un même secteur de partager, au sein de clubs fermés (distribution, presse et caritatif), des données anonymisées afin d’effectuer des analyses sur de larges volumes d’information. « Nous gérons des données historisées sur de longues périodes, renfermant de multiples informations sur les comportements des clients. Notre travail consiste à fournir des informations prédictives à nos clients : modélisation du churn (déperdition au sein de la base clients, NDLR), définition du potentiel de clients, stratégie d’acquisition de nouveaux clients… », précise René Lefébure, le directeur de la R&D de Conexance. Au total, la PME a agrégé, dans ses bases, 24 millions de foyers et gère pas moins de 1 700 variables essentiellement transactionnelles (2 500 prévues fin 2016. Autant d’éléments potentiellement significatifs des comportements clients. « C’est cette largeur qui pose problème. Nous avions besoin de nouveaux algorithmes », reprend René Lefébure.

Un modèle prêt en moins d’une heure

conexance
René Lefébure

Avant tout pour des questions de productivité. Chez Conexance, une équipe de 9 personnes doit réaliser plus de 5 000 scorings par an. « Or, chacun d’entre eux nécessite en moyenne 6 passages (choix des dimensions et algorithmes pertinents, NDLR). Ces étapes statistiques demandent entre 3 heures – pour les scorings les plus simples – et jusqu’à 7 ou 8 heures de travail », détaille le directeur de la R&D. D’où l’intérêt de la PME pour les services de Machine Learning. Après étude (et évaluation de plusieurs alternative dont l’offre de Sas Institute et des solutions Open Source bâties autour de R), Conexance opte pour l’offre Microsoft : Azure Machine Learning. « Aujourd’hui, avec plus de 1 000 variables et environ 1 million d’enregistrements, construire un modèle sur ce service prend environ 50 minutes. Et le faire tourner demande 11 à 12 minutes de plus », assure René Lefébure. A condition évidemment de dimensionner l’infrastructure Azure en conséquence, ce qui a un impact sur les coûts.

Le gain de productivité pour les équipes de statisticiens n’en reste pas moins important. Un élément intéressant pour Conexance, qui, pour gagner l’adhésion de nouveaux clients à ses clubs, propose des tests gratuits sur de premiers scoring. Etre en mesure de les produire rapidement et de façon très automatisée s’avère donc crucial pour la société nordiste.

Prédictions plus fiables

Par ailleurs, le passage au Machine Learning masque également un enjeu de performances. « Dans l’univers mouvant de la donnée, où il faut faire progresser les rendements des campagnes, multiplier les types de scoring, intégrer des démarches de segmentation ou encore raccourcir les délais de livraison, miser sur une analyse statistique qui, elle, n’évolue pas ne me paraît pas être le bon modèle », résumé René Lefébure. Le Machine Learning permet de faire tourner en parallèle 8 modèles différents. « Selon les problématiques il est possible soit de sélectionner le meilleur modèle (selon un ou plusieurs critères), soit de combiner les différents modèles et/ou leurs résultats », précise le statisticien dans un billet de blog. Là où la méthode classique ne permet de bâtir – en 3 heures au mieux – qu’un modèle reposant sur un seul algorithme. Conexance avance des gains dans la qualité de prédiction allant de 20 % – « ce qui ne change rien pour un client sur le plan opérationnel »- à 300 %. Un bond qui, là, se révèle très significatif et qui résulte de « l’intégration de davantage de variables et de l’utilisation d’une combinaison de modèles », selon René Lefébure

Si la PME utilise pour l’instant Azure for Machine Learning en doublon de son outillage traditionnel (basé sur les solutions de Sas Institute), essentiellement pour benchmarker les modèles traditionnels de Conexance, René Lefébure envisage un avenir où le Machine Learning prendra le pas sur les démarches manuelles. « A terme, j’espère que ces dernières ne représenteront plus que 10 % de nos opérations de scoring », dit-il. D’ici la fin 2015, la PME envisage également la construction d’un portail sur lequel ses clients pourront faire fonctionner eux-mêmes les modèles les plus performants.

Signalons que Conexance s’est également appuyé sur Azure pour son architecture Hadoop. Celle-ci héberge des données non structurées (essentiellement des données de navigation), tandis que les bases SQL plus classiques (Oracle pour les données très confidentielles et SQL Server) prennent en charge les données transactionnelles.

A lire aussi :

Machine Learning contre statistiques « classiques » : qui remportera le match ? (tribune)
Ciblage marketing : la Fnac fait confiance au Machine Learning
Bernard Ourghanlian, Microsoft : « Pourquoi le Machine Learning va gagner l’entreprise »

Crédit photo : agsandrew / Shutterstock

Lire la biographie de l´auteur  Masquer la biographie de l´auteur