Big Data : le Machine Learning protège les Livebox Orange de la foudre

Mixer les données de Météo France à la géolocalisation de ses abonnés. Et confier le tout au Machine Learning. Orange a imaginé cette solution pour protéger ses Livebox des surtensions dues à la foudre. Résultat : des dizaines de milliers de box sauvées.

Des données météo, une pincée de Machine Learning et, à la clef, plusieurs dizaines de milliers de Livebox – la box Internet d’Orange – sauvées de la foudre. Mis en œuvre par les équipes chargées de l’exploitation des données chez l’opérateur, ce projet (« Sauvons les Livebox »), présenté dans le cadre du salon Big Data Paris (qui se tenait les 7 et 8 mars au Palais des Congrès), est un des premiers à exploiter les algorithmes du Machine Learning au sein d’Orange.

A l’origine, en 2014, le projet démarre toutefois sur des bases plus traditionnelles, reposant sur des règles métier. L’objectif : améliorer l’expérience des clients dont la Livebox est victime d’un impact de foudre. Chaque année, environ 40 000 box sont foudroyées chez Orange. « Le projet comprend une phase préventive et une phase de diagnostic, après l’événement météo, explique Sébastien Boutin, le directeur de la stratégie data d’Orange (en photo). Au cours de la première, nous croisons les données de Météo France sur les orages avec nos données de facturation pour alerter les clients potentiellement concernés et leur demander de débrancher leur Livebox. A posteriori, sur la base des impacts réels et des données techniques issues des clients de la zone concernée, on lance un diagnostic automatique des équipements potentiellement atteints ». Les clients concernés sont avertis, afin de vérifier la réalité de la panne et, le cas échéant, de déclencher le remplacement de la box. Sur ces bases, Orange a envoyé 6 millions d’e-mails et 7 millions de SMS à ses clients en 2014. Entre le 8 et 9 août de cette même année – un épisode orageux très violent -, 18 700 alertes vers des possesseurs de Livebox apparemment ‘grillées’ sont lancées.

« Le Machine Learning n’est pas une boîte magique »

Orange Livebox Play (photo CL)

« Au cours de cette année-là, le projet a permis de sauver 35 000 Livebox (via leur déconnexion du réseau avant l’orage, NDLR) et d’en échanger 8 000 autres », résume Sébastien Boutin. Soit 2,8 millions d’euros d’économies (Livebox sauvées, coûts au SAV et interventions évitées) pour un coût d’un million.

C’est sur cette base qu’Orange a décidé de prolonger l’expérience en testant le Machine Learning, en 2015. Tout en enrichissant les données analysées, avec notamment la nature des orages, la topologie des territoires et les modèles de Livebox (certains étant plus sensibles que d’autres). Résultat : 20 % de Livebox sauvés en plus, soit 3,6 millions d’euros de gain, selon l’opérateur. « Mais attention, le Machine Learning n’est pas une boîte magique, avertit le directeur de la stratégie data. C’est un modèle complexe qui nécessite des données fiables et un binôme métier – data scientist performant. Au départ, nos résultats étaient moins bons qu’avec les règles de gestion exploitées dès 2014 ! » Selon le responsable, 90 % du travail réside dans la préparation de la donnée : « la phase la plus fastidieuse, la plus chronophage », dit-il.

« ROI démontré = budgets sanctuarisés »

Cette année, Orange a prévu de capitaliser sur cette expérience pour mettre en œuvre trois nouveaux projets : la prédiction des besoins en matériel lors des interventions de terrain, le filtrage des interventions et la modélisation de l’insatisfaction des clients (sur la base des données techniques du réseau). « Avoir démontré très rapidement le retour sur investissement de nos projets a permis de valider l’intérêt pour ces technologies et de sanctuariser les budgets », note Sébastien Boutin, intégré à la direction de la stratégie client et data de l’opérateur, créée en 2013.

Cette direction transverse de 6 personnes anime une communauté de spécialistes issus des métiers et de la DSI. « On s’est rendu compte que le groupe comptait toute une population d’analystes qui faisaient déjà du reporting », note Sébastien Boutin. La direction de la stratégie client et data est chargée de l’animation du programme Data Intelligence, un des 8 programmes définis comme prioritaires dans le plan stratégique d’Orange. Pour mettre en place les projets découlant de cette initiative – Sébastien Boutin dit avoir identifié entre 20 et 30 scénarios métiers à ce jour -, le groupe s’est équipé d’une plate-forme Hadoop, fournie par Hortonworks. Notons que cette initiative n’est pas venue bousculer à ce jour les applications analytiques existantes : comme les autres opérateurs, Orange travaille notamment depuis des années sur la gestion des résiliations (churn). « Sur ces applications de scoring, nous exploitons toujours nos solutions en place, détaille Sébastien Boutin. Tout simplement parce que, pour l’instant, nous n’avons pas trouvé mieux ! »

A lire aussi :

Mike Olson, Cloudera : « dans Hadoop, temps réel et batch sur les mêmes données »

La Poste Courrier préposée à transformer le Big Data en or

Données inutiles ou non classées : quand le Big Data coûte bonbon