Oups : Delta avait bien oublié de brancher la prise

Selon le Pdg de Delta, la panne de la compagnie aérienne s’explique par le fait que 300 serveurs n’étaient pas reliés au système d’alimentation électrique de secours.

deltaoutageSuite à la panne majeure qu’a connu Delta Airlines en début de semaine, et après que la compagnie aérienne a averti qu’il s’agissait d’un problème d’alimentation électrique sur ses systèmes informatiques, des twittos se sont amusés à faire circuler une photo (ci-contre) de ce qui ressemble à un employé d’une compagnie aérienne tenant une prise à la main, un sourire sardonique au bord des lèvres.

Si on en croit l’interview que le Pdg de la compagnie d’Atlanta, Ed Bastian, a accordée au journal local The Atlanta Journal-Constitution, le scénario de la panne n’est pas très éloigné de cette caricature circulant sur les réseaux sociaux. Le dirigeant explique benoîtement qu’environ 300 serveurs, parmi les 7 000 que fait tourner l’IT de son entreprise, n’étaient pas raccordés au système d’alimentation de secours. Une erreur qui est restée « indétectée, ce qui n’aurait pas dû arriver », admet le Pdg.

Interdépendances dans le SI

Quand un module de contrôle de l’alimentation, situé dans les locaux de Delta, a pris feu, lundi, cela a provoqué une surtension et la panne d’un transformateur situé dans le datacenter de la compagnie. Conséquence : l’alimentation principale, fournie par Georgia Power, a été coupée. La plupart des systèmes ont alors basculé sur l’alimentation de secours, sauf les 300 serveurs en question qui, pour une raison que la compagnie n’a pas précisée, n’étaient pas reliés à cette source d’énergie alternative au moment de la panne.

bastian
Ed Bastian, Pdg de Delta Airlines.

Manque de chance, lesdits serveurs, une minorité sur le parc que fait fonctionner la DSI de Delta, avaient un « impact très significatif » sur le fonctionnement de la compagnie, selon Ed Bastian. Qui ajoute que quand les autres serveurs de l’entreprise – ceux ayant basculé sur l’alimentation de secours – sont redevenus opérationnels, ils ont été ralentis ou stoppés par l’absence de réponse venant des 300 machines manquantes dans le SI. Bref, la conjonction d’une panne matérielle, d’une invraisemblable erreur et des interdépendances du système d’information expliqueraient l’incroyable chaos dans lequel a été plongé Delta pendant deux jours et demi.

Pas de sous-investissement ?

Rappelons que la panne a provoqué au total l’annulation de 2 100 vols, sans parler des innombrables retards. Selon Ed Bastian, aucun événement n’avait causé un tel arrêt des activités de sa compagnie, excepté l’ordre du gouvernement américain de faire atterrir tous les avions le 11 septembre 2001 après les attentats sur le World Trade Center.

Les détails fournis par Ed Bastian peuvent en tout cas expliquer pourquoi le plan de secours de Delta n’a pas fonctionné, une fois l’alimentation primaire de son datacenter perdue. Le Pdg se défend toutefois de tout sous-investissement dans ses systèmes d’information. Selon lui, Delta a dépensé des centaines de millions de dollars sur son SI et sa modernisation au cours des 3 dernières années. Dont 150 millions pour la seule année 2016. Même s’il reconnaît que l’infrastructure IT de la deuxième compagnie aérienne des Etats-Unis « est ancienne » (elle repose pour partie sur des mainframes), il assure que « là n’est pas le problème ».

Plus tôt en 2016, Delta a recruté un nouveau DSI (en provenance de l’assureur AIG) et un nouveau responsable des infrastructures (débauché chez Marriott). « C’est un domaine où nous savons que nous devons investir. Et nous y investissons », assure le Pdg.

A lire aussi :

Un bug logiciel bloque le trafic aérien aux Etats-Unis

Delta équipe ses 11 000 pilotes de tablettes Microsoft Surface 2