Windows Azure a planté… et la panne perdure

À 1 heure 45 GMT ce mercredi 29 février, le service d’infrastructure cloud Azure de Microsoft a connu un sérieux plantage, mondial. Depuis, l’éditeur peine à relancer la machine. C’est la première alerte sérieuse et d’envergure que rencontre cette offre depuis son lancement en 2009.

« Nous avons rencontré un problème avec la gestion du service Windows Azure. Les clients ne seront pas en mesure d’effectuer des opérations de gestion des services. »

Par ce premier message laconique, Microsoft a révélé (et reconnu) que son service d’infrastructure cloud Windows Azure a rencontré une panne sérieuse et mondiale sur la gestion des services. De nombreux sites web et services hébergés sur Azure sont tombés. Malgré la réactivité des équipes de l’éditeur, le problème perdure.

La panne aurait débuté à 1 heure 45 GMT. À 5 heures GMT, Microsoft aurait pris les mesures nécessaires pour bloquer la panne et éviter qu’elle ne « se propage à travers l’environnement de production ». Elle n’aurait affecté que 3,8 % des services hébergés sur Azure, selon Microsoft, mais ce chiffre n’a pu être validé, car le phénomène pourrait bien avoir pris une ampleur non maîtrisée. En effet, si les services touchés sont officiellement peu nombreux, la panne a quand même affecté et ralenti le trafic sur et vers Azure, en particulier aux États-Unis et dans le nord de l’Europe. Ce que Microsoft a confirmé à 10 heures 55 GMT.

Par ailleurs, plusieurs services ont également rencontré des problèmes de disponibilité dans six régions du monde – réparties entre l’Amérique du Nord, l’Asie et l’Europe – dont SQL Azure Data Sync, Access Control 2.0, Azure Reporting, Azure Marketplace et Azure Service Bus.

Toujours pas dépanné

À 13 heures 30 GMT, Microsoft confirmait être « toujours en dépannage ». Et à 19 heures 30 GMT, Microsoft indiquait s’être lancé dans la récupération des services affectés, déclarant que « de plus en plus d’applications de clients devraient être sauvegardées et s’exécuter, même si les fonctionnalités de gestion n’ont pas encore été restaurées ». Le dernier message de Microsoft porté à notre connaissance, à 21 heures GMT, confirmait que le service de gestion rencontrait encore une panne dans le monde entier.

Depuis, les notifications de mises à jour s’enchainent, confirmant que Microsoft travaille à la résolution des problèmes rencontrés sur Azure. De même que les critiques des utilisateurs qui ne cessent d’enfler. L’exaspération domine, Microsoft semble éprouver des difficultés à maitriser son bébé et les messages qu’il diffuse, centrés sur « l’atténuation des problèmes en cours », ne sont finalement pas très rassurants.

Microsoft n’est pas le seul à rencontrer des problèmes avec son cloud. Amazon Web Service a déjà affiché en plusieurs occasions des indisponibilités sérieuses. En revanche, la stratégie d’AWS et ses engagements contractuels ne sont pas les mêmes, de même que le volume des clients, déjà bien installés chez Amazon, mais qui se cherchent encore chez Microsoft. C’est pourquoi la panne sur Azure pourrait se traduire pendant quelques mois par des conséquences commerciales désastreuses, surtout en France où l’on recherche encore les premiers clients sérieux, hors des maquettes montées chez les partenaires de Microsoft.

L’occasion également de rappeler que quand un service cloud plante, le plantage prend automatiquement une ampleur mondiale.