Cloud Azure : la panne proviendrait de l’année bissextile (suite)

« Service is running normally ». Microsoft confirme la fin de la panne qui a paralysé, quasi mondialement et pendant plusieurs heures, son service de cloud Windows Azure.

Bill Laing, vice-président de la division server and cloud de Microsoft, s’est excusé auprès des clients du cloud Azure et a indiqué sur le blog Windows Azure que la panne qui a paralysé mondialement une partie du service durant plusieurs heures (lire notre précédent article) est désormais résolue.

Même si l’analyse des difficultés est en cours, il semblerait que la panne, qui a touché plusieurs régions du globe, pourrait être due à un calcul du temps incorrect pour l’année bissextile. Depuis la paranoïa du bug de l’an 2000, qui aurait pu imaginer qu’une société comme Microsoft puisse se faire piéger par un 29 février ?

Corriger, région après région et cloud après cloud

Le problème aurait été rapidement découvert, et un correctif a été développé. Cependant, il a fallu corriger chacun des clouds Azure régionaux, et c’est cette opération qui s’est révélée longue et aurait entrainé la persistance des dysfonctionnements constatés. Toutes les sous-régions du cloud n’ont pas eu droit au même traitement au même moment. Microsoft vient ici soulever une nouvelle problématique à laquelle les candidats au cloud n’avaient pas pensé : le cloud n’est pas égalitaire selon les régions du globe ! Un comble pour un nuage.

Cedexis, qui s’affirme « aiguilleur du net » et dont les services consistent à apporter de la performance aux utilisateurs en aiguillant intelligemment le trafic sur la meilleure plateforme (hébergeur, CDN, cloud) disponible, analyse en permanence la performance des grands services d’infrastructure cloud avec son Cedexis Radar. Nous publions en fin d’article le tableau de bord de la disponibilité des clouds régionaux de Windows Azure, qui démontre très clairement que la chute d’Azure a été radicale, mais également que sa remontée a été inégalitaire, région après région.

La France a été peu impactée par la panne, les premiers clients français du cloud Azure de Microsoft tardent à se manifester (lire notre tribune : Cloud computing, du discours à la réalité. Que se passe-t-il réellement dans le monde du cloud ?). En revanche, l’effet de la défaillance a été plus massif dans certaines régions du globe où des services importants, comme CloudStore, la place de marché de services cloud du gouvernement anglais, qui s’appuie en partie sur Azure et qui a planté 9 jours seulement après son lancement.

La sécurité du cloud en question ?

À y regarder de près, aucune plateforme de cloud n’est à l’abri d’un risque de défaillance. Amazon Web Services, nous l’évoquions dans notre précédent article, s’est déjà planté plusieurs fois. Chez Microsoft, Office 365 a également planté en août 2011. Et combien encore, que nous ignorons et qui se cachent éventuellement derrière des baisses de régimes pour éviter de trop évoquer leurs défaillances ? Surtout que dans de nombreux cas, Amazon s’en rappelle amèrement, l’origine de la défaillance est humaine !

La période de rodage semble difficile pour les opérateurs de cloud, tout comme les solutions de secours… qui jusqu’à présent se sont montrées inefficaces. Un comble pour des acteurs dont le discours affirme que leurs solutions clouds ont l’avantage d’être autrement sécurisées que ce que la plupart des entreprises pourront jamais s’offrir. Sans oublier que quand l’entreprise se plante, elle en supporte les conséquences, mais quand c’est le cloud, tout le monde paie, mondialement. Microsoft l’apprend à ses dépens !