La panne d’Amazon S3 due à une erreur humaine

C’est une erreur faite lors de l’entrée d’une commande informatique qui a provoqué la panne du service de stockage Cloud S3 d’Amazon. Panne qui a duré une demi-journée.

Mardi, une panne d’envergure avait touché le service de stockage Cloud d’Amazon, S3 (Simple Storage Service). Un problème qui a provoqué la chute de milliers de sites et services web. Voir à ce propos notre précédent article « Amazon S3 en panne, Internet chancelle ».

Rappelons que seule la région de Virginie du Nord (US-EAST-1) a été concernée par ce problème. Si de nombreux services sont tombés – en cascade – seul S3 a été initialement touché.

Amazon tient à s’expliquer sur ce qui s’est passé. Une lenteur dans le système de facturation était en cours d’étude. Un membre de l’équipe S3 a lancé un cas de test qui devait avoir pour conséquence le retrait d’un petit ensemble de serveurs d’un sous-système de S3, relatif au processus de facturation.

Et là, c’est le drame

« Malheureusement, l’une des commandes a été saisie incorrectement et un plus grand ensemble de serveurs que prévu a été supprimé », explique laconiquement la firme. Une erreur humaine donc. Qui a eu pour conséquence de mettre hors jeu le sous-système indexant les objets S3 et celui chargé d’allouer l’espace de stockage.

Handicapés d’une partie de leurs serveurs, ces sous-systèmes ont dû être complètement redémarrés. Pendant ce temps, c’est l’ensemble de S3 qui est devenu inopérant. Ainsi que certains autres services de la firme s’appuyant sur S3.

À lire aussi :
Avec Chime, Amazon se lance à l’assaut de Skype for Business
Amazon recrute 1500 personnes en France y compris pour AWS
Résultats 2016 : AWS est la machine à bénéfices d’Amazon

Crédit photo : © Photobank gallery – Shutterstock