Pour gérer vos consentements :
Categories: CloudDatacenters

Coup de chaud sur l’Europe… et ses datacenters

La plus haute température jamais enregistrée au Royaume-Uni ? Elle était de 38,7 °C… jusqu’à mardi. Dans la journée, des dizaines de stations météo ont relevé des valeurs supérieures. Dont certaines dépassant 40 degrés. Par exemple à l’aéroport de Londres-Heathrow.

Dans la capitale britannique et son agglomération, la vague de chaleur a touché jusqu’aux datacenters. Google Cloud et Oracle ont tous deux signalé des problèmes de refroidissement. Qui ont eu pour conséquence la perte de l’accès à certains services.

Il était environ 18 heures sur place quand Google a ouvert le ticket d’incident. Le groupe américain constatait alors depuis environ deux heures des problèmes avec Compute Engine. En cause, donc, les systèmes de refroidissement de ses installations. Plus précisément, dans un des bâtiments hébergeant la zone A de la région Europe de l’Ouest 2.

Premiers symptômes recensés : des extinctions inopinées de VM et la perte de redondance pour certains disques persistants. Premières mesures : éteindre une partie de la zone et limiter l’instanciation de VM spot.

Peu après, Google a reconnu que les problèmes sur les disques persistants pouvaient s’étendre sur l’ensemble de la région cloud. Vers 21 heures, il a ajouté l’autoscaling sur la liste des défaillances. Vers minuit, les choses étaient globalement rentrées dans l’ordre : la plupart des clients pouvaient lancer des VM dans toute la région Europe de l’Ouest 2, zone A comprise. L’incident n’a toutefois été signalé comme « résolu » que vers 5 heures du matin ce mercredi. Quelques volumes persistants sur disque dur rencontraient alors encore des erreurs.

Les services d’intégration restent perturbés chez Oracle

Les soucis ont officiellement commencé vers 13 heures chez Oracle, qui les a clairement imputés aux « températures exceptionnelles ». Elles l’ont contraint à arrêter une partie de ses services dans le datacenter « UK South », qui n’était plus correctement refroidi.

Vers 16 heures, Oracle déplorait des problèmes sur le compute, le réseau et le stockage (bloc, objet). Une heure plus tard, il y ajoutait ses services d’intégration d’applications et de données.
Le rétablissement officiel du réseau et du stockage est intervenu vers minuit. Pour le compute, ce fut vers 4 heures ce mercredi. Les services d’intégration ne sont toujours pas pleinement rétablis aux dernières nouvelles.

Photo d’illustration © dotshock – Shutterstock

Recent Posts

Ce que Llama 3 dit de l’évolution des LLM

Diverses tendances animant l'univers des LLM transparaissent en filigrane du discours de Meta sur Llama…

1 heure ago

APT44, bras armé cyber de la Russie

Mandiant a attribué un APT à Sandworm, considéré comme le principal groupe cybercriminel à la…

20 heures ago

Cybersécurité : HarfangLab et Filigran connectent EDR et CTI

Les deux startup proposent un connecteur entre la platefome OpenCTI de Filigran et l’EDR de…

22 heures ago

Le hacking autonome, capacité émergente de GPT-4 ?

Des chercheurs ont mis des agents LLM à l'épreuve dans la détection et l'exploitation de…

23 heures ago

Les applications de messagerie se mettent au chiffrement post-quantique

Dans la lignée de Signal, iMessage intègre une couche de chiffrement post-quantique.

1 jour ago

Infrastructures LAN : une photo du marché avant la fusion HPE-Juniper

Douze fournisseurs sont classés dans le dernier Magic Quadrant des infrastructures LAN.

2 jours ago