Le plantage d’une baie EMC met OVH à genoux (MAJ)

Suite au plantage d’une baie EMC, les sites fonctionnant sur l’offre d’hébergement mutualisé de l’hébergeur sont indisponibles. OVH a dû en passer par la restauration des données depuis les sauvegardes.

L’hébergeur français OVH a connu une panne importante hier, vers 18h30 : celle-ci a touché une baie de stockage EMC utilisée pour stocker une partie des bases de données des hébergements mutualisés sur le datacenter parisien de la société (P19). Au total, quelque 50 000 sites sur un total de 3 millions de clients pour le Roubaisien ont recours à cette offre. La panne d’une baie VNX 5400, à priori en raison d’un défaut d’alimentation, a fait tomber un système de stockage de 96 disques SSD répartis sur plusieurs systèmes.

La pire panne d’OVH depuis 2006

OVH a lancé deux actions en parallèle pour remédier à la panne. Une tentative pour redémarrer le système avec une baie transportée en urgence depuis Roubaix. Le constructeur EMC est impliqué dans cette tentative de récupération. En parallèle, la société a lancé la restauration des données depuis les sauvegardes. Faute d’avoir pu faire redémarrer les baies pour l’instant, c’est la procédure de restauration qui a permis de remettre sur pied, graduellement, le service. A 17h16 ce vendredi 30 juin – donc près de 24 heures après la panne -, 79 des 96 serveurs touchés ont été remis en service, si on se fie aux indications des services techniques de l’hébergeur.

Il s’agit là de la panne la plus importante d’OVH depuis 2006. Dans un message, Octave Klaba, fondateur et directeur technique d’OVH, indique que ce précédent épisode avait entraîné une remise en question de l’architecture de stockage maison, et que cette nouvelle mésaventure constitue une « leçon de plus ». « Nous allons vous communiquer les changements qui vont s’opérer dès la fin de cet incident pour éviter de revivre la prochaine panne de cette ampleur dans 10 ans encore », promet le dirigeant.

Mise à jour le 3 juillet à 10h25 :

Dans une mise à jour de son message posté originellement vendredi, Octave Klaba met hors de cause la technologie EMC à proprement parler et précise que ce sont bien les conditions d’exploitation mises en œuvre par OVH qui sont à l’origine de la panne : « Nos datacenters ne sont pas adaptés pour héberger ce type d’infrastructure. Seules certaines salles sont spécialement préparées pour ce genre d’hébergement, mais cette baie de stockage n’y a pas été hébergé, ce qui est l’origine du problème », écrit le fondateur et directeur technique de l’hébergeur.

A lire aussi :

OVH emprunte 400 millions d’euros pour accélérer son expansion

Cloud : OVH lance des instances optimisées GPU

OVH publie le code source de son chatbot client

crédit photo © dotshock – shutterstock