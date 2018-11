Le 3 juin dernier, le trafic aérien de l’aéroport d’Hambourg en Allemagne a dû être interrompu à la suite d’une panne d’électricité frappant les deux terminaux du site. En conséquence, des milliers de voyageurs ont dû être redirigés vers l’aéroport d’Hanovre (150 kilomètres plus loin). L’aéroport d’Hambourg avec 17 millions de passagers par an est le cinquième plus important d’Allemagne.

En comparaison, si aujourd’hui l’un des principaux fournisseurs de cloud public rencontrait des difficultés, ce serait les services de plusieurs centaines de milliers d’entreprises dans le monde qui seraient affectés. Et plus le système est vaste et complexe, plus les utilisateurs sont susceptibles d’être touchés. Heureusement, de telles situations d’urgence ne se produisent que très rarement et on ne peut que féliciter cette prouesse des plus grands fournisseurs de services mondiaux.

L’étude Cloud Down réalisée en janvier 2018, par le fournisseur de services financiers Lloyds, a recensé seulement huit pannes sur une période allant de février 2012 à février 2017.

La plupart des fournisseurs de cloud ont donc bonne réputation parce que leurs services sont performants, hautement disponibles et sans interruption. Mais cette exemplarité conforte les responsables informatiques qui restent bien souvent loin des concepts de défaillance en interne, ce qui suppose qu’ils sont peu préparés aux situations d’urgence.

Les résultats de la dernière étude Veritas Truth in Cloud, menée auprès d’un panel de responsables informatiques en France, révèlent que plus de la moitié (60%) des sondés considèrent que les fournisseurs de services cloud sont responsables en cas d’interruption de service. Mais si ces derniers s’engagent sur des niveaux de services, ceux-ci ne concernent généralement que la couche infrastructure de l’entreprise.

En cas de panne, la restauration est une responsabilité commune à la fois au fournisseur de services cloud et à l’entreprise. Ce manque d’information de la part des entreprises participe à la mauvaise réputation des fournisseurs de cloud, bien souvent tenus comme seuls responsables en cas de dysfonctionnement. En réalité, les entreprises doivent adopter une position proactive sur la disponibilité des applications dans le cloud.

Il existe une multitude de solutions pour que les responsables informatiques puissent se préparer aux pannes éventuelles, parmi lesquelles l’automatisation et les tests des processus pour s’assurer de leur bon fonctionnement.

L’automatisation en cas d’urgence

Les applications d’aujourd’hui sont souvent multicouches et compliquées. Elles contiennent des données provenant de différents emplacements et services cloud. Or, plus leur structure est complexe, plus il y aura de pertes de données en cas de panne et leur récupération sera longue.

En général, les services informatiques perdent beaucoup de temps parce qu’ils utilisent plusieurs outils isolés et rapprochent manuellement leurs résultats. Ainsi, toutes les étapes importantes, les critères de mesure, les données de performance, ne sont pas automatiquement surveillés de bout en bout par une « entité » globale et leur conformité n’est donc pas assurée. Le manque d’automatisation pour l’ensemble de l’application, incluant les multiples couches et dépendances, peut entraîner des temps d’arrêt plus longs et plus coûteux.

Pour assurer une reprise rapide à partir du cloud et prévenir les pannes liées à des erreurs humaines, une solution consiste à automatiser les processus de reprise après sinistre. La solution idéale étant de pouvoir déclencher l’ensemble du processus en un seul clic.

Se préparer aux cas d’urgence

En cas de sinistre, la récupération des données est difficile à contrôler. Dans ce cas de figure, des solutions aux concepts dits de continuité d’activité constituent un moyen pour les entreprises de contrôler leurs architectures, leur disponibilité et de tester le processus de défaillance. Ces solutions interagissent avec les systèmes des principaux fournisseurs de cloud, utilisant leurs protocoles, leurs services et leurs moteurs de données. Les entreprises ont ainsi une visibilité sur tous les éléments importants à sécuriser. Avec des analyses et des rapports intégrés qui identifient en permanence les risques potentiels.

L’ensemble du processus de reprise après sinistre est donc testé sans perturber les opérations en cours. Les responsables informatiques peuvent ainsi évaluer avec précision le temps dont ils ont besoin pour restaurer les applications sensibles. Ces « tests » fournissent des chiffres solides en cas d’urgence.

A mesure que la migration vers le cloud s’accélère, les entreprises doivent donc impérativement prendre conscience de l’impact que pourrait avoir un dysfonctionnement cloud sur leur activité. Choisir la meilleure approche signifie moins de temps d’arrêt, de conséquences financières, moins d’impact sur la confiance des clients et réduit les risques de détériorer la réputation de la marque.