Quand l’érosion logicielle perturbe des bases de données

Box érosion logicielle

L’équipe tech de Box revient sur le dysfonctionnement d’un de ses services de continuité, qui ne faisait pas l’objet de tests réguliers.

Box, victime du phénomène d’érosion logicielle ? Son équipe tech contextualise ainsi un incident survenu sur un outil de monitoring de bases de données. Elle en a tiré un court post-mortem, avec une morale : faites régulièrement faire de l’exercice à vos logiciels.

L’outil en question, nommé Spatula, avait été développé en 2016. Son rôle : détecter les bases de données plantées et rediriger le trafic. Il a récemment dysfonctionné sur la partie redirection. Une alerte est donc tout de même parvenue à l’administratrice, qui a dû résoudre le problème « à la main » un samedi à l’aube. Il lui a fallu du temps pour réapprendre le processus, « effacé de la mémoire collective depuis son automatisation », pour résumer les propos de Box.

Box instaure un régime à trois tests par jour

On a découvert par après que Spatula dysfonctionnait depuis quatre jours, en conséquence d’une mise à jour sur une autre partie de l’environnement. Le service étant peu sollicité, on ne s’était pas rendu compte du problème.

Dans ce contexte, Box a introduit une vérification synthétique sur une base de données test. Elle s’exécute trois fois par jour, à horaires fixes (8 heures, 15 heures et 18 heures), sur tout le pipeline. On a donc, en théorie, un temps de réaction maximal de 14 heures… confirmé dans le cadre du premier incident ayant suivi la mise en place de ce filet de sécurité.

À consulter en complément :

Des tests au CI : AXA et la gestion des applications legacy
OpenAI : gare à l’obsolescence
Obsolescence informatique : les propositions du Cigref aux fournisseurs

Photo d’illustration © Greentech – Adobe Stock