Conférence SNW (3): l’indexation, compagne fidèle du stockage

La conférence SNIA Storage Networking World a été l’occasion de confirmer la
nécessité d’associer un vrai moteur d’indexation au stockage et
archivage

S’agissant de l’archivage, de protection de données type CDP (protection continue), de SRM ou d’ILM pour la classification de données, l’indexation devient plus précieuse que jamais.

FAST, Index Engines et Exalead étaient activement présents déclinant chacun leurs particularités avec talent. Le premier illustrait sa technologie chez de nombreux fournisseurs grâce à de nombreux accords OEM, c’est vrai que FAST fait figure de référence, car présent depuis plus longtemps, sur ce segment malgré quelques lacunes parfaitement couvertes par Exalead. Index Engines démontrait une solution innovante, indépendante et complète d’indexation de contenu des images ? backup ou archive ? stockées sur bandes grâce à une bonne connaissance des formats de bandes et applicatifs. La démonstration est ‘bluffante’ de simplicité. Ainsi, sans restaurer les données sur disque, la technologie Index Engines permet de lire une bande et d’indexer directement son contenu offrant une finesse de recherche additionnelle, complémentaire de la simple recherche d’image par mots clés par exemple. La version actuelle supporte 8 lecteurs tous actifs en simultané sur cette fonction. La bataille est rude, Tim Williams, CEO et fondateur, a annoncé la création d’un Advisory Board composé de dirigeants d’EMC, Network Appliance, Copan Systems ou CommVault, indiquant implicitement que ces sociétés ont ou vont passer un accord d’intégration. Pour Exalead, l’histoire est différente, puisqu’il s’agit de pénétrer le marché avec un moteur innovant et très performant, disponible uniquement sous forme logicielle, très léger et faiblement consommateur d’espace disque. La société a d’ores et déjà signé avec Messaging Architects, éditeur canadien d’une solution d’archivage de messagerie.

L’Archivage n’est pas oublié bien sûr, puisque par définition, on y trouve une quantité importante de données, qui se cumulent au cours du temps, auxquelles l’utilisateur souhaite accéder sans dégradation de temps d’accès et sans perte de richesse fonctionnelle. Les nouvelles plates-formes d’archivage, les fameux CAS ? Content Addressable Aware Storage ? basées sur une philosophie disque, offrent une approche économique, redondante et performante qui toutes intègrent une fonction d’indexation et de recherche puissante. Ainsi, parmi les nouveaux acteurs, Archivas et Permabit ont retenu FAST mais seraient potentiellement prêts à évoluer vers une offre plus ouverte, plus légère et plus performante.

Les segments communs à l’archivage et à la protection de données en raison des technologies et méthodes employées sont eux aussi de parfaits candidats à l’indexation. Les produits de backup disque qui proposent de stocker, pour le court terme ou plus longtemps les informations, offrent une vue unifiée et simplifiée de l’espace des fichiers protégés sous la forme d’un share Windows ou d’un point de montage NFS. Ces derniers sont alors soumis à un moteur d’indexation externe qui parcourt l’arborescence, indexe les meta-data et les data, pour simplifier le recouvrement de l’information manquante. L’utilisateur peut ainsi très simplement parcourir et choisir le fichier recherché puis le restaurer. Avamar Technologies, en cours d’acquisition par EMC, et Symantec NetBackup PureDisk (Veritas) proposent cette vue unifiée de l’ensemble des données protégées disponible à l’indexation externe.

Côté CDP, il est immédiat de penser à une intégration dans l’interface de restauration afin de fournir une vue ?à la Google’ pour naviguer et pointer sur le bon fichier. En effet, souvenons-nous que la « protection continue » capture toutes les modifications d’un fichier, toujours sous un même nom ? l’utilisateur ne l’a pas renommé ? dont le seul différentiateur externe est la date et éventuellement la taille. Grâce à l’utilisation d’un outil puissant d’indexation, la recherche est simplifiée et fournie directement sur le bureau de l’utilisateur capable sans aide particulière d’accéder à ces propres données.

Pour l’ILM et notamment pour la partie classification de données, l’indexation sur les meta-data, data et données ajoutées par l’utilisateur peut se révéler être un différentiateur clé dans l’utilisation de la solution permettant de « coller » au mieux aux exigences de « catégorisation » de l’information. Ainsi, Scentric, qui vient d’annoncer Destiny 2.0, se penche sérieusement sur le couplage d’un moteur externe performant et suffisamment souple pour coller aux besoins des marchés verticaux.

Le stockage bouge et les innovations continuent de débarquer sur ce marché longtemps relégué en second plan pour les investissements des entreprises. Aujourd’hui, l’économie est numérique et le stockage est en passe de constituer l’un des premiers postes informatiques de l’entreprise.

A demain pour un nouveau compte-rendu de cette conférence, d’ici là rendez-vous sur ces différents blogs : https://continuousdataprotection.blogspot.com/, https://filestorage.blogspot.com/ et https://contentaddressablestorage.blogspot.com/.

(*) président et fondateur de l’association SNIA France