IBM propose GPFS-SNC, un système de fichiers conçu pour l’analytique

Deux fois plus rapide que ses concurrents, le système de fichiers GPFS-SNC d’IBM Research est dédié spécifiquement aux ensembles de données massifs et au traitement avancé de l’information.

Les chercheurs des laboratoires d’IBM Research viennent de mettre au point un nouveau système de fichiers répondant au doux nom de General Parallel File System-Shared Nothing Cluster (ouf !). GPFS-SNC pour les intimes.

Celui-ci est au cœur d’un nouveau design de l’architecture de stockage des systèmes informatiques, qui permettra de faciliter les opérations de traitement et d’analyse de l’information. IBM compte l’utiliser au sein de ses gammes High Performance Computing Systems, Information Archive, Scale-Out NAS (SONAS) et Smart Business Compute Cloud. Ce système de fichiers distribué sera idéal pour manipuler des ensembles de données d’une taille de plusieurs pétaoctets et comprenant des milliards de documents.

GPFS-SNC s’appuie sur les techniques utilisées au sein des clusters pour proposer des fonctionnalités avancées de gestion des fichiers, de haute disponibilité et de réplication des informations. L’attribut SN (Shared Nothing) signifie que chaque nœud du système de stockage est indépendant des autres et travaille sur son propre jeu de données. Ceci a un impact important en terme de rapidité de traitement. Autre bénéfice, les performances s’accroissent de façon linéaire avec l’ajout de nouveaux nœuds.

Selon IBM, ce système de fichiers permet de livrer des données ‘préparées’ (d’où l’adjectif d’analytique) deux fois plus rapidement que ses concurrents. GPFS-SNC pourrait donc prendre une place de choix dans le monde des applications financières, ou celui du data mining.