TRIBUNE: Google File System, innovation discrète, fondamentale

Omniprésent, Google a remplacé dans l’esprit des consommateurs les grands frères technologiques et précurseurs tels que Microsoft ou même Apple -aujourd’hui synonyme d’iPod. Une de ses recettes miracle tient à son architecture de stockage…

Google s’affiche fréquemment à la ‘une’ de la presse, bousculant toutes les prévisions des analystes. Souvenons-nous de leur introduction boursière effectuée très cavalièrement, il y a un peu plus de 1 an, avec un prix d’entrée fixé aux enchères aux Etats-Unis, là encore en torsadant les bonnes pratiques de l’establishment financier à Wall street.

Et dernièrement, atteignant des niveaux de cotations importants, plus de 450 dollars, le titre ne faisait toujours pas l’objet de division. Et le plus fort pour marquer les esprits, c’est peut-être cette publicité sur le soi-disant salaire de ses 3 dirigeants (L. Page, S. Brin et E. Schmidt) fixé à 1 dollar par an chacun… Innovant une nouvelle fois et ne se satisfaisant d’aucune solution du marché, Google a imaginé, dès sa création, une architecture de stockage capable de stocker des milliards de fichiers pour une capacité cumulée de plusieurs Po (1 Po = 1 000 000 Go), tolérante aux pannes, tournant sur plusieurs milliers de machines standards, peu chères et interchangeables et susceptible d’agrégation de performance. Et pour satisfaire les requêtes planétaires, ce type de configuration existe en plusieurs lieux de la planète recevant les ordres de répartiteurs de charges. La solution imaginée, architecturée et développée par Google a donné lieu à la création du Système de Fichiers Google (GFS) utilisé en interne mais non disponible à la vente. Dommage. L’idée initiale fut le besoin de coller avec les besoins, les comportements et les charges applicatives. Le dernier chiffrage indique une configuration avec 15000 PC à 1000 dollars l’unité, on imagine alors le nombre d’armoires les unes à côté des autres, une vraie impression de puissance. Après analyse des choix possibles sur le marché notamment des solutions distribuées inspirées d’Andrew File System ou du fameux Distributed File System de Transarc/IBM, Google a donc opté pour un développement interne. GFS fonctionne bien sûr sur Linux installé sur des machines très standards donc complètement interchangeables. L’architecture est un modèle à 3 niveaux avec un serveur principal appelé master, plusieurs serveurs dits « chunkservers et un niveau dit « client ». L’idée est simple au demeurant ressemblant à des approches type PVFS ou d’autres utilisées dans le monde du calcul scientifique: diviser pour mieux régner. Un fichier est divisé en segments de 64Mo et assigné à des « chunkservers«  chargés eux de stocker localement les segments comme des données indépendantes. Les clients questionnent ensuite le serveur maître qui connaît la correspondance de chaque fichier et des segments le constituant. Passons les détails techniques pour insister sur la capacité d’évolution importante de cette architecture où il suffit de multiplier les serveurs intermédiaires pour délivrer plus de performances et de disponibilité. Une nouvelle fois Google sort des entiers battus en imaginant une architecture informatique, unique, performante, à la demande, évolutive, redondante et surtout développée en interne pour garder un contrôle total. La propriété intellectuelle est certainement ce qui caractérise le plus Google aujourd’hui, souvent copié jamais égalé… (*) président et fondateur SNIA France