Fujitsu prépare la base de données la plus rapide au monde

Le moteur de base de données XML Shunsaku de Fujitsu, dont le prototype a été affecté à la recherche génétique, permet déjà de diviser par 120 la vitesse de recherche dans la base nationale japonaise de recherche sur le génome humain

La base de données du ‘

National Institute of Genetics‘ du Japon referme toutes les informations du Japan Patent Office, et en particulier toutes les données relatives aux projets de recherche sur le génome humain menés par le gouvernement japonais. Le volume de la base de l’institut de génétique, nommé Idenken, double tous les ans, et 10.000 utilisateurs s’y connectent quotidiennement afin d’interroger 35 millions d’enregistrements aux formats et volumes divers. Dans l’état du système, il faut environ 10 minutes avant d’extraire les résultats d’une requête sur deux ou trois mots clés. Les premiers tests menés par Fujitsu avec sa base de données XML Shusaku permettent d’obtenir le même résultat en 5 secondes ! Ce qui ferait de cette base de données la plus rapide au monde. Le secret de la base de données de Fujitsu tiendrait dans son algorithme de recherche qui ne fait pas appel à un index. La base est donc interrogée en temps réel. Et chaque nouveau document peut apparaître dans les résultats dès qu’il est ajouté dans la base. Sur une base de données relationnelle, l’index doit obligatoirement être mis à jour en permanence, sinon les nouveaux documents ne sont pas accessibles. Or, dans une base comme Idenken dont le contenu augmente quotidiennement, la recherche indispensable sur l’ensemble de la base (afin de prendre en compte les dernières informations ajoutées dans la base, généralement les pus pertinentes car les plus récentes) est inévitablement ralentie. Cette problématique technologique n’affecte pas la base de Fujitsu, puisque le moteur travaille en temps réel. XML Shusaku prend donc toute sa dimension dans la recherche textuelle par ses processus à grande vitesse, ce qui apporte toute sa puissance au moteur, en particulier sur le champ des biotechnologies. Le prototype de XML Shusaku, qui a démontré sa puissance sur Idenken, devrait rapidement être commercialisé au Japon sous l’appellation Shunsaku Data Manager Enterprise Edition, et pourrait être distribué aux Etats-Unis avant la fin de l’année.