Connect transforme MariaDB en outil de traitement analytique

Olivier Bertrand - Connect - MariaDB © Silicon.fr

Grâce au moteur de stockage Connect, MariaDB peut aborder le monde de l’analytique, avec la possibilité d’accéder à des sources d’informations de formats divers… sans intégration préalable dans une base de données.

Dernier épisode dans notre série d’articles concernant la journée organisée par SkySQL autour de MariaDB (voir « SkySQL se démarque de MySQL en misant sur MariaDB » et « Monty (MariaDB) : “Le code de MySQL 5.6 est de mauvaise qualité” »).

MariaDB 10.0 se veut de plus en plus un pont entre deux mondes, celui du SQL et du NoSQL. À cet effet, un connecteur Cassandra a été créé. Un autre pour LevelDB est en cours de mise au point.

Mais la surprise pourrait bien venir de Connect, un produit dont le nom n’est pas encore définitif, mais qui sera inclus dans MariaDB 10.0. Connect est présenté comme un moteur de stockage capable de lire et écrire une multitude de formats de fichiers : DBF, CSV, INI, XML… Une passerelle ODBC est également de la partie.

Un outil analytique

Dans l’absolu, rien de fondamental dans cette annonce. Mais, parfois, tout est dans la formulation. Connect est en effet conçu pour s’attaquer à des jeux de données non structurées. La définition même de ce que font les outils analytiques Big data, même si l’aspect volumétrie des jeux de données n’est pas ici prioritaire (le traitement de gigaoctets d’informations non structurées reste toutefois possible).

Le tout est développé par un Français, Olivier Bertrand. 79 ans au compteur, mais l’esprit vif et une connaissance horizontale de l’informatique d’entreprise. Cloud et Big data sont loin de lui faire peur.

« Ce moteur de stockage est différent de tous les autres », précise-t-il d’emblée. De fait, il est dédié à l’analytique et non au transactionnel. Ici, les contraintes sont différentes. Primo, il faut pouvoir accéder à toutes les informations et non pas seulement à celles centralisées dans des bases de données. Secundo, le profil des utilisateurs est particulier ; cadres, décideurs, etc. Enfin, moins d’utilisateurs sont connectés en simultané.

L’analytique est à faible volumétrie en termes d’utilisateurs, à forte volumétrie en matière de sources de données et transversale lors des requêtes. Le transactionnel est tout simplement à l’opposé de ces contraintes. Connect est conçu pour répondre spécifiquement à la problématique de l’analytique.

Une offre sans intégration

L’intérêt de Connect est qu’il évite d’avoir à recourir à une solution d’intégration. Ce qui réduit le temps de traitement de l’information. De fait, l’auteur rappelle que le point essentiel n’est pas de faire une requête SQL en quelques centièmes de seconde, mais la fraicheur des données traitées. Si le processus d’intégration date de plusieurs jours, il en est autant des données analysées. C’est tout le problème.

« Ce qui compte c’est le temps de réponse par rapport à la donnée elle-même », résume Olivier Bertrand. Avec Connect, tout se fait en direct. L’utilisateur se connecte à un document, y applique une table, puis fait des requêtes. Notez que la table peut adresser simultanément plusieurs sources de données (locales ou stockées sur le réseau).

Des outils permettent de créer de nouveaux connecteurs en quelques heures (pour peu que le format du fichier cible soit documenté, cela va sans dire). Cette flexibilité en fait une véritable usine à connecteurs.

Nous pouvons ainsi imaginer le cas d’un bureau d’étude, où le manager peut aller piocher dans les données issues des outils de PAO (via un connecteur maison), du système de facturation (via un connecteur générique créé par un tiers) et d’éventuels fichiers Excel (via le connecteur CSV livré par défaut avec Connect).

Le tout formant une vue unique pour les requêtes. Vue qui se traduira par la possibilité de créer un tableau de bord représentatif de l’ensemble de l’activité du bureau d’étude.

Pour le Big data analytique ?

Nous l’avons signalé, les sources de données peuvent être éparpillées sur le réseau. Le Big data analytique est alors tout proche. Tout du moins dans ses aspects non structurés, distribués et multisources. Connect n’est pour le reste pas conçu pour traiter des pétaoctets de données, quoique rien ne l’en empêche techniquement parlant.

Cette solution se veut donc pleine de potentiel. Tout dépendra de la communauté, qui aidera à améliorer sa capacité à monter en charge, ainsi que le nombre de ses connecteurs. Notez que Connect n’est pas encore disponible sur la Toile. Il faudra donc attendre la sortie de MariaDB 10.0 pour le découvrir.

Crédit photo : © Silicon.fr


Voir aussi
Quiz Silicon.fr – Connaissez-vous les logiciels open source ?