Base de données : Oracle veut unifier les langues de requêtes autour de SQL

Oracle va lancer à la rentrée une offre baptisée Big Data SQL qui permet d’utiliser des commandes SQL pour des requêtes dans des systèmes Hadoop ou No-SQL.

Oracle reconnaît que le monde des bases de données ne parlent pas la même langue et surtout pas uniquement celui de sa propre solution. Pour établir une passerelle entre le monde SQL et No-SQL, la firme de Redwood Shores vient de lancer Big Data SQL qui permet d’utiliser des commandes SQL pour interroger d’autres systèmes comme Hadoop ou les bases de données No-SQL.

Interrogé par nos confrères de The Register, Neil Mendelson, président de l’activité Big Data et Analytique chez Oracle, explique qu’avec cette solution, « les administrateurs de bases de données n’ont pas à apprendre d’autres langages de requêtes sur des bases de données non relationnelles ou pour appeler des informations stockées dans Hadoop ».  Il ajoute que « l’objectif de Big Data SQL est de fédérer les différents systèmes et de les rendre opérationnels sans avoir besoin d’acquérir de nouvelles compétences, de restreindre la gouvernance ou le contrôle requis pour des questions réglementaires ».

Une offre à compléter

Dans le détail, Big Data SQL se base sur la technologie « Hadoop Smart Scan ». Cette dernière propose plusieurs options dont un scan des données en local, qui sont lues et traitées dans leur espace de stockage. Il y a aussi une évaluation des prévisions et des projections où les données les plus pertinentes sont soumises à Hadoop. Enfin, la solution réalise une analyse complexe où les données comme JSON et XML sont traités à la source. L’offre Big Data SQL sera disponible à l’automne prochain dans un premier temps sur Exadata 12.102 et elle sera proposée sur d’autres appliances promet Neil Mendelson.

Il existe des outils similaires dans la communauté Open Source. On peut citer par exemple Stinger qui utilise des commandes SQL pour interroger les données conservées dans Hadoop ou des langages spécifiques comme CQL (Cassandra Query Language).

Le service d’Oracle est propriétaire et ne supportera, à son démarrage, que Apache Hive et HDFS (Hadoop File System). L’entreprise américaine prévoit de le faire évoluer en prenant en compte des données conservées dans Mongo DB, Hbase, Oracle No SQL DB, etc.

A lire aussi :

Oracle double les performances de MySQL