GTC 2010 : ParStream met le GPU au service des bases de données analytiques

ParStream compte bien révolutionner le marché de la Business Intelligence en proposant d’analyser de larges ensembles de données à une vitesse record.

Développée dans le plus grand secret pendant trois ans, la solution ParStream de la société allemande empulse voit aujourd’hui le jour. Cet outil permet de gérer des bases de données comportant des masses phénoménales d’informations, avec une vitesse qui sera entre trois et trente-cinq fois supérieure à celle obtenue avec des bases de données orientées colonnes classiques (silos de données).

L’éditeur exploite l’important nombre de cœurs des GPU (processeurs graphiques) et la bande passante de la mémoire intégrée aux cartes graphiques pour balayer rapidement les données. « Nous ne parlons pas ici de bases de données de quelques dizaines de gigaoctets, qui restent à la portée des solutions traditionnelles, mais de celles comportant des téraoctets de données et des centaines de millions d’entrées », nous confient les responsables de la compagnie.

L’accès à la base de données s’effectue au travers du classique SQL, la puissance des GPU permettant de lancer des requêtes d’une extrême complexité. Cette solution fait donc pleinement partie de cette nouvelle génération d’applications CUDA qui vise spécifiquement le marché de la gestion et de l’analyse de données professionnelles.

Ce produit est disponible sous deux formes : des appliances 4U livrées clés en main (pouvant contenir un maximum de huit cartes GPU), ou un logiciel à installer sur une machine (ou un ensemble de machines) utilisant l’une des distributions Linux supportées par l’éditeur.