Comment Teradata Virtual Storage booste le datawarehouse

Logiciels

En direct de Las Vegas, entretien avec Scott Gnau, directeur du développement chez Teradata sur cette nouvelle technologie et sur les “objets Java”

Pour le datawarehouse, le stockage s’avère une fonction essentielle. Et le stockage virtuel peut apporter une réelle valeur ajoutée. La plupart des acteurs, comme Oracle ou IBM, propose un stockage virtuel. Néanmoins, si l’on examine attentivement les technologies, une base de données finit par dépendre d’un support physique spécifique, dédié. Avec notre technologie de virtualisation, l’ensemble des systèmes de stockage est réellement considéré comme un tout. Ainsi, aucun support de disque n’est dédié à une base de données, et le pool de disques peut évoluer sans contrainte. Nous différencions également la gestion des CPU de celle des disques.

Toutefois, des disques différents nécessitent des prises en compte spécifiques…

C’est justement sur ce point essentiel que Teradata 13 apporte une nouvelle dimension essentielle. En effet, nous proposons la possibilité de mixer les technologies de disques de 73 téraoctets, de 46 téraoctets, ou de 300 téraoctets. Bien entendu, ils fonctionnent tous à des vitesses différentes. Or ces différences de performances limitaient jusqu’à présent ce type de fonctionnement. En effet, avec des systèmes parallèles, la vitesse de l’ensemble des disques est réglée sur les performances du plus faible d’entre eux. Ce qui entraîne une perte d’efficacité et des chutes de performances. Avec Teradata Virtual Storage, cette barrière est dépassée.

teradata_scott_gnau.jpg

Sur quoi peut s’appuyer l’utilisateur pour définir des règles de priorités du stockage au niveau du système ?

Certes, Teradata autorise des accès différentiels aux disques, mais surtout le système détermine lui-même les données à stocker sur le support le plus rapide en fonction de la fréquence des accès. L’utilisateur n’a pas à se préoccuper de ce type de tâches, le système s’en charge. De son côté, l’utilisateur peut définir des priorités au niveau applicatif – qui seront prises en compte par le système-, mais pas au niveau système. Teradata Virtual Storage s’occupe du stockage au niveau des blocs de données, pour les router vers le support le plus approprié à tout moment.

L’intégration d’objets Java à la base de données fonctionne-t-elle comme les triggers que connaissent les programmeurs ?

Ces possibilités de stocker des programmes en Java ou en C comme des fonctions dans la base de données vont au-delà du procédé des triggers. En effet, un trigger se déclenche lors de l’accomplissement d’une condition. Alors que dans notre cas, il s’agit d’amener la réalisation de la tâche vers la donnée, plutôt que d’extraire la donnée afin qu’elle soit traitée par la tâche. Lors du chargement d’un jeu de données, la base de données exécute le programme en son sein, et renvoie directement le résultat avec l’ensemble des autres données.


Auteur : José Diz
Lire la biographie de l´auteur  Masquer la biographie de l´auteur