Azure Data Lake, du stockage Hadoop sur le Cloud de Microsoft

Scott Guthriedi Azure

Compatible HDFS, l’offre Azure Data Lake sera accessible depuis les applications Big Data Hadoop. Pour les workloads plus classiques, Microsoft livre également SQL Data Warehouse.

Lors de sa conférence développeurs Build, Microsoft a aussi levé le voile sur Azure Data Lake. Cette offre permet de disposer d’une solution de stockage de haute capacité, adaptée au monde de l’analytique Big Data. Le tout hébergé sur le Cloud public de la firme, Azure.

Afin de faciliter le travail des développeurs, cette solution est compatible HDFS (Hadoop Distributed File System) et sera donc directement utilisable depuis les distributions et applications Hadoop. Un bon point. Autre élément intéressant, aucune limite n’est appliquée sur la taille d’un compte ou celle des fichiers qui y sont stockés. Data Lake est donc prévu pour avaler toutes les données, sans limites, avant de les restituer aux applications analytiques Big Data.

SQL ou NoSQL ?

Offre plus classique, SQL Data Warehouse rejoint le catalogue des services Azure. Dédiée aux bases de données relationnelles SQL, cette solution met à profit les avantages du Cloud pour proposer des capacités de montée en charge inédites.

Avec ces deux annonces, Microsoft répond aux deux stratégies de traitement des données en vigueur en entreprise : l’offre traditionnelle, mettant en œuvre des données structurées (SQL Data Warehouse) et la mouvance Big Data, avec le stockage massif de données non structurées (Data Lake).

Notez que sur le NoSQL, Microsoft propose également DocumentDB, une offre présentée l’été dernier (voir à ce propos notre article « DocumentDB : le Cloud Microsoft Azure passe au NoSQL »).

À lire aussi :

Microsoft lance sa fabrique à applications Cloud, Azure App Service
Microsoft booste la puissance des machines virtuelles d’Azure
Quiz Silicon.fr – 10 questions sur les bases de données SQL Open Source