Pour gérer vos consentements :
Categories: CloudData & Stockage

AWS : Glue DataBrew dope la préparation de données

Amazon Web Services (AWS) a confirmé la disponibilité étendue de DataBrew.

AWS Glue DataBrew est le nouvel outil de préparation visuelle des données de la gamme AWS Glue. Le service d’extraction, transformation et chargement (ETL) de données lancé en 2017 par le fournisseur cloud américain.

« Les clients AWS utilisent les données pour l’analyse avancée et le machine learning (ML) à un rythme sans précédent », a déclaré Raju Gulabani, vice-président Database & Analytics d’AWS. Selon l’ingénieur, toutefois, les équipes passent « jusqu’à 80% » de leur temps à nettoyer et à normaliser les données, plutôt qu’à les analyser et à en extraire de la valeur.

AWS Glue DataBrew a été conçu pour inverser la tendance.

Visualisation et automatisation

Managé, serverless (sans serveur à gérer pour le client), AWS Glue DataBrew permet aux analystes et scientifiques de la data de nettoyer et de transformer les données depuis une interface visuelle interactive, de type « pointer et cliquer » (point-and-click).

Par ailleurs, plus de 250 fonctions pré-intégrées dans DataBrew permettent d’automatiser les tâches de préparation et de transformation des données (filtrage des anomalies, normalisation des formats, correction des valeurs non valides…). À défaut, ces tâches nécessiteraient « des jours ou des semaines d’écriture de code », selon la firme.

L’outil facilite ainsi, d’après ses promoteurs, l’accès et l’exploration visuelle de la data à partir de différents services Amazon : lac de données (S3), entrepôt de données (Amazon Redshift), moteur (Aurora) et gestionnaire de base de données (RDS).

Une fois les données préparées, les clients peuvent les utiliser avec AWS et des services tiers d’analyse avancée pour interroger et extraire de la valeur les données et former des modèles d’apprentissage machine (ML). Aussi, le paiement se fait à l’usage.

L’outil AWS Glue DataBrew est pour le moment accessible dans les régions AWS suivantes : Europe (Francfort, Irlande), Asie-Pacifique (Tokyo, Sydney), États-Unis Est (Virginie du Nord, Ohio) et Ouest (Oregon). D’autres régions seront couvertes prochainement.

(crédit photo © Shutterstock)

Recent Posts

La Fondation Linux a fait son choix pour remplacer Redis

La Fondation Linux apporte son soutien à Valkey, un fork de Redis qui vient d'émerger…

3 heures ago

Quels sentiments animent la communauté OpenAI ?

Le contenu du forum officiel de la communauté OpenAI donne des indications sur les points…

3 heures ago

Emmanuelle Olivié-Paul — AdVaes : « Le premier enjeu du scope 3 c’est d’avoir les données pour faire une évaluation »

Dans une interview accordée à Silicon, Emmanuelle Olivié-Paul, présidente-fondatrice du cabinet de market intelligence AdVaes,…

4 heures ago

Étude Trends of IT 2024 : comprendre les mutations de l’environnement IT

Silicon et KPMG lancent Trends of IT 2024, une étude co-construite avec les managers IT…

21 heures ago

Guillaume Poupard, DGA de Docaposte : « Le plus de l’offre, c’est notre position comme acteur de confiance »

Avec son Pack cybersécurité lancé au Forum InCyber 2024, Docaposte tend une perche aux PME.…

21 heures ago

Quels impacts de l’IA générative sur le monde de la cybersécurité ? : regards croisés entre Onepoint, Wavestone et Fortinet

Quels sont les impacts immédiats de l'IA générative sur la cybersécurité ? Comment le contexte…

1 jour ago