BigQuery : le JSON natif en phase expérimentale

BigQuery JSON natif

Le JSON natif dans BigQuery est ouvert à l’expérimentation, sur inscription.

Une fonctionnalité expérimentale de plus* pour BigQuery : le JSON natif. Accessible sur inscription, elle ouvre le data warehouse cloud de Google au semi-structuré (données sans schéma fixe).

Ce format a ses particularités. Il nécessite, entre autres, d’utiliser SQL standard (pas le SQL « legacy » propre à BigQuery). On notera aussi :

– L’utilisation impérative de fichiers CSV pour le chargement en lot ; sinon, il y a deux API en flux : l’ancienne (tabledata.insertAll) et la nouvelle (BigQuery Storage Write), à la tarification plus basse

– L’impossibilité de définir des colonnes de type JSON sur des tables externes

– L’incompatibilité avec Data Studio, l’outil dataviz de Google

– Une limite d’imbrication de 500 objets

– Pas de prise en charge de l’autocomplétion des mots-clés JSON dans l’éditeur SQL de la console Google Cloud

* Deux autres fonctionnalités sont actuellement en cours d’expérimentation sur BigQuery. D’un côté, un service de migration d’entrepôts. De l’autre, les sessions. Elles permettent, par exemple, de parcourir l’historique des requêtes, de réutiliser des variables et des tables temporaires ou de créer des transactions multi-instructions.

Photo d’illustration © KanawatTH – Adobe Stock