Pour gérer vos consentements :
Categories: Data & Stockage

Dix fonctionnalités expérimentales à tester sur Snowflake

Tables dynamiques, observabilité native, détection automatique des schémas de métadonnées… Autant de fonctionnalités sur lesquelles Snowflake est revenu cette semaine à l’occasion du Snowday 2022. Toutes en sont au stade de la bêta privée. D’autres, au contraire, sont en accès public. En voici dix, toutes ouvertes cette année.

Entrepôts plus grands

Option lancée en juin. Accessible à tous. Deux configurations : 5X-Large et 6X-Large. En disponibilité générale sur toutes les régions AWS et en avant-première sur les régions Azure. L’utilisation des crédits Snowflake double lorsqu’on passe à la taille d’entrepôt supérieure.

Service d’accélération des requêtes

Option lancée en mai. Accessible à partir de l’édition Enterprise. Elle fournit, pour les « grosses » requêtes, une capacité de débordement sur des ressources de calcul partagées. Commandes SQL prises en charge : SELECT, INSERT (avec instruction SELECT) et CREATE TABLE AS SELECT.

Entrepôts optimisés pour Snowpark

Option ouverte ce mois-ci. Accessible à tous. Avec elle, chaque nœud fournit 16 fois la quantité de mémoire et 10 fois la quantité de cache d’un entrepôt standard. Disponible pour le moment sur 9 régions AWS, 5 Azure et une Google Cloud (aux USA). Son lancement va de pair avec la disponibilité générale de Snowpark pour Python (en plus de Java et Scala).

Type de données GEOMETRY

Ce type de données géospatiales, ouvert en août et accessible à tous, complète GEOGRAPHY. Ce dernier suit la norme WGS 84 et modélise la Terre comme si elle était une sphère parfaite. GEOMETRY représente quant à lui les caractéristiques dans un systèmes de coordonnées planes (euclidien, cartésien).

Réplication et basculement/restauration de compte

Option ouverte en août. Réplication des bases de données et des partages accessibles pour tous les comptes. Édition Business Critical ou supérieure requise pour la réplication d’autres objets et pour le basculement/la restauration automatiques. Toutes les régions AWS, Azure et Google Cloud la prennent en charge.

Connexion entre Snowpipe et Pub/Sub ou Azure Event Grid

Option ouverte en juin. Accessible à tous. Avec elle, Snowpipe (service d’alimentation de données en continu) peut envoyer des notifications d’erreur à ces deux services de messagerie cloud.
Pas de prise en charge inter-cloud pour le moment : Snowflake ne peut pousser des messages que vers le service fourni avec la plate-forme où il est hébergé (Google Cloud pour Pub/Sub, Azure pour Event Grid).

Traitement de données non structurées avec des UDF/UDTF Java

Ouvert depuis avril. Accessible à tous. Permet de lire et de traiter des données non structurées en zone de préparation. En utilisant soit des UDF (fonctions définies par l’utilisateur), soit des UDTF (fonctions de table définies par l’utilisateur).

Historique d’accès pour les colonnes

Option ouverte en octobre. Accessible à tous. Elle permet de visualiser, lors des opérations d’écriture, les flux de données entre les colonnes sources et de destination.

Procédures anonymes

Option ouverte en octobre. Accessible à tous. Elle utilise la commande SQL CALL pour créer et appeler ce type de procédures, similaire aux procédures stockées mais non conservées pour un usage ultérieur. L’exécution se fait avec les droits de l’appelant, le contexte de session et un accès aux variables et paramètres de session de l’appelant.

Diverses capacités pour le service d’optimisation de la recherche

Le service est accessible à partir de l’édition Enterprise. Parmi les derniers ajouts :

– Possibilité de définir les colonnes concernées dans une table
– Prise en charge des recherches impliquant sous-chaînes et expressions régulières (prédicats de type LIKE, CONTAINS, ENDSWITH…)
– Support des colonnes VARIANT, OBJECT et ARRAY (données semi-structurées), ainsi que des requêtes utilisant des fonctions géospatiales avec des objets GEOGRAPHY

Illustration principale © Snowflake

Recent Posts

GPT-4o : où, quand et pour qui ?

OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.

17 heures ago

Nom de domaine : Twitter définitivement remplacé par X

Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…

22 heures ago

Microsoft propose une délocalisation hors de Chine à ses ingénieurs IA et Cloud

Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…

23 heures ago

Du « Monde » à Reddit, le point sur les partenariats data d’OpenAI

Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?

23 heures ago

Comment Younited a appliqué la GenAI au crédit conso

Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…

24 heures ago

Processeurs : les États-Unis fabriqueront 30 % des puces avancées d’ici 2032

Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…

2 jours ago