Snowflake et l’IA : le point sur la roadmap

Snowflake IA

Comment l’IA, générative ou non, se diffuse-t-elle chez Snowflake ? Point d’étape après la conférence Snowday 2023.

En matière d’IA, où en est Snowflake ? Le schéma suivant résume la situation.

Snowflake IA

Les trois éléments en haut à gauche sont des fonctions « prêtes à l’emploi », accessibles sur l’interface graphique. Elles sont pour le moment en bêta privée.

Avec Document AI, on est sur de l’extraction de contenu. Document AI

Snowflake Copilot est un assistant de codage SQL.

Snowflake Copilot

Universal Search se fonde sur la technologie de Neeva (que Snowflake a acquis en mai). La version initiale permettra de trouver tables, vues, bases de données, schémas, éléments de la marketplace et articles de documentation.

Universal Search

Ces capacités reposent sur un moteur de fonctions sans serveur. Appelé Cortex, il donne également un accès API à :

– Diverses fonctionnalités basées sur des LLM (détection de sentiment, extraction de réponses, résumé de texte et traduction), toutes en bêta privée

résumé dans un Snowflake Notebook

– Du machine learning « maison » pour la prédiction et la détection d’anomalies sur séries temporelles (« disponibilité globale bientôt »), la classification (bêta privée à venir) et l’identification de facteurs d’évolution de métriques (bêta publique)

– Des modèles conversationnels pour la complétion (bêta privée ; base : Llama 2 en versions 7, 13 et 70 milliards de paramètres) et le codage SQL (bêta privée ; version « programmatique » de Copilot)

– Vectorisation et recherche vectorielle, avec un type de donnée natif (bêta privée)

fonctions SQL embedding et vector distance dans Snowsight

La case « Apps in minutes » fait référence à l’intégration du framework Streamlit dans Snowflake. Elle aussi est pour le moment en bêta privée.

Snowflake avance sur le MLOps

Les éléments sur la droite du schéma viennent se placer sous l’ombrelle Snowpark ML.

Lancé en 2019, Snowpark associe bibliothèques et runtimes pour le déploiement et le traitement d’autres langages que SQL. La « boîte à outils » Snowpark ML en est une composante. Elle fournit bibliothèque Python et infrastructure gérée.

Snowflake va y ajouter :

– Une API permettant d’utiliser des frameworks de type Scikit-learn et XGBoost sans créer de procédures stockées (Modeling API ; disponibilité générale « bientôt »)

– Un registre (bêta publique à venir) avec gestion des versions et RBAC

– Un feature store et une interface de notebooks (bêta privée)

annonces ML

Illustration principale © Tada Images – Adobe Stock