Box et Google Cloud changent d’angle sur l’IA

Box BoxWorks 2021

Box va exploiter Vertex AI pour l’extraction de métadonnées. Ce n’est pas la première fois qu’il s’appuie sur Google Cloud pour ce cas d’usage.

On prend les mêmes et on recommence ? La dernière annonce faite dans le cadre du partenariat Box-Google Cloud pourrait donner cette impression.

Objet de l’annonce : l’usage de Vertex AI pour l’extraction de métadonnées. On pourra commencer à l’expérimenter en 2024, d’abord sous la forme d’une API, à partir de l’abonnement Box Enterprise Plus.

La promesse : pouvoir classer automatiquement des documents, en paramétrant éventuellement soi-même des templates de métadonnées ensuite exploitables dans des logiciels tiers.

Box AI extraction

La connexion avec Vertex AI se fait sous la bannière Box AI. Cette initiative annoncée au printemps est actuellement en bêta privée. Avec elle, Box ouvre la voie aux modèles de fondation, à commencer par ceux d’OpenAI.

Le partenariat avec Google Cloud avait officiellement démarré en 2016. Il s’était d’abord traduit par l’intégration – effective début 2019 – de Box dans G Suite (Docs, Sheets, Slides). Il se poursuit sous l’ère Google Workspace avec, parmi les dernières nouveautés, un connecteur pour le calendrier.

Box Google Agenda

Cloud Vision, Document AI… Mêmes fins, autres moyens

En 2017, Box et Google Cloud avaient commencé à « parler d’IA ». Le premier s’était engagé à utiliser l’API Cloud Vision du second pour l’extraction de texte à partir d’images.

La démarche avait finalement pris forme sur la base d’un service fondé sur cette API : Document Understanding AI (aujourd’hui appelé Document AI).

En 2019, Box avait fait le point sur ses expérimentations avec la version alpha de ce service, pour de la détection d’informations et de la validation de prêts hypothécaires.

extraction métadonnées 2019

Cette expérimentation était portée par une brique maison : Box Skills, un framework conçu notamment pour… extraire des métadonnées à partir de documents.

Box Skills

Document AI est accessible via le « Skills Kit », wrapper Node permettant aux utilisateurs de développer leurs propres pipelines d’extraction. Mais Box propose aussi des skills « prêtes à l’emploi ». Il y en avait initialement trois, origine IBM (Watson pour le traitement de fichiers audio), Microsoft (services cognitifs Azure pour la vidéo)… et donc Google Cloud pour les images. L’offre actuelle est la suivante :

tableau skills

En parallèle, Box officialise son arrivée sur la marketplace Google Cloud. Cela complète sa présence sur la marketplace Azure.

Illustration principale ©