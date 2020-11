Google Cloud élargit sa communication sur Document AI, plate-forme qui met à contribution ses services algorithmiques pour favoriser l’exploitation des données non structurées.

Google accentue sa communication au sujet de Document AI. Sous cette bannière, le groupe américain entend favoriser l’exploitation des données non structurées. Pour cela, il met à contribution plusieurs des outils algorithmiques hébergés sur son cloud.

Dans l’absolu, Document AI n’est pas nouveau. Sa présentation remonte à la Cloud Next ’19. Le contenu de l’offre a toutefois récemment évolué, avec le passage de l’API en v1beta3. Et l’élargissement du catalogue de « processeurs » (outils de traitement) sur lesquels elle se fonde.

Deux de ces processeurs, qualifiés de « génériques », sont en accès public. L’un met en œuvre l’OCR (sur une cinquantaine de langues en manuscrit ; 200 en tapuscrit). L’autre permet de traiter des formulaires.

L’accès aux autres processeurs se fait pour le moment sur demande. Parmi eux, un générique (scission de documents) et deux catégories de « spécifiques », dédiés respectivement à la gestion des emprunts et de la facturation.

Dans ces deux domaines, l’essentiel des documents pris en charge concernent les États-Unis. De manière plus générale, l’anglais est la seule langue que traite actuellement Document AI. Sauf pour l’OCR, donc (fonctionnalité qu’on peut tester ici avec des PDF de 5 pages maximum ; le fichier que nous avons téléversé comprenait des noms, des numéros de téléphone et des adresses postales et électroniques, correctement détectés).

Il est d’autant plus difficile d’interpréter la tarification du service que Google Cloud fait la jonction avec d’autres de ses produits. Par exemple les API Vision et Natural Language, ainsi que le portefeuille AutoML. Ce dernier ouvre la porte à la classification de documents ou encore à l’extraction d’entités.

Les traitements s’effectuent par défaut dans une région Google Cloud aux États-Unis. Il est toutefois possible de basculer vers l’Union européenne.

