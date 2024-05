Pas d’IA sans data. Peu importe si on connaît la chanson : elle aura été la trame de fond de la keynote introductive du Google Cloud Summit Paris 2024.

La présence d’Andrei Gutmans a témoigné du focus. L’intéressé dirige l’activité base de données du groupe américain. Il a eu l’occasion d’évoquer, entre autres, un élément clé pour les projets GenAI : la prise en charge des vecteurs. Effective sur les offres MySQL et Redis ; expérimentée notamment sur Spanner, Firestore… et AlloyDB. Ce dernier, compatible PostgreSQL, a également été doté d’une capacité d’appel de modèles externes (Anthropic, Hugging Face, OpenAI…) et d’une API en langage naturel. Renault Group en est l’un des clients, dans le cadre de son métavers industriel (jumeau numérique des usines et de la supply chain).

Andrei Gutmans aura aussi mis en avant l’intégration – expérimentale – de Gemini dans les bases de données. Autant pour les gérer que les moderniser et générer/expliquer du SQL (voir notre article « Comment Gemini irrigue les produits data de Google Cloud »). Auparavant, Anthony Cirot, patron Europe du Sud, avait passé en revue quelques services présentés et/ou lancés récemment. Parmi eux, Hyperdisk ML (stockage bloc pour workloads IA), AI Hypercomputer (architecture de calcul intensif) et l’ancrage sur Google Search (connexion de LLM au moteur de recherche).

Penser passage à l’échelle et plan de continuité

Chez Airbus, la disponibilité et la qualité de la data est le premier critère de tri des cas d’usage GenAI. Quand bien même un grand chantier avait démarré en 2017-2018 dans le cadre du projet qui a mené à la plate-forme Skywise (data lake à destination des compagnies aériennes), il reste encore des centaines de référentiels nécessitant du travail de nettoyage et de qualification, reconnaît Catherine Jestin. « J’ai en tête un cas d’usage où Airbus travaille depuis près de deux ans sur le nettoyage d’une information particulière », explique la vice-présidente exécutive chargée du digital – et par ailleurs présidente du board de Gaia-X.

En 2023, l’avionneur a collecté environ 600 cas d’usages. Il les a répartis en catégories et, pour chacune, sélectionné un pilote en fonction de la valeur. Il est prévu, cette année, de traiter entre 10 et 15 cas d’usage par catégorie. En prenant soin de penser immédiatement au passage à l’échelle. « On a pris le mur plusieurs fois », déclare Catherine Jestin. Elle donne l’exemple d’un cas d’optimisation des stocks de pièces de rechange pour l’A380. « On a voulu le passer à l’échelle de l’A320. Sauf que dans un cas, on avait fait [quelques centaines] d’avions et dans l’autre, 10 000. Forcément, ça a beaucoup moins bien marché. Il a fallu retravailler l’algorithme, l’infrastructure. »

Comme avec n’importe quelle solution digitale, il faut un plan de continuité d’affaires. Le cas s’est présenté récemment. Une application aidant à réaliser une opération de jonction des ailes avec le fuselage est tombée en panne… et « personne ne savait comment le faire à la main ».

Valeo, Worldline : l’impulsion par les hackathons

Chez Valeo, pas soumis aux mêmes exigences réglementaires, « on cherche beaucoup le gain de temps », d’après Cédric Merlin, directeur de l’IA. Autre critère : à quel point peut-on exploiter un cas d’usage ? Dans ce contexte, l’analyse documentaire, que beaucoup demandent, « se retrouve vite en haut de la pile ».

Valeo a aussi collecté environ 600 cas d’usage. Il avait donné une première impulsion par l’intermédiaire d’un hackathon à l’échelle mondiale, sponsorisé par le Comex. En anticipation, il avait formé un millier de collaborateurs. Ce qui a permis de gagner en pertinence sur les propositions.

L’une d’entre elles, développée prioritairement, est censée accélérer l’entraînement des algorithmes de perception de l’environnement au sein des logiciels d’aide à la conduite. Il consiste à générer des images en conditions difficiles (pluie, brouillard, neige ; nuit également) à partir d’images prises en bonnes conditions.

Worldline est auss passé par un hackathon (AI Challenge). Des centaines de cas d’usage ont émergé… mais c’était début 2023. Structurés sur des catégories assez classiques (productivité du collaborateur, aide aux développeurs et aux fonctions support…), ils étaient « plus fantasmés que concrets », admet le DSI Nicolas Gour. « Les gens n’avaient pas assez manipulé l’IA générative. Pour identifier des cas d’usage pertinents, il faut avoir été un minimum formé. »

Depuis, Worldline a mis en place son propre ChatGPT, qu’utilise aujourd’hui un tiers de l’effectif – soit 6000 personnes. Il a aussi multiplié les hackathons spécifiques.

Un « effet Deepmind » sur Google Cloud

Google Cloud a une autre vitrine : la collaboration avec sa société sœur Deepmind. Axée moonshots (intelligence artificielle forte, IA pour la science…), elle avait absorbé, il y a un an, les labos Google Brain, positionnés quant à eux sur l’IA appliquée aux produits. En France, la fusion s’est traduite par la création d’un AI Hub. 300 personnes se sont rejointes dans ce centre ouvert à proximité du siège de Google (Paris 9e).

Le dernier partenariat en date implique le 3IA PRAIRIE. « Il y a des compétences qu’on n’a pas en interne. Avec l’Institut Curie, on va travailler sur des maladies rares [pour] lesquelles on n’a pas de médecin », affirme Armand Joulin. directeur de recherche arrivé fin 2023 en provenance de Meta.

L’ancrage sur Google Search résulte des travaux de Deepmind. Idem pour deux autres services récemment intégrés : la prise en compte de l’audio au sein des vidéos qu’analyse Gemini et les filigranes invisibles sur les images que génère Imagen.

Photo : de gauche à droite, Anthony Cirot, Tony Parker (venu en tant que fondateur d’Infinity Nine Group) et Isabelle Fraine (directrice France de Google Cloud)