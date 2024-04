Numéro 1 mondial des cosmétiques avec un chiffre d’affaires de près de 41,2 milliards €, le groupe L’Oréal compte 90 000 employés. C’est aussi le 3ième plus gros annonceur mondial. « Nous avons de très nombreux cas d’usage à traiter sur des itérations très courtes » explique Antoine Castex, Data Platform Architect du Groupe L’Oréal.

« Tous les matins les gens se réveillent sur les réseaux sociaux avec de nouvelles idées, de nouvelles envies, et nous devons leur proposer des produits. C’est la raison pour laquelle, on ne travaille pas sur des projets énormes amenés à être lancés au bout de plusieurs années. Nous avons besoin d’être agiles, flexibles et itérer rapidement. » ajoute-t-il.

Avec L’OréalGPT, l’idée initiale était de concrétiser rapidement un projet d’IA générative dans un cadre interne. L’objectif est alors de démontrer que L’Oréal sait réaliser des produits digitaux pour ses employés et basés sur les technologies du moment. « L’idée était de créer une très belle application et très utile » résume Antoine Castex.

Des services GenAI pour motoriser les cas d’usage IA du groupe

Lancé en septembre 2023 et mis en ligne en décembre, L’OréalGPT comptait déjà 19 000 utilisateurs distincts au bout de 3 mois. L’IA a généré 330 000 messages et 46 000 images.

« La génération d’image n’a été ouverte qu’auprès de 1 000 salariés mais quand on voit le nombre d’images qu’ils ont généré, on constate qu’il y a un vrai besoin. Les équipes marketing travaillent avec des agences, mais l’outil est un moyen de vérifier qu’une idée est pertinente et peut donner lieu à un vrai projet. » poursuit-il.

Au-delà ce produit digital, l’ambition du centre d’excellence IA (AI COE) du groupe est de proposer des services d’IA générative réutilisables dans le cas d’autres cas d’usage, notamment directement par les métiers.

Thomas Menard, Manager de l’AI COE précise : « En nous appuyant sur les couches basses de L’OréalGPT, nous avons décidé de créer des GenAI Services. Il s’agit d’un ensemble de micro-services, des API qui vont permettre aux IT et non-IT de les exploiter pour créer les applications dont ils ont besoin et changer de LLM en fonction de leurs besoins par simple paramétrage. »

Cette plateforme est sécurisée et validée par les architectes de la DSI, par les CISO et les équipes Data Privacy et juridiques.

La plateforme GenAI imaginée par l’équipe projet est déployée sur le Cloud GCP, un choix logique lorsqu’on sait que L’Oréal héberge déjà 10 Po de données chez Google, notamment sur son service BigQuery. « Ainsi, la donnée est au plus proche de cet écosystème GenAI, ce qui doit permettre d’accélérer les projets futurs mariant Data et IA générative » précise Thomas Menard.

Parmi les divers services délivrés par la plateforme figure le classique Prompt : L’API retourne un texte à une question posée. Actuellement, l’utilisateur a le choix entre GPT 3.5, GPT 4, Gemini et PaLM2 et Mistral Large quelques jours seulement après l’annonce de sa disponibilité sur Azure.

Cette même API permet de faire du Chat, avec une gestion de l’historique de l’échange, une mémoire long terme. Des conversations multimodales seront possibles très prochainement, en s’appuyant sur Google Gemini et GPT4 Vision. Ouverte auprès d’un nombre limité d’utilisateurs, la génération d’image donne accès au modèle Stable Diffusion XL (SDXL) et prochainement à Stable Cascade et à Stable 3.

L’accès à Dall-E 3 vise les utilisateurs moins experts dans le Prompting d’image. Des fonctionnalités supplémentaires comme l’upscaling 4K, l’Inpainting, l’Outpainting sont annoncées de même que la génération de vidéos.

La plateforme GenAI de l’Oréal repose sur LangChain

Bien évidemment, la plateforme intègre un service de RAG (Retrieval Augmented Generation) afin de permettre aux utilisateurs d’uploader des documents pour étayer les réponses des LLM. Pour héberger les données de ses RAG, L’Oréal a fait le choix de la solution Pinecone, une base vectorielle accessible en mode « as a Service » et jugée très simple d’utilisation par l’équipe projet. L’Oréal évalue aujourd’hui Vertex Vector Search de Google, mais aucune décision de migration n’a été prise à ce jour.

La plateforme qui porte l’ensemble de ces services repose sur la solution Open Source LangChain déployée sur Google Cloud Run, en mode Serverless.

Thomas Menard explique ce choix : « Nous avons fait le choix de LangChain car de notre point de vue tout miser du Copilot ou un équivalent est une erreur. La technologie à la mode aujourd’hui ne le sera pas nécessairement demain. Par exemple, Mistral arrive à sortir des modèles qui rivalisent avec GPT-4. Il faut avoir le choix, le choix c’est la liberté. S’appuyer sur les modèles que l’on souhaite, des modèles comme Gemini Pro ou GPT 3.5 qui sont équivalents et on doit laisser à chacun le choix de choisir celui qu’il préfère et nous devons leur donner ce choix et ce n’est pas l’IT qui doit décider pour 90 000 employés. »

LangChain offre à L’Oréal la capacité de gérer de multiples LLM, donne accès à des fonctions avancées comme la SummarizationBuffer Memory qui donne l’illusion d’une conversation infinie quelque soit la fenêtre de token du modèle. Il est possible de choisir différents parser ou encore opter pour la base vectorielle de son choix pour porter les RAG.

« Nous avons démarré sur Pinecone, mais si nous décidons un jour de basculer sur Chroma DB ou Vertex Vector Search, le niveau de complexité ne sera pas très élevé. » complète Thomas Menard. De même, pour le chargement et l’analyse des documents, l’équipe a démarré avec Document AI de Google. Jugée trop lente, cette fonctionnalité a été remplacée par la librairie Python pypdf, avant de basculer à nouveau vers Document AI à la sortie d’une version plus performante. Le tout ne fut affaire que de quelques lignes de configuration à changer…

Beauty Genious : le cas d’usage présenté au CES 2024

L’ensemble de la plateforme est dockerisée sur Google Cloud Run et les API sont référencées dans la plateforme de gestion d’API de l’Oréal Apigee.

Outre L’OréalGPT, plusieurs autres cas d’usage ont été développés directement par le centre d’excellence IA, mais beaucoup d’autres équipes le sollicitent pour développer leurs propres cas d’usage.

Le plus médiatisé d’entre eux est sans doute Beauty Genious qui a été présenté par Nicolas Hieronimus, le CEO du Groupe L’Oréal, lors du CES 2024, à Las Vegas. Ce service sera lancé sur le marché américain en septembre 2024. Ce cas d’usage sera bien plus imposant que les précédents puisque ce sera le premier à être proposé directement aux clients du géant des cosmétiques.

