Pour gérer vos consentements :
Categories: ChatGPT

Quelques éléments sur l’offre GenAI qu’Orange Business monte avec LightOn

Combien ça coûte ? « Un certain prix par mois »… En l’état, Orange Business n’en dit pas plus quant à la tarification de l’offre GenAI qu’il vient d’annoncer en partenariat avec LightOn.

À défaut, voici quelques autres éléments.

En quoi consiste cette solution SaaS ?

Elle donne accès à une interface « à la ChatGPT ». L’UI peut varier en fonction des métiers. LightOn fournit le LLM, qui tourne sur des GPU NVIDIA H100 et L40S localisés dans des datacenters Orange Business en France.

Quel est ce LLM ?

Il s’agit d’Alfred, un modèle open source à 40 milliards de paramètres découlant de l’ajustement de Falcon-40B par RLHF (renforcement par feed-back humain), puis du surentraînement sur un mélange de données publiques et de données étiquetées par LightOn.

LightOn traite et produit exclusivement du texte. Sa première version (Alfred-40B-0723) fut publiée à l’été 2023. Une deuxième (Alfred-40B-1023) arriva en novembre. Au menu, un contexte élargi à 8k, davantage de capacités sur la conversation avec des documents et une « conscience accrue » (aptitude à reconnaître ignorer des réponses).

LightOn maintient, dans le cadre de son offre Paradigm, une version affinée d’Alfred, plus avancée que le modèle open source.

Peut-on « personnaliser » Alfred ?

L’offre d’Orange Business permet d’intégrer des bases documentaires pour la génération augmentée de récupération (RAG). Autre option : la connexion à des bases par API. En fonction des usages, on peut envisager un ajustement du modèle (finetuning).

Dans le cas où on l’alimente ainsi de documents, Alfred cite ses sources et surligne les passages pertinents.

Est-ce vraiment une offre « clés en main » ?

Orange Business emploie l’expression. Reste qu’en fonction des use cases, il pourra être nécessaire de recourir à des services professionnels. La connexion de bases à l’API du LLM entre dans ce cadre. Comme la formation et l’idéation, à travers la Digital Service School.

En parallèle de ce SaaS, Orange Business donne accès à des serveurs GPU (matériel HPE + cartes H100) dans ses datacenters de Chartres et Val-de-Reuil, sur son infrastructure VMware.

À consulter en complément :

IA générative : 7 entrepreneurs français qui vont faire 2024
GenAI : comment choisir une solution « prête à l’emploi »
Yann Le Cun – Meta AI : « Le futur de l’IA n’est pas dans les LLM mais dans l’IA guidée par les objectifs »
LLaMandement : qu’est-ce que ce LLM made in Bercy ?

Illustration principale © Arthur Chazallet

Recent Posts

Legapass : comment protéger ses données privées jusque dans l’au-delà

Comment gérer les données numériques après la mort de son détenteur ? La jeune pousse…

2 jours ago

Iris, un assistant d’IA conversationnelle en langue des signes

Ivès, expert en accessibilité de la surdité, s’est associé à Sopra Steria et à IBM…

2 jours ago

GenAI : le Royaume-Uni poursuit ses investigations sur les partenariats de Microsoft et Amazon

L'Autorité de la concurrence et des marchés (CMA) a lancé la phase de recherche de…

3 jours ago

Clients de VMware : les raisons de la colère

Broadcom remplace pas moins de 168 logiciels VMware par deux grandes licences de location correspondant…

3 jours ago

Laurent Carlier – BNP Paribas Global Market : « L’IA permet de modéliser des relations plus complexes, mais il faut rester prudent »

La banque d’investissement utilise l'IA pour proposer des stratégies individualisées, en termes de rendement et…

3 jours ago

Open Compute Project : les datacenters partagent des bonnes pratiques pour l’environnement

OVHCloud partage ses efforts environnementaux au sommet de l’Open Compute Project qui se tient à…

4 jours ago