Pour gérer vos consentements :
Categories: ChatGPT

Foundry : vers une offre OpenAI sur ressources dédiées

Des ressources dédiées pour exécuter les modèles d’OpenAI ? C’est le principe de l’offre Foundry, annoncée auprès d’un cercle restreint d’utilisateurs.

En l’état, Foundry donne accès à trois modèles de traitement et de production de langage naturel. Le plus puissant semble être une version « boostée » de Davinci, peut-être fondée sur GPT-4. Son historique peut contenir 32 000 tokens (« morceaux de mots » équivalant à environ 4 caractères). Soit huit fois plus que pour davinci-text-003, l’actuelle référence au catalogue public d’OpenAI.

Foundry ne permet pas encore de personnaliser les modèles proposés. Le contrôle des versions, en revanche, est activé. Un SLA à retenir : 99,5 % de disponibilité pour toutes les instances, avec un support technique par téléphone.

La tarification se fonde sur des unités de compute. Elle suppose un engagement de trois mois minimum.

On l’aura constaté : la facture pourra dépasser le million de dollars par an pour le plus puissant des modèles. Mais avec, donc, des ressources dédiées qu’on pourra probablement exploiter sans limites de requêtes.

À titre comparatif, l’exécution des modèles Davinci de base par l’intermédiaire de l’API OpenAI (endpoint /completions) revient à 0,02 $ par tranche de 1000 tokens. C’est le même prix dans le cadre de l’offre Azure OpenAI Service, avec laquelle Microsoft apporte des garanties supplémentaires en matière d’options d’hébergement, de chiffrement ou encore de gestion des identités.

La version payante de ChatGPT est quant à elle facturée 24 $ TTC par mois.

Illustration principale générée par IA

Recent Posts

AWS abandonne WorkDocs, son concurrent de Dropbox

Un temps pressenti pour constituer le socle d'une suite bureautique AWS, Amazon WorkDocs arrivera en…

13 heures ago

Eviden structure une marque de « serveurs IA »

Eviden regroupe cinq familles de serveurs sous la marque BullSequana AI. Et affiche le supercalculateur…

16 heures ago

SSE : l’expérience se simplifie plus que les prix

Le dernier Magic Quadrant du SSE (Secure Service Edge) dénote des tarifications et des modèles…

18 heures ago

IA générative : les lignes directrices de l’ANSSI

Formats de paramètres, méthodes d'apprentissage, mutualisation GPU... Voici quelques-unes des recommandations de l'ANSSI sur l'IA…

2 jours ago

De la marque blanche à l’« exemption souveraine », Broadcom fait des concessions aux fournisseurs cloud

À la grogne des partenaires VMware, Broadcom répond par diverses concessions.

2 jours ago

iPadOS finalement soumis au DMA

iPadOS a une position suffisamment influente pour être soumis au DMA, estime la Commission européenne.

2 jours ago