L’API DALL·E est disponible : les choses à savoir

DALL·E, le modèle génératif d’images d’OpenAI, est désormais accessible par API. Quelles possibilités d’usage, quelles limites… et quels prix ?

Une API de plus au catalogue d’OpenAI. En bêta publique, elle donne accès à la dernière version de DALL·E, le modèle générateur d’images.

Trois options : créer des images, en éditer ou en faire des variations.

La première de ces options génère, à partir d’une requête de 1000 caractères maximum, des images carrées de 256, 512 ou 1024 pixels de côté. Par défaut, une à la fois, mais on peut pousser jusqu’à dix. Deux formats de sortie possibles : soit en Base64, soit sous forme d’une URL qui reste valide une heure.

L’option « édition » implique d’uploader à la fois une image et un masque. En fait une deuxième image, de mêmes dimensions, et dont les parties transparentes correspondent à celles qui seront éditées. Image et masque doivent être en PNG, dans un format carré et peser moins de 4 Mo. La limite pour la consigne textuelle est la même : 1000 caractères.

La troisième option utilise les mêmes paramètres que l’édition, sans masque.

DALL·E, aussi cher que Davinci

Sur la question des droits d’exploitation : on peut republier et commercialiser, sans limites, toute image créée avec DALL·E. Qu’elle ait été générée/transformée avec des crédits gratuits ou payants. OpenAI encourage toutefois à « dévoiler spontanément l’implication d’une IA ». Retirer le filigrane est possible, tant qu’on « ne trompe pas sur la nature de [l’image] ».

Avec DALL·E, la facturation est séparée de celle des autres API d’OpenAI. Il faut dire que l’unité de référence n’est pas la même. Exit les tokens correspondant à des « fragments de mots » : on paye pour chaque image produite. C’est 0,20 $ en 1024 pixels ; 0,018 $ en 512 pixels ; 0,016 $ en 256 pixels. Des prix à la hauteur de ceux de Davinci, le plus puissant des modèles de traitement du langage naturel d’OpenAI.

Le premier mois, on bénéfice de 50 crédits gratuits. S’en ajoutent ensuite 15 par mois, non cumulables. On peut aussi utiliser, avec l’API DALL·E, les 18 $ de crédit qu’OpenAI offre à l’ouverture d’un compte (validité : trois mois).

Des remises sur volume peuvent, officiellement, être sollicitées à partir de 5000 $ de conso mensuelle. Par défaut, l’accès se bloque à partir de 120 $ dépensés au cours d’un mois. Il faut remplir un formulaire pour relever ce plafond.

On prendra également contact avec OpenAI si on souhaite relever les limites de requêtes de l’API DALL·E. En l’occurrence, 10 images par minutes et 25 par tranche de 5 minute.

En l’état, il n’y a pas de SLA… comme pour les autres API. Ci-dessous, le résumé de leur disponibilité sur les 60 derniers jours.

disponibilité DALL-E

Microsoft, principal soutien financier d’OpenAI, a intégré DALL·E dans Bing. Il l’a aussi embarqué dans une application web nommée Designer. Présentée à la mi-octobre, elle est actuellement en accès anticipé avec liste d’attente. Objectif : l’intégrer, à terme, dans la suite Microsoft 365.

Illustration principale © artinspiring – Adobe Stock