OpenAI amorce le décloisonnement de ChatGPT

OpenAI ouvre la voie à l’intégration de plug-in dans ChatGPT. Avec des perspectives fonctionnelles autant qu’économiques.

« L’esquisse d’une IA qui se cultive par API ». Ainsi avions-nous décrit, il y a quelques semaines, Toolformer. Meta est à l’origine de ce modèle GPT-J capable de décider quand et comment s’appuyer sur des outils externes.

OpenAI y fait référence à l’heure d’annoncer l’arrivée des plug-in pour ChatGPT. L’idée est la même : ces modules doivent permettre d’appeler des services complétant les capacités du chatbot.

L’idée est d’ouvrir, à terme, un magasin de plug-in qu’on pourra installer directement depuis l’interface de discussion*. Pour le moment, l’expérimentation se fait en cercle restreint, avec liste d’attente. Publics prioritaires : les développeurs et les utilisateurs de ChatGPT Plus.

Le catalogue comprend actuellement quinze plug-in. Douze proviennent de sources tierces (Expedia, FiscalNote, Instacart, KAYAK, Klarna, Milo, OpenTable, Shopify, Slack, Speak, Wolfram, Zapier). Les trois autres émanent d’OpenAI. Ils permettent respectivement de rechercher sur le web, d’interpréter du code Python et d’indexer des bases de connaissances.

catalogue plug-in ChatGPT

Vers un « ChatGPT Store »

Le plug-in de recherche web utilise l’API Bing Search. Il rend compte, au format texte, des étapes de navigation, en citant ses sources. Au nom de la sécurité, OpenAI a limité ses possibilités : uniquement des requêtes GET (pas d’opérations transactionnelles). Il a par publié sa plage d’IP sortantes, fixé un user-agent explicite (ChatGPT-User) et mis des quotas pour éviter d’envoyer trop de trafic.

L’interpréteur de code fonctionne dans un bac à sable. Il gère le téléversement et le téléchargement de fichiers. La session persiste tout au long de la discussion. OpenAI identifie trois cas d’usage en particulier : résoudre des problèmes mathématiques, analyser/visualiser des données et convertir des formats de fichiers.

Le code du plug-in « bases de connaissances » est open source. Charge à qui veut l’exploiter de déployer sa propre instance et de l’enregistrer sur ChatGPT. Sous le capot, on a le choix entre six bases de données pour l’indexation : Milvus, Piecone, Qdrant, Redis, Weaviate et Zilliz. La synchronisation des sources se fait par webhooks.

À chaque plug-in tiers doivent se rattacher un fichier de manifeste et une spécification OpenAPI. En l’état, seuls les développeurs sont autorisés à installer ce type de plug-in.

manifeste

* Et aussi de permettre l’usage de plug-in dans des applications au sein desquelles on a intégré ChatGPT.

Illustration principale © k_e_n – Adobe Stock