Pour gérer vos consentements :
Categories: ChatGPT

Sécurité des IA génératives : l’OWASP esquisse un Top 10

« Confiance excessive dans le contenu généré ». C’est l’une des vulnérabilités qui figurent au Top 10 OWASP pour les grands modèles de langage (LLM).

Ce dernier n’est encore officiellement qu’à l’état de brouillon (version 0.1). Il n’inclut effectivement, entre autres, qu’un nombre limité de scénarios d’attaque. Et ne comporte pas, pour le moment, de mapping CWE.

Les dix vulnérabilités listées sont les suivantes :

Injection de prompts
Fuite de données
Mauvaise isolation
Exécution de code non autorisé
Falsification de requête côté serveur (SSRF ; Server-Side Request Forgery)
Confiance excessive dans le contenu généré
Paramétrage inadéquat du LLM
Mauvais contrôle des accès
Mauvaise gestion des erreurs
Manipulation des données/processus d’entraînement

Si on excepte le monitoring et les audits réguliers, la méthode qui revient le plus pour éviter ces failles est la validation des entrées. Suivent l’isolation de l’environnement du LLM et le filtrage contextuel du contenu généré.

En amont de la phase d’exploitation, il importe de définir des objectifs clairs sur lesquels on alignera le dataset, la procédure d’entraînement… et les capacités du modèle (actions autorisées, paramètres de sécurité).

Sur la phase d’exploitation, on affinera régulièrement le modèle pour améliorer sa compréhension des entrées malveillantes. On s’assurera par ailleurs de bien cadrer les messages d’erreur et de débogage ; typiquement, en privilégiant des annonces « génériques » pour les utilisateurs et en réservant les détails aux devs/admins. Tout en établissant un processus d’évaluation continue de tous ces aspects.

À consulter en complément :

Fronde à l’OWASP : les projets qui se rebiffent
Public Money Public Code : où en est cette campagne européenne pour le logiciel libre ?
Le legacy s’installe aussi dans l’open source

Photo d’illustration ©

Recent Posts

Legapass : comment protéger ses données privées jusque dans l’au-delà

Comment gérer les données numériques après la mort de son détenteur ? La jeune pousse…

3 jours ago

Iris, un assistant d’IA conversationnelle en langue des signes

Ivès, expert en accessibilité de la surdité, s’est associé à Sopra Steria et à IBM…

3 jours ago

GenAI : le Royaume-Uni poursuit ses investigations sur les partenariats de Microsoft et Amazon

L'Autorité de la concurrence et des marchés (CMA) a lancé la phase de recherche de…

4 jours ago

Clients de VMware : les raisons de la colère

Broadcom remplace pas moins de 168 logiciels VMware par deux grandes licences de location correspondant…

4 jours ago

Laurent Carlier – BNP Paribas Global Market : « L’IA permet de modéliser des relations plus complexes, mais il faut rester prudent »

La banque d’investissement utilise l'IA pour proposer des stratégies individualisées, en termes de rendement et…

4 jours ago

Open Compute Project : les datacenters partagent des bonnes pratiques pour l’environnement

OVHCloud partage ses efforts environnementaux au sommet de l’Open Compute Project qui se tient à…

5 jours ago