Trois cas d'usage de l'IA à la Cour de cassation
Dans le cadre d'une cartographie des cas d'usage potentiels de l'IA en son sein, la Cour de cassation évoque des outils déjà mis en place.

L'IA, une bonne solution pour cartographier les litiges ? La Cour de cassation exprime une "forte incertitude" à ce sujet.
L'exercice consiste à dresser une chronologie des procédures au fond jusqu'au pourvoi. Ainsi qu'à classifier les parties en matérialisant leurs relations et à détecter les affaires apparentées (qui présentent une "connexité", dans le vocabulaire juridique). Il combine l'exploitation des métadonnées de la Cour, des écritures des parties et des décisions rendues en première instance ou en appel. Cette variété de sources questionne la capacité d'un système d'IA à "avoir une juste compréhension" sans pour autant déployer des ressources trop coûteuses.
La Cour de cassation a identifié d'autres cas où un système d'IA ne serait potentiellement pas adapté. Par exemple, le présignalement des pourvois. C'est-à-dire l'identification des affaires répondant à certaines questions de droit que se posent ses chambres. Actuellement réalisée à fréquence mensuelle, le processus repose sur "une analyse humaine fine difficilement reproductible par un système d'IA".
Automatiser l'orientation des pourvois
La Cour a, au contraire, introduit de l'algorithmique dans une démarche effectuée en parallèle : l'orientation des mémoires ampliatifs (documents contenant les moyens de droit et arguments) vers les chambres adéquates.
Cette opération est réalisée au sein du SDER (service de documentation, des études et du rapport), par des bureaux dits "miroirs" des chambres. Elle implique l'attribution de codes matières issus d'une nomenclature qui en compte des centaines.
Pour assister cette tâche, un outil automatisé fut mis en place en 2020. Développé en deux mois par un data scientist puis intégré au SI après un an, il exploite la méthode de pondération TF-IDF (term frequency-inverse document frequency), souvent utilisée en recherche d'information.
L'outil a aujourd'hui un taux de succès de plus de 90 %, mais le processus d'orientation des mémoires consomme encore entre 25 et 40 % du temps de travail des 12 juristes présents au sein des bureaux miroirs des chambres civiles, commerciale et sociale. Dans ce contexte, la Cour de cassation entretient des perspectives d'automatisation totale. Si la technologie est identifiée et frugale, reste un obstacle technique : un volume insuffisant de données annotées (l'entraînement s'est fait sur le stock de mémoires déjà orientés).
Un modèle made in Inria pour pseudonymiser les décisions de justice
Autre élément en production : un outil de pseudonymisation des décisions de justice. Réalisé grâce à la participation au programme "Entrepreneur(e)s d'intérêt général" d'Etalab, il repose sur deux algorithmes. Le principal, de type NER (reconnaissance des entités nommées), identifie les éléments à occulter. Il se fonde sur des modèles de langage entraînés par l'Inria et affinés par la Cour. Ses performances sont enrichies par le second, qui modélise le langage des décisions de justice françaises en s'appuyant sur une base d'environ 2 millions d'arrêts (cours d'appel et cassation). Les agents de la cellule d'anonymisation ont été sollicités pour en annoter une partie (identification des entités d'intérêt).
La mise en prod remonte à 2019, après 10 mois de travail de deux data scientists. L'an dernier, un modèle plus robuste reposant sur un GPU A40 a été mis en service. Prenant 4 secondes pour chaque décision (contre 50 minutes sur CPU), il est accompagné d'un nouvel algorithme "de fiabilité" qui identifie l'éventuelle nécessité d'une relecture humaine.
Le réentraînement peut nécessiter jusqu'à un mois de travail. Il est effectué régulièrement pour prendre en compte les évolutions des sujets traités dans les décisions et les nouvelles sources de données comme les tribunaux de commerce.
Divergences, un projet éclaireur
Encore en développement, mais avec des résultats intermédiaires qui apparaissent "immédiatement mobilisables", il y a le projet Divergences. Son domaine : la détection, au sein des arrêts de la Cour, des éventuelles divergences d'interprétation entre chambres ou sections.
Deux algorithmes en ont résulté. L'un assure le titrage automatique (75 % de réussite). L'autre, le rapprochement de décisions en exploitant les chaînes de titrage (35 % de réussite).
Les travaux furent initialement menés avec l'Inria. Le SDER les a repris et poursuit leur amélioration, notamment pour la rédaction automatique de sommaires à partir de la motivation des arrêts.
L'appréhension des arrêts d'appel puis des décisions de première instance constitue une suite logique du projet. La principale difficulté technique sera l'hétérogénéité de mise en forme des documents. Autre perspective : l'étude des rapprochements ou divergences entre droit interne et droit européen.
Les connaissances acquises lors du projet Divergences peuvent également soutenir la détection des questions de droit nouvelles ou des contentieux émergents. Le gain de qualité ou d'efficacité serait significatif, mais supposerait "un fort investissement des équipes de data science comme du métier".
Le projet a par ailleurs mis en évidence la capacité à développer à très court terme une interface de titrage semi-automatique des décisions publiées par la Cour. Elle permettrait d'améliorer la classification des décisions au sein de la base interne Jurinet.
Préparer le changement d'échelle de la base Judilibre
La Cour de cassation a sa propre DSI et un labo d'innovation composé de 10 profils techniques. Elle se prépare à un changement d'échelle fin 2025 : l'ensemble des décisions publiques transmises par les tribunaux en matière civile, sociale et commerciale, les conseils de prud'hommes et les tribunaux de commerce commenceront à alimenter sa base Judilibre (accessible au public), à raison d'un million de décisions par an. Un champ d'application supplémentaire pour l'IA. Plus en tout cas que l'aide à la décision, sur laquelle la Cour n'exprime pas de besoin. Elle en a bien identifié en matière d'aide à la rédaction, mais ils sont d'une "complexité particulière" (enjeux éthiques, juridiques et techniques majeurs).
La Cour de cassation est partenaire du Sorbonne Cluster for AI, porteur d'un des 9 clusters IA nationaux (financé à hauteur de 35 M€ sur 5 ans). Cela lui ouvre des possibilités d'accès à de la puissance de calcul et à des ressources en data science. Elle
Illustration © Zerbor - Shutterstock
Sur le même thème
Voir tous les articles Data & IA