Legaltechs : du big data au smart data

L’heure est à la massification des données. Dans le secteur du droit, de nouveaux défis apparaissent notamment dans le traitement des données de jurisprudence. À la clé : une révolution à venir pour les particuliers comme pour les professionnels du droit, menée par les legaltechs.

Le droit est un domaine où pour prendre la bonne décision, il est nécessaire de connaître, analyser et questionner les textes législatifs et les décisions de jurisprudence, y compris la gestion de l’ensemble des données dans le temps et parfois les données chiffrées qui y sont liées. Les professionnels du secteur doivent donc se fonder sur un corpus d’éléments toujours pluslarge et complexe pour prendre leurs décisions. Pour faire face à cette croissance inexorable de « données » juridiques classiques ou dérivées, l’utilisation d’outils de « big data » spécialisés devient une nécessité.

D’un point de vue technique, la nature très particulière des données juridiques, qui reposent sur des textes et des interprétations souvent au cas par cas, oblige les développeurs de ces outils à construire des bases de données juridiques intelligentes tenant compte d’un grand nombre de critères pour pouvoir être correctement exploitées.

Le défi : savoir traiter des données « non structurées »

Dans de nombreux domaines, les données à exploiter via des outils de « big data » sont peu complexes à prendre en charge car elles sont soit chiffrées, soit parfaitement structurées. Il suffira de récupérer un maximum de données et d’utiliser des stratégies de « mapping » pour en tirer des enseignements significatifs.A contrario, dans le domaine du droit, les données à exploiter sont diverses et plus complexes. Dans le jargon du « big data », on parle de données « non structurées » car celles-ci ne sont pas préalablement classées. Ainsi, pour exploiter à grande échelle des données textuelles liées par exemple à des décisions de jurisprudence, il est nécessaire d’utiliser des méthodes d’intelligence artificielle plus sophistiquées, notamment de « machine learning »et de « deep learning ».

Le but : parvenir à créer des silos de données rangées, structurées et donc valorisées à partir d’éléments préalablement « non structurés ». On entre ainsi dans le domaine de la « smart data », c’est-à-dire de la donnée rendue intelligente. La donnée devient « intelligente » par deux opérations majeures : la modélisation (l’analyse syntaxique des documents) et le branchement de stratégies imitant nos réseaux neuronaux : les traitements TAL ou NLP qui interviennent a posteriori.

Donner du sens à des données juridiques disparates permet à celles-ci d’être interprétées par un
moteur de recherche capable d’apporter des réponses ciblées en fonction de requêtes formulées de différentes manières.

La difficulté de ce processus tient au fait que ces données peuvent être très différentes les unes des autres. Par ailleurs, le travail de « Machine learning » reste nécessairement lié à un important travail humain en amont pour permettre aux algorithmes de bien interpréter les données qui leur sont soumises. Cette technique ne pourra donc jamais se passer du travail d’experts chevronnés.

Le but final : créer des algorithmes d’aide à la décision

Une fois mises au point, ces bases de données peuvent permettre à des algorithmes de réaliser un
remarquable travail d’aide au jugement dans des cas de figure simples. Sont notamment concernés les cas de licenciements abusifs, les procédures de divorce ou encore les troubles de voisinage. Ces types de conflits se caractérisent par des motifs répétitifs d’une affaire à l’autre, et le traitement de chaque nouveau cas est simple si l’on connaît l’ensemble des cas précédents et le contexte lié à la typologie d’affaires.

Ces algorithmes ne peuvent donc être que d’une précieuse aide pour les juges, permettant de gagner en efficacité – Ce sont des outils d’aide qui n’entament pas le libre arbitre pour la rédaction de chaque décision. Ils ne prédisent aucunement l’avenir du droit ou de quoi que ce soit d’ailleurs, les variables étant trop nombreuses et complexes in fine. Le principe d’incertitude juridique est bien réel : une probabilité de présence n’est pas une présence (cf. le spectre de faits juridiques, leur variabilité, leur inférence sur l’application de(s) (la) règle(s) de droit, la variabilité d’application de cette même règle, l’ensemble des éléments d’appréciation, sans même parler de la procédure et des voies de recours, etc.)

Il est par ailleurs probable que d’ici une dizaine d’années, nous assistions à une déjudiciarisation
partielle de certaines procédures – ou recours aujourd’hui fréquents. Celles-ci pourront être mimées ou exécutées partiellement par des algorithmes sans besoin a priori des services d’un juge ni même d’un médiateur. Les particuliers engagés dans un conflit simple pourront réaliser des simulations en ligne pour connaître à l’avance le traitement de leur cas. Les algorithmes ne remplaceront pas, bien sûr, le libre arbitre de chacun : si l’une des deux parties considère que l’algorithme ne tient pas compte de certaines circonstances particulières, le recours à un avocat et à un juge resterait naturellement possible.

La généralisation de ce type d’innovation serait un gain pour tout le monde. Pour les particuliers, les procédures judiciaires les plus simples deviendraient moins coûteuses et donc plus égalitaires. Pourles professionnels du droit, l’utilisation d’outils d’aide à la décision permettrait un gain d’efficacité susceptible de répondre à certains défis actuels comme l’engorgement des tribunaux et la lenteur de la Justice. Le potentiel de ces outils est gigantesque : l’innovation dans le domaine du droit ne fait que commencer !