Predictice : grâce aux algorithmes, cette startup est capable de prédire l’issue d’une action en justice et d’optimiser les stratégies contentieuses des avocats

Temps de lecture estimé : 12 minutes

*Attention, ce contenu a été publié il y a 1 année. Il n'est peut-être plus d'actualité.*

Fondée par deux élèves avocats technophiles et deux ingénieurs en informatique, la startup française Predictice exploite les techniques du machine learning pour prédire les chances de succès d’une procédure judiciaire et optimiser la stratégie contentieuse des avocats, en s’appuyant notamment sur les décisions de justice antérieures. Actuellement en phase bêta, ce service sera proposé dès septembre 2016 aux cabinets d’avocats et services juridiques d’entreprise. Zoom sur ce projet soutenu par OVH dans le cadre du Digital Launch Pad.

Predictice startup LegalTech soutenue par OVH Digital Launch Pad

Qu’est-ce que la « justice prédictive » ?

Les startups abusent volontiers de buzzwords pour décrire leur activité. À ce jeu-là, nous ne serions d’ailleurs pas mauvais : à la croisée des chemins entre l’open data, le big data et l’intelligence artificielle — avec le recours à des techniques de deep learning — notre projet est presque un sans-faute. Le problème, c’est que l’utilisation excessive de ces concepts à la mode entretient une bulle et relègue au second plan ce que ces technologies apportent réellement aux utilisateurs. Soyons concret ! Predictice est une plateforme d’aide à la décision à destination des cabinets d’avocats. Notre objectif est de fournir à ces derniers une probabilité statistique de succès pour les affaires qu’ils vont plaider, mais pas seulement. Nous permettons aux avocats d’optimiser leur stratégie, en les aidant à identifier et hiérarchiser les leviers qui vont permettre d’influencer positivement la résolution d’un litige, c’est-à-dire les arguments qui ont le plus de chance de fonctionner, ceux sur lesquels il est judicieux d’insister, en tenant compte des caractéristiques spécifiques du dossier de leur client. Enfin, nous sommes capables de livrer une estimation des indemnités obtenues dans le cadre de contentieux similaires préalablement jugés, ainsi qu’une cartographie des juridictions les plus favorables selon le type de problématique.

Quel est le champ d’application de votre solution ?

Notre ambition est de couvrir l’intégralité des litiges auxquels peuvent être confrontés les avocats, du droit du travail au droit des affaires, en passant par le droit administratif. En cela, nous sommes différents des projets initiés notamment aux États-Unis. Par exemple celui de la société Lex Machina, spécialisée dans la (lucrative) problématique des brevets industriels, ou les solutions prédictives à destination des magistrats, telles que l’algorithme « Compas », qui utilise d’autres données que les décisions judiciaires pour définir le risque de récidive d’un détenu (1).

Bien évidemment, nos prédictions ont une plus grande valeur lorsqu’elles s’appuient sur une jurisprudence volumineuse (l’ensemble des décisions de justice relatives à une question juridique donnée, NDR). Notre outil est aujourd’hui particulièrement fiable dans le domaine du droit administratif ou dans certains contentieux de masse, à l’instar des litiges consécutifs à un licenciement. Il existe en effet beaucoup d’occurrences, avec une variété de cas suffisamment significative pour rendre pertinents les rapprochements. Dans un dossier de licenciement, vous imaginez bien que l’issue sera sensiblement différente selon l’ancienneté de l’employé, ou son état de santé physique ou moral lorsque la procédure a été enclenchée par l’employeur. Nos prédictions tiennent donc compte de ces caractéristiques.

Comment obtenez-vous les décisions judiciaires qui constituent votre matière première ?

Dans le cadre d’une politique globale en faveur de l’open data, depuis une année environ les juridictions sont incitées à mettre à disposition du public les décisions judiciaires devenues définitives, dans le respect de la vie privée des personnes concernées (2). Dans les faits, ces données ont commencé à être accessibles il y a un an, elles sont devenues exploitables il y a six mois et cela va s’accélérer dans les mois à venir, le temps que les institutions judiciaires mettent en place les procédures pour anonymiser et publier ces documents. Notre base de données comprend aujourd’hui un million de lignes, sans compter les différents codes (articles de loi) et textes de doctrine (commentaires de code et de décisions judiciaires par des universitaires), sur lesquels nous nous appuyons également.

Grâce à quelles technologies parvenez-vous à extraire de ces documents juridiques les informations qui vous permettent de réaliser des prédictions ?

Ce corpus de textes judiciaires, dont le volume va aller croissant, est soumis à un traitement informatique en trois étapes. Pour simplifier, chacune de ces étapes permet de répondre successivement à ces trois questions : que s’est-il passé ? Que va-t-il se passer ? Comment optimiser la stratégie contentieuse ?
Le droit utilise un langage très normé ; il y a peu de synonymes et les tournures de phrase utilisées pour rendre un jugement à Lille ou à Marseille sont similaires. En conséquence, il est possible d’indexer et d’enrichir les données de façon automatisée, en y ajoutant des métadonnées. C’est la première étape. Ces métadonnées rendent compte des caractéristiques du litige : quelle a été l’indemnité réclamée et celle effectivement obtenue ? S’agissait-il d’un recours ou du jugement de première instance ? Etc. Cela nous permet de proposer à nos utilisateurs un moteur de recherche capable de fournir toutes les informations utiles à propos d’un litige (textes de loi, jurisprudences, doctrine…).
La seconde étape du traitement fait entrer en jeu les algorithmes. Deux litiges n’étant jamais identiques, l’objectif est d’identifier la corrélation entre un facteur ou une combinaison de facteurs (analyse multivariée) et la résolution d’une affaire. Pour cela, nous exploitons l’algorithme SyntaxNet, développé par Google et rendu open source le 12 mai 2016 (3). Cet outil d’analyse syntaxique aide les machines à comprendre le langage humain et permet, dans notre cas, de repérer les dépendances entre des mots pour en extraire du sens. Le texte ainsi enrichi est soumis à des algorithmes de classification/régression (Vapnik’s SVM) et des règles d’association (Frequent Pattern Vertical) pour créer des modèles prédictifs complexes. En appliquant ces modèles aux caractéristiques de son litige, l’avocat est ainsi capable d’évaluer les probabilités de succès.
La troisième et dernière étape consiste à évaluer et comparer plusieurs stratégies contentieuses, pour que l’avocat puisse construire, en fonction des caractéristiques variables de l’affaire, l’argumentation qui a statistiquement le plus de chance de réussir.

Exemple de dashboard d’analyse des décisions de justice dans le cas d’une rupture brutale des relations commerciales.
Exemple de dashboard d’analyse des décisions de justice dans le cas d’une rupture brutale des relations commerciales.

Comment les avocats accueillent-ils votre projet ?

Les barreaux (représentants des avocats auprès de chaque tribunal de grande instance, NDR) sont relativement conservateurs. Les avocats ont la culture du papier ; ils impriment, ils surlignent, ils archivent… Mais les choses sont en train de changer. Il y a eu une première vague de legal startups menaçant directement leur gagne-pain. C’est la fameuse menace d’« ubérisation », même si le mot a tendance à simplifier une réalité complexe, étant donné que la profession d’avocat est fortement réglementée et, d’autre part, hautement qualifiée. Si les avocats ont d’abord considéré les nouvelles technologies comme un risque, n’hésitant pas à batailler en justice avec certaines startups, ils sont aujourd’hui nombreux à y voir une opportunité. Les projets comme les nôtres, qui visent à outiller les professionnels du droit et, finalement, à maximiser leur valeur ajoutée, constituent une deuxième vague de legal startups, plutôt bien accueillie.
En ce qui concerne Predictice, nous avons fait le choix de co-concevoir notre solution avec des cabinets d’avocats partenaires (3), suivant deux axes : l’animation d’ateliers pour comprendre les besoins de nos utilisateurs, et d’autre part l’amélioration continue basée sur le feedback de nos bêta-testeurs.
Toutefois, soyons honnête, l’arrivée de la justice prédictive n’est pas sans conséquence sur la pratique du métier d’avocat. Imaginez que vous puissiez savoir, avant d’entamer une procédure judiciaire, que vos chances de succès sont de 2 % seulement. Vous vous tournerez très certainement vers la médiation, la transaction ou tout autre mode de règlement amiable de votre litige, plutôt que de passer plusieurs années dans les prétoires. L’avocat devra trouver sa place dans ce nouveau système de résolution des litiges, amené à se développer dans les années à venir, désengorgeant par ailleurs les juridictions suivant le système des vases communicants.

Le lancement commercial de votre solution est prévu pour le mois de septembre. Combien d’utilisateurs visez-vous ?

Il y a en France 60 000 avocats, et nous tablons sur un taux de pénétration de 30 à 50 %, soit entre 15 et 30 000 utilisateurs. À cela s’ajoutent les services juridiques d’entreprise et les cabinets comptables qui ont une branche juridique. Notre business model de plateforme en SaaS, facturée aux cabinets sous la forme d’un abonnement sans engagement et sans tenir compte du nombre d’utilisateurs de la solution devrait faciliter son adoption. Nous prévoyons à moyen terme à un développement à l’international, notamment dans les juridictions francophones et de tradition civiliste, mais également dans les pays de droit anglo-saxon qui accordent une place prépondérante à la jurisprudence.

Quels sont vos principaux défis techniques, en matière d’infrastructure informatique ?

Le premier défi tient à la scalabilité de l’infrastructure, qui devra supporter une croissance que nous espérons rapide, et une charge importante car l’usage de notre application est assez intensif : lorsqu’un avocat travaille sur un dossier, il va faire des recherches pendant parfois plus d’une heure, lançant des requêtes assez gourmandes en ressources. Pour démarrer, nous nous sommes basés sur un serveur dédié OVH, que nous avons virtualisé avec l’hyperviseur ESXi de VMware, ceci pour isoler au sein de machines virtuelles nos différents services (fronts web, bases de données MySQL et ElasticSearch, backoffice, monitoring…). Demain, grâce à la virtualisation et au vRack, il sera assez facile de répartir les VM sur plusieurs serveurs dédiés interconnectés pour augmenter notre capacité de traitement et constituer une architecture n-tiers plus résiliente.
Nous avons récemment rejoint le Digital Launch Pad d’OVH , programme d’accompagnement des startups, pour bénéficier de conseils plus approfondis sur l’infrastructure et accéder aux solutions GPU (architectures massivement parallèles) parfaitement adaptés aux traitements de type Deep Learning. Cela pour améliorer la vitesse d’apprentissage de nos algorithmes (plus de cinq heures actuellement avec un jeu de données restreint), en déployant une architecture CUDA (computer unified device architecture), utilisant un processeur graphique pour effectuer les calculs à la place du CPU.

La justice prédictive ouvre la porte à une justice automatisée ou assistée par ordinateur, niant les cas particuliers pour uniformiser les décisions de justice, les faire tendre vers une hypothétique moyenne… Qu’en pensez-vous ? (Vous pouvez bien sûr réclamer la présence d’un avocat pour répondre !)

L’objectif de Predictice est d’atténuer l’incertitude, la zone grise qui entoure les décisions judiciaires, en fournissant des outils pour augmenter leur prévisibilité. Consulter la jurisprudence et effectuer des rapprochements avec des affaires similaires a toujours constitué une partie importante du travail des avocats – et même des juges, qui vérifient si la décision qu’ils s’apprêtent à rendre va à l’encontre des décisions précédentes et, le cas échéant, si la différence de traitement est justifiée.
La révolution, c’est de pouvoir accéder à ces données dans des volumes inédits, et de disposer de machines qui ont des capacités de calcul sans commune mesure avec celui de l’esprit humain, fut-il hautement qualifié.
Ce faisant, nous donnons aux avocats et à leurs clients, les justiciables, la possibilité d’accéder à une justice un peu meilleure. Tenter d’anticiper les décisions de justice a toujours été une nécessité, l’existence des systèmes de barème en est la preuve (pensez au barème des indemnités en cas de licenciement). Ce type de système, dont les intervalles ne sont jamais assez fins pour embrasser la diversité du réel, aboutit malgré lui à une uniformisation qui lisse les cas particuliers et prévaut sur l’expérience des juges. À l’inverse, un calcul statistique, avec une pondération fine des différents critères, s’appuyant sur l’ensemble des précédents, permet une prise en compte du particularisme. La justice prédictive réussit donc à répondre à l’exigence d’anticipation des coûts, de transparence du système, et de la prise en compte des particularités.
Toutefois, vous avez raison de souligner le danger inhérent à cette révolution technologique : la tentation de passer de la justice prédictive à la condamnation automatique. Ce totalitarisme niant l’individu et les spécificités de chaque cas a été suffisamment bien documenté par la science-fiction (— (re)lisez The minority report de P. K . Dick — pour nous alerter sur les excès auxquels cela aboutirait inévitablement. L’individualisation de la décision rendue doit rester un principe essentiel du droit.

Vous allez avoir entre les mains des données susceptibles de rendre compte de l’évolution de la jurisprudence dans le temps, et en fonction des contextes politiques et médiatiques. Prévoyez-vous de communiquer sur ces données ?

Predictice souhaite mettre rapidement en place un Observatoire du contentieux dont l’objectif serait d’éclairer les justiciables et les professionnels sur les grandes tendances de la justice française. Néanmoins notre but premier reste aujourd’hui la fourniture d’une solution fiable et performante à destination des avocats. Améliorer le fonctionnement de la justice nous paraît être un objectif primordial. Nous y contribuerons dans la mesure de nos moyens en mettant à disposition les analyses réalisées grâce à notre outil.

Notes

(1) Lire à ce sujet : États-Unis : l’algo qui prédit la récidive devant les juges , par Andréa Fradin, Rue89.nouvelobs.com, le 27 juin 2016.

(2) Lire : Les décisions de justice seront publiées en open data , par Guillaume Champeau, Numerama, le 28 avril 2016.

(3) Notamment le cabinet international Taylor Wessing et la boutique SoLegal.

(4) C’est notamment grâce à l’algorithme SyntaxNet que le moteur de recherche de Google sait répondre aux requêtes prenant la forme de questions naturellement formulées par un humain, par exemple « Où manger ce soir ? ». Ceci en prenant en compte non seulement le sens des mots, mais aussi le contexte. Au sujet de la mise à disposition en open source de cet algorithme par Google, lire SyntaxNet en open source : Google à la conquête de l’IA , The Good Life, par Kahina Meziant, le 18 mai 2016.

Copywriter at OVH.