Arnout Jaspers:  Rechtspraak – Liever kunstmatige intelligentie dan het willekeurige maatwerk van menselijke rechters

ArnoutJaspers 8-3-25
Het vonnis van het gerechtshof in hoger beroep tegen de uitspraak van de rechtbank Amsterdam van 27 februari 2025, zoals geschreven door ChatGPT

Zou u het accepteren als een computer iemand tot tien jaar cel of tot TBS veroordeelt? Begrijpelijkerwijs niet als u zelf de verdachte bent, maar anderen? Een voorstel om computers recht te laten spreken zou nu op massale tegenstand stuiten, zowel bij het brede publiek als bij advocaten en rechters.

Beslissingen door computers hebben een slechte naam. In sommige gevallen terecht, maar soms is het ook demonisering bij de gratie van onwetendheid. Het simplistische idee op links dat ‘de algoritmes’ van Mark Zuckerberg de PVV groot gemaakt hebben, of dat we nu geen rechts kabinet zouden hebben als X op zwart was gezet na de overname door Musk, is onhoudbaar. Uit serieus onderzoek blijkt dat mensen zich verrassend weinig laten beÏnvloeden door nepnieuws en sensatie op social media.

Computer heeft ook nu al een functie in het recht

Niettemin heerst breed het gevoel dat computers of algoritmes niet te vertrouwen zijn met beslissingen die over mensen gaan. Alleen een menselijke deskundige kan de particuliere omstandigheden van een ander mens zodanig wegen, dat er een rechtvaardige beslissing uitrolt over, bijvoorbeeld, de alimentatie bij een echtscheiding of de hoogte van een schadevergoeding na ernstig gebakkelei tussen buren. Recht is een kwestie van maatwerk, ieder geval is anders, dat is niet te vatten in rigide algoritmes.

Als u dat gelooft, heb ik nieuws: de hoogte van de alimentatie en de schadevergoeding in zulke zaken rolt al uit een computer. Dat bedrag wordt deels bepaald door objectieve input als de inkomens van de partners en de omvang van de schade, deels door vergelijkbare zaken uit het verleden als maatstaf te nemen.

Dat is het principe van de jurisprudentie: een nieuwe uitspraak moet in lijn zijn met eerdere uitspraken in vergelijkbare zaken. Het is allang gebleken, dat een computer veel beter in staat is dan een rechter om in honderdduizenden eerdere vonnissen naar vergelijkbare zaken te zoeken.

Het bedrag aan alimentatie of schadevergoeding dat nu uit de computer rolt is slechts een advies aan de rechter. Die mag daarvan afwijken, maar dan heeft hij of zij wat uit te leggen aan op z’n minst een van beide partijen. Het zou me niets verbazen als rechters bij deze zaken al nauwelijks meer afwijken van wat de computer adviseert.   

Al in de jaren tachtig voorspelde computerwetenschapper Jaap van den Herik dat computers steeds meer de taak van rechters zullen gaan overnemen, ook in ingewikkelde zaken waarbij beslist moet worden over ‘schuldig’ of ‘niet-schuldig’. Als hoogleraar aan de universiteit Leiden heeft hij vanaf 1991 geprobeerd deze voorspelling waar te maken. Hij is inmiddels met emeritaat, maar nuchter bekeken is op dat terrein weinig resultaat geboekt.

Computervertalingen zijn veel beter geworden

Met wijsheid achteraf kun je stellen dat de tijd er niet rijp voor was. Artifical Intelligence was toen gebaseerd op expertsystemen: algoritmes zoals die alimentatierekenaar, maar dan ingewikkelder, met steeds meer ingeprogrammeerde regeltjes. Dat bleek een doodlopende weg. In wezen verliep de ontwikkeling, of het gebrek daaraan, van rechtspreken door de computer parallel met de ontwikkeling van computervertalingen. Decennia lang waren computervertalingen vrijwel waardeloos, en ze werden ook nauwelijks beter. 

Pas sinds een paar jaar, met AI gebaseerd op neurale netwerken, machine learning en massale hoeveelheden trainingsdata, kunnen computers goed tot zeer goed teksten van de ene taal naar de andere vertalen. Sterker nog, ze kunnen nu ook quasi-menselijke, schijnbaar intelligente teksten zelf bedenken, zoals iedereen heeft gemerkt die een chatbot als ChatGPT of Grok uitgeprobeerd heeft.

In hoger beroep 

Maar die revolutie heeft de rechtspraak nog niet bereikt. Waarom zou een chatbot die hele verhandelingen kan schrijven over het toerisme in Spanje, de strategische overwegingen rond de oorlog in Oekraïne of de voors en tegens van baby’s alleen laten slapen, geen vonnis kunnen schrijven?

Dat roept natuurlijk om een experimentele benadering, dus ik ben bij ChatGPT in hoger beroep gegaan tegen een recent vonnis van de rechtbank Amsterdam waar weer veel discussie over was. Dit vonnis houdt in dat de Telegraaf één zin moet rectificeren in een column over de verbondenheid van islamitische koepelorganisatie FIO met Hamas.

Dat is heel simpel: kopieer de tekst van het vonnis van de desbetreffende website, maak er een pdf van, geef die als bijlage aan ChatGPT, en laat die in de rol van het Gerechtshof een nieuw vonnis schrijven. Zie de illustratie bij dit artikel. 

Uiteraard is dit geen serieus voorbeeld van de computer die recht spreekt, want ik heb ChatGPT simpelweg opgedragen om tot een ander besluit te komen dan het vonnis van de rechtbank Amsterdam. Niettemin produceert deze bot in een minuut of drie een geloofwaardige juridische tekst van – ook volgens de opdracht – ongeveer duizend woorden. Hij slaat wel op een belangrijk punt de plank mis: hij ‘denkt’ ten onrechte dat de rechtbank rectificatie eiste van de term ‘meeheulen’ van FIO met Hamas, terwijl de rechter alleen rectificatie eiste van één zin waarin een komma als een dubbele punt gelezen zou kunnen worden, waardoor lezers kunnen  denken dat FIO ‘gelieerd’ is aan Hamas.

Dat is blijkbaar nog te subtiel voor deze chatbot, want dat negeert hij. Toch is dat helemaal niet zo raar: ik vond het zelf ook al inconsequent dat de rechtbank moeilijk doet over de term ‘gelieerd aan’, terwijl hij vindt dat de term ‘meeheulen met’ wel onder de vrijheid van meningsuiting van een columnist valt.

Neem ook geluiden uit de samenleving mee

Ik ben ervan overtuigd dat een op maat gemaakt AI-systeem op basis van ChatGPT of Grok, na een uitvoerige testfase, minstens zo goede of betere vonnissen kan vellen dan een menselijke rechter. Als trainingsdata van het systeem kunnen alle Nederlandse, maar ook buitenlandse vonnissen worden ingevoerd. Maar het systeem moet juist niet daartoe beperkt zijn; het moet ook gewoon alle geluiden uit de samenleving meenemen, net zoals de algemene chatbots ook doen.

Er is in 2016 al eens een experiment gedaan, waarbij onderzoekers een AI-systeem uitspraken van het Europese Hof voor de Rechten van de Mens lieten voorspellen, en die had het in 79 procent van de gevallen goed. Dat was nog voor de recente AI-revolutie, dus dat kunnen computers inmiddels vast veel beter. 

AI moet beter worden dan de menselijke rechter

In zulke zaken oordeelt de rechter puur op basis van schriftelijke bronnen, en wellicht mondelinge verklaringen die ook uitgeschreven kunnen worden, dus dat is relatief makkelijk voor een AI-systeem. In nieuwe zaken, waar het bewijsmateriaal ook foto’s, DNA-bewijs en zeer technische informatie omvat, moet een betrouwbare, consequente manier gevonden worden om al het bewijsmateriaal over een nieuwe zaak ter beschikking te stellen aan het systeem. Dat zal nog een  hele kluif worden. Overigens hebben rechters dat probleem nu ook.  

Stel dat we over een paar jaar een functionerend AI-systeem hebben dat recht spreekt. Hoe beoordelen we dan of dat ‘goede’ vonnissen zijn? In eerste instantie kun je het uiteraard parallel laten lopen met de menselijke rechtspraak, en kijken of AI tot hetzelfde vonnis komt als de edelachtbare in kwestie. Dat kan enig vertrouwen geven in de betrouwbaarheid van het systeem, maar het streven moet juist niet zijn, dat er 99,9% overlap is tussen de AI en menselijke vonnissen. Want we willen juist dat AI betere vonnissen velt dan de mens.

Je kunt ook een soort Turing-test doen: leg een flink aantal AI- en menselijke vonnissen voor aan een panel van leken en van juristen. Als die niet beter dan met een dobbelsteen kunnen bepalen of een zeker vonnis AI of menselijk is, is het AI-systeem geslaagd voor de Turing-test.

Als zo’n AI-systeem eenmaal werkt, gaat het schrijven van een vonnis razendsnel, tegen verwaarloosbare kosten en het gaat dag en nacht door. Allemaal grote voordelen ten opzichte van menselijke rechters. We kunnen ook meerdere, onafhankelijke AI-systemen over een zaak laten oordelen. Als dat panel van AI-systemen niet unaniem is over een zaak, moet er alsnog een mens naar kijken. Zo zijn er allerlei checks and balances denkbaar om AI-rechtspraak dienstbaar en controleerbaar te houden.   

Rechters zullen voorspelbaar gaan steigeren als ze vervangen dreigen te worden door een AI-systeem: ‘Zo’n systeem met nullen en enen zal nooit de unieke omstandigheden van een zaak op waarde kunnen schatten! Wij leveren maatwerk met de menselijke maat, wat snapt een computer daarvan?’  

Minder maatwerk, graag!

Ik schat dat dit over tien jaar een achterhoedegevecht is. Toen de CD nieuw was, had je ook mensen die bij hoog en bij laag volhielden, dat zo’n digitaal medium nooit de subtiele geluidsschakeringen van een grammofoonplaat van vinyl zou kunnen evenaren. Schakers verbeeldden zich tot Deep Blue wereldkampioen Kasparov versloeg, dat ze een hogere vorm van schaakkennis bezaten die voor computers altijd buiten bereik zou blijven.

Als je de willekeurige interpretaties en het subjectieve shoppen in verzachtende omstandigheden van rechters een beetje volgt, zou je ook tot de conclusie kunnen komen: minder maatwerk, graag!

Ook een AI-systeem zal nooit perfect zijn, maar mensen onderschatten wat een knoeiers mensen zijn, ook als ze een toga of andere imponeerkleding dragen, zoals een uniform of een witte labjas. En hoe plechtstatiger de beroepsgroep, hoe groter de zelfoverschatting.

WetenschapsjournalistArnout Jaspers is auteur van de bestsellers De Stikstoffuik (2023) en De Klimaatoptimist (2024), over energietransitie in Nederland. De boeken zijn HIER en HIERte bestellen. Informatie voor media en boekhandel:  info@blauwburgwal.nl.   

Wynia’s Week verschijnt drie keer per week, 156 keer per jaar, met even onafhankelijke als broodnodige artikelen en columns, video’s en podcasts. U maakt dat samen met de andere donateurs mogelijk. Doet u weer mee, ook in 2025? Kijk HIERHartelijk dank!