Einführung in der Praxis

Die eAkte eröffnet die Möglichkeit, mit geeigneten Technologien die elektronischen Dokumente zu erschließen. Manche Ideen liegen dabei sofort auf der Hand: Auslesen von Daten, Dokumentenvergleiche, Anonymisierung etc. Für andere Ideen fehlt heute noch die Vorstellungskraft. Um nun die richtige Technologie auszuwählen, ist es entscheidend, die praktische Anwendung der Technologie im Blick zu haben.

Projekte zum Einsatz Künstlicher Intelligenz sollten immer mit denjenigen entwickelt werden, die die Technologien dann tatsächlich anwenden sollen. Um schnell zu Innovationen zu gelangen, bietet sich die Entwicklung von sog. MVPs (Minimal Viable Products) an. Ein MVP stellt die kleinste funktionsfähige Lösung für ein spezifisches Problem dar. Das Unternehmen IBM entwickelt diese Lösungen in einem „Garagen-Ansatz“, in den Nutzerinnen und Nutzer gemeinsam mit IT-Experten für nicht mehr als fünf oder sechs Wochen in einem agilen Entwicklungsprozess zusammenarbeiten. So sind gemeinsam mit Richterinnen und Richtern erste KI-gestützte MVPs für die Bearbeitung in Massenverfahren (Fluggastrechte Projekt „FRAUKE“, Dieselklagen Projekt „OLGA“) entstanden.


 


Das Pilotprojekt „FRAUKE“

Das Amtsgericht Frankfurt am Main hat in Zusammenarbeit mit IBM Deutschland GmbH und der Hessischen Zentrale für Datenverarbeitung das Pilotprojekt FRAUKE gestartet. Es handelt sich dabei um eine Software auf Basis von Künstlicher Intelligenz, die testweise bei Massenverfahren zu Fluggastrechten angewendet wird.

Die Fluggastrechteverordnung der EU aus dem Jahr 2004 besagt, dass Fluggesellschaften Kompensationsleistungen erbringen müssen, wenn Flüge ausfallen oder verspätet sind. Diese Verordnung wurde lange Zeit vernachlässigt, da die Entschädigungssummen für die Menschen zu gering waren, um sie einzuklagen.

Seit 2018 haben sich jedoch viele Rechtsdienstleister auf dem Markt etabliert und nutzen hochautomatisierte Anwendungen, um solche Forderungen einzuklagen. Das Amtsgericht Frankfurt hat allein im vergangenen Jahr ca. 15.000 Klagen in solchen Fällen erhalten, was zu enormen praktischen Problemen in der Abarbeitung geführt hat.

Die Fluggastrechtfälle sind in der Regel repetitiv, da es sich meist um ähnliche Flugverbindungen handelt. Die Klagen sind in ihrer Art und Weise sehr vergleichbar, weshalb es sinnvoll ist, diese Fälle in ein strukturiertes Verfahren zu überführen. IBM hat Interesse gezeigt, ihre KI-Technologie „Watson“ einzusetzen und mit dem Amtsgericht Frankfurt in einem Pilotprojekt ein Minimal Viable Product (MVP) zu entwickeln.

Das Amtsgericht Frankfurt hat das Know-how für das Projekt beigesteuert und IBM hat die Ressourcen für eine Machbarkeitsstudie zur Verfügung gestellt. Im Projekt FRAUKE wurde zunächst überlegt, wie man eine Richterin oder einen Richter bei der Entscheidungsfindung unterstützen kann, wenn sie oder er relativ gleichförmige Schriftsätze hat. Für die Urteilsfindung sind die Flugstrecke, die Flugnummer, möglicherweise Passagiere und Zedenten sowie die Entfernung und der Sachverhalt relevant.

Es gibt wenige Verteidigungsmuster auf Seiten der Airlines, die zeigen, warum es für eine Flugverspätung oder Annullierung einen außergewöhnlichen Umstand gibt. Für diese Fallkonstellationen können Textbausteine entwickelt werden, um ein Urteil mit relativ wenigen Klicks zu erstellen. Das Amtsgericht Frankfurt hat Textbausteine zusammengetragen und FRAUKE liefert nun die passenden Textbausteine sowie die dazu existierenden Urteile als Auswahl. Das fertige Produkt, das der Richterin oder dem Richter angeboten wird, ist bereits ein Urteilsvorschlag, den sie oder er individuell ergänzen kann. Natürlich ist es Voraussetzung, dass die Richterin oder der Richter die Akte vollständig kennt – die KI spielt in dieser Hinsicht keine bedeutende Rolle.

Derzeit sind in diesem MVP für einen Fall – bezogen auf Wetterphänomene – die Textbausteine und ein Teil der dazu passenden Urteile integriert. Der Einsatz von KI bei Massenverfahren in Fluggastrechteverfahren könnte jedoch weiter ausgebaut werden: In der ersten Stufe würden Textbausteine aufgrund der Erkennung durch die KI generiert, in der zweiten Stufe würden die ähnlichsten Urteile bis hin zum EuGH einbezogen und in der dritten Stufe würde ein vollständiger Urteilsvorschlag erstellt. Perspektivisch wäre es sinnvoll, dieses Projekt für alle Gerichte in Deutschland mit Fluggastrechtefällen weiterzuentwickeln.

Das Projekt FRAUKE erfreute sich großer Zustimmung bei Richterinnen und Richtern, was auf einen bemerkenswerten Wandel in der Richterschaft hinweist. Zahlreiche Kolleginnen und Kollegen waren bereit, Textbausteine beizusteuern und mitzuwirken. Aktuell ist es günstig, eAkten und KI-Projekte voranzutreiben, da eine neue Generation von Richterinnen und Richtern Interesse an IT zeigt und auf Unterstützung bei Massenverfahren angewiesen ist.

Das Projekt FRAUKE ist ein vielversprechender Ansatz, der durch den Einsatz von Künstlicher Intelligenz und die Bereitstellung von Textbausteinen und Urteilen eine effiziente Unterstützung bei der Urteilsfindung ermöglicht. Es ist nun an der Zeit, das Projekt FRAUKE weiterzuentwickeln und andere Gerichte einzubeziehen, die mit Fluggastrechtefällen zu tun haben. Dazu ist die Erweiterung des MVP und die Integration von Textbausteinen anderer Gerichte erforderlich.

Die hohe Akzeptanz in der Richterschaft zeigt den unaufhaltsamen Wandel in der Justiz und die Offenheit für neue Technologien. Weitere Projekte sollten folgen, um die Effizienz und Effektivität der Rechtsprechung zu steigern und den wachsenden Anforderungen gerecht zu werden.

 
 

Das Projekt „OLGA“

Das Oberlandesgericht Stuttgart erfährt aufgrund der vielen Gerichtsverfahren im Rahmen des sogenannten „Dieselskandals“, die in Berufung gehen, eine hohe Belastung. Derzeit sind über 14.000 Berufungsverfahren nur in Dieselsachen anhängig. Vier Spezialsenate sind damit beschäftigt, diese Verfahren zu bearbeiten, was in Anbetracht der schieren Masse bei herkömmlicher Bearbeitung dennoch Jahre dauern kann. Glücklicherweise werden die Akten der Zivilsenate seit 2019 elektronisch geführt, was die Auswertung für KI-Anwendungen erleichtert. Die große Masse an Berufungsverfahren stellt somit einen riesigen Datenschatz dar, der für das Training von Algorithmen und KI-Anwendungen genutzt werden kann.

Die Motivation für ein KI-Projekt liegt offen zu Tage: In Dieselsachen gleichen sich die Akten häufig stark, sodass sich die Lektüre der Schriftsätze oft eintönig gestaltet. Vergleichbare Fälle lassen sich zur leichteren Bearbeitung zwar zu Fallgruppen zusammenfassen; es ist jedoch zeitaufwändiger und manuelle Arbeit notwendig, um die für die Einordnung relevanten Daten zu finden. Berufungsbegründungen sind oft über 180 Seiten lang und die relevanten Daten sind nicht immer an denselben Stellen zu finden. Die Suche nach den entscheidenden Daten in diesen Schriftsätzen gleicht einem Schürfen nach Diamanten und bindet viel Zeit, wie auch das Kopieren dieser Informationen und das Einfügen an anderer Stelle.

Hier kommen die nicht generativen KI-Ansätze ins Spiel: Durch eine geeignete Kombination aus Dokumentenklassifizierung und Informationsextraktion übernimmt die im Rahmen des Projektes OLGA von IBM mitentwickelte Anwendung die Fallgruppenzusammenfassung (vgl. Künstliche Intelligenz im Einsatz bei Dieselverfahren, in: Deutsche Richterzeitung 101/2 (2023), S. 68 f.). Alle Parameter, nach denen OLGA sucht, werden fachlich von den Richterinnen und Richtern der Spezialsenate für Dieselsachen festgelegt. Die Senate liefern auch die Fallgruppen zu, die sie aus ihrer Rechtsprechung gewinnen, und geben damit vor, wie OLGA die Verfahren anhand der gefundenen Parameter klassifizieren soll.

Im Ergebnis können die Richterinnen und Richter über eine komfortabel bedienbare Weboberfläche auf ihre Verfahren zugreifen und nach verschiedenen Kriterien sortieren, wobei auch mehrere Filter gleichzeitig Anwendung finden können. So lassen sich etwa vergleichbare Verfahren „en bloc“ abarbeiten. Die Senatsvorsitzenden können OLGA auch bei der Terminierung nutzen und sich etwa sämtliche Verfahren in ihren Senaten anzeigen lassen, die sowohl bestimmten Parametern entsprechen (etwa: identischer Motortyp, selbe Abgasnorm, keine Rückrufbetroffenheit) als auch von denselben Kanzleien betreut werden. Auf diese Weise sind effektivere Sitzungstage planbar, was auch für die Parteien und ihre Vertreterinnen und Vertreter mit Vorteilen verbunden ist.

Besonders wichtig war dem Projektteam, das System von Beginn an so zu gestalten, dass jeder KI-gestützte Schritt überprüft werden kann: Die Richterinnen und Richter können sich alle erkannten Parameter direkt im entsprechenden Verfahrensdokument anzeigen lassen und so erkennen, ob OLGA richtig lag. In nicht wenigen Fällen ist eine eindeutige Zuordnung eines Verfahrens zu einer Fallgruppe gar nicht möglich, weil das System mehrere oder sich widersprechende Treffer derselben Kategorie gefunden hat. Kommt die KI nicht weiter, so können die Richterinnen und Richter anhand der ihnen präsentierten Treffer schnell und sicher entscheiden, wie mit dem Fall weiter zu verfahren ist.

Doch nicht nur mit dem Einsatz von KI an sich, auch mit dem Weg von der Idee zum Echtbetrieb hat das Oberlandesgericht Stuttgart Neuland betreten: Anders als Richterinnen und Richter das von IT-Projekten häufig gewohnt sind, wurden die Mitglieder der Spezialsenate für Dieselsachen nicht mit einem (un-)fertigen Produkt konfrontiert, das nach vor Jahren festgelegten Vorgaben extern entwickelt worden ist. Sie waren vielmehr von Anfang an aktiv eingebunden. Sie konnten bereits in der ersten Projektphase auf dem Weg zu einem Prototypen, der die Umsetzbarkeit der Idee beweisen sollte, gemeinsam mit den IT-Fachleuten und Designern von IBM in interdisziplinären Workshops die Anforderungen an das System und dessen Benutzeroberfläche erarbeiten.

Dank der gezielten Auswahl der KI-Technologie ist außerdem die Transparenz und Nachvollziehbarkeit des Systems stets gewährleistet. Die Fokussierung auf das Notwendige vereinfacht außerdem die Inbetriebnahme eines solchen Systems, welche von der ersten Idee bis hin zum operativen Einsatz lediglich sechs Monate Entwicklungszeit benötigt hat. Das Training eines Deep-Learning-Modells hätte sicherlich ein Vielfaches an Zeit und Daten benötigt und der Einsatz eines generativen Modells bietet sich aufgrund der Eigenheit der Problemstellung nicht an. Die so erzielten Ergebnisse spiegeln daher den Erfolg des Bottom-Up-Ansatzes wider.



Zurück zu Seite 1 | zurück zu Seite 2 | Seite 3