Der zentrale Use Case für das Projekt ist die Erkennung von Dokumenten im Bereich Automotive, in dem der Partner ControlExpert über langjährige Erfahrung und eine ausreichende Menge an Trainingsdaten verfügt.
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
FedXtract - Use Case Document Recognition
1. Use Case Document Recognition
im Automotive Bereich für das
Projekt FedXtract
GEFÖRDERT VOM PROJEKTTRÄGER
2. AUSGANGSSITUATION
2
Problem: Viele Kunden von CE (u.a. Versicherer)
möchten moderne Deep Learning-Architekturen
einsetzen, verfügen aber für sich allein nicht über
genügend Daten und/oder können diese nicht mit CE
teilen
Föderiertes Lernen ermöglicht dabei verschiedenen
Kunden das Training gemeinsamer Modelle über CE,
ohne dass Daten die eigenen Server verlassen
ControlExpert kann Expertise sammeln in der
Entwicklung einer Open Source-Lösung zur einfachen
Organisation moderner KI-Verfahren
FÖDERIERTE KI-LÖSUNG ZUR VERARBEITUNG KOMPLEXER DOKUMENTE
Ermöglicht Kunden von CE den gemeinsamen
Einsatz moderner großer KI-Architekturen
Gemeinsames
globales KI-Modell
Kunde 1 Kunde 2 Kunde X
Daten 1
Userspezifische KI
Transfer
Learning
Daten 2
Userspezifische KI
Transfer
Learning
Daten X
Userspezifische KI
Transfer
Learning
Update
globales KI-
Modell
Globale KI an
Anwender
Kein
Datenaustausch
Föderiertes
Lernen
4. VERSCHIEDENE ARTEN VON DOKUMENTEN
4
Gutachten
Kostenvoranschlag (KVA) Rechnung
• Erstellt mit Kalkulationssoftware,
• Wenig Varianz in Format
• Kopf mit Halter und
Fahrzeugdaten
• Serien-/ und Sonderausstattung
• Tabelle mit Reparaturkosten
• Fotos
• Viele verschiedene Formate
• Ausführliche Beschreibung des
Fahrzeugs und seines Zustands
• Vorschäden, Wertminderung,
Wiederbeschaffungswert
• KVA
• Fotos
• Viele verschiedene Formate
(15.000 Markenwerkstätten,
22.000 freie Werkstätten)
• Rechnungskopf
• Tabelle mit Reparaturkosten
• Fotos
5. BEISPIELDOKUMENTE VON CE
5
• Anschreiben/Mail
• Gescannte Rechnung
• Zusatzinformationen
zum Prüfauftrag
• Gescanntes Gutachten
• Bilder
• Gescannter KVA
• Bilder
• gescannte Rechnung
• Abtretungserklärung
• Schadenhergang
• Lackierrechnung
• KVA
• Bilder
6. 6
HERAUSFORDERUNGEN
• z.T. gescannte Dokumente von schlechter Qualität
(geringe Auflösung, rotiert, …)
• Im pdf sind oft viele zusätzliche Dokumente enthalten
(z.B. Gutachten oder KVA in der Rechnungsprüfung)
• Im pdf sind nur die für den jeweiligen Prozess
relevanten Entitäten gelabelt
(z.B. Rechnungsdatum auf separater Lackierrechnung
ist nicht gelabelt)
• Entitäten, die mehrmals auf dem Dokument vorhanden
sind, sind nur an einer Stelle gelabelt.
→ verrauschte Daten, da eigentlich zu lernende Entitäten nicht überall gelabelt sind