SlideShare ist ein Scribd-Unternehmen logo
Use Case Document Recognition
im Automotive Bereich für das
Projekt FedXtract
GEFÖRDERT VOM PROJEKTTRÄGER
AUSGANGSSITUATION
2
 Problem: Viele Kunden von CE (u.a. Versicherer)
möchten moderne Deep Learning-Architekturen
einsetzen, verfügen aber für sich allein nicht über
genügend Daten und/oder können diese nicht mit CE
teilen
 Föderiertes Lernen ermöglicht dabei verschiedenen
Kunden das Training gemeinsamer Modelle über CE,
ohne dass Daten die eigenen Server verlassen
 ControlExpert kann Expertise sammeln in der
Entwicklung einer Open Source-Lösung zur einfachen
Organisation moderner KI-Verfahren
FÖDERIERTE KI-LÖSUNG ZUR VERARBEITUNG KOMPLEXER DOKUMENTE
Ermöglicht Kunden von CE den gemeinsamen
Einsatz moderner großer KI-Architekturen
Gemeinsames
globales KI-Modell
Kunde 1 Kunde 2 Kunde X
Daten 1
Userspezifische KI
Transfer
Learning
Daten 2
Userspezifische KI
Transfer
Learning
Daten X
Userspezifische KI
Transfer
Learning
Update
globales KI-
Modell
Globale KI an
Anwender
Kein
Datenaustausch
Föderiertes
Lernen
3
W0L000051T2123456
ME-CE 100
Kostenpositionen
…
DATENEINGA
NG
DATENEXTRAK
TION
KI-MODELL PRÜFUNG
UNSER KERNPROZESS
W0L000051T2123456
ME-CE 100
Kostenpositionen
…
SORTIEREN
VERSCHIEDENE ARTEN VON DOKUMENTEN
4
Gutachten
Kostenvoranschlag (KVA) Rechnung
• Erstellt mit Kalkulationssoftware,
• Wenig Varianz in Format
• Kopf mit Halter und
Fahrzeugdaten
• Serien-/ und Sonderausstattung
• Tabelle mit Reparaturkosten
• Fotos
• Viele verschiedene Formate
• Ausführliche Beschreibung des
Fahrzeugs und seines Zustands
• Vorschäden, Wertminderung,
Wiederbeschaffungswert
• KVA
• Fotos
• Viele verschiedene Formate
(15.000 Markenwerkstätten,
22.000 freie Werkstätten)
• Rechnungskopf
• Tabelle mit Reparaturkosten
• Fotos
BEISPIELDOKUMENTE VON CE
5
• Anschreiben/Mail
• Gescannte Rechnung
• Zusatzinformationen
zum Prüfauftrag
• Gescanntes Gutachten
• Bilder
• Gescannter KVA
• Bilder
• gescannte Rechnung
• Abtretungserklärung
• Schadenhergang
• Lackierrechnung
• KVA
• Bilder
6
HERAUSFORDERUNGEN
• z.T. gescannte Dokumente von schlechter Qualität
(geringe Auflösung, rotiert, …)
• Im pdf sind oft viele zusätzliche Dokumente enthalten
(z.B. Gutachten oder KVA in der Rechnungsprüfung)
• Im pdf sind nur die für den jeweiligen Prozess
relevanten Entitäten gelabelt
(z.B. Rechnungsdatum auf separater Lackierrechnung
ist nicht gelabelt)
• Entitäten, die mehrmals auf dem Dokument vorhanden
sind, sind nur an einer Stelle gelabelt.
→ verrauschte Daten, da eigentlich zu lernende Entitäten nicht überall gelabelt sind
7
RELEVANTE ENTITÄTEN
Allgemeine Entitäten:
• Kopfdaten
• Einzelne Kostenpositionen
• Gesamtkosten (Netto/Brutto)
• Rechnungsdatum (nur bei
Rechnungen)
Kfz-spezifische Entitäten:
• Fahrzeuginformationen
• Schadeninformationen

Weitere ähnliche Inhalte

Ähnlich wie FedXtract - Use Case Document Recognition

DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdfDACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
DNUG e.V.
 
Cloud OS - Die Vision und Strategie von Microsoft
Cloud OS - Die Vision und Strategie von MicrosoftCloud OS - Die Vision und Strategie von Microsoft
Cloud OS - Die Vision und Strategie von Microsoft
Peter Kirchner
 
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
topsoft - inspiring digital business
 
Dr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
Dr. Ingo Laue - Microsoft Azure | Projekt-ErfahrungenDr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
Dr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
Symposia Media
 
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdfJoachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
FIWARE
 
Standardisierung, Herstellerabhängigkeiten und Open Source Software
Standardisierung, Herstellerabhängigkeiten und Open Source SoftwareStandardisierung, Herstellerabhängigkeiten und Open Source Software
Standardisierung, Herstellerabhängigkeiten und Open Source Software
Matthias Stürmer
 
abtis führt bei Felss den Modern Secure Workplace ein
abtis führt bei Felss den Modern Secure Workplace einabtis führt bei Felss den Modern Secure Workplace ein
abtis führt bei Felss den Modern Secure Workplace ein
bhoeck
 
devolo Smart Home Forschungsprojekt ACEMIND
devolo Smart Home Forschungsprojekt ACEMIND devolo Smart Home Forschungsprojekt ACEMIND
devolo Smart Home Forschungsprojekt ACEMIND
resultsrelations
 
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
Leadec
 
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
Praxistage
 
CLOUDSERVICES FÜR ISVs
CLOUDSERVICES FÜR ISVsCLOUDSERVICES FÜR ISVs
CLOUDSERVICES FÜR ISVs
acentrix GmbH
 
Zertifizierter projektmanager verfügbar
Zertifizierter projektmanager verfügbarZertifizierter projektmanager verfügbar
Zertifizierter projektmanager verfügbar
Datamatics Global Services GmbH
 
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
Intland Software GmbH
 
PLM-Zukunftsthemen
PLM-ZukunftsthemenPLM-Zukunftsthemen
PLM-Zukunftsthemen
Intelliact AG
 
Remote CAD
Remote CADRemote CAD
Remote CAD
FrankBseke
 
Digitale Kommunikation in Fertigungsnetzwerken neu gedacht
Digitale Kommunikation in Fertigungsnetzwerken neu gedachtDigitale Kommunikation in Fertigungsnetzwerken neu gedacht
Digitale Kommunikation in Fertigungsnetzwerken neu gedacht
Georg Guentner
 
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der PraxisGanzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Fujitsu Central Europe
 
Client 2015 Strategie Short Version V0.52
Client 2015 Strategie Short Version V0.52Client 2015 Strategie Short Version V0.52
Client 2015 Strategie Short Version V0.52
Udo Schwartz
 
BATbern41 Die Evolution zu Microservices
BATbern41 Die Evolution zu MicroservicesBATbern41 Die Evolution zu Microservices
BATbern41 Die Evolution zu Microservices
BATbern
 
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
bhoeck
 

Ähnlich wie FedXtract - Use Case Document Recognition (20)

DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdfDACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
DACHNUG50 Event driven Architecture - Bernd Gewehr - Voessing de.pdf
 
Cloud OS - Die Vision und Strategie von Microsoft
Cloud OS - Die Vision und Strategie von MicrosoftCloud OS - Die Vision und Strategie von Microsoft
Cloud OS - Die Vision und Strategie von Microsoft
 
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
Swiss Cloud Conference 2014: Wachstum und Herausforderung im Mittelstand meis...
 
Dr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
Dr. Ingo Laue - Microsoft Azure | Projekt-ErfahrungenDr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
Dr. Ingo Laue - Microsoft Azure | Projekt-Erfahrungen
 
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdfJoachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
Joachim Schonowski MSG Group DIN SPEC PAS 91607_- Standards_v01.pdf
 
Standardisierung, Herstellerabhängigkeiten und Open Source Software
Standardisierung, Herstellerabhängigkeiten und Open Source SoftwareStandardisierung, Herstellerabhängigkeiten und Open Source Software
Standardisierung, Herstellerabhängigkeiten und Open Source Software
 
abtis führt bei Felss den Modern Secure Workplace ein
abtis führt bei Felss den Modern Secure Workplace einabtis führt bei Felss den Modern Secure Workplace ein
abtis führt bei Felss den Modern Secure Workplace ein
 
devolo Smart Home Forschungsprojekt ACEMIND
devolo Smart Home Forschungsprojekt ACEMIND devolo Smart Home Forschungsprojekt ACEMIND
devolo Smart Home Forschungsprojekt ACEMIND
 
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
Everything as-a-service Modelle: Als Industriedienstleister die "Fabrik der Z...
 
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
Frank Schlotter, Mag. Christoph Domanig (Active Business Consult – Cenit)
 
CLOUDSERVICES FÜR ISVs
CLOUDSERVICES FÜR ISVsCLOUDSERVICES FÜR ISVs
CLOUDSERVICES FÜR ISVs
 
Zertifizierter projektmanager verfügbar
Zertifizierter projektmanager verfügbarZertifizierter projektmanager verfügbar
Zertifizierter projektmanager verfügbar
 
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
Eclipse DVCS-Day: eGit, Git, Mercurial-Anwendungen in der Praxis
 
PLM-Zukunftsthemen
PLM-ZukunftsthemenPLM-Zukunftsthemen
PLM-Zukunftsthemen
 
Remote CAD
Remote CADRemote CAD
Remote CAD
 
Digitale Kommunikation in Fertigungsnetzwerken neu gedacht
Digitale Kommunikation in Fertigungsnetzwerken neu gedachtDigitale Kommunikation in Fertigungsnetzwerken neu gedacht
Digitale Kommunikation in Fertigungsnetzwerken neu gedacht
 
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der PraxisGanzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
Ganzheitliche Speicherlösungen: Unser Storage-Konzept in der Praxis
 
Client 2015 Strategie Short Version V0.52
Client 2015 Strategie Short Version V0.52Client 2015 Strategie Short Version V0.52
Client 2015 Strategie Short Version V0.52
 
BATbern41 Die Evolution zu Microservices
BATbern41 Die Evolution zu MicroservicesBATbern41 Die Evolution zu Microservices
BATbern41 Die Evolution zu Microservices
 
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
Mit Microsoft Teams und dem Modern Secure Workplace Effizienz und Sicherheit ...
 

FedXtract - Use Case Document Recognition

  • 1. Use Case Document Recognition im Automotive Bereich für das Projekt FedXtract GEFÖRDERT VOM PROJEKTTRÄGER
  • 2. AUSGANGSSITUATION 2  Problem: Viele Kunden von CE (u.a. Versicherer) möchten moderne Deep Learning-Architekturen einsetzen, verfügen aber für sich allein nicht über genügend Daten und/oder können diese nicht mit CE teilen  Föderiertes Lernen ermöglicht dabei verschiedenen Kunden das Training gemeinsamer Modelle über CE, ohne dass Daten die eigenen Server verlassen  ControlExpert kann Expertise sammeln in der Entwicklung einer Open Source-Lösung zur einfachen Organisation moderner KI-Verfahren FÖDERIERTE KI-LÖSUNG ZUR VERARBEITUNG KOMPLEXER DOKUMENTE Ermöglicht Kunden von CE den gemeinsamen Einsatz moderner großer KI-Architekturen Gemeinsames globales KI-Modell Kunde 1 Kunde 2 Kunde X Daten 1 Userspezifische KI Transfer Learning Daten 2 Userspezifische KI Transfer Learning Daten X Userspezifische KI Transfer Learning Update globales KI- Modell Globale KI an Anwender Kein Datenaustausch Föderiertes Lernen
  • 3. 3 W0L000051T2123456 ME-CE 100 Kostenpositionen … DATENEINGA NG DATENEXTRAK TION KI-MODELL PRÜFUNG UNSER KERNPROZESS W0L000051T2123456 ME-CE 100 Kostenpositionen … SORTIEREN
  • 4. VERSCHIEDENE ARTEN VON DOKUMENTEN 4 Gutachten Kostenvoranschlag (KVA) Rechnung • Erstellt mit Kalkulationssoftware, • Wenig Varianz in Format • Kopf mit Halter und Fahrzeugdaten • Serien-/ und Sonderausstattung • Tabelle mit Reparaturkosten • Fotos • Viele verschiedene Formate • Ausführliche Beschreibung des Fahrzeugs und seines Zustands • Vorschäden, Wertminderung, Wiederbeschaffungswert • KVA • Fotos • Viele verschiedene Formate (15.000 Markenwerkstätten, 22.000 freie Werkstätten) • Rechnungskopf • Tabelle mit Reparaturkosten • Fotos
  • 5. BEISPIELDOKUMENTE VON CE 5 • Anschreiben/Mail • Gescannte Rechnung • Zusatzinformationen zum Prüfauftrag • Gescanntes Gutachten • Bilder • Gescannter KVA • Bilder • gescannte Rechnung • Abtretungserklärung • Schadenhergang • Lackierrechnung • KVA • Bilder
  • 6. 6 HERAUSFORDERUNGEN • z.T. gescannte Dokumente von schlechter Qualität (geringe Auflösung, rotiert, …) • Im pdf sind oft viele zusätzliche Dokumente enthalten (z.B. Gutachten oder KVA in der Rechnungsprüfung) • Im pdf sind nur die für den jeweiligen Prozess relevanten Entitäten gelabelt (z.B. Rechnungsdatum auf separater Lackierrechnung ist nicht gelabelt) • Entitäten, die mehrmals auf dem Dokument vorhanden sind, sind nur an einer Stelle gelabelt. → verrauschte Daten, da eigentlich zu lernende Entitäten nicht überall gelabelt sind
  • 7. 7 RELEVANTE ENTITÄTEN Allgemeine Entitäten: • Kopfdaten • Einzelne Kostenpositionen • Gesamtkosten (Netto/Brutto) • Rechnungsdatum (nur bei Rechnungen) Kfz-spezifische Entitäten: • Fahrzeuginformationen • Schadeninformationen

Hinweis der Redaktion

  1. Link zu Beispielen, Kernbotschaften
  2. Backup