SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Architektur und Modelle für ein
verteiltes Training zur
Verarbeitung komplexer
Dokumente
GEFÖRDERT VOM PROJEKTTRÄGER
© Fraunhofer IAIS
2
FedXtract
› Problem: Viele KMUs möchten moderne Deep
Learning-Architekturen einsetzen, verfügen aber für
sich allein nicht über genügend Daten
› Ziel: Entwicklung einer Open Source-Lösung zur
einfachen Organisation moderner KI-Verfahren
› Föderiertes Lernen ermöglicht dabei verschiedenen
Kunden das Training gemeinsamer Modelle, ohne dass
Daten die eigenen Server verlassen
› Fraunhofer IAIS entwickelt hier eine geeignete Modell-
Architektur für einen Use Case in der
Dokumentenanalyse
Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente
Ermöglicht KMUs den gemeinsamen Einsatz
moderner großer KI-Architekturen
© Fraunhofer IAIS
3
FedXtract
Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente
Ermöglicht KMUs den gemeinsamen Einsatz
moderner großer KI-Architekturen
› Ein zentrales Modell wird vom Server
erstellt und an die lokalen Geräte
verteilt, z.B vortrainiertes von
HuggingFace
› Jeder KMU trainiert mit seinen Daten.
Dabei wird der individuelle Loss und der
Gradient berechnet. .
© Fraunhofer IAIS
4
Dokumentenanalyse
Wichtigste Eigenschaften:
• Transformer-basierter Ansatz zur Extraktion von Inhalten aus Dokumenten
• Pretraining auf ungelabelten Daten
› Multilingual Masked Visual-Language Modeling
› Bestimme maskiertes Wort basierend auf umgebenden Wörtern und Layout/Bild-
Features vorher
› Text-Image Alignment
› Maskiere Text auf Bild. Modell soll für jedes Wort bestimmen, ob es maskiert ist
› Text-Image Matching
› Bestimme, ob Text und Bild vom selben Dokument stammen
• Feintuning auf Downstream-Tasks
› Z.B. Named Entity Recognition, Reading Order Detection, Document Classification,…
› Gelabelte Daten notwendig
LayoutXLM
© Fraunhofer IAIS
5
Dokumentenanalyse
LayoutXLM
© Fraunhofer IAIS
6
Workflow
Wichtigste Eigenschaften:
• gemeinsames Modell
• Training auf gelabelten Daten
› Finetuning auf C€ Daten
Gemeinsames Modell
© Fraunhofer IAIS
7
Total Dataset Size
Daniel Lanz Data
Dataset Size
Daniel Lanz delivery 1 342 MB
Daniel Lanz delivery 2 565 MB
© Fraunhofer IAIS
9
Entities
bank_blz
bank_account
date
street_name
email_adress
amount_of_money
mail_box
last_name
postcode
company_name
title
city
bank_bic
street_num
unspecified
country
phone_number
bank_iban
first_name
register_num
street_num_add
co
street_num
Daniel Lanz Data
© Fraunhofer IAIS
10
Some Annotated Examples
Daniel Lanz Data
© Fraunhofer IAIS
11
Some Annotated Examples
Daniel Lanz Data
© Fraunhofer IAIS
12
Some Annotated Examples
Daniel Lanz Data
© Fraunhofer IAIS
13
Dokumentenanalyse
Input
Image
Retrieval-Enhanced Transformer -Retro
Document Store
Embedding
Encoder
Embedding
Model
© Fraunhofer IAIS
14
Dokumentenanalyse
Input
Image
Retro Modified
Embedding
Encoder
Document Store
Embedding
Model
Layout
Info
+
Layout
Info’s
© Fraunhofer IAIS
15
Dokumentenanalyse
LayoutXLM
Position Embeddings
2D Position Embeddings
Multi-Modal Transformer
Visual and text Embeddings
Source: Yiheng Xu et al, LayoutXLM: Multimodal Pre-training for Multilingual Visually-rich Document Understanding, Sept 21
© Fraunhofer IAIS
16
Entity frequency of the 1st Delivery
* The entities street_num, street_num_add and co are missing from the first delivery
bank_blz 4
bank_account 5
date 161
street_name 64
email_adress 19
amount_of_money 236
mail_box 4
last_name 67
postcode 67
company_name 109
title 7
city 74
bank_bic 7
street_num 63
unspecified 51
country 7
phone_number 29
bank_iban 9
first_name 63
register_num 9
Daniel Lanz Data
© Fraunhofer IAIS
17
Entity frequency of the 2nd Delivery
bank_blz 58
bank_account 60
date 1804
street_name 583
email_adress 171
amount_of_money 3071
mail_box 36
bank_blz 58
bank_account 60
date 1804
street_name 583
email_adress 171
amount_of_money 3071
mail_box 36
bank_blz 58
bank_account 60
date 1804
street_name 583
email_adress 171
amount_of_money 3071
mail_box 36
Daniel Lanz Data
© Fraunhofer IAIS
18
Entity frequency of the 3rd Delivery
Daniel Lanz Data
bank_blz 58
bank_account 60
date 1880
street_name 597
email_adress 176
amount_of_money 3159
mail_box 38
last_name 652
postcode 671
company_name 1216
title 69
city 903
bank_bic 128
street_num 63
unspecified 12
country 190
phone_number 325
bank_iban 153
first_name 600
register_num 107
street_num_add 9
co 2
street_num 578
© Fraunhofer IAIS
19
Dokumentenanalyse
Text Embeddings
Retrieval-Enhanced Transformer -Retro
Only considers textual
similarity
© Fraunhofer IAIS
20
Dokumentenanalyse
Feature
Embeddings
Retro-Modification
Multi-Model
Transforme
r
Considers multiple features
Multi-Model
Transforme
r
Multi-Model
Transformer

Weitere ähnliche Inhalte

Ähnlich wie FedXtract - Architektur

Intranet Implementierung mit Intrexx
Intranet Implementierung mit IntrexxIntranet Implementierung mit Intrexx
Intranet Implementierung mit IntrexxBrigitte Ilsanker
 
Architectures for .Net Core Applications
Architectures for .Net Core ApplicationsArchitectures for .Net Core Applications
Architectures for .Net Core ApplicationsRobin Sedlaczek
 
Analytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rAnalytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rMarcel Franke
 
AdminCamp2017 - ApplicationInsights
AdminCamp2017 - ApplicationInsightsAdminCamp2017 - ApplicationInsights
AdminCamp2017 - ApplicationInsightsChristoph Adler
 
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...Niels de Bruijn
 
DNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereDNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereFriedel Jonker
 
DNUG 2017 - ApplicationInsights
DNUG 2017 - ApplicationInsightsDNUG 2017 - ApplicationInsights
DNUG 2017 - ApplicationInsightsChristoph Adler
 
Drupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichDrupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichMichael Groeschel
 
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014Matthias Stürmer
 
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...panagenda
 
IBM Connections 6 und was ist Pink?
IBM Connections 6 und was ist Pink?IBM Connections 6 und was ist Pink?
IBM Connections 6 und was ist Pink?Belsoft
 
Webinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit HadoopWebinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit Hadoopfun communications GmbH
 
NetTask DE Reseller Models Introduction Cloud Services
NetTask DE Reseller Models Introduction Cloud ServicesNetTask DE Reseller Models Introduction Cloud Services
NetTask DE Reseller Models Introduction Cloud ServicesNetTask GmbH
 

Ähnlich wie FedXtract - Architektur (20)

Intranet Implementierung mit Intrexx
Intranet Implementierung mit IntrexxIntranet Implementierung mit Intrexx
Intranet Implementierung mit Intrexx
 
Architectures for .Net Core Applications
Architectures for .Net Core ApplicationsArchitectures for .Net Core Applications
Architectures for .Net Core Applications
 
Analytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und rAnalytic powerhouse parallel data warehouse und r
Analytic powerhouse parallel data warehouse und r
 
AdminCamp2017 - ApplicationInsights
AdminCamp2017 - ApplicationInsightsAdminCamp2017 - ApplicationInsights
AdminCamp2017 - ApplicationInsights
 
Lean Collaboration
Lean CollaborationLean Collaboration
Lean Collaboration
 
Hsps2014
Hsps2014Hsps2014
Hsps2014
 
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
 
DNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereDNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_Konferenzbroschuere
 
Frameworks und Prozessoren
Frameworks und ProzessorenFrameworks und Prozessoren
Frameworks und Prozessoren
 
DNUG 2017 - ApplicationInsights
DNUG 2017 - ApplicationInsightsDNUG 2017 - ApplicationInsights
DNUG 2017 - ApplicationInsights
 
Infrastructure Solution Day | Core
Infrastructure Solution Day | CoreInfrastructure Solution Day | Core
Infrastructure Solution Day | Core
 
Drupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und VergleichDrupal und Drupalgardens: Einsatz und Vergleich
Drupal und Drupalgardens: Einsatz und Vergleich
 
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014
Präsentationen der 29 Studierenden-Apps der Open Data Vorlesung 2014
 
id netsolutions produktfolder docufied for nav
id netsolutions produktfolder docufied for navid netsolutions produktfolder docufied for nav
id netsolutions produktfolder docufied for nav
 
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...
DNUG - ApplicationInsights: So analysieren, optimieren und modernisieren Sie ...
 
IBM Connections 6 und was ist Pink?
IBM Connections 6 und was ist Pink?IBM Connections 6 und was ist Pink?
IBM Connections 6 und was ist Pink?
 
Webinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit HadoopWebinar Big Data - Enterprise Readiness mit Hadoop
Webinar Big Data - Enterprise Readiness mit Hadoop
 
Modernes Rechenzentrum
Modernes Rechenzentrum Modernes Rechenzentrum
Modernes Rechenzentrum
 
NetTask DE Reseller Models Introduction Cloud Services
NetTask DE Reseller Models Introduction Cloud ServicesNetTask DE Reseller Models Introduction Cloud Services
NetTask DE Reseller Models Introduction Cloud Services
 
PHPblue LOS!NRW
PHPblue LOS!NRWPHPblue LOS!NRW
PHPblue LOS!NRW
 

FedXtract - Architektur