1. Aufbau und Verwendung spezieller Lexika bei der Digitalisierung historischer Kollektionen Annette Gotscharek, Ulrich Reffle, Christoph Ringlstetter, Klaus U. Schulz CIS, University of Munich
2.
3.
4.
5.
6. OCR historischer Texte: gute Qualität S tädte den römischen mumcizmg gleich zu stellen. Allem wenn sich je in einem Rechtstheile die altrechtlichen teutschen Gewohnheiten, und Gesetze erhalten haben, so ist es gewiß in dieser Lehre, man mag entweder auf die Befugniß, die Stadtgerechtigkeit zu ertheilen , oder auf die innere Regimentsverfftssung so- BSB IMPACT Workshop 04.03.2010: LMU/CIS
7. OCR historischer Texte: mittlere Qualität Fürsten zu Gstternwerden/wer wollte vermainen / daßwt IhroKhurftrstl Durchl gnädiglsterHcttVatterinderpictcr rndFrombkcltallmFürstenvorzusetzen!scyn/vnd das halst> in^cclcQ^ vci pluz^uäzn 5accr6o5 daß tl iN KilchkN GottW wehr als ein Pries ter . BSB IMPACT Workshop 04.03.2010: LMU/CIS
42. Anwendung Lexika 2: OCR Erste Experimente zur OCR mit dem IMPACT Abbyy External Dictionary Interface FR9 BSB IMPACT Workshop 04.03.2010: LMU/CIS
43.
44. Alignierung zwischen OCR und Groundtruth BSB IMPACT Workshop 04.03.2010: LMU/CIS Mittlere Erkennung Gute Erkennung
45.
46. WER > 50% WER ~ 10% BSB IMPACT Workshop 04.03.2010: LMU/CIS Dictionary 16 th century No. of word errors Reduction of error rate 18 th century No. of word errors Reduction of error rate 19 th century No. of word errors Reduction of error rate No Lexicon 1306 - 827 - 2074 - Optimal Lexicon 756 42% 395 52% 612 70% Modern Lexicon 1096 16% 501 39% 888 57% W.Historical Lexicon 938 28% 481 42% 856 59% Modern + Virtual H.L. 1011 25% 480 42% 849 59%
47.
48.
49. Ressourcen für Frühneuhochdeutsch Integration der OCR Anbieter Spezielle Font- und Zeichenmodelle Verbesserung der OCR durch spezielles VD16 Lexikon Verbesserung der Suche durch IR Variantenlexikon Linguistische Datenbank für VD16 BSB IMPACT Workshop 04.03.2010: LMU/CIS