Neues Lesen – Chancen der HandschriftenerkennungTobias Hodel
Vortrag im Rahmen des Panels: Digitale Werkzeuge – eine Bereicherung für die Geschichtswissenschaft? (Schweizerische Geschichtstage 2019, Zürich): https://www.geschichtstage.ch/panel/113/digitale-werkzeuge-eine-bereicherung-fuer-die-geschichtswissenschaft.
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...ETH-Bibliothek
War es bis vor wenigen Jahren unvorstellbar, dass historische Handschriften automatisiert texterkannt werden können, so haben maschinenlernende Verfahren nunmehr den Durchbruch gebracht. Ob mittelalterlicher Codices oder frühneuzeitliche Handschrift, ob Arabisch, Hebraeisch oder Bangla - mit einigen Dutzend Seiten können die zugrundeliegenden neuronalen Netze so trainiert werden, dass die Transkription für die weitere Verarbeitung brauchbar ist. Um die Technologie einem großen Kreis an Nutzerinnen und Nutzern verfügbar zu machen, wurde im Rahmen zweier EU Projekte die Froschungsplattform Transkribus entwickelt. Mit Transkribus erhalten Nutzerinnen und Nutzer ein Werkzeug, mit dem sie selbst alle Schritte im Workflow abdecken können. Mehr als 18.000 Benutzer haben sich in der Plattform bereits registriert und vielfach das Programm ausprobiert. Der Vortrag wird anhand konkreter Beispiele die Leistungsfähigkeit moderner Texterkennungsverfahren geben, sowie einen Ausblick auf die künftigen Entwicklungen bieten.
Dienstleistungen von SLUB und TIB für die digitale Langzeitverfügbarkeit. Ein...Dr. Achim Bonte
Auf der Basis der Software Rosetta bieten die SLUB Dresden und die TIB Hannover abgestimmte Langzeitarchivierungsservices an. Das Netzwerk ist offen für weitere Leistungsknoten. Beschrieben werden u.a. die strategischen Ziele, Kompetenzschwerpunkte, Leistungen und Konditionen des LZA-Verbunds
Neues Lesen – Chancen der HandschriftenerkennungTobias Hodel
Vortrag im Rahmen des Panels: Digitale Werkzeuge – eine Bereicherung für die Geschichtswissenschaft? (Schweizerische Geschichtstage 2019, Zürich): https://www.geschichtstage.ch/panel/113/digitale-werkzeuge-eine-bereicherung-fuer-die-geschichtswissenschaft.
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...ETH-Bibliothek
War es bis vor wenigen Jahren unvorstellbar, dass historische Handschriften automatisiert texterkannt werden können, so haben maschinenlernende Verfahren nunmehr den Durchbruch gebracht. Ob mittelalterlicher Codices oder frühneuzeitliche Handschrift, ob Arabisch, Hebraeisch oder Bangla - mit einigen Dutzend Seiten können die zugrundeliegenden neuronalen Netze so trainiert werden, dass die Transkription für die weitere Verarbeitung brauchbar ist. Um die Technologie einem großen Kreis an Nutzerinnen und Nutzern verfügbar zu machen, wurde im Rahmen zweier EU Projekte die Froschungsplattform Transkribus entwickelt. Mit Transkribus erhalten Nutzerinnen und Nutzer ein Werkzeug, mit dem sie selbst alle Schritte im Workflow abdecken können. Mehr als 18.000 Benutzer haben sich in der Plattform bereits registriert und vielfach das Programm ausprobiert. Der Vortrag wird anhand konkreter Beispiele die Leistungsfähigkeit moderner Texterkennungsverfahren geben, sowie einen Ausblick auf die künftigen Entwicklungen bieten.
Dienstleistungen von SLUB und TIB für die digitale Langzeitverfügbarkeit. Ein...Dr. Achim Bonte
Auf der Basis der Software Rosetta bieten die SLUB Dresden und die TIB Hannover abgestimmte Langzeitarchivierungsservices an. Das Netzwerk ist offen für weitere Leistungsknoten. Beschrieben werden u.a. die strategischen Ziele, Kompetenzschwerpunkte, Leistungen und Konditionen des LZA-Verbunds
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenGeorg Rehm
Georg Rehm and Clemens Neudecker. Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken . Berliner Bibliothekswissenschaftliches Kolloqium (BBK), Humboldt-Universität zu Berlin, Berlin, Germany, June 2017. June 06, 2017. Invited talk.
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliothekencneudecker
In der Präsentation werden zunächst digitale Kuratierungstechnologien vorgestellt, wie sie derzeit im Rahmen eines vom Bundesministerium für Bildung und Forschung geförderten Verbundprojekts unter der Leitung des DFKI für die Anwendung in vier Branchen bzw. Domänen entwickelt werden.* Unter Kuratierungstechnologien verstehen wir verschiedene semantische Sprach- und Wissenstechnologien für die Analyse, Verarbeitung und Erstellung digitaler Inhalte und ihr Zusammenspiel in domänenspezifischen Workflows. Anschließend werden verschiedene exemplarische Anwendungsszenarien in Bibliotheken thematisiert, die sich insbesondere durch die Massendigitalisierung ergeben.
Anhand von Beispielen aus der bibliothekarischen Arbeit im 21. Jahrhundert sowie der Nachnutzung digitaler Bibliotheksdaten in Wissenschaft und Kreativwirtschaft werden die vielfältigen Möglichkeiten und Potenziale der Nutzung von Kuratierungstechnologien zur Datenaufbereitung, Datenanreicherung und Bereitstellung von attraktiven Diensten in Bibliotheken sowie für die Entwicklung neuartiger Forschungs- und Geschäftsfelder in deren Umfeld aufgezeigt.
*http://digitale-kuratierung.de/
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
Georg Rehm. Transformieren, Manipulieren, Kuratieren? Technologien für die Wissensarbeit im Netz. KOOP-LITERA International. Konferenz 2017, Berlin, Germany, June 2017. June 20, 2017. Invited talk.
Georg Rehm. Kuratieren im Zeitalter der KI. #DKT17 - Kuratieren im Zeitalter der KI, Berlin, Germany, October 2017. October 12, 2017. Invited keynote talk.
Teaching and Learning Experience Design – der Ruf nach besserer Lehre: aber wie?Isa Jahnke
Der Ruf danach, dass es bessere Lehre geben muss oder das Lehre verbessert werden sollte, ist nicht neu. Es gibt auch schon seit längerer Zeit Rufe danach, dass Lehre der Forschung in Universitäten gleichgestellt werden soll. (Und in den letzten Jahren ist in Deutschland auch einiges an positiven Entwicklungen geschehen, z.B. durch die Aktivitäten des Stifterverbands). Wie kann die Verbesserung der Lehre weitergehen? Fehlt etwas in dieser Entwicklung? Ja, sagt dieser Beitrag, der zum Nachdenken und Diskutieren anregen soll. In diesem Beitrag wird ein forschungsbasierter Ansatz zur Diskussion gestellt. Es wird argumentiert, dass Lehre nur dann besser wird, wenn es mit den Prinzipen der Wissenschaft und Forschung angegangen wird (d.h. gestalten, Daten erheben, auswerten, verbessern). Es benötigt neue Verhaltensregeln oder -prinzipien bei der Gestaltung von Lehrveranstaltungen. Das bedeutet zum Beispiel das Prinzipien der Evidenzbasierung und wissenschaftliche Herangehensweisen im Lehr-Lerndesign als zentrales Fundament etabliert werden sollte. Evidenzbasierung hier meint, folgt man der Logik der Forschung, dass Lehrveranstaltungen als Intervention verstanden werden. Mit dieser Intervention werden Studierende befähigt, bestimmte vorab festgelegte Kompetenzen zu entwickeln. Und die Frage, die sich bei jeder Lehr-Lernveranstaltung dann stellt, ist, ob diese Objectives bzw. Learning Outcomes auch erreicht wurden. Klar ist, dass die subjektive Lehrevaluation der Studierenden oder auch die Notengebnung nicht ausreichen, um diese Frage zu beantworten. Hierfür gibt es eine Reihe von Methoden, die genutzt werden können, z.B. aus dem Bereich des User- / Learning Experience Design. Diese Methoden umfassen unter anderem Usability-Tests, Learner Experience Studies, Pre-/Post-Tests, und Follow-up Interviews. Diese können zur Gestaltung und Erfassung von effektiven, effizienten und ansprechenden digitalen Lerndesigns verwendet (Reigeluth 1983, Honebein & Reigeluth, 2022).
Der Beitrag will die Entwicklung zur Verbesserung von Lehre weiter pushen. Neue Ideen in die Bewegung bringen. Als Gründungsvizepräsidentin der UTN hab ich die Chance, hier ein neues Fundament für eine gesamte Uni zu legen. Wird das Gelingen? Ist dieser Ansatz, den ich hier vorstelle, eine erfolgsversprechende Option dafür? Hier können sich die TeilnehmerInnen an dieser Entwicklung beteiligen.
Mathematikunterricht in 1zu1 Ausstattungen.pptxFlippedMathe
Wie geht guter Mathematikunterricht? Und jetzt auch noch mit Tablet/Laptop? In dieser Fortbildung soll es genau darum gehen.
Sebastian Schmidt kennt vielleicht nicht Ihre persönliche Antwort auf guten (digitalen) Mathematikunterricht, aber er hat seit 2013 versucht, mit digitalen Hilfsmitteln seinen Unterricht kompetenzorientierter zu gestalten. Die Digitalisierung von Unterricht hat immer die Problematik, das Lernen der Schülerinnen und Schülern aus dem Fokus zu verlieren. Diese sollen digital mündig werden und gleichzeitig Mathematik besser verstehen.
In dieser eSession werden zahlreiche Methoden, Konzepte und auch Tools vorgestellt, die im Mathematikunterricht des Referenten erfolgreich eingesetzt werden konnten. Nicht alles kann am nächsten Tag im Unterricht eingesetzt werden, aber man erhält einen Überblick, was möglich ist. Sie entscheiden dann selbst, worauf Sie Ihren Fokus legen und wie Sie selbst in die 1:1-Ausstattung starten.
Lassen Sie sich überraschen und nehmen Sie mit, was für Sie sinnvoll erscheint. Auf der Homepage von Sebastian Schmidt gibt es neben Links und Materialien zur Fortbildungen auch Workshops fürs eigene Ausprobieren. https://www.flippedmathe.de/fortbildung/mathe-ws/
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenGeorg Rehm
Georg Rehm and Clemens Neudecker. Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken . Berliner Bibliothekswissenschaftliches Kolloqium (BBK), Humboldt-Universität zu Berlin, Berlin, Germany, June 2017. June 06, 2017. Invited talk.
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliothekencneudecker
In der Präsentation werden zunächst digitale Kuratierungstechnologien vorgestellt, wie sie derzeit im Rahmen eines vom Bundesministerium für Bildung und Forschung geförderten Verbundprojekts unter der Leitung des DFKI für die Anwendung in vier Branchen bzw. Domänen entwickelt werden.* Unter Kuratierungstechnologien verstehen wir verschiedene semantische Sprach- und Wissenstechnologien für die Analyse, Verarbeitung und Erstellung digitaler Inhalte und ihr Zusammenspiel in domänenspezifischen Workflows. Anschließend werden verschiedene exemplarische Anwendungsszenarien in Bibliotheken thematisiert, die sich insbesondere durch die Massendigitalisierung ergeben.
Anhand von Beispielen aus der bibliothekarischen Arbeit im 21. Jahrhundert sowie der Nachnutzung digitaler Bibliotheksdaten in Wissenschaft und Kreativwirtschaft werden die vielfältigen Möglichkeiten und Potenziale der Nutzung von Kuratierungstechnologien zur Datenaufbereitung, Datenanreicherung und Bereitstellung von attraktiven Diensten in Bibliotheken sowie für die Entwicklung neuartiger Forschungs- und Geschäftsfelder in deren Umfeld aufgezeigt.
*http://digitale-kuratierung.de/
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
Georg Rehm. Transformieren, Manipulieren, Kuratieren? Technologien für die Wissensarbeit im Netz. KOOP-LITERA International. Konferenz 2017, Berlin, Germany, June 2017. June 20, 2017. Invited talk.
Georg Rehm. Kuratieren im Zeitalter der KI. #DKT17 - Kuratieren im Zeitalter der KI, Berlin, Germany, October 2017. October 12, 2017. Invited keynote talk.
Teaching and Learning Experience Design – der Ruf nach besserer Lehre: aber wie?Isa Jahnke
Der Ruf danach, dass es bessere Lehre geben muss oder das Lehre verbessert werden sollte, ist nicht neu. Es gibt auch schon seit längerer Zeit Rufe danach, dass Lehre der Forschung in Universitäten gleichgestellt werden soll. (Und in den letzten Jahren ist in Deutschland auch einiges an positiven Entwicklungen geschehen, z.B. durch die Aktivitäten des Stifterverbands). Wie kann die Verbesserung der Lehre weitergehen? Fehlt etwas in dieser Entwicklung? Ja, sagt dieser Beitrag, der zum Nachdenken und Diskutieren anregen soll. In diesem Beitrag wird ein forschungsbasierter Ansatz zur Diskussion gestellt. Es wird argumentiert, dass Lehre nur dann besser wird, wenn es mit den Prinzipen der Wissenschaft und Forschung angegangen wird (d.h. gestalten, Daten erheben, auswerten, verbessern). Es benötigt neue Verhaltensregeln oder -prinzipien bei der Gestaltung von Lehrveranstaltungen. Das bedeutet zum Beispiel das Prinzipien der Evidenzbasierung und wissenschaftliche Herangehensweisen im Lehr-Lerndesign als zentrales Fundament etabliert werden sollte. Evidenzbasierung hier meint, folgt man der Logik der Forschung, dass Lehrveranstaltungen als Intervention verstanden werden. Mit dieser Intervention werden Studierende befähigt, bestimmte vorab festgelegte Kompetenzen zu entwickeln. Und die Frage, die sich bei jeder Lehr-Lernveranstaltung dann stellt, ist, ob diese Objectives bzw. Learning Outcomes auch erreicht wurden. Klar ist, dass die subjektive Lehrevaluation der Studierenden oder auch die Notengebnung nicht ausreichen, um diese Frage zu beantworten. Hierfür gibt es eine Reihe von Methoden, die genutzt werden können, z.B. aus dem Bereich des User- / Learning Experience Design. Diese Methoden umfassen unter anderem Usability-Tests, Learner Experience Studies, Pre-/Post-Tests, und Follow-up Interviews. Diese können zur Gestaltung und Erfassung von effektiven, effizienten und ansprechenden digitalen Lerndesigns verwendet (Reigeluth 1983, Honebein & Reigeluth, 2022).
Der Beitrag will die Entwicklung zur Verbesserung von Lehre weiter pushen. Neue Ideen in die Bewegung bringen. Als Gründungsvizepräsidentin der UTN hab ich die Chance, hier ein neues Fundament für eine gesamte Uni zu legen. Wird das Gelingen? Ist dieser Ansatz, den ich hier vorstelle, eine erfolgsversprechende Option dafür? Hier können sich die TeilnehmerInnen an dieser Entwicklung beteiligen.
Mathematikunterricht in 1zu1 Ausstattungen.pptxFlippedMathe
Wie geht guter Mathematikunterricht? Und jetzt auch noch mit Tablet/Laptop? In dieser Fortbildung soll es genau darum gehen.
Sebastian Schmidt kennt vielleicht nicht Ihre persönliche Antwort auf guten (digitalen) Mathematikunterricht, aber er hat seit 2013 versucht, mit digitalen Hilfsmitteln seinen Unterricht kompetenzorientierter zu gestalten. Die Digitalisierung von Unterricht hat immer die Problematik, das Lernen der Schülerinnen und Schülern aus dem Fokus zu verlieren. Diese sollen digital mündig werden und gleichzeitig Mathematik besser verstehen.
In dieser eSession werden zahlreiche Methoden, Konzepte und auch Tools vorgestellt, die im Mathematikunterricht des Referenten erfolgreich eingesetzt werden konnten. Nicht alles kann am nächsten Tag im Unterricht eingesetzt werden, aber man erhält einen Überblick, was möglich ist. Sie entscheiden dann selbst, worauf Sie Ihren Fokus legen und wie Sie selbst in die 1:1-Ausstattung starten.
Lassen Sie sich überraschen und nehmen Sie mit, was für Sie sinnvoll erscheint. Auf der Homepage von Sebastian Schmidt gibt es neben Links und Materialien zur Fortbildungen auch Workshops fürs eigene Ausprobieren. https://www.flippedmathe.de/fortbildung/mathe-ws/
1. Kanton Zürich
Direktion der Justiz und des Innern
Project
Automatic Text Recognition
dh summer school Lausanne
Tobias Hodel (Staatsarchiv Zürich)
Staatsarchiv
2. Direktion der Justiz
und des Innern
11.30-12.00 Introduction to text recognition (+ READ)
12.00-12.30 Use Transkribus
12.30-13.00 What's next for text recognition/ feedback
Program of workshop
3. Direktion der Justiz
und des Innern
- Recognition of layout and text structures
- Recognition of writing
- Implementation of dictionaries
- Type/Writer identification
Perspectives for institutions
- Best-practices for recognition of large amounts of documents
Perspectives for scholars
- How to use in Digital Humanities/DHist: What does quality for what purpose
How is text recognized?
5. Direktion der Justiz
und des Innern
- Machine learning using neural networks
- Processes writing by line, rather than by character
- Needs to be trained by being shown document images and transcripts
- More training data --> more accurate recognition
- Create a model to transcribe and search a collection of documents
Automated Text Recognition
6. Direktion der Justiz
und des Innern
- Neural networks can also process printed text – with less training data!
- Transcribe documents or use OCR engine in Transkribus
- Use these transcripts to train a model
- Results with 1-2% CER are possible
Recognising printed text
11. Direktion der Justiz
und des Innern
- Making archival (esp. handwritten) documents more accessible
- New research infrastructure – Transkribus
- Funded until mid-2019 by the European Union
- 14 European partners
What is READ
Recognition and Enrichment of Archival Data
12. Direktion der Justiz
und des Innern
- University of Innsbruck (co-ordinator / Austria) --> Transkribus
- Universitat Politecnica de Valencia (Spain) --> HTR
- University College London (United Kingdom) --> Dissemination, e-Learning
- National Center for Scientific Research “Demokritos” (Greece) --> Layout Analysis
- Democritus University of Thrace (Greece) --> Layout Analysis
- University of London Computer Centre (United Kingdom) --> Webinterface
- Vienna University of Technology (Austria) --> Layout Analysis, Writer Identification, STent
- University of Rostock (Germany) --> HTR, Layout Analysis
- Leipzig University (Germany) --> Dictionaries, Named Entities
- Xerox Research Centre Europe (France) --> Document Understanding
- Ecole Polytechnique Federale de Lausanne (Switzerland) --> Large Scale Demonstrator
- National Archives Finland (Finland) --> Large Scale Demonstrator
- Passau Diocesan Archives (Germany) --> Large Scale Demonstrator
READ Partner
15. Bentham model
•
Based on Jeremy Bentham’s papers
(c.18-19 English)
•
Written by Bentham and his
secretaries
•
Trained on 896 pages – using
transcripts submitted by volunteers
•
5-10% CER is possible
16.
17. Direktion der Justiz
und des Innern
1 Writer, 150 pages of trainingsmaterial:
10%
1 Writer, 450 pages of material for training:
4,4%
Same writer, 10 years later,
without material for training:
9,2%
1 Writer, 1132 pages of material for training:
3%
Text Recognition: What to expect
(Character Error Rate)
18. Direktion der Justiz
und des Innern
X Writers, 800 pages of material
for training:
18%
X Writers, 100'000+ pages of
material for training:
?? %
Text Recognition: What to expect
(Character Error Rate)
19. Direktion der Justiz
und des Innern
Let's get really started...
Transkribus: transkribus.eu / email@transkribus.eu / transkribus.eu/wiki/
READ: read.transkribus.eu (News)
Staatsarchiv Zürich: tobias.hodel@ji.zh.ch
25. Direktion der Justiz
und des Innern
By UPVLC & HIMANIS (IRHT)
http://prhlt-kws.prhlt.upv.es/himanis/
(search for example for: «scriptor», play-around with „confidence“)
For further infos:
https://himanis.hypotheses.org/105
Keyword Spotting
27. Direktion der Justiz
und des Innern
Transkribus export to be presented in EVT (by HumaReC)
http://humarec-viewer.vital-it.ch
Transkribus and EVT
Edition Visualization Technology
28. Direktion der Justiz
und des Innern
●
10 Steps Guide
●
10 Steps Video
●
Transkribus Wiki
First Transkribus user day will take place in
Vienna, November 2nd
and 3rd
2017!
Find out more: