Transformationen:Zum Übergang aus langfristigen Editionsprojekten in die digitale Welt
1. Transformationen:
Zum Übergang aus langfristigen
Editionsprojekten in die digitale Welt
Georg Vogeler
@gvogeler
Zentrum für Informationsmodellierung – Universität Graz
Institut für Dokumentologie und Editorik e.V.
2. Was ist ein langfristiges Editionsprojekt?
• Einheitliches Textcorpus (auf Grund von Thema, Form)
• Gemeinsame Editionsmethode
• Gemeinsamer Forschungskontext
• Stabile Bearbeiter
• So groß, daß 3 bis 5 Jahre Forschungsförderung nicht ausreichen
3. Langfristige Editionsprojekte: beispielsweise
• Marx-Engels-Gesamtausgabe (Berlin-Brandenburgische Akademie der
Wissenschaften)
• Reichsversammlungen und Reichstage 1376-1662 (Historische Kommission
bei der Bayerische Akademie der Wissenschaften)
• Ministerratsprotokolle Bayern (Historische Kommission bei der Bayerische
Akademie der Wissenschaften)
• Ministerratsprotokolle Habsburgerreich (Österreichische Akademie der
Wissenschaften)
• Monumenta Germaniae Historica
• Deutsche Inschriften (Interakademisches Projekt)
• …
5. Z.B. MGH – DD F.II.
• Beschlossen 1978, Anschubfinanzierung DFG 1985, übernommen von
der Bayerischen Akademie der Wissenschaften seit 1990, zwei
Mitarbeiter Vollzeit, Studienassistenzen, derzeit aufgestockt um eine
dritte Stelle eines wissenschaftlichen Mitarbeiters, Leitung Prof. Dr.
Walter Koch (ehem. Mitarbeiter an der Edition Friedrich Barbarossas)
• Vorgehen:
• Materialsammlung seit 1904
• Archivreisen seit 1988
• Texterstellung seit 1999
• Publikationen: Bd. 1 2002, Bd. 2 2008, Bd. 3 2010, Bd. 4 2014, Bd. 5 in
Vorbereitung, Editionsplan auf mindestens 8 Bde. ausgelegt
8. Digitale Edition – warum sollte man
überhaupt darüber nachdenken?
• Verfügbarkeit
Publikation im WWW,
kontinuierliche Publikation,
Nachnutzung der Originaldaten
• Interaktivität
Vom Benutzer beeinflußbare
Anzeige, z.B. Volltextsuche,
Selektion, Ein/Ausblenden von
Informationen, Hyperlinks
• Multimedialität
Einbindung von
Handschriftenbildern, Karten etc.
11. Kodierung von Druckvorlagen:
z.B. Deutsche Inschriften - online
Grüntgens Max; Kasper, Dominik, 2013, https://prezi.com/ddlgg6edxs1n/dio-vortrag-itug-2013/
13. Digitale Edition – warum sollte man
überhaupt darüber nachdenken?
Benutzersicht
• Verfügbarkeit
Publikation im WWW,
kontinuierliche Publikation,
Nachnutzung der Originaldaten
• Interaktivität
Vom Benutzer beeinflußbare
Anzeige, z.B. Volltextsuche,
Selektion, Ein/Ausblenden von
Informationen, Hyperlinks
• Multimedialität
Einbindung von
Handschriftenbildern, Karten etc.
Erstellersicht
15. Digitale Edition – warum sollte man
überhaupt darüber nachdenken?
Benutzersicht
• Verfügbarkeit
Publikation im WWW,
kontinuierliche Publikation,
Nachnutzung der Originaldaten
• Interaktivität
Vom Benutzer beeinflußbare
Anzeige, z.B. Volltextsuche,
Selektion, Ein/Ausblenden von
Informationen, Hyperlinks
• Multimedialität
Einbindung von
Handschriftenbildern, Karten etc.
Erstellersicht
• Abstraktion
Konzentration auf inhaltliche
Entscheidungen durch Trennung von Daten
und Ansicht
• Einbindung von externen Quellen
Bibliographische Daten, Georeferenzierung
/ Gazetteer
• Konsistenz der Daten
Regelhaftigkeit durch Maschine
überprüfbar
• Kollaboration über Distanz
Gemeinsame Datenbanken von verteilten
Arbeitsgruppen
16. Editionsprozeß DD.F.II.
• Urkunden- und Literaturkartei
• Zu jeder Urkunde ein Mappe mit
• Erfassungsbogen
• Bildern
• Photokopien
• Zu jeder Urkunde eine Datei mit
Editionstext
• Dateien zur Vorbereitung von
Registern, Bibliographie und
Konkordanzen
18. Daten
(symbolische Repräsentation von Beobachtungen)
Lesen
Analysieren
(Suchen,
Zählen,
Beziehungen
herstellen)
Papier / Buch
Computer
Beschreiben
Kodieren
Projektlaufzeit
19. Kodierung
Kategorisierung von Textfragmenten, so daß
1. die Textfragemente anders als in der originalen Form organisierbar
sind (Strukturierung)
2. sich aus den Kategorien Annahmen über die Textfragmente ergeben
(semantische Anreicherung)
20. Kodierung in der Texterstellung
„In der nachstehenden Textausgabe des älteren, im Essener
Münsterarchiv aufbewahrten Exemplars des Liber ordinarius sind die
rubrizierten Überschriften in Kursivschrift wiedergegeben. Die Initialen
sind fett gedruckt. Die Versalzeichen sind weggelassen, dafür ist aber
jedesmal der erste Buchstabe nach einem Versalzeichen auch fett
gedruckt, nur nicht so gross, wie die Initialen. Die im Original mit Noten
auf vier oder zwei Linien versehenen Texte sind durch gesperrte
Kursivschrift gekennzeichnet. Die eingeklammerten Zahlen entsprechen
den Seitenzahlen des Kodex. Die figürlichen Darstellungen im Original
sind in ganz genauer Grösse an den entsprechenden Stellen in dem Text
wiedergegeben.“
(Einleitung zur Edition des Essener Liber ordinarius, ed. Arens 1908, S. IX)
21. Kodierung
„In der nachstehenden Textausgabe des älteren, im Essener
Münsterarchiv aufbewahrten Exemplars des Liber ordinarius sind die
rubrizierten Überschriften in Kursivschrift wiedergegeben. Die
Initialen sind fett gedruckt. Die Versalzeichen sind weggelassen, dafür
ist aber jedesmal der erste Buchstabe nach einem Versalzeichen auch
fett gedruckt, nur nicht so gross, wie die Initialen. Die im Original mit
Noten auf vier oder zwei Linien versehenen Texte sind durch gesperrte
Kursivschrift gekennzeichnet. Die eingeklammerten Zahlen
entsprechen den Seitenzahlen des Kodex. Die figürlichen
Darstellungen im Original sind in ganz genauer Grösse an den
entsprechenden Stellen in dem Text wiedergegeben.“
(Einleitung zur Edition des Essener Liber ordinarius, ed. Arens 1908, S. IX)
22. Vorlage Edition
rubrizierten Überschriften Kursivschrift
Initialen fett
Versalzeichen weggelassen
der erste Buchstabe nach einem
Versalzeichen fett, nicht so gross
Noten gesperrte Kursivschrift
Seitenzahlen des Kodex eingeklammerten Zahlen
figürlichen Darstellungen wiedergegeben
23. Vorlage Gedruckte Kodierung Digitale Kodierung (z.B. TEI)
rubrizierten
Überschriften
Kursivschrift <head>…</head>
Initialen fett <hi>…</hi>
Versalzeichen weggelassen <metamark/>
erster Buchstabe nach
einem Versalzeichen
fett, nicht so gross
Noten gesperrte Kursivschrift <notatedMusic>
Seitenzahlen des Kodex
eingeklammerten
Zahlen
<pb n="fol. 1r"/>
figürlichen
Darstellungen
wiedergegeben <figure><graphic url="….jpg"/></figure
28. Digitale Derivate:
Vorabpublikation und Materialsammlungen
• Nur transkribierte Texte mit Regest
• DD Heinrich V.
(http://www.mgh.de/ddhv/)
• regionale Materialsammlung
• MGH Constitutiones Karls IV.
(http://telota.bbaw.de/constitutiones)
• Editionstexte ohne Einleitungen und
Register:
• MGH Urkunden Heinrichs VI.:
(http://www.mgh.de/datenbanken/diplom
ata/urkunden-heinrichs-vi/)
• MEGA (http://telota.bbaw.de/mega/)
• „Datenbanken“
• Schreiberdatenbank Ludwig der Fromme,
Ergänzende Materialien Ottonenurkunden
29. Szenarien der Transformation
1. Onlineedition neben gedruckter Edition
2. Angereicherte Retrodigitalisierung
3. Materialsammlungen als digitale Forschungsdaten
4. Kodierung der Druckvorlage digital nutzbar machen
5. Digitale Arbeitsumgebungen
31. z.B. Oxygen-Framework Ediarum: XML basiert
StefanDumontandMartinFechner,«BridgingtheGap:GreaterUsabilityforTEI
encoding»,JournaloftheTextEncodingInitiative[Online],Issue8|December2014
-December2015,Onlinesince09June2015,connectionon10September2017.
URL:http://jtei.revues.org/1242;DOI:10.4000/jtei.1242
32. Alle aktuell erarbeiteten Editionen
sind potentiell digitale Editionen.
Georg Vogeler
georg.vogeler@uni-graz.at
Nutzen wir das Potential!
Institut für Dokumentologie und Editorik e.V.
Hinweis der Redaktion
Outline:
Digitale Edition ist …
Langfristige Editionsprojekte ist
Ein einheitliches Textcorpus, das
Gemeinsame Editionsregeln / -methoden braucht
Einen gemeinsamen / spezifischen Forschungskontext hat
Einen stabilen Bearbeiterstab hat
Und so groß ist, daß es nicht im Rahmen einer der üblichen 3-5-Jahresförderungen realisiert werden kann.
Z.B. Urkunden Kaiser Friedrichs II.
= …
Digitalisierung mit dMGH
Digital First
Akzeptieren, daß digitale Forschungsdaten entstehen
Kodierung explizit machen, weiter entwickeln (Leiden+)
Retrodigitalisierung
Mustererkennung kann schon ziemlich viel
Händische Anreicherung
Problem Rechte => Hybrideditionen
Umwandlung
Vorabpublikation
Werkzeuge
Fazit: 5 Punkte
F.II. und dMGH und „Edition champion“: Wo sind die Unterschiede: dMGH als elektronische Publikation, Materialien und Arbeitsprozeß in vordigitaler Welt aufgesetzt (physische Kopie, Mappen als Organisationshilfsmittel, Arbeitstechniken; Computer als Satzwerkzeug, Recherchealltag; Vorstellung vom „Buch“ als Produkt)
DIO als weitergehende Retrokonversion
Umstellung des Arbeitsworkflows? Karl IV
Hindernisse für den Übergang:
Online Publikation nur mit Retrodigitalisierung der alten
Algorithmische Verarbeitung vs. Individuelle Entscheidung
Methoden und Materialsammlung sind in vordigitaler Zeit definiert worden, Personal daran geschult
Keine Hindernisse für den Übergang:
Kodierung machen wir schon immer
Digital First ist schon längst der Fall
Es gibt technische Intermdiäre (Formatvorlagen in Word)
Galenedition BBAW
Corpus Vitrearum
Die Kommission war eher technik-affin: Spiegel Publikation, Anschaffung von Scannern, Computereinsatz für die Textvorbereitung, umfangreiche digitale Dokumentation; aber auch: „Urkundenkartei“, „Literaturkartei“, „Mappen“
„Urkundenkartei“, „Literaturkartei“, „Mappen“
EDV-Einsatz: Scanner, Textverarbeitungssoftware
Druckvorlage als Worddokument
Register: Dateien, Zettel, vereinzelt lokale Datenbanklösungen
Bd. 1: 137, Bd. 2: 276, Bd. 3: 205, Bd. 4: 277, Bd. 5: 197
Nur Texte, dafür mit Lemmatisierung
dMGH = ….
Explizites Ziel: Erhalt der Zitierfähigkeit incl. Erhalt von Fehlern
http://www.dmgh.de/de/fs1/object/display/bsb00066349_00013.xml => Ein TEI des Scans – also ohne jede Semantik
Mustererkennung von Verweisen
Händische Nachbearbeitung z.B. GND-Nummern
LaTeX als Satzprogramm => Kodierung
DI mit dem Formatvorlagenweg: Nachstrukturierung der Wordvorlage; Integration in Datenbank
https://prezi.com/ddlgg6edxs1n/dio-vortrag-itug-2013/?utm
Transkript von DIO-Vortrag ITUG 2013
Perspektiven und Probleme standardisierter XML-Auszeichnungen einer digitalen InschrifteneditionOnlinegang eines InschriftenbandesDIO und EpiDoc: XML-Ausgabe und Potentiale Hindernisse und Schwierigkeiten
_campaign=share&utm_medium=copy
Max Grüntgens
Gleiches Druckbild – aber andere Suchmöglichkeiten: Zeige mir alle Inschriften in gotischer Majuskel, die keine Epitaphien sind.
DB = mein eigenes Arbeitsinstrument =>
EpiDoc-Editor
https://github.com/EpiDoc/EFES
Reichstagsakten 1576 (Historische Kommission bei der Bayerischen Akademie der Wissenschaften, München)
Computer sind mit Lehrstuhl untergegangen, nur Filme, Photokopien, ausgedruckte Transkriptionen sind als Material archiviert worden
Mustererkennung der Datierungen führt zu
RTA 1576-Geschichte
DD.H.V.: Keine Register, diplomatischer Kommentar, Bibliographie etc.
Const.: „Das im Folgenden in elektronischer Form dargebotene Urkundenmaterial umfasst knapp 500 Urkunden aus allen mittel- und norddeutschen Archiven (d. h. aus Berlin, Brandenburg, Sachsen-Anhalt, Sachsen, Thüringen, Niedersachsen, Hamburg, Bremen, Schleswig-Holstein, Mecklenburg-Vorpommern) sowie aus Dänemark, die dem editorischen Anspruch der Monumenta Germaniae Historica entsprechen und bis zum Erscheinen der jeweiligen Constitutiones-Bände (2011–2027) den maßgeblichen und zitierfähigen Editionsstand bieten. Dem virtuellen Charakter der Darbietung entsprechend kann "zitierfähig" jedoch nicht die seiten- und zeilengenaue Anführbarkeit eines Urkundenbelegs bedeuten. Auch auf eine Zeilenzählung innerhalb der Urkunden ist verzichtet worden, weil sich der Zeilenumfang je nach Ausgabe- und Darstellungsformat verändert.“
Bd. 12: 2013, 1357-1359
Constitutiones et acta publica imperatorum et regum.Dokumente zur Geschichte des Deutschen Reiches und seiner Verfassung. Bd. 13: 1360-1361Teil 1: 1360 (Nr. 1–463)Bearbeitet von Ulrike Hohensee, Mathias Lawo, Michael Lindner und Olaf B. Rader.L und 414 S. 4º. 2016. ISBN 978-3-447-10748-8 Ln. € 120,–bestellen/orderTeil 2: 1361 (Nr. 464–786) und RegisterBearbeitet von Ulrike Hohensee, Mathias Lawo, Michael Lindner und Olaf B. Rader.ISBN 978-3-447-10835-5 in Vorb.
MEGA: Nur ein Textcorpus, edierter Text in verschiedenen Fassungen aber ohne Apparat, nur ein kumuliertes Sachregister
Ad 1.: (als Vorabpublikation und / oder nachträgliches Onlinestellen; als funktional angereicherte/abweichende Publikation)
Als Ansatz zum Erhalt der bisherigen Arbeitsumgebung.
Bsp. Gallia Pontificia / Karl IV.
Allgemeine Werkzeuge wie: Word, Literaturdatenbanken (Zotero); eigene Werkzeuge für Personen
http://digiversity.net/2012/digitale-arbeitsumgebung-fur-das-editionsvorhaben-schleiermacher-in-berlin-1808-1834/
ediarum-Umgebung als Experiment
Vorteil: konsistente Register, gemeinsame Ressourcen wie Literaturdatenbanken
Lokale Datenbanklösungen; papyri.info; CTE bedenklich; TextGrid
Oder aber eben den Word-Weg
Akzeptanz, daß die Arbeit der Editoren in ihrer digitalen Form besser repräsentiert ist, als in der gedruckten Form – und Unterstützung dabei.