SlideShare ist ein Scribd-Unternehmen logo
1
Ursula Welsch
XML-Struktur
Text Encoding Initiative
2
Agenda
• Vorrede
• Geschichte und Weiterentwicklung
• Einsetzbarkeit
• Grundkonzept
• Metadaten
• Allgemeine Textelemente
• Dokumenttypen
• Besonderheiten
• Strukturkonfiguration
• Qualitätssicherung und Weiterverarbeitung
• Fazit
3
Vorrede
Das Herzstück einer XML-Anwendung ist
die Struktur!
• Struktur muss die Inhalte abbilden – nicht das
Printwerk
• Semantik so viel wie notwendig für geplante
Anwendungen
• Inhaltsmodelle so eng wie möglich für hohe
Datenqualität
• Unterstützung von Autor, Redaktion und
Produktion
4
Standard-DTDs im Verlagswesen
• DocBook:
www.docbook.org
• NLM – National Library of Medicine:
dtd.nlm.niv.gov/3.0/
– JATS = Journal Article Tag Suite
– NCBI BTL = National Center of
Biotechnology Information Book Tag Library
• TEI – Text Encoding Initiative:
www.tei-c.org
5
Geschichte und
Weiterentwicklung
Text Encoding Initiative (TEI)
• Entstehung ab Ende der 80er Jahre
• erste Ausgabe der "Guidelines" Mai 1994
• Entwicklung, Nutzung und Pflege bis 2000
als Gemeinschaftsaktivität mehrerer
wissenschaftlicher Disziplinen
• seit 2001 TEI Consortium
• Aktuelle Version: TEI P5
In Arbeit:
• SIG Correspondence
Ergänzung
• Music Encoding Initiative (MEI)
6
Einsetzbarkeit
• Ziel:
alle Arten von wissenschaftlichem Text
• Dokument orientiert:
teiCorpus, TEI
• Anpassungskonzept:
Einzelmodule, die je nach Bedarf zu einer
Anwendung compiliert werden müssen
• Ausnahme:
TEI lite
• Einsatz:
heute vor allem in den Digital Humanities
• Lizenz:
Creative Commons Lizenz (3.0 Unported)
7
Grundkonzept
• Sprache:
englisch
• Dokumentation:
ausführlich (1613 Seiten), englisch
• Trennung von Metadaten und Text
• Semantische Strukturen:
z.T. in den Elementnamen, z.T. in Attributwerten
• Konfigurierbarkeit:
via Online-Tool ROMA
=> DTD, XML-Schema, Relax NG
8
Metadaten
Element: teiHeader
Teile:
• fileDesc:
bibliografische Beschreibung
• encodingDesc:
Besonderheiten der verwendeten Struktur
• profileDesc:
textliche Beschreibung des enthaltenen Korpus
• revisionDesc:
Enstehungs- und Bearbeitungsgeschichte der
Datei
9
Metadaten
Beispiel:
• Tag-Nutzung
• Wichtig für
Langzeitarchivierung
10
Allgemeine Textelemente
Hierarchische Struktur
• text (front, body, back)
• div und div1, div2 etc.
Absatzformate
• Generell: p
• wissenschaftliche, z.B.
argument, note, eg
• editionsspezifische, z.B. del,
add,rdg
• ansonsten mit dem Attribut
@type bei nahezu jedem
Element spezifizierbar
11
Allgemeine Textelemente
Zeichenformate
• eine reiche Palette von Elementen zur
linguistischen und
• interpretatorischen Beschreibung des Texts,
z.B. s, seg, hi, emph, foreign,
mentioned, term, title etc.
Verweise
• ref, ptr, anchor, seg, xptr, xref
12
Allgemeine Textelemente
Abbildungen
• Figure:
gruppiert alles, was zu der Abbildung gehört
• Graphic: ist die Abbildung selbst
13
Allgemeine Textelemente
Tabellen
• sehr simple eigene
Struktur
• nur row und cell
• kein Header-Element
• für komplexere Tabellen
HTML- oder CALS-
Tabellenmodell
integrierbar via
Namensräume
14
Dokumenttypen
Zeitschriften
• Wie Bücher, Monografien
15
Dokumenttypen
Lexika
• Eintrag:
entry
• Bedeutungen:
sense
16
Besonderheiten
• Editionen mit
– Urkunden
– Nachlässe (Briefe, Tagebücher, Notizbücher)
– Gesamtwerk
17
Die Aufgabe von Editionen
• Bereitstellung einer zuverlässigen Textgrundlage
für jedwede historische oder interpretatorische
Betrachtung
 systematische Sichtung sämtlicher zugehöriger
Überlieferungsträger
 zeichengetreue Transkription der Textzeugen
 genetische Dokumentation und Textkonstitution
• Verbreitung der Buch- bzw. Online-Publikation,
je nach Quellenlage – zu dem Zweck:
 die Autographen und alten Urkunden zu schonen
(z.B. Vermeidung von direktem Hautkontakt oder
ungünstigen klimatischen Bedingungen)
 Lücken im Bestand zu schließen, die z.B. durch Verluste
und Aufteilungen in der Folge der beiden Weltkriege des
20. Jhs. entstanden sind
18
Digitalisate
19
Bibliographie des Editionsobjekts
Dazu gehören z.B.:
 Lagerort der Originale (Bibliothek, Nachlass ...)
 genaue Bezeichnung (Titel, Sigle, Aktenzeichen ...)
 bis auf Einzel-Dokumentbasis
Strukturanforderung:
 klare Trennung von Metadaten und Textbeschreibung
 Metadatenbereich mit „Feldern“ für alle notwendigen
Angaben
TEI:
 teiHeader/fileDesc
– titleStmt
– publicationStmt
– sourceDesc
20
Bibliographie des Editionsobjekts
Strukturdiagramm: Strukturbeispiel:
21
Beschreibung der Materialität
Dazu gehören:
 Beschreibung der äußeren Gestalt
 ggf. aufgeteilt in Blätter, Seiten,
Einzelobjekte ...
Strukturanforderung:
 textliche Beschreibung des Textträgers
 ggf. Zeilen-, Seiten-, Spaltenwechsel ...
 ggf. Zuordnung von Sub-Dokumenten
TEI:
 physDesc
 lb, pb, cb
 @rend
22
Beschreibung der Materialität
Strukturdiagramm: Strukturbeispiel:
23
Repräsentation des Textes
Dazu gehören:
 verschiedene Dokumenttypen, z.B. Briefe, Urkunden,
Notizbücher, Prosatexte, Gedichte, szenische Texte ...
 mit allen spezifischen Anforderungen an die Aufbereitung
Strukturanforderung:
 bei Briefen: z.B. Absender, Anrede, Briefkorpus,
Grußformel, Postscriptum ...
 bei Notizbüchern: Art der Notiz, Sub-Dokumente ...
 bei Gedichten: Strophen, Verse ...
 bei Szenischen Texten: Akte, Figuren, Sprechertext,
Regieanweisungen ...
TEI:
 Briefe: opener mit dateline, address, closer mit salute
 Gedichte/Szen.Texte: lg/l, role, actor, cast, caesura ...
24
Repräsentation des Textes
Strukturdiagramm: Strukturbeispiel:
25
Kennzeichnung von Metainformationen
Dazu gehören z.B.:
 Personennamen
 Datumsangaben
 Ortsangaben
Strukturanforderung:
 bei Personennamen: Vor- und Nachname, Namensteile
 bei Datumsangaben: Tag-Monat-Jahr, gesichert/ungesichert
 bei Ortsangaben: geografische bzw. politische Zuordnung,
historischer Kontext, Klassifizierung z.B. als Stadt, Land ...
TEI (verschiedene Möglichkeiten):
 rs type=person vs. persName/forename+surname, role
 rs type=date vs. date/@when/@from/@to/@precision
 rs type=place vs. placeName, geogName, region, state
26
Kennzeichnung von Metainformationen
Strukturdiagramm: Strukturbeispiel:
27
Textkritik
Dazu gehören:
 Beschreibung der Textvariationen, die am Textträger
erkennbar sind, z.B.
 nachträgliche Korrekturen des handschriftlichen Texts
 Anstreichungen oder Anmerkungen im gedrucktem Material,
ggf. mit verschiedenen Stiften
 einschließlich der Schreib-Topographie (oben, unten, drüber...)
Strukturanforderung:
 Streichungen, Ergänzungen, Änderungen
 verschränkte Unterstreichungen
 Angabe der Position
TEI:
 subst, del, add, restore, unclear, damage ...
 app, rdg, ..., sic, supplied ...
28
Textkritik
Strukturdiagramm: Strukturbeispiel:
29
Überlieferungskritik und Kommentierung
Dazu gehören:
 Kennzeichnung der Stelle im Primärtext
 Kommentartext mit Auszeichnungen, Metainformationen,
Verweisen auf andere Textstellen ...
Strukturanforderung:
 Textanker:
eindeutige Benennung, eindeutiger Bezug
 Kommentartext:
vielfältige Textauszeichnung, da hier z.B. auch Gedichte, Zitate,
Übersetzungen und Hinweise auf andere Kommentare,
Primärtextstellen oder Sekundärliteratur ihren Ort haben
TEI (jeweils verschiedene Möglichkeiten):
 Textanker: ref vs. anchor vs. milestone
 Kommentartext: note vs. ref (als Verweisziel)
30
Überlieferungskritik und Kommentierung
Strukturdiagramm: Strukturbeispiel:
31
Strukturkonfiguration
32
Qualitätssicherung und
Weiterverarbeitung
Teilweise sehr umfangreiche Inhaltsmodelle, z.B.:
• Unterstrukturen in Überschriften:
ca. 54 Unterelemente neben Text
• Unterstrukturen in Absätzen:
ca. 54 Unterelemente neben Text
33
Probleme bei der Datenerstellung
editionsübergreifend unterschiedliche
Auszeichnungen
34
Probleme bei der Datenerstellung
trotz redaktioneller Vorgabeliste keine einheitlichen
Attributwerte
Vermischung von semantischer und typografischer
Auszeichnung – auch englischer und deutscher
Benennungen ...
35
Qualitätssicherung in der Redaktion
36
Weiterverarbeitung
Verfügbare
Stylesheets,
u.a.:
37
Fazit
 Für nahezu alle verlagsrelevanten und wissenschaftlichen
Textanforderungen gibt es semantische Elemente.
 Weitere Semantisierung über allseits verfügbare Attribute
wie z.B. @type und @subtype.
 In der Regel Verzicht auf ganz enge Inhaltsmodelle –
jedoch Konfiguration via ROMA möglich.
 Trotzdem sind umfangreiche und präzise Erläuterungen im
Redaktionshandbuch notwendig, um einen konsistenten
Einsatz der XML-Strukturen zu erreichen.
38
Vielen Dank für Ihre
Aufmerksamkeit!
Ursula Welsch
ursula.welsch@welschmedien.de
www.welschmedien.de
www.xml-schule.de

Weitere ähnliche Inhalte

Empfohlen

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 

Empfohlen (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

XML-Struktur: TEI (Text Encoding Initiative)

  • 2. 2 Agenda • Vorrede • Geschichte und Weiterentwicklung • Einsetzbarkeit • Grundkonzept • Metadaten • Allgemeine Textelemente • Dokumenttypen • Besonderheiten • Strukturkonfiguration • Qualitätssicherung und Weiterverarbeitung • Fazit
  • 3. 3 Vorrede Das Herzstück einer XML-Anwendung ist die Struktur! • Struktur muss die Inhalte abbilden – nicht das Printwerk • Semantik so viel wie notwendig für geplante Anwendungen • Inhaltsmodelle so eng wie möglich für hohe Datenqualität • Unterstützung von Autor, Redaktion und Produktion
  • 4. 4 Standard-DTDs im Verlagswesen • DocBook: www.docbook.org • NLM – National Library of Medicine: dtd.nlm.niv.gov/3.0/ – JATS = Journal Article Tag Suite – NCBI BTL = National Center of Biotechnology Information Book Tag Library • TEI – Text Encoding Initiative: www.tei-c.org
  • 5. 5 Geschichte und Weiterentwicklung Text Encoding Initiative (TEI) • Entstehung ab Ende der 80er Jahre • erste Ausgabe der "Guidelines" Mai 1994 • Entwicklung, Nutzung und Pflege bis 2000 als Gemeinschaftsaktivität mehrerer wissenschaftlicher Disziplinen • seit 2001 TEI Consortium • Aktuelle Version: TEI P5 In Arbeit: • SIG Correspondence Ergänzung • Music Encoding Initiative (MEI)
  • 6. 6 Einsetzbarkeit • Ziel: alle Arten von wissenschaftlichem Text • Dokument orientiert: teiCorpus, TEI • Anpassungskonzept: Einzelmodule, die je nach Bedarf zu einer Anwendung compiliert werden müssen • Ausnahme: TEI lite • Einsatz: heute vor allem in den Digital Humanities • Lizenz: Creative Commons Lizenz (3.0 Unported)
  • 7. 7 Grundkonzept • Sprache: englisch • Dokumentation: ausführlich (1613 Seiten), englisch • Trennung von Metadaten und Text • Semantische Strukturen: z.T. in den Elementnamen, z.T. in Attributwerten • Konfigurierbarkeit: via Online-Tool ROMA => DTD, XML-Schema, Relax NG
  • 8. 8 Metadaten Element: teiHeader Teile: • fileDesc: bibliografische Beschreibung • encodingDesc: Besonderheiten der verwendeten Struktur • profileDesc: textliche Beschreibung des enthaltenen Korpus • revisionDesc: Enstehungs- und Bearbeitungsgeschichte der Datei
  • 10. 10 Allgemeine Textelemente Hierarchische Struktur • text (front, body, back) • div und div1, div2 etc. Absatzformate • Generell: p • wissenschaftliche, z.B. argument, note, eg • editionsspezifische, z.B. del, add,rdg • ansonsten mit dem Attribut @type bei nahezu jedem Element spezifizierbar
  • 11. 11 Allgemeine Textelemente Zeichenformate • eine reiche Palette von Elementen zur linguistischen und • interpretatorischen Beschreibung des Texts, z.B. s, seg, hi, emph, foreign, mentioned, term, title etc. Verweise • ref, ptr, anchor, seg, xptr, xref
  • 12. 12 Allgemeine Textelemente Abbildungen • Figure: gruppiert alles, was zu der Abbildung gehört • Graphic: ist die Abbildung selbst
  • 13. 13 Allgemeine Textelemente Tabellen • sehr simple eigene Struktur • nur row und cell • kein Header-Element • für komplexere Tabellen HTML- oder CALS- Tabellenmodell integrierbar via Namensräume
  • 16. 16 Besonderheiten • Editionen mit – Urkunden – Nachlässe (Briefe, Tagebücher, Notizbücher) – Gesamtwerk
  • 17. 17 Die Aufgabe von Editionen • Bereitstellung einer zuverlässigen Textgrundlage für jedwede historische oder interpretatorische Betrachtung  systematische Sichtung sämtlicher zugehöriger Überlieferungsträger  zeichengetreue Transkription der Textzeugen  genetische Dokumentation und Textkonstitution • Verbreitung der Buch- bzw. Online-Publikation, je nach Quellenlage – zu dem Zweck:  die Autographen und alten Urkunden zu schonen (z.B. Vermeidung von direktem Hautkontakt oder ungünstigen klimatischen Bedingungen)  Lücken im Bestand zu schließen, die z.B. durch Verluste und Aufteilungen in der Folge der beiden Weltkriege des 20. Jhs. entstanden sind
  • 19. 19 Bibliographie des Editionsobjekts Dazu gehören z.B.:  Lagerort der Originale (Bibliothek, Nachlass ...)  genaue Bezeichnung (Titel, Sigle, Aktenzeichen ...)  bis auf Einzel-Dokumentbasis Strukturanforderung:  klare Trennung von Metadaten und Textbeschreibung  Metadatenbereich mit „Feldern“ für alle notwendigen Angaben TEI:  teiHeader/fileDesc – titleStmt – publicationStmt – sourceDesc
  • 21. 21 Beschreibung der Materialität Dazu gehören:  Beschreibung der äußeren Gestalt  ggf. aufgeteilt in Blätter, Seiten, Einzelobjekte ... Strukturanforderung:  textliche Beschreibung des Textträgers  ggf. Zeilen-, Seiten-, Spaltenwechsel ...  ggf. Zuordnung von Sub-Dokumenten TEI:  physDesc  lb, pb, cb  @rend
  • 23. 23 Repräsentation des Textes Dazu gehören:  verschiedene Dokumenttypen, z.B. Briefe, Urkunden, Notizbücher, Prosatexte, Gedichte, szenische Texte ...  mit allen spezifischen Anforderungen an die Aufbereitung Strukturanforderung:  bei Briefen: z.B. Absender, Anrede, Briefkorpus, Grußformel, Postscriptum ...  bei Notizbüchern: Art der Notiz, Sub-Dokumente ...  bei Gedichten: Strophen, Verse ...  bei Szenischen Texten: Akte, Figuren, Sprechertext, Regieanweisungen ... TEI:  Briefe: opener mit dateline, address, closer mit salute  Gedichte/Szen.Texte: lg/l, role, actor, cast, caesura ...
  • 25. 25 Kennzeichnung von Metainformationen Dazu gehören z.B.:  Personennamen  Datumsangaben  Ortsangaben Strukturanforderung:  bei Personennamen: Vor- und Nachname, Namensteile  bei Datumsangaben: Tag-Monat-Jahr, gesichert/ungesichert  bei Ortsangaben: geografische bzw. politische Zuordnung, historischer Kontext, Klassifizierung z.B. als Stadt, Land ... TEI (verschiedene Möglichkeiten):  rs type=person vs. persName/forename+surname, role  rs type=date vs. date/@when/@from/@to/@precision  rs type=place vs. placeName, geogName, region, state
  • 27. 27 Textkritik Dazu gehören:  Beschreibung der Textvariationen, die am Textträger erkennbar sind, z.B.  nachträgliche Korrekturen des handschriftlichen Texts  Anstreichungen oder Anmerkungen im gedrucktem Material, ggf. mit verschiedenen Stiften  einschließlich der Schreib-Topographie (oben, unten, drüber...) Strukturanforderung:  Streichungen, Ergänzungen, Änderungen  verschränkte Unterstreichungen  Angabe der Position TEI:  subst, del, add, restore, unclear, damage ...  app, rdg, ..., sic, supplied ...
  • 29. 29 Überlieferungskritik und Kommentierung Dazu gehören:  Kennzeichnung der Stelle im Primärtext  Kommentartext mit Auszeichnungen, Metainformationen, Verweisen auf andere Textstellen ... Strukturanforderung:  Textanker: eindeutige Benennung, eindeutiger Bezug  Kommentartext: vielfältige Textauszeichnung, da hier z.B. auch Gedichte, Zitate, Übersetzungen und Hinweise auf andere Kommentare, Primärtextstellen oder Sekundärliteratur ihren Ort haben TEI (jeweils verschiedene Möglichkeiten):  Textanker: ref vs. anchor vs. milestone  Kommentartext: note vs. ref (als Verweisziel)
  • 32. 32 Qualitätssicherung und Weiterverarbeitung Teilweise sehr umfangreiche Inhaltsmodelle, z.B.: • Unterstrukturen in Überschriften: ca. 54 Unterelemente neben Text • Unterstrukturen in Absätzen: ca. 54 Unterelemente neben Text
  • 33. 33 Probleme bei der Datenerstellung editionsübergreifend unterschiedliche Auszeichnungen
  • 34. 34 Probleme bei der Datenerstellung trotz redaktioneller Vorgabeliste keine einheitlichen Attributwerte Vermischung von semantischer und typografischer Auszeichnung – auch englischer und deutscher Benennungen ...
  • 37. 37 Fazit  Für nahezu alle verlagsrelevanten und wissenschaftlichen Textanforderungen gibt es semantische Elemente.  Weitere Semantisierung über allseits verfügbare Attribute wie z.B. @type und @subtype.  In der Regel Verzicht auf ganz enge Inhaltsmodelle – jedoch Konfiguration via ROMA möglich.  Trotzdem sind umfangreiche und präzise Erläuterungen im Redaktionshandbuch notwendig, um einen konsistenten Einsatz der XML-Strukturen zu erreichen.
  • 38. 38 Vielen Dank für Ihre Aufmerksamkeit! Ursula Welsch ursula.welsch@welschmedien.de www.welschmedien.de www.xml-schule.de