Advanced Markup & Metadata
Wintersemester 2013 / 2014
18. Dezember 2013 – Die Text Encoding Initiative (TEI)

Universität ...
Sitzungsüberblick
„Die Text Encoding Initiative (TEI)“
 Frage- und Problemstellung
 Die TEI und ihre Intention
 Konsort...
Frage- und Problemstellung:
Wie lassen sich mit einem Standard
sämtliche in den Geisteswissenschaften
zu behandelnden Text...
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und ...
Vers

Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leich...
Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25
in. (101.6 × 63.5 cm). http://whitne...
Die Text Encoding Initiative
Text Encoding Initiative (TEI)
Eine Lösung: TEI (Text Encoding Initiative)
 Fokus: Text

TEI bezeichnet sowohl
 das Kons...
Text Encoding Initiative (TEI)
Geschichte:

 1987 entstanden als internationale Initiative von
Philologinnen und Philolog...
Die Text Encoding Initiative
Versionsgeschichte
 1990: TEI P1 (P => Proposal, Entwurf / Plan)
Basiert auf SGML (Standard ...
Die Text Encoding Initiative
Standards und Guidelines
 Standards der TEI schränken die schier unendlichen
Auszeichnungsmö...
Die Text Encoding Initiative
Modularisierung
 Flexible Auswahl von TEI-Elementen aufgrund des
modularen Charakters der TE...
Die Text Encoding Initiative

TEI und oXygen:

Alternativ: Angepasste Schemata generieren mit
http://www.tei-c.org/Roma
Die Text Encoding Initiative

Verortung:

EAD: Encoded Archival Description
METS: Metadata Encoding and Transmission Stand...
TEI – Praxis
Die Text Encoding Initiative
Aufbau und Elemente eines
TEI-Dokumentes:
 Wurzelelement: <TEI>
 Enthält mindestens
 <teiH...
Die Text Encoding Initiative
<teiHeader>


Enthält Metadaten zum Text: Autorin / Autor, Titel,
Erstellungsdatum, etc.
Vie...
Die Text Encoding Initiative
<fileDesc>
 Bibliographische Beschreibung
des TEI-Dokumentes (Autor, Titel,
Editor, Projekt,...
Übung I
Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie sie
sich unter http://oraweb.swkk.de/dig...
Die Text Encoding Initiative
<text>
 Enthält den eigentlichen Text:
 <body> (obligatorisch)
 <front> und / oder <back> ...
Übung II


Bilden Sie die Verse und Strophen der Elegie
„Alexis und Dora“ mit Ihrem TEI-Dokument ab.



Fortgeschritten ...
/
WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)
Nächste SlideShare
Wird geladen in …5
×

WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)

389 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
389
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
61
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)

  1. 1. Advanced Markup & Metadata Wintersemester 2013 / 2014 18. Dezember 2013 – Die Text Encoding Initiative (TEI) Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de
  2. 2. Sitzungsüberblick „Die Text Encoding Initiative (TEI)“  Frage- und Problemstellung  Die TEI und ihre Intention  Konsortium und Standard  Eine kurze (Versions)Geschichte der TEI  Elemente der TEI  Praxis:  Einen nach den Regeln der TEI ausgezeichneten Text erweitern  Zugriff auf ein TEI-konformes XML-Dokument mit XSLT & Co.
  3. 3. Frage- und Problemstellung: Wie lassen sich mit einem Standard sämtliche in den Geisteswissenschaften zu behandelnden Texte beschreiben?
  4. 4. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte.
  5. 5. Vers Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte. Strophe
  6. 6. Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
  7. 7. vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
  8. 8. Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25 in. (101.6 × 63.5 cm). http://whitney.org/WatchAndListen/AudioGuides?play_id=370
  9. 9. Die Text Encoding Initiative
  10. 10. Text Encoding Initiative (TEI) Eine Lösung: TEI (Text Encoding Initiative)  Fokus: Text TEI bezeichnet sowohl  das Konsortium (TEI-C),  als auch einen Standard zur Kodierung und zum Austausch von Textdokumenten „TEI hat ein unabhängiges, portables und offenes Format [für die] Speicherung, Austausch und Analyse von Texten in den Geisteswissenschaften entwickelt. Das konkrete Resultat dieser Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher Textsorten als auch das Textkodierungsformat selber.“ (http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)  Richtlinien und Format sind frei zugänglich und kostenlos
  11. 11. Text Encoding Initiative (TEI) Geschichte:  1987 entstanden als internationale Initiative von Philologinnen und Philologen  Dokumentenformat zur Repräsentation von Texten in digitaler Form  Vielseitigkeit & Praxisnähe Differenzierung: TEI bezeichnet sowohl  das Konsortium (TEI-C), 2000 gegründet  als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren.
  12. 12. Die Text Encoding Initiative Versionsgeschichte  1990: TEI P1 (P => Proposal, Entwurf / Plan) Basiert auf SGML (Standard Generalized Markup Language)  1992 / 1993: TEI P2  1994: TEI P3 ("Green Books")  2002: TEI P4 (XML-basiert)  2002: TEI Lite  2007 TEI P5
  13. 13. Die Text Encoding Initiative Standards und Guidelines  Standards der TEI schränken die schier unendlichen Auszeichnungsmöglichkeiten von XML ein. Dabei stellen sich die folgenden Grundfragen:  Welche Tags und welche Attribute lassen sich verwenden, um eigene Texte auszuzeichnen?  Wie lassen sich die Tags miteinander kombinieren / verschachteln?  Überblick über Richtlinien, z.B. für TEI P5:  http://www.tei-c.org/Vault/P5/2.4.0/doc/tei-p5-doc/en/html/  http://www.tei-c.org/Vault/P5/2.4.0/doc/tei-p5doc/en/Guidelines.pdf (1605 Seiten)
  14. 14. Die Text Encoding Initiative Modularisierung  Flexible Auswahl von TEI-Elementen aufgrund des modularen Charakters der TEI. So muss ein eigenes Schema nicht alle Elemente und Attribute der TEI enthalten.  Module, u.a.:      core für Basiselemente header für Metadaten textstructure für grundlegende Textstrukturen drama für Dramen prose, poetry, etc.
  15. 15. Die Text Encoding Initiative TEI und oXygen: Alternativ: Angepasste Schemata generieren mit http://www.tei-c.org/Roma
  16. 16. Die Text Encoding Initiative Verortung: EAD: Encoded Archival Description METS: Metadata Encoding and Transmission Standard
  17. 17. TEI – Praxis
  18. 18. Die Text Encoding Initiative Aufbau und Elemente eines TEI-Dokumentes:  Wurzelelement: <TEI>  Enthält mindestens  <teiHeader> (obligatorisch)  <text> und / oder  <facsimile> (Verknüpfung mit Bildmaterialien) oder  <fsdDecl> (u.a. für Textanalysen)
  19. 19. Die Text Encoding Initiative <teiHeader>  Enthält Metadaten zum Text: Autorin / Autor, Titel, Erstellungsdatum, etc. Vier Teile:      <fileDesc> (obligatorisch) <encodingDesc> (fakultativ) <profileDesc> (fakultativ) <revisionDesc> (fakultativ)
  20. 20. Die Text Encoding Initiative <fileDesc>  Bibliographische Beschreibung des TEI-Dokumentes (Autor, Titel, Editor, Projekt, Erstellungsdatum usw.)  Beschreibung der Quelle(n), einer Handschrift, eines Archivguts usw.  Muss enthalten:  <titleStmt>, <publicationStmt>, <sourceDesc>  Kann enthalten:  <editionStmt>, <extent>, <seriesStmt>, <notesStmt>
  21. 21. Übung I Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie sie sich unter http://oraweb.swkk.de/digimo_online/digimo.entry?source=digimo.Digitalisat_anzeigen&a_i d=4557&p_ab=0 findet.     Erstellen Sie in „oXygen“ ein TEI-Dokument nach der Vorlage „TEI P5 All“. Bilden Sie den Titel „Alexis und Dora“ und den Namen des Autors („Johann Wolfgang von Goethe“) über <titleStmt> ab. Füllen Sie <publicationStmt> mit einer kurzen Beschreibung über Ihr Codierungsprojekt. Das Gedicht findet sich im 1797 von Friedrich Schiller herausgegebenen, in Tübingen veröffentlichten, „Musen-Almanach“. Bilden Sie diese bibliographischen Informationen über <sourceDesc> ab. Tipp: Ein Codierungsbeispiel für Hugo von Hofmannsthals „Die Beiden“ findet sich unter http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html. Informationen zu den TEI-Elementen lassen sich unter http://www.tei-c.org/release/doc/tei-p5doc/de/html/ref-publicationStmt.html aufrufen.
  22. 22. Die Text Encoding Initiative <text>  Enthält den eigentlichen Text:  <body> (obligatorisch)  <front> und / oder <back> (fakultativ) Gliederungselemente in <body>:  <div> Abschnitte im Dokument (Kapitel, unterschiedliche Gedichte, etc.). Attribute:  n (Nummerierung)  type („book“, „chapter“, „poem“)  <head> (Kopfbereich, Beschreibung des (hier:) Gedichtes)  <lg> (Line Group), Abschnitte des Gedichtes (i.e. Strophen)  type („stanza“, „para“, etc. Vgl.: http://www.tei-c.org/release/doc/teip5-doc/en/html/examples-lg.html)  <l> (Line), Verse des Gedichtes
  23. 23. Übung II  Bilden Sie die Verse und Strophen der Elegie „Alexis und Dora“ mit Ihrem TEI-Dokument ab.  Fortgeschritten (!): Erstellen Sie ein XSLTStylesheet, das aus dem TEI-Dokument ein HTML-Dokument erstellt.
  24. 24. /

×