SlideShare ist ein Scribd-Unternehmen logo
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Daten- und Metadatenstandards
Sommersemester 2013
29. Mai 2013 – Die Text Encoding Initiative (TEI)
„Die Text Encoding Initiative (TEI)“
 Frage- und Problemstellung
 Die TEI und ihre Intention
 Konsortium und Standard
 Eine kurze (Versions)Geschichte der TEI
 Elemente der TEI
 Praxis:
 Einen nach den Regeln der TEI ausgezeichneten Text
erweitern
 Zugriff auf ein TEI-konformes XML-Dokument mit XSLT &
Co.
Sitzungsüberblick
Frage- und Problemstellung:
Wie lassen sich mit einem Standard
sämtliche in den Geisteswissenschaften
zu behandelnden Texte beschreiben?
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und sicher war ihr Gang,
Kein Tropfen aus dem Becher sprang.
So leicht und fest war seine Hand:
Er ritt auf einem jungen Pferde,
Und mit nachlässiger Gebärde
Erzwang er, daß es zitternd stand.
Jedoch, wenn er aus ihrer Hand
Den leichten Becher nehmen sollte,
So war es beiden allzu schwer:
Denn beide bebten sie so sehr,
Daß keine Hand die andre fand
Und dunkler Wein am Boden rollte.
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und sicher war ihr Gang,
Kein Tropfen aus dem Becher sprang.
So leicht und fest war seine Hand:
Er ritt auf einem jungen Pferde,
Und mit nachlässiger Gebärde
Erzwang er, daß es zitternd stand.
Jedoch, wenn er aus ihrer Hand
Den leichten Becher nehmen sollte,
So war es beiden allzu schwer:
Denn beide bebten sie so sehr,
Daß keine Hand die andre fand
Und dunkler Wein am Boden rollte.
Vers
Strophe
SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)
Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25
in. (101.6 × 63.5 cm). http://whitney.org/WatchAndListen/AudioGuides?play_id=370
Die Text Encoding Initiative
Eine Lösung: TEI (Text Encoding Initiative)
 Fokus: Text
TEI bezeichnet sowohl
 das Konsortium (TEI-C),
 als auch einen Standard zur Kodierung und zum Austausch von
Textdokumenten
„TEI hat ein unabhängiges, portables und offenes Format [für die]
Speicherung, Austausch und Analyse von Texten in den
Geisteswissenschaften entwickelt. Das konkrete Resultat dieser
Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher
Textsorten als auch das Textkodierungsformat selber.“
(http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)
 Richtlinien und Format sind frei zugänglich und kostenlos
Text Encoding Initiative (TEI)
Geschichte:
 1987 entstanden als internationale Initiative von
Philologinnen und Philologen
 Dokumentenformat zur Repräsentation von Texten in
digitaler Form
 Vielseitigkeit & Praxisnähe
Differenzierung: TEI bezeichnet sowohl
 das Konsortium (TEI-C), 2000 gegründet
 als auch Richtlinien und Empfehlungen zur Kodierung
und zum Austausch von Textdokumenten.
Intention: Geisteswissenschaftlerinnen und
Geisteswissenschaftler sollen über größtmögliche Freiheit
verfügen, textuell vorliegende Information nach eigenem
Textbegriff in XML zu codieren.
Text Encoding Initiative (TEI)
Versionsgeschichte
 1990: TEI P1 (P => Proposal, Entwurf / Plan)
Basiert auf SGML (Standard Generalized Markup
Language)
 1992 / 1993: TEI P2
 1994: TEI P3 ("Green Books")
 2002: TEI P4 (XML-basiert)
 2002: TEI Lite
 2007 TEI P5
Die Text Encoding Initiative
Standards und Guidelines
 Standards der TEI schränken die schier unendlichen
Auszeichnungsmöglichkeiten von XML ein. Dabei stellen
sich die folgenden Grundfragen:
 Welche Tags und welche Attribute lassen sich verwenden,
um eigene Texte auszuzeichnen?
 Wie lassen sich die Tags miteinander kombinieren /
verschachteln?
 Überblick über Richtlinien, z.B. für TEI P5: http://www.tei-
c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1641
Seiten)
Die Text Encoding Initiative
Modularisierung
 Flexible Auswahl von TEI-Elementen aufgrund des
modularen Charakters der TEI. So muss ein eigenes
Schema nicht alle Elemente und Attribute der TEI
enthalten.
 Module, u.a.:
 core für Basiselemente
 header für Metadaten
 textstructure für grundlegende Textstrukturen
 drama für Dramen
 prose, poetry, etc.
Die Text Encoding Initiative
TEI und oXygen:
Alternativ: Angepasste Schemata generieren mit
http://www.tei-c.org/Roma
Die Text Encoding Initiative
Verortung:
Die Text Encoding Initiative
EAD: Encoded Archival Description
METS: Metadata Encoding and Transmission Standard
TEI – Praxis
Aufbau und Elemente eines
TEI-Dokumentes:
 Wurzelelement: <TEI>
 Enthält mindestens
 <teiHeader> (obligatorisch)
 <text>
und / oder
 <facsimile> (Verknüpfung mit
Bildmaterialien)
oder
 <fsdDecl> (u.a. für Textanalysen)
Die Text Encoding Initiative
<teiHeader>
 Enthält Metadaten zum Text: Autorin / Autor, Titel,
Erstellungsdatum, etc.
 Vier Teile:
 <fileDesc> (obligatorisch)
 <encodingDesc> (fakultativ)
 <profileDesc> (fakultativ)
 <revisionDesc> (fakultativ)
Die Text Encoding Initiative
<fileDesc>
 Bibliographische Beschreibung
des TEI-Dokumentes (Autor, Titel,
Editor, Projekt, Erstellungsdatum
usw.)
 Beschreibung der Quelle(n), einer
Handschrift, eines Archivguts usw.
 Muss enthalten:
 <titleStmt>, <publicationStmt>,
<sourceDesc>
 Kann enthalten:
 <editionStmt>, <extent>,
<seriesStmt>, <notesStmt>
Die Text Encoding Initiative
Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie sie
sich unter http://ora-
web.swkk.de/digimo_online/digimo.entry?source=digimo.Digitalisat_anzeigen&a_i
d=4557&p_ab=0 findet.
 Erstellen Sie in „oXygen“ ein TEI-Dokument nach der Vorlage „TEI P5 All“.
 Bilden Sie den Titel „Alexis und Dora“ und den Namen des Autors („Johann
Wolfgang von Goethe“) über <titleStmt> ab.
 Füllen Sie <publicationStmt> mit einer kurzen Beschreibung über Ihr
Codierungsprojekt.
 Das Gedicht findet sich im 1797 von Friedrich Schiller herausgegebenen, in
Tübingen veröffentlichten, „Musen-Almanach“. Bilden Sie diese
bibliographischen Informationen über <sourceDesc> ab.
Tipp: Ein Codierungsbeispiel für Hugo von Hofmannsthals „Die Beiden“ findet sich
unter http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html. Informationen
zu den TEI-Elementen lassen sich unter http://www.tei-c.org/release/doc/tei-p5-
doc/de/html/ref-publicationStmt.html aufrufen.
Übung I
<text>
 Enthält den eigentlichen Text:
 <body> (obligatorisch)
 <front> und / oder <back> (fakultativ)
Gliederungselemente in <body>:
 <div> Abschnitte im Dokument (Kapitel, unterschiedliche
Gedichte, etc.). Attribute:
 n (Nummerierung)
 type („book“, „chapter“, „poem“)
 <head> (Kopfbereich, Beschreibung des (hier:) Gedichtes)
 <lg> (Line Group), Abschnitte des Gedichtes (i.e. Strophen)
 type („stanza“, „para“, etc. Vgl.: http://www.tei-c.org/release/doc/tei-
p5-doc/en/html/examples-lg.html)
 <l> (Line), Verse des Gedichtes
Die Text Encoding Initiative
 Bilden Sie die Verse und Strophen der Elegie
„Alexis und Dora“ mit Ihrem TEI-Dokument ab.
 Fortgeschritten (!): Erstellen Sie ein XSLT-
Stylesheet, das aus dem TEI-Dokument ein
HTML-Dokument erstellt.
Übung II
/

Weitere ähnliche Inhalte

Andere mochten auch

Matricula
MatriculaMatricula
Imagenes en power
Imagenes en powerImagenes en power
Imagenes en power
Lorena Gonzalez
 
Las licencias de uso: nuevas fronteras en el mundo digital
Las licencias de uso: nuevas fronteras en el mundo digitalLas licencias de uso: nuevas fronteras en el mundo digital
Las licencias de uso: nuevas fronteras en el mundo digital
Silvia Arano Poggi
 
Leccionbiodiversidad
LeccionbiodiversidadLeccionbiodiversidad
Leccionbiodiversidad
Lore
 
Figaronron - Parc Paradisio 03 (13-07-2008)
Figaronron - Parc Paradisio 03 (13-07-2008)Figaronron - Parc Paradisio 03 (13-07-2008)
Figaronron - Parc Paradisio 03 (13-07-2008)
Figaronron Figaronron
 
Tarea ud4 Valero Gallego
Tarea ud4 Valero GallegoTarea ud4 Valero Gallego
Tarea ud4 Valero Gallego
enkarny
 
Microclase 2015
Microclase 2015Microclase 2015
Microclase 2015
Omar Eduardo Espinosa
 
TALLER N.11- MODELO TCP/IP
TALLER N.11- MODELO TCP/IPTALLER N.11- MODELO TCP/IP
TALLER N.11- MODELO TCP/IP
mario23
 

Andere mochten auch (9)

Matricula
MatriculaMatricula
Matricula
 
Imagenes en power
Imagenes en powerImagenes en power
Imagenes en power
 
Las licencias de uso: nuevas fronteras en el mundo digital
Las licencias de uso: nuevas fronteras en el mundo digitalLas licencias de uso: nuevas fronteras en el mundo digital
Las licencias de uso: nuevas fronteras en el mundo digital
 
Leccionbiodiversidad
LeccionbiodiversidadLeccionbiodiversidad
Leccionbiodiversidad
 
Figaronron - Parc Paradisio 03 (13-07-2008)
Figaronron - Parc Paradisio 03 (13-07-2008)Figaronron - Parc Paradisio 03 (13-07-2008)
Figaronron - Parc Paradisio 03 (13-07-2008)
 
Tarea ud4 Valero Gallego
Tarea ud4 Valero GallegoTarea ud4 Valero Gallego
Tarea ud4 Valero Gallego
 
Folder gs 2012
Folder gs 2012 Folder gs 2012
Folder gs 2012
 
Microclase 2015
Microclase 2015Microclase 2015
Microclase 2015
 
TALLER N.11- MODELO TCP/IP
TALLER N.11- MODELO TCP/IPTALLER N.11- MODELO TCP/IP
TALLER N.11- MODELO TCP/IP
 

Ähnlich wie SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)

BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
Institute for Digital Humanities, University of Cologne
 
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Jakob .
 
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
Thomas Tunsch
 
W. Neubauer - E-Lib.ch im europäischen Kontext
W. Neubauer - E-Lib.ch im europäischen KontextW. Neubauer - E-Lib.ch im europäischen Kontext
W. Neubauer - E-Lib.ch im europäischen Kontext
infoclio.ch
 
German AAT 2013
German AAT 2013German AAT 2013
German AAT 2013
AAT Taiwan
 
Paul Otlet Mundaneuem - Ausarbeitung
Paul Otlet Mundaneuem - AusarbeitungPaul Otlet Mundaneuem - Ausarbeitung
Paul Otlet Mundaneuem - Ausarbeitung
wruge
 
Recherche daf-2017
Recherche daf-2017Recherche daf-2017
Recherche daf-2017
rheinturm
 
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
Institute for Digital Humanities, University of Cologne
 

Ähnlich wie SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI) (14)

WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)
WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)
WiSe 2013 | IT-Zertifikat: AMM - Die Text Encoding Initiative (TEI)
 
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
 
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: TextBit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
 
WiSe 2013 | Kolloquium "Digital Humanities" - 04
WiSe 2013 | Kolloquium "Digital Humanities" - 04WiSe 2013 | Kolloquium "Digital Humanities" - 04
WiSe 2013 | Kolloquium "Digital Humanities" - 04
 
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
 
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
SoSe 2013 | IT-Zertifikat: AMM - Klausurvorbereitung
 
[3] Nu P 01 4
[3] Nu P 01 4[3] Nu P 01 4
[3] Nu P 01 4
 
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
Kommunikation für Experten: Kulturelle Gedächtnisorganisationen und vernetzte...
 
W. Neubauer - E-Lib.ch im europäischen Kontext
W. Neubauer - E-Lib.ch im europäischen KontextW. Neubauer - E-Lib.ch im europäischen Kontext
W. Neubauer - E-Lib.ch im europäischen Kontext
 
German AAT 2013
German AAT 2013German AAT 2013
German AAT 2013
 
Paul Otlet Mundaneuem - Ausarbeitung
Paul Otlet Mundaneuem - AusarbeitungPaul Otlet Mundaneuem - Ausarbeitung
Paul Otlet Mundaneuem - Ausarbeitung
 
Recherche daf-2017
Recherche daf-2017Recherche daf-2017
Recherche daf-2017
 
WiSe 2013 | Kolloquium "Digital Humanities" - 05
WiSe 2013 | Kolloquium "Digital Humanities" - 05WiSe 2013 | Kolloquium "Digital Humanities" - 05
WiSe 2013 | Kolloquium "Digital Humanities" - 05
 
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
 

Mehr von Institute for Digital Humanities, University of Cologne

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Institute for Digital Humanities, University of Cologne
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Institute for Digital Humanities, University of Cologne
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Institute for Digital Humanities, University of Cologne
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Institute for Digital Humanities, University of Cologne
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
Institute for Digital Humanities, University of Cologne
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Institute for Digital Humanities, University of Cologne
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Institute for Digital Humanities, University of Cologne
 

Mehr von Institute for Digital Humanities, University of Cologne (20)

Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
 
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
 
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
 
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-gamesBit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-13_ki-in-games
 
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-visionBit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
 
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filterBit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
 
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationenBit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
 
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompressionBit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
 
Bit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-webBit sosem 2016-wieners-sitzung-08_semantic-web
Bit sosem 2016-wieners-sitzung-08_semantic-web
 
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-iiBit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
 
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikationBit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
 
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conwayBit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
 
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatikBit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
 
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmenBit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-03_algorithmen
 
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturenBit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
 
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischungBit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-01_auffrischung
 
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblickBit sosem 2016-wieners-sitzung-00_themenueberblick
Bit sosem 2016-wieners-sitzung-00_themenueberblick
 
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung IIBit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
 

SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)

  • 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de Daten- und Metadatenstandards Sommersemester 2013 29. Mai 2013 – Die Text Encoding Initiative (TEI)
  • 2. „Die Text Encoding Initiative (TEI)“  Frage- und Problemstellung  Die TEI und ihre Intention  Konsortium und Standard  Eine kurze (Versions)Geschichte der TEI  Elemente der TEI  Praxis:  Einen nach den Regeln der TEI ausgezeichneten Text erweitern  Zugriff auf ein TEI-konformes XML-Dokument mit XSLT & Co. Sitzungsüberblick
  • 3. Frage- und Problemstellung: Wie lassen sich mit einem Standard sämtliche in den Geisteswissenschaften zu behandelnden Texte beschreiben?
  • 4. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte.
  • 5. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte. Vers Strophe
  • 7. Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
  • 8. vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
  • 9. Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25 in. (101.6 × 63.5 cm). http://whitney.org/WatchAndListen/AudioGuides?play_id=370
  • 10. Die Text Encoding Initiative
  • 11. Eine Lösung: TEI (Text Encoding Initiative)  Fokus: Text TEI bezeichnet sowohl  das Konsortium (TEI-C),  als auch einen Standard zur Kodierung und zum Austausch von Textdokumenten „TEI hat ein unabhängiges, portables und offenes Format [für die] Speicherung, Austausch und Analyse von Texten in den Geisteswissenschaften entwickelt. Das konkrete Resultat dieser Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher Textsorten als auch das Textkodierungsformat selber.“ (http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)  Richtlinien und Format sind frei zugänglich und kostenlos Text Encoding Initiative (TEI)
  • 12. Geschichte:  1987 entstanden als internationale Initiative von Philologinnen und Philologen  Dokumentenformat zur Repräsentation von Texten in digitaler Form  Vielseitigkeit & Praxisnähe Differenzierung: TEI bezeichnet sowohl  das Konsortium (TEI-C), 2000 gegründet  als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren. Text Encoding Initiative (TEI)
  • 13. Versionsgeschichte  1990: TEI P1 (P => Proposal, Entwurf / Plan) Basiert auf SGML (Standard Generalized Markup Language)  1992 / 1993: TEI P2  1994: TEI P3 ("Green Books")  2002: TEI P4 (XML-basiert)  2002: TEI Lite  2007 TEI P5 Die Text Encoding Initiative
  • 14. Standards und Guidelines  Standards der TEI schränken die schier unendlichen Auszeichnungsmöglichkeiten von XML ein. Dabei stellen sich die folgenden Grundfragen:  Welche Tags und welche Attribute lassen sich verwenden, um eigene Texte auszuzeichnen?  Wie lassen sich die Tags miteinander kombinieren / verschachteln?  Überblick über Richtlinien, z.B. für TEI P5: http://www.tei- c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1641 Seiten) Die Text Encoding Initiative
  • 15. Modularisierung  Flexible Auswahl von TEI-Elementen aufgrund des modularen Charakters der TEI. So muss ein eigenes Schema nicht alle Elemente und Attribute der TEI enthalten.  Module, u.a.:  core für Basiselemente  header für Metadaten  textstructure für grundlegende Textstrukturen  drama für Dramen  prose, poetry, etc. Die Text Encoding Initiative
  • 16. TEI und oXygen: Alternativ: Angepasste Schemata generieren mit http://www.tei-c.org/Roma Die Text Encoding Initiative
  • 17. Verortung: Die Text Encoding Initiative EAD: Encoded Archival Description METS: Metadata Encoding and Transmission Standard
  • 19. Aufbau und Elemente eines TEI-Dokumentes:  Wurzelelement: <TEI>  Enthält mindestens  <teiHeader> (obligatorisch)  <text> und / oder  <facsimile> (Verknüpfung mit Bildmaterialien) oder  <fsdDecl> (u.a. für Textanalysen) Die Text Encoding Initiative
  • 20. <teiHeader>  Enthält Metadaten zum Text: Autorin / Autor, Titel, Erstellungsdatum, etc.  Vier Teile:  <fileDesc> (obligatorisch)  <encodingDesc> (fakultativ)  <profileDesc> (fakultativ)  <revisionDesc> (fakultativ) Die Text Encoding Initiative
  • 21. <fileDesc>  Bibliographische Beschreibung des TEI-Dokumentes (Autor, Titel, Editor, Projekt, Erstellungsdatum usw.)  Beschreibung der Quelle(n), einer Handschrift, eines Archivguts usw.  Muss enthalten:  <titleStmt>, <publicationStmt>, <sourceDesc>  Kann enthalten:  <editionStmt>, <extent>, <seriesStmt>, <notesStmt> Die Text Encoding Initiative
  • 22. Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie sie sich unter http://ora- web.swkk.de/digimo_online/digimo.entry?source=digimo.Digitalisat_anzeigen&a_i d=4557&p_ab=0 findet.  Erstellen Sie in „oXygen“ ein TEI-Dokument nach der Vorlage „TEI P5 All“.  Bilden Sie den Titel „Alexis und Dora“ und den Namen des Autors („Johann Wolfgang von Goethe“) über <titleStmt> ab.  Füllen Sie <publicationStmt> mit einer kurzen Beschreibung über Ihr Codierungsprojekt.  Das Gedicht findet sich im 1797 von Friedrich Schiller herausgegebenen, in Tübingen veröffentlichten, „Musen-Almanach“. Bilden Sie diese bibliographischen Informationen über <sourceDesc> ab. Tipp: Ein Codierungsbeispiel für Hugo von Hofmannsthals „Die Beiden“ findet sich unter http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html. Informationen zu den TEI-Elementen lassen sich unter http://www.tei-c.org/release/doc/tei-p5- doc/de/html/ref-publicationStmt.html aufrufen. Übung I
  • 23. <text>  Enthält den eigentlichen Text:  <body> (obligatorisch)  <front> und / oder <back> (fakultativ) Gliederungselemente in <body>:  <div> Abschnitte im Dokument (Kapitel, unterschiedliche Gedichte, etc.). Attribute:  n (Nummerierung)  type („book“, „chapter“, „poem“)  <head> (Kopfbereich, Beschreibung des (hier:) Gedichtes)  <lg> (Line Group), Abschnitte des Gedichtes (i.e. Strophen)  type („stanza“, „para“, etc. Vgl.: http://www.tei-c.org/release/doc/tei- p5-doc/en/html/examples-lg.html)  <l> (Line), Verse des Gedichtes Die Text Encoding Initiative
  • 24.  Bilden Sie die Verse und Strophen der Elegie „Alexis und Dora“ mit Ihrem TEI-Dokument ab.  Fortgeschritten (!): Erstellen Sie ein XSLT- Stylesheet, das aus dem TEI-Dokument ein HTML-Dokument erstellt. Übung II
  • 25. /