Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.de...
„Die Text Encoding Initiative (TEI)“ Frage- und Problemstellung Die TEI und ihre Intention Konsortium und Standard Ein...
Frage- und Problemstellung:Wie lassen sich mit einem Standardsämtliche in den Geisteswissenschaftenzu behandelnden Texte b...
Hugo von Hofmannsthal – Die BeidenSie trug den Becher in der Hand– Ihr Kinn und Mund glich seinem Rand –,So leicht und sic...
Hugo von Hofmannsthal – Die BeidenSie trug den Becher in der Hand– Ihr Kinn und Mund glich seinem Rand –,So leicht und sic...
Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25in. (101.6 × 63.5 cm). http://whitney...
Die Text Encoding Initiative
Eine Lösung: TEI (Text Encoding Initiative) Fokus: TextTEI bezeichnet sowohl das Konsortium (TEI-C), als auch einen Sta...
Geschichte: 1987 entstanden als internationale Initiative vonPhilologinnen und Philologen Dokumentenformat zur Repräsent...
Versionsgeschichte 1990: TEI P1 (P => Proposal, Entwurf / Plan)Basiert auf SGML (Standard Generalized MarkupLanguage) 19...
Standards und Guidelines Standards der TEI schränken die schier unendlichenAuszeichnungsmöglichkeiten von XML ein. Dabei ...
Modularisierung Flexible Auswahl von TEI-Elementen aufgrund desmodularen Charakters der TEI. So muss ein eigenesSchema ni...
TEI und oXygen:Alternativ: Angepasste Schemata generieren mithttp://www.tei-c.org/RomaDie Text Encoding Initiative
Verortung:Die Text Encoding InitiativeEAD: Encoded Archival DescriptionMETS: Metadata Encoding and Transmission Standard
TEI – Praxis
Aufbau und Elemente einesTEI-Dokumentes: Wurzelelement: <TEI> Enthält mindestens <teiHeader> (obligatorisch) <text>und...
<teiHeader> Enthält Metadaten zum Text: Autorin / Autor, Titel,Erstellungsdatum, etc. Vier Teile: <fileDesc> (obligator...
<fileDesc> Bibliographische Beschreibungdes TEI-Dokumentes (Autor, Titel,Editor, Projekt, Erstellungsdatumusw.) Beschrei...
Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie siesich unter http://ora-web.swkk.de/digimo_onli...
<text> Enthält den eigentlichen Text: <body> (obligatorisch) <front> und / oder <back> (fakultativ)Gliederungselemente ...
 Bilden Sie die Verse und Strophen der Elegie„Alexis und Dora“ mit Ihrem TEI-Dokument ab. Fortgeschritten (!): Erstellen...
/
SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)
Nächste SlideShare
Wird geladen in …5
×

SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)

300 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
300
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
84
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

SoSe 2013 | IT-Zertifikat: DM - Die Text Encoding Initiative (TEI)

  1. 1. Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // jan.wieners@uni-koeln.deDaten- und MetadatenstandardsSommersemester 201329. Mai 2013 – Die Text Encoding Initiative (TEI)
  2. 2. „Die Text Encoding Initiative (TEI)“ Frage- und Problemstellung Die TEI und ihre Intention Konsortium und Standard Eine kurze (Versions)Geschichte der TEI Elemente der TEI Praxis: Einen nach den Regeln der TEI ausgezeichneten Texterweitern Zugriff auf ein TEI-konformes XML-Dokument mit XSLT &Co.Sitzungsüberblick
  3. 3. Frage- und Problemstellung:Wie lassen sich mit einem Standardsämtliche in den Geisteswissenschaftenzu behandelnden Texte beschreiben?
  4. 4. Hugo von Hofmannsthal – Die BeidenSie trug den Becher in der Hand– Ihr Kinn und Mund glich seinem Rand –,So leicht und sicher war ihr Gang,Kein Tropfen aus dem Becher sprang.So leicht und fest war seine Hand:Er ritt auf einem jungen Pferde,Und mit nachlässiger GebärdeErzwang er, daß es zitternd stand.Jedoch, wenn er aus ihrer HandDen leichten Becher nehmen sollte,So war es beiden allzu schwer:Denn beide bebten sie so sehr,Daß keine Hand die andre fandUnd dunkler Wein am Boden rollte.
  5. 5. Hugo von Hofmannsthal – Die BeidenSie trug den Becher in der Hand– Ihr Kinn und Mund glich seinem Rand –,So leicht und sicher war ihr Gang,Kein Tropfen aus dem Becher sprang.So leicht und fest war seine Hand:Er ritt auf einem jungen Pferde,Und mit nachlässiger GebärdeErzwang er, daß es zitternd stand.Jedoch, wenn er aus ihrer HandDen leichten Becher nehmen sollte,So war es beiden allzu schwer:Denn beide bebten sie so sehr,Daß keine Hand die andre fandUnd dunkler Wein am Boden rollte.VersStrophe
  6. 6. Codices Electronici Ecclesiae Coloniensis (CEEC) http://www.ceec.uni-koeln.de/
  7. 7. vdIb - Verteilte Digitale Inkunabelbibliothek http://inkunabeln.ub.uni-koeln.de/
  8. 8. Glenn Ligon (b. 1960), Untitled (I Am a Man), 1988. Oil and enamel on canvas. 40 × 25in. (101.6 × 63.5 cm). http://whitney.org/WatchAndListen/AudioGuides?play_id=370
  9. 9. Die Text Encoding Initiative
  10. 10. Eine Lösung: TEI (Text Encoding Initiative) Fokus: TextTEI bezeichnet sowohl das Konsortium (TEI-C), als auch einen Standard zur Kodierung und zum Austausch vonTextdokumenten„TEI hat ein unabhängiges, portables und offenes Format [für die]Speicherung, Austausch und Analyse von Texten in denGeisteswissenschaften entwickelt. Das konkrete Resultat dieserArbeit sind sowohl Richtlinien für die Kodierung unterschiedlicherTextsorten als auch das Textkodierungsformat selber.“(http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html) Richtlinien und Format sind frei zugänglich und kostenlosText Encoding Initiative (TEI)
  11. 11. Geschichte: 1987 entstanden als internationale Initiative vonPhilologinnen und Philologen Dokumentenformat zur Repräsentation von Texten indigitaler Form Vielseitigkeit & PraxisnäheDifferenzierung: TEI bezeichnet sowohl das Konsortium (TEI-C), 2000 gegründet als auch Richtlinien und Empfehlungen zur Kodierungund zum Austausch von Textdokumenten.Intention: Geisteswissenschaftlerinnen undGeisteswissenschaftler sollen über größtmögliche Freiheitverfügen, textuell vorliegende Information nach eigenemTextbegriff in XML zu codieren.Text Encoding Initiative (TEI)
  12. 12. Versionsgeschichte 1990: TEI P1 (P => Proposal, Entwurf / Plan)Basiert auf SGML (Standard Generalized MarkupLanguage) 1992 / 1993: TEI P2 1994: TEI P3 ("Green Books") 2002: TEI P4 (XML-basiert) 2002: TEI Lite 2007 TEI P5Die Text Encoding Initiative
  13. 13. Standards und Guidelines Standards der TEI schränken die schier unendlichenAuszeichnungsmöglichkeiten von XML ein. Dabei stellensich die folgenden Grundfragen: Welche Tags und welche Attribute lassen sich verwenden,um eigene Texte auszuzeichnen? Wie lassen sich die Tags miteinander kombinieren /verschachteln? Überblick über Richtlinien, z.B. für TEI P5: http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1641Seiten)Die Text Encoding Initiative
  14. 14. Modularisierung Flexible Auswahl von TEI-Elementen aufgrund desmodularen Charakters der TEI. So muss ein eigenesSchema nicht alle Elemente und Attribute der TEIenthalten. Module, u.a.: core für Basiselemente header für Metadaten textstructure für grundlegende Textstrukturen drama für Dramen prose, poetry, etc.Die Text Encoding Initiative
  15. 15. TEI und oXygen:Alternativ: Angepasste Schemata generieren mithttp://www.tei-c.org/RomaDie Text Encoding Initiative
  16. 16. Verortung:Die Text Encoding InitiativeEAD: Encoded Archival DescriptionMETS: Metadata Encoding and Transmission Standard
  17. 17. TEI – Praxis
  18. 18. Aufbau und Elemente einesTEI-Dokumentes: Wurzelelement: <TEI> Enthält mindestens <teiHeader> (obligatorisch) <text>und / oder <facsimile> (Verknüpfung mitBildmaterialien)oder <fsdDecl> (u.a. für Textanalysen)Die Text Encoding Initiative
  19. 19. <teiHeader> Enthält Metadaten zum Text: Autorin / Autor, Titel,Erstellungsdatum, etc. Vier Teile: <fileDesc> (obligatorisch) <encodingDesc> (fakultativ) <profileDesc> (fakultativ) <revisionDesc> (fakultativ)Die Text Encoding Initiative
  20. 20. <fileDesc> Bibliographische Beschreibungdes TEI-Dokumentes (Autor, Titel,Editor, Projekt, Erstellungsdatumusw.) Beschreibung der Quelle(n), einerHandschrift, eines Archivguts usw. Muss enthalten: <titleStmt>, <publicationStmt>,<sourceDesc> Kann enthalten: <editionStmt>, <extent>,<seriesStmt>, <notesStmt>Die Text Encoding Initiative
  21. 21. Grundlage der folgenden Übungen ist Goethes Elegie „Alexis und Dora“, wie siesich unter http://ora-web.swkk.de/digimo_online/digimo.entry?source=digimo.Digitalisat_anzeigen&a_id=4557&p_ab=0 findet. Erstellen Sie in „oXygen“ ein TEI-Dokument nach der Vorlage „TEI P5 All“. Bilden Sie den Titel „Alexis und Dora“ und den Namen des Autors („JohannWolfgang von Goethe“) über <titleStmt> ab. Füllen Sie <publicationStmt> mit einer kurzen Beschreibung über IhrCodierungsprojekt. Das Gedicht findet sich im 1797 von Friedrich Schiller herausgegebenen, inTübingen veröffentlichten, „Musen-Almanach“. Bilden Sie diesebibliographischen Informationen über <sourceDesc> ab.Tipp: Ein Codierungsbeispiel für Hugo von Hofmannsthals „Die Beiden“ findet sichunter http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html. Informationenzu den TEI-Elementen lassen sich unter http://www.tei-c.org/release/doc/tei-p5-doc/de/html/ref-publicationStmt.html aufrufen.Übung I
  22. 22. <text> Enthält den eigentlichen Text: <body> (obligatorisch) <front> und / oder <back> (fakultativ)Gliederungselemente in <body>: <div> Abschnitte im Dokument (Kapitel, unterschiedlicheGedichte, etc.). Attribute: n (Nummerierung) type („book“, „chapter“, „poem“) <head> (Kopfbereich, Beschreibung des (hier:) Gedichtes) <lg> (Line Group), Abschnitte des Gedichtes (i.e. Strophen) type („stanza“, „para“, etc. Vgl.: http://www.tei-c.org/release/doc/tei-p5-doc/en/html/examples-lg.html) <l> (Line), Verse des GedichtesDie Text Encoding Initiative
  23. 23.  Bilden Sie die Verse und Strophen der Elegie„Alexis und Dora“ mit Ihrem TEI-Dokument ab. Fortgeschritten (!): Erstellen Sie ein XSLT-Stylesheet, das aus dem TEI-Dokument einHTML-Dokument erstellt.Übung II
  24. 24. /

×