Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Dr. Jan G. Wieners // jan.wieners@uni-koe...
 „BAM“-Sektor: Bibliotheken, Archive, Museen
 Digitale Bibliotheken, Digitale Archive, Digitale Museen
 Bibliographisch...
Digitale Bibliothek
Vannevar Bush(1890-1974)
Sammlung digitaler Objekte
 Text
 Video
 Audio
 3D Objekte
 Simulationen, VR, etc.
Bereitstellung von Zugriffsmöglich...
Arten von Metadaten:
 Administrative metadata for managing resources, such as
rights information
 Descriptive metadata f...
Arten von Metadaten:
 Administrative metadata for managing resources, such as
rights information
 Descriptive metadata f...
 MARC
 MAB
 MARCXML
 Dublin Core (DC)
 Metadata Object Description Schema: MODS
 METS/MODS
Bibliographische Metadate...
MARC
MARC: MAchine Readable Cataloging
 Vorgestellt in den späten 1960er Jahren von Henriette Avram
(Library of Congress)
 !G...
Beispiel: http://catalog2.loc.gov
MARC
 Variable Control Fields (00x)
 Variable Data Fields
 Numbers and Codes (0xx)
 Main Entries (1xx)
 Titles (2xx)
 Edi...
MARCXML-Darstellung
MARCXML
Vorteile?
MARCXML  Dublin Core
http://lccn.loc.gov/79459272/dc
Satz von 15 Elementen zur Beschreibung von Ressourcen:
 Title
 Creator
 Subject
 Description
 Publisher
 Contributor...
Maschinelles Austauschformat für Bibliotheken
(MAB),
 MAB  1970er, Deutsche Nationalbibliothek
 MAB2  1990er
 Verwend...
Intention: Digitalisierung und Erschließung der im
deutschen Sprachraum veröffentlichten Drucke des
18. Jahrhunderts
Konte...
VD18 – Arbeitsaufteilung / Workflow
SWB
KoordinierungsDB
VD18: Daten
Digitale Objekte:
METS / MODS
Problemstellung
 Zwei sich ergänzende internationale Formate zur
Kodierung von Metadaten und digitalen Objekten, die
aus mehreren Teilen ...
Sieben Hauptabschnitte:
 Kopfteil (METS Header)
 Erschließungsangaben (Descriptive Metadata)
 Verwaltungsangaben (Admin...
Einheitliches Strukturieren: Standards
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und ...
Hugo von Hofmannsthal – Die Beiden
Sie trug den Becher in der Hand
– Ihr Kinn und Mund glich seinem Rand –,
So leicht und ...
Ein Standard von dem man unbedingt ‘mal gehört haben muss:
Die Text Encoding Initiative (TEI)
Eine Lösung: TEI (Text Encoding Initiative)
 Fokus: Text
TEI bezeichnet sowohl
 das Konsortium (TEI-C),
 als auch einen...
Geschichte:
 1987 entstanden als internationale Initiative von
Philologinnen und Philologen
 Dokumentenformat zur Repräs...
Versionsgeschichte
 1990: TEI P1 (P => Proposal, Entwurf / Plan)
Basiert auf SGML (Standard Generalized Markup
Language)
...
http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1646 Seiten)
Modularisierung
 Flexible Auswahl von TEI-Elementen aufgrund des
modularen Charakters der TEI. So muss ein eigenes
Schema...
Verortung:
EAD: Encoded Archival Description
METS: Metadata Encoding and Transmission Standard
Datenhaltungsschicht: XML vs. JSON?
/
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Du...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Du...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Du...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Du...
Nächste SlideShare
Wird geladen in …5
×

SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.

537 Aufrufe

Veröffentlicht am

SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.

Veröffentlicht in: Bildung
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
537
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
38
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie
  • Vannevar Bush [ˌvæˈniː.vɚ] KBE (1890 in Everett, Massachusetts; † 30. Juni 1974 in Belmont, Massachusetts) war ein US-amerikanischer Ingenieur und Analogrechner-Pionier. Bush war eine der wichtigsten Personen der US-Kriegsführung im Zweiten Weltkrieg, er entwickelte in seinem 1945 publizierten Essay As we may think das Konzept des Memex (Memory Extender), der als ein Vorläufer des Personal Computers und des Hypertextes gilt.
  • Der Memex (Memory Extender; dt. etwa: Gedächtnis-Erweiterer) ist ein als möglichst menschengerechtes, einfach bedienbares Wissensfindungs- und Verwertungssystem konzipierter Kompakt-Analog-Rechner, der 1945 von Vannevar Bush im Artikel As We May Think (Atlantic Monthly, Juli 1945, S. 101 ff.) fiktiv vorgestellt wurde.
  • Grundfrage: Woher stammen die Metadaten?

    Option I: Ein Mensch hat festgelegt, dass x  Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu.

    Option II: Ein Computerprogramm hat x analysiert und bestimmt  Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus.
  • Benannt nach Dublin, Ohio, wo 1995 das erste Treffen der Gruppe / Initiative veranstaltet wurde.
    Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für
    Nutzung durch Nicht-Spezialisten
    die Beschreibung digitaler Ressourcen (i.e. Websites), die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden
    Verglichen mit MARC: Sehr einfach
    Designziel: Allgemeinheit, Einfachheit
  • Jean-Michel Basquiat
  • Geschichte:
    1987 entstanden als internationale Initiative von Philologinnen und Philologen
    Dokumentenformat zur Repräsentation von Texten in digitaler Form
    Vielseitigkeit & Praxisnähe

    Differenzierung: TEI bezeichnet sowohl
    das Konsortium (TEI-C), 2000 gegründet
    als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren.
  • Standards und Guidelines
    Standards der TEI schränken die schier unendlichen Auszeichnungsmöglichkeiten von XML ein. Dabei stellen sich die folgenden Grundfragen:
    Welche Tags und welche Attribute lassen sich verwenden, um eigene Texte auszuzeichnen?
    Wie lassen sich die Tags miteinander kombinieren / verschachteln?
    Überblick über Richtlinien, z.B. für TEI P5: http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1641 Seiten)
  • BAMS-Sektor
  • SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.

    1. 1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Dr. Jan G. Wieners // jan.wieners@uni-koeln.de Tools & Methods in Digital Humanities Sommersemester 2015 09. Juni 2015 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core, TEI & Co.
    2. 2.  „BAM“-Sektor: Bibliotheken, Archive, Museen  Digitale Bibliotheken, Digitale Archive, Digitale Museen  Bibliographische Metadaten  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema (MODS)  Digitale Objekte  Metadata Encoding and Transmission Standard (METS)  Ein (DER) Standard zur Codierung von Texten: TEI Überblick / ToDo
    3. 3. Digitale Bibliothek
    4. 4. Vannevar Bush(1890-1974)
    5. 5. Sammlung digitaler Objekte  Text  Video  Audio  3D Objekte  Simulationen, VR, etc. Bereitstellung von Zugriffsmöglichkeiten:  Benutzerseite:  Zugriff (access)  Abfrage (retrieval) von digitalen Objekten  Bibliothekarinnen-/Bibliothekarseite:  Selection  Organization  Maintenance Metadaten  Kritisch für alle Formen organisierter digitaler Inhalte Digitale Bibliothek
    6. 6. Arten von Metadaten:  Administrative metadata for managing resources, such as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”
    7. 7. Arten von Metadaten:  Administrative metadata for managing resources, such as rights information  Descriptive metadata for describing resources (Beispiel: Zettel des Zettelkataloges)  Preservation metadata for describing resources, such as recording preservation actions  Technical metadata related to low-level system information, such as data formats and any data compression used  Usage metadata related to system use, such as tracking user behavior  “End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display” Metadaten
    8. 8.  MARC  MAB  MARCXML  Dublin Core (DC)  Metadata Object Description Schema: MODS  METS/MODS Bibliographische Metadaten: Standards, eine Auswahl
    9. 9. MARC
    10. 10. MARC: MAchine Readable Cataloging  Vorgestellt in den späten 1960er Jahren von Henriette Avram (Library of Congress)  !Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)  MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“ [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]  “Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R  final revised 2nd edition).” [Witten, Bainbridge, Nichols (2010): How to Build a Digital Library] MARC
    11. 11. Beispiel: http://catalog2.loc.gov MARC
    12. 12.  Variable Control Fields (00x)  Variable Data Fields  Numbers and Codes (0xx)  Main Entries (1xx)  Titles (2xx)  Edition, Imprint, etc. (2xx)  Physical Description, etc. (3xx)  Series Statements (4xx)  Notes (5xx)  […]  Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html MARC Tags (die Spitze des Eisbergs)
    13. 13. MARCXML-Darstellung MARCXML Vorteile?
    14. 14. MARCXML  Dublin Core http://lccn.loc.gov/79459272/dc
    15. 15. Satz von 15 Elementen zur Beschreibung von Ressourcen:  Title  Creator  Subject  Description  Publisher  Contributor  Date  Type  Format  Identifier  Source  Language  Relation  Coverage  Rights  Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig Dublin Core
    16. 16. Maschinelles Austauschformat für Bibliotheken (MAB),  MAB  1970er, Deutsche Nationalbibliothek  MAB2  1990er  Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung) Kleiner Exkurs: MAB und VD18
    17. 17. Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke des 18. Jahrhunderts Kontext VD18 VD 16 VD 17 VD 18 ~100 000 erfasste Titel ~255 000 Titel Ziel: Mehr als 600 000 Titel Förderzeitraum: 1969- 1999 Förderzeitraum: Seit Juli 1996 Förderzeitraum: Ab 2009
    18. 18. VD18 – Arbeitsaufteilung / Workflow SWB KoordinierungsDB
    19. 19. VD18: Daten
    20. 20. Digitale Objekte: METS / MODS
    21. 21. Problemstellung
    22. 22.  Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS):  Metadata Encoding and Transmission Standard (METS)  Metadata Object Description Schema (MODS)  Heimat von METS: http://www.loc.gov/standards/mets/  METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.” METS / MODS
    23. 23. Sieben Hauptabschnitte:  Kopfteil (METS Header)  Erschließungsangaben (Descriptive Metadata)  Verwaltungsangaben (Administrative Metadata)  Dateienabschnitt (File Section)  Strukturbeschreibung (Structural Map)  Strukturverknüpfungen (Structural Links)  Verhalten (Behavior) Ein Beispiel:  http://vd18-proto.bibliothek.uni-halle.de/de-slub- vd18/oai/?verb=GetRecord&metadataPrefix=mets&mode =view&identifier=5270690 METS / MODS
    24. 24. Einheitliches Strukturieren: Standards
    25. 25. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte.
    26. 26. Hugo von Hofmannsthal – Die Beiden Sie trug den Becher in der Hand – Ihr Kinn und Mund glich seinem Rand –, So leicht und sicher war ihr Gang, Kein Tropfen aus dem Becher sprang. So leicht und fest war seine Hand: Er ritt auf einem jungen Pferde, Und mit nachlässiger Gebärde Erzwang er, daß es zitternd stand. Jedoch, wenn er aus ihrer Hand Den leichten Becher nehmen sollte, So war es beiden allzu schwer: Denn beide bebten sie so sehr, Daß keine Hand die andre fand Und dunkler Wein am Boden rollte. Vers Strophe
    27. 27. Ein Standard von dem man unbedingt ‘mal gehört haben muss: Die Text Encoding Initiative (TEI)
    28. 28. Eine Lösung: TEI (Text Encoding Initiative)  Fokus: Text TEI bezeichnet sowohl  das Konsortium (TEI-C),  als auch einen Standard zur Kodierung und zum Austausch von Textdokumenten „TEI hat ein unabhängiges, portables und offenes Format [für die] Speicherung, Austausch und Analyse von Texten in den Geisteswissenschaften entwickelt. Das konkrete Resultat dieser Arbeit sind sowohl Richtlinien für die Kodierung unterschiedlicher Textsorten als auch das Textkodierungsformat selber.“ (http://www.onb.ac.at/sichtungen/print/bruvik-tm-1a-print.html)  Richtlinien und Format sind frei zugänglich und kostenlos Text Encoding Initiative (TEI)
    29. 29. Geschichte:  1987 entstanden als internationale Initiative von Philologinnen und Philologen  Dokumentenformat zur Repräsentation von Texten in digitaler Form  Vielseitigkeit & Praxisnähe Differenzierung: TEI bezeichnet sowohl  das Konsortium (TEI-C), 2000 gegründet  als auch Richtlinien und Empfehlungen zur Kodierung und zum Austausch von Textdokumenten. Intention: Geisteswissenschaftlerinnen und Geisteswissenschaftler sollen über größtmögliche Freiheit verfügen, textuell vorliegende Information nach eigenem Textbegriff in XML zu codieren. Text Encoding Initiative (TEI)
    30. 30. Versionsgeschichte  1990: TEI P1 (P => Proposal, Entwurf / Plan) Basiert auf SGML (Standard Generalized Markup Language)  1992 / 1993: TEI P2  1994: TEI P3 ("Green Books")  2002: TEI P4 (XML-basiert)  2002: TEI Lite  2007 TEI P5 Die Text Encoding Initiative
    31. 31. http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf (1646 Seiten)
    32. 32. Modularisierung  Flexible Auswahl von TEI-Elementen aufgrund des modularen Charakters der TEI. So muss ein eigenes Schema nicht alle Elemente und Attribute der TEI enthalten.  Module, u.a.:  core für Basiselemente  header für Metadaten  textstructure für grundlegende Textstrukturen  drama für Dramen  prose, poetry, etc. Die Text Encoding Initiative
    33. 33. Verortung: EAD: Encoded Archival Description METS: Metadata Encoding and Transmission Standard
    34. 34. Datenhaltungsschicht: XML vs. JSON?
    35. 35. /

    ×