Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 1
Linus Kohl
Metadaten
Museum Digital, 2014
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 2
Definition
Metadaten sind strukturierte Informationen, die
Primärdokumente beschreiben, erklären, lokalisieren und
zur Recherche, Auffindung und Verwaltung dieser dienen
Anne Gilliland-Swetland in Introduction to Metadata
Beispiel Kunstwerk
Titel, Künstler, Standort, Datierung, Material
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 3
Zweck

Erstellen einer digitalen Identität

Elektronische Inhalte Organisieren

Inhalte leichter finden

Interoperabilität erhöhen

Unterstützung bei der Archivierung und Erhaltung
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 4
Schema

Formale Beschreibung einer Struktur von Daten

Tupel (Attribut,Datenfeld)

Zuweisung Attribut → Datentyp
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 5
RDF Resource Description Framework

Allgemeiner Syntax zur Strukturierung von
Informationen

Triple
Gerichteter Graph: Subjekt → Prädikat → Objekt
Kunstwerk → Künstler → 'Michelangelo Buonarroti'
Kunstwerk → Titel → 'Die Erschaffung Adams'
Kunstwerk → Standort → Standort → Adresse → Strasse

URIs
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 6
URI Uniform Resource Identifier
Namensräume

Eindeutiger Identifikator für Ressourcen
http://schema.org/Person

Innerhalb eines Namensraumes sind alle Bezeichnungen
einzigartig
Adress, Email, Name,...

Zuweisung von Präfixen
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 7
Dublin Core

DC Namensraum

Vokabular zur standardisierten Beschreibung

15 Elemente (identifier, creator, title,...)

Alle optional
Qualified Dublin Core

Erweiterung Dublin Core

55 Elemente (available, modified, provenance,...)
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 8
XML Extensible Markup Language

Hierarchisch strukturierte Daten

Etabliert für Austausch zwischen Anwendungen
<Adresse>
<Strasse>Geschwister-Scholl-Platz</Strasse>
<Hausnummer>1</Hausnummer>
<PLZ>80539</PLZ>
<Ort>München</Ort>
</Adresse>
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 9
RDF/XML DC Beispiel
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/">
<rdf:Description>
<dc:identifier>/api/record/2023822/</dc:identifier>
<dc:title>Die Erschaffung Adams</dc:title>
<dc:creator>Michelangelo Buonarroti</dc:creator>
<dc:format>Image</dc:format>
</rdf:Description>
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 10
Notwendigkeit Metadaten für Museen

Öffnung Datenbasis nach aussen
→ Öffentlichen Zugang zum kulturellen Erbe

Aggregation in Verbunddatenbanken
→ Auffindbarkeit erleichtern
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 11
Anforderungen für Museen

Publikation von vollen, deskriptiven Information zu
Objekten aus verschiedenen Bereichen

Konsistente Daten zur übergreifenden Suche

Objektinformation soll auch ausserhalb der eigenen
Sammlungsdatenbank verständlich sein
→ Notwendigkeit eines allgemeinen Ansatzes

unterschiedliche Sammlungen, Objektklassen
Datenstrukturen, Software-Systeme
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 12
CIDOC Conceptual Reference Model

Ontologie für Begriffe und Informationen im
Kulturbereich

Ereignis-zentrische Modelierung
Kein Erzeugungsdatum, sondern Ereignis der Erzeugung
P47F.is_identified_by
TA 959a (E42.Object_Identifier)
P49F.has_former_or_current_keeper
Museum Benaki (E40.Legal_Body)
P108B.was_produced_by
<Creation of Epitaphios GE34604> (E12.Production) ← Ereignis
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 13
CDWA Light Categories for the Description of Works of Art

XML Schema Spezifikation für Kunst/Kultur Objekte

Ziel Beständigkeit und Integrität von Daten erhöhen

Verwendung innerhalb der Open Archives Initiative
<cdwalite:objectWorkTypeWrap>
<cdwalite:objectWorkType termsource="AAT">
painting ← Art & Architecture Thesaurus
</cdwalite:objectWorkType>
<cdwalite:objectWorkType termsource="AAT">
altarpiece
</cdwalite:objectWorkType>
</cdwalite:objectWorkTypeWrap>
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 14
Museumdat

Übertragung von Kerndaten an Museumsportale

Erweiterung von CDWA Lite

Kompatibel zu CIDOC, Ereignis Orientiert

Pflichtfelder
Objekttyp, Objektname, Datensatz-ID, Datensatz-Typ, Datensatzquelle

Trennung
deskriptive metadaten <> administrative metadaten
dargestellte daten <> indizierte daten
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 15
LIDO Lightweight Information Describing Objects

Integriertes Schema von CIDOC, CDWA Lite,
Museumdat und SPECTRUM

Hoher Verbreitungsgrad
http://www.lido-schema.org/documents/examples/LIDO-Example_FMobj00154983-LaPrimavera.xml
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 16
LIDO Attribute
Objekt Klassifikation
Objekt/Arbeits Typ
Klassifikation
Objekt Identifikation
Titel/Name
Inschriften
Archiv/Standort
Zustand/Ausgabe
Objektbeschreibung
Maße
Ereignisse
Ereignisse
Verbindungen
Ähnliche Werke
Themen
Administrative Metadaten
Rechte
Datensatz-Nr.
Quelle
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 17
LIDO Lightweight Information Describing Objects

Bezüge Objekt zu Personen, Zeiten, Orten über
Ereignisse gespeichert

Objekt beteiligt an Ereignis
Herstellung, Fund, Gebrauch, Erwerb

Mit Person

Zu einer Zeit

An einem Ort
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 18
LIDO Beispiel
objectWorkType: Fresko
title: Die Erschaffung Adams
event ← Modellierung über Ereignisse
eventType Herstellung
eventActor
displayActorInRole Michelangelo Buonarroti ← Trennung Darstellung/Daten
actorInRole
actor
nameActor Buonarroti, Michelangelo
roleActor Painter
eventDate
displayDate ab 1508
date
earliestDate 1508
latestDate 1512
eventPlace
place
namePlace Vatikanstadt
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 19
LIDO Verbesserungen

Referenzierung von Vokabularen

Mehrsprachige Angaben

Trennung Darstellung / Information

Ereignisorientierte Modellierung
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 20
OAI Open Archive Initiative

“low-barrier” Spezifikation zum Austausch von
Metadaten
→ OAI-PMH Protocol for Metadata Harvesting

XML basierte REST API

Multi-Tier Architektur (Anbieter, Aggregatoren, Nutzer)

Anfragen
Identify, ListRecords, GetRecords

Parameter
baseUrl, from & until date, metadataPrefix, sets
http://data.fitzmuseum.cam.ac.uk/oai/?verb=ListRecords&metadataPrefix=pnds_dc
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 21
Anfragesprachen | REST

Representational State Transfer

HTTP Basiert

Leichte Anbindung
http://www.europeana.eu/api/v2/search.json
?wskey=xxxxxxxxx
&qf=YEAR:[1910 TO 1920]
&query=Mona Lisa
http://labs.europeana.eu/api/console/
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 22
Anfragesprachen | SPARQL
Anfragesprache für RDF Systeme, z.B. CIDOC
PREFIX crm: <http://erlangen-crm.org/current/> ← Namensräume
SELECT DISTINCT ?object {
?object crm:P102_has_title ?title . ←Titel des Objektes
?title rdfs:label ?label . ←Label des Titel Elements
FILTER(REGEX(?label, "Mona Lisa")) ←Label die Mona Lisa enthalten
}
Museum Digital, 2014
Linus Kohl -14.05.2014 Folie 23
Fragen

Museum Digital - Metadaten

  • 1.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 1 Linus Kohl Metadaten Museum Digital, 2014
  • 2.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 2 Definition Metadaten sind strukturierte Informationen, die Primärdokumente beschreiben, erklären, lokalisieren und zur Recherche, Auffindung und Verwaltung dieser dienen Anne Gilliland-Swetland in Introduction to Metadata Beispiel Kunstwerk Titel, Künstler, Standort, Datierung, Material
  • 3.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 3 Zweck  Erstellen einer digitalen Identität  Elektronische Inhalte Organisieren  Inhalte leichter finden  Interoperabilität erhöhen  Unterstützung bei der Archivierung und Erhaltung
  • 4.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 4 Schema  Formale Beschreibung einer Struktur von Daten  Tupel (Attribut,Datenfeld)  Zuweisung Attribut → Datentyp
  • 5.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 5 RDF Resource Description Framework  Allgemeiner Syntax zur Strukturierung von Informationen  Triple Gerichteter Graph: Subjekt → Prädikat → Objekt Kunstwerk → Künstler → 'Michelangelo Buonarroti' Kunstwerk → Titel → 'Die Erschaffung Adams' Kunstwerk → Standort → Standort → Adresse → Strasse  URIs
  • 6.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 6 URI Uniform Resource Identifier Namensräume  Eindeutiger Identifikator für Ressourcen http://schema.org/Person  Innerhalb eines Namensraumes sind alle Bezeichnungen einzigartig Adress, Email, Name,...  Zuweisung von Präfixen
  • 7.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 7 Dublin Core  DC Namensraum  Vokabular zur standardisierten Beschreibung  15 Elemente (identifier, creator, title,...)  Alle optional Qualified Dublin Core  Erweiterung Dublin Core  55 Elemente (available, modified, provenance,...)
  • 8.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 8 XML Extensible Markup Language  Hierarchisch strukturierte Daten  Etabliert für Austausch zwischen Anwendungen <Adresse> <Strasse>Geschwister-Scholl-Platz</Strasse> <Hausnummer>1</Hausnummer> <PLZ>80539</PLZ> <Ort>München</Ort> </Adresse>
  • 9.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 9 RDF/XML DC Beispiel <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/"> <rdf:Description> <dc:identifier>/api/record/2023822/</dc:identifier> <dc:title>Die Erschaffung Adams</dc:title> <dc:creator>Michelangelo Buonarroti</dc:creator> <dc:format>Image</dc:format> </rdf:Description>
  • 10.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 10 Notwendigkeit Metadaten für Museen  Öffnung Datenbasis nach aussen → Öffentlichen Zugang zum kulturellen Erbe  Aggregation in Verbunddatenbanken → Auffindbarkeit erleichtern
  • 11.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 11 Anforderungen für Museen  Publikation von vollen, deskriptiven Information zu Objekten aus verschiedenen Bereichen  Konsistente Daten zur übergreifenden Suche  Objektinformation soll auch ausserhalb der eigenen Sammlungsdatenbank verständlich sein → Notwendigkeit eines allgemeinen Ansatzes  unterschiedliche Sammlungen, Objektklassen Datenstrukturen, Software-Systeme
  • 12.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 12 CIDOC Conceptual Reference Model  Ontologie für Begriffe und Informationen im Kulturbereich  Ereignis-zentrische Modelierung Kein Erzeugungsdatum, sondern Ereignis der Erzeugung P47F.is_identified_by TA 959a (E42.Object_Identifier) P49F.has_former_or_current_keeper Museum Benaki (E40.Legal_Body) P108B.was_produced_by <Creation of Epitaphios GE34604> (E12.Production) ← Ereignis
  • 13.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 13 CDWA Light Categories for the Description of Works of Art  XML Schema Spezifikation für Kunst/Kultur Objekte  Ziel Beständigkeit und Integrität von Daten erhöhen  Verwendung innerhalb der Open Archives Initiative <cdwalite:objectWorkTypeWrap> <cdwalite:objectWorkType termsource="AAT"> painting ← Art & Architecture Thesaurus </cdwalite:objectWorkType> <cdwalite:objectWorkType termsource="AAT"> altarpiece </cdwalite:objectWorkType> </cdwalite:objectWorkTypeWrap>
  • 14.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 14 Museumdat  Übertragung von Kerndaten an Museumsportale  Erweiterung von CDWA Lite  Kompatibel zu CIDOC, Ereignis Orientiert  Pflichtfelder Objekttyp, Objektname, Datensatz-ID, Datensatz-Typ, Datensatzquelle  Trennung deskriptive metadaten <> administrative metadaten dargestellte daten <> indizierte daten
  • 15.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 15 LIDO Lightweight Information Describing Objects  Integriertes Schema von CIDOC, CDWA Lite, Museumdat und SPECTRUM  Hoher Verbreitungsgrad http://www.lido-schema.org/documents/examples/LIDO-Example_FMobj00154983-LaPrimavera.xml
  • 16.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 16 LIDO Attribute Objekt Klassifikation Objekt/Arbeits Typ Klassifikation Objekt Identifikation Titel/Name Inschriften Archiv/Standort Zustand/Ausgabe Objektbeschreibung Maße Ereignisse Ereignisse Verbindungen Ähnliche Werke Themen Administrative Metadaten Rechte Datensatz-Nr. Quelle
  • 17.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 17 LIDO Lightweight Information Describing Objects  Bezüge Objekt zu Personen, Zeiten, Orten über Ereignisse gespeichert  Objekt beteiligt an Ereignis Herstellung, Fund, Gebrauch, Erwerb  Mit Person  Zu einer Zeit  An einem Ort
  • 18.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 18 LIDO Beispiel objectWorkType: Fresko title: Die Erschaffung Adams event ← Modellierung über Ereignisse eventType Herstellung eventActor displayActorInRole Michelangelo Buonarroti ← Trennung Darstellung/Daten actorInRole actor nameActor Buonarroti, Michelangelo roleActor Painter eventDate displayDate ab 1508 date earliestDate 1508 latestDate 1512 eventPlace place namePlace Vatikanstadt
  • 19.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 19 LIDO Verbesserungen  Referenzierung von Vokabularen  Mehrsprachige Angaben  Trennung Darstellung / Information  Ereignisorientierte Modellierung
  • 20.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 20 OAI Open Archive Initiative  “low-barrier” Spezifikation zum Austausch von Metadaten → OAI-PMH Protocol for Metadata Harvesting  XML basierte REST API  Multi-Tier Architektur (Anbieter, Aggregatoren, Nutzer)  Anfragen Identify, ListRecords, GetRecords  Parameter baseUrl, from & until date, metadataPrefix, sets http://data.fitzmuseum.cam.ac.uk/oai/?verb=ListRecords&metadataPrefix=pnds_dc
  • 21.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 21 Anfragesprachen | REST  Representational State Transfer  HTTP Basiert  Leichte Anbindung http://www.europeana.eu/api/v2/search.json ?wskey=xxxxxxxxx &qf=YEAR:[1910 TO 1920] &query=Mona Lisa http://labs.europeana.eu/api/console/
  • 22.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 22 Anfragesprachen | SPARQL Anfragesprache für RDF Systeme, z.B. CIDOC PREFIX crm: <http://erlangen-crm.org/current/> ← Namensräume SELECT DISTINCT ?object { ?object crm:P102_has_title ?title . ←Titel des Objektes ?title rdfs:label ?label . ←Label des Titel Elements FILTER(REGEX(?label, "Mona Lisa")) ←Label die Mona Lisa enthalten }
  • 23.
    Museum Digital, 2014 LinusKohl -14.05.2014 Folie 23 Fragen