Linked Data und Digitalisierungsprojekte
Carsten Klee (ZDB)
5.Carsten Klee - Zeitschriftendatenbank S. 2
Linked Data
http://www.w3.org/DesignIssues/
 Verknüpfen von Daten über das Web
 alle "Dinge" werden mit einem URI identifiziert
 möglichst HTTP-URIs verwenden um LookUps zu ermöglichen
 eine Beschreibung des "Ding" in RDF (Resource)
 Links auf andere Resources um (auch unbekannte)
Informartionsbedarfe erfüllen zu können
5.Carsten Klee - Zeitschriftendatenbank S. 3
Vorteile von Linked Data (LD)
 Multilinguale Funktionalitäten wie multilinguale Bezeichnung
von Klassifikationsstellen, Metadatenelementen etc.
 Kollaborative Beschreibung von Ressourcen und einfache
Nachnutzung von Informationen aus anderen Quellen
 Einfache Zitierbarkeit von Beschreibungen
 Flexiblerer Datenaustausch
 Nicht gesamte Katalogeinträge müssen ausgetauscht werden,
sondern - je nach Anwendung und Bedarf - auch nur einzelne
Beschreibungsaspekte.
5.Carsten Klee - Zeitschriftendatenbank S. 4
LD für Bibliotheken I
 Auffindbarkeit von Bibliotheksdaten durch Suchmaschinen
 bibliothekarische Formate erschweren die Nachnutzung durch
externe Akteure
 Bibliotheksdaten eher semi-strukturiert und nicht für
maschinelle Verarbeitung optimiert.
 Technologische Veränderungen in der Bibliothekswelt hängen
von kommerziellen Softwareanbietern ab.
5.Carsten Klee - Zeitschriftendatenbank S. 5
LD für Bibliotheken II
 Bibliotheken beginnen ihre bibliographischen Daten in RDF zu
publizieren
 In vielen Bereichen ist LD aber immer noch nicht im
Bewusstsein von Bibliotheken angekommen (Digitalisierung)
 Gründe:
 LD wird nur als weiteren Metadatenstandard angesehen
 Datenschutz wird bei LD kritisch gesehen
 Ängste vor Verlust der Kontrolle über die Daten
 Rechte teils unklar, teilweise schwer zu managen
5.Carsten Klee - Zeitschriftendatenbank S. 6
Library Linked Data Incubator Group Final Report
http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/
 Mehrwerte nicht immer gleich erkennbar
 Verlinkung von Daten ist der wichtigste Faktor für eine
Annäherung an den Informationsbedarf des Nutzers
 Das Navigieren zwischen Bibliotheks- und anderen
Informationen wird immer fließender
 Verteilte Suchen werden besser und für den Nutzer gibt es
großen Mehrwert durch ein reicheres Kontextangebot
5.Carsten Klee - Zeitschriftendatenbank S. 7
LD für Bibliotheken III
 Aufgaben für Bibliotheken:
1. Veröffentlichung von Sammlungen als LD
 eventuell im Zusammenhang mit DDB und Europeana
1. Veröffentlichung von Thesauri, Normdatein, Mappings und
Services als LD
 z.B. Basisklassifikation (GBV)
http://id.loc.gov/vocabulary/classSchemes/bkl
1. Veröffentlichung von Best Practice Guides und Lessons
Learned
 z.B. DINI KIM Empfehlungen zur RDF-Repräsentation
bibliografischer Daten
http://nbn-resolving.de/urn:nbn:de:kobv:11-100212769
1. Bibliotheken sollten für "offene" Daten eintreten
5.Carsten Klee - Zeitschriftendatenbank S. 8
LD und Digitalisierung
 Leuchtturmprojekte
 Chronical of America http://chroniclingamerica.loc.gov/
 ZDW – Pressemappe 20. Jahrhundert
http://zbw.eu/labs/de/project/p20
5.Carsten Klee - Zeitschriftendatenbank S. 9
Beispiel Pressemappe 20. Jahrhundert I
 Ziele
1. Persistenter Identifier für Sammlung, Dossier, Dokument,
Seite und sogar Suchresultate (zum Zitieren und Verlinken
zum wissenschaftlichen Gebrauch)
2. Vernknüpfung von weiteren Webressourcen im Kontext der
Metadaten (als erweitertes Nutzungsangebot)
3. Gleichzeitig Unterstützung von Standard-Image und
-Metadatenviewern
4. Ermöglichen von automatisierten Harvesting und guter
Nachnutzbarkeit der Metadaten für Applikationen wie
Europeana oder Virtuelle Bibliotheken
5.Carsten Klee - Zeitschriftendatenbank S. 10
Beispiel Pressemappe 20. Jahrhundert II
 Einsatz von OAI-ORE
 defines standards for
the description and
exchange of
aggregations of Web
resources
 may combine
distributed resources
with multiple media
types
 Beschreibung von
Objekten, die aus
anderen Objekten
bestehen
http://challenge.semanticweb.org/submissions/swc2010_submission_6.pdf
5.Carsten Klee - Zeitschriftendatenbank S. 11
Europeana und EDM
http://pro.europeana.eu/carare-edm
 EDM – Europeana Data Model
 Brücke zwischen METS, LIDO, EAD und Europeana
 basiert auf OAI-ORE und CIDOC-CRM
 unterscheidet Objekt, Metadaten, Ansichten
 Verlinkung von Objekten, Events, Personen, Orte etc.
5.Carsten Klee - Zeitschriftendatenbank S. 12
EDM - Konzept
http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum-
heuristischen-potential-des-europeana-data-model
5.Carsten Klee - Zeitschriftendatenbank S. 13
EDM – Verschiedene "Sichten" auf ein Objekt
http://wiki.bib.uni-mannheim.de/dc-provenance/lib/exe/detail.php?
id=europeana_example&media=europeana-ore.png
5.Carsten Klee - Zeitschriftendatenbank S. 14
DM2E
http://dm2e.eu/
 Ziele: Erleichterung der Datenaggregation für Europeana und
Entwicklung von Tools für die Weiterbearbeitung u.a. von
digitalen Manuskripten
http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum-
heuristischen-potential-des-europeana-data-model
5.Carsten Klee - Zeitschriftendatenbank S. 15
DM2E
 Erweiterung und Spezifizierung von EDM
 Fokus auf digitalisierte Handschriften
http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum-
heuristischen-potential-des-europeana-data-model
5.Carsten Klee - Zeitschriftendatenbank S. 16
Worauf sollten Bibliotheken bei der Digitalisierung
achten?
 Definition der Functional Requirements (Was/nicht, für Wen,
Wie)
 Erstellung strukturierter Metadaten, Nutzung von
Normdateien
 Eindeutige Identifizierbarkeit von Metadaten-Entitäten
(Personen, Institutionen, Orte, Events)
 Eindeutige Identifizierbarkeit von Ressourcen/Objekten
(Sammlungen, Dokumente, Editionen, Seiten etc.)
 Formatunabhängige Datenhaltung (NoSQL-Datenbanken,
Solr, Elastic Search, Triple-Stores)
 METS ist ein sehr spezielles Austauschformat!!!!
 Wie seiht es mit den Rechten aus?
5.Carsten Klee - Zeitschriftendatenbank S. 17
Zusammenfassung
 LD bietet enorme Vorteile gegenüber konventionellen
Datenmanagement
 Vorteile nicht sind immer sichtbar (kein
 Mehrwerte gehen Hand in Hand mit der Verlinkung v. Daten,
"Freigabe" der Daten und Akzeptanz von LD einher
 Bibliotheken spielen eine wichtige (normierende) Rolle,
 tun sich allerdings schwer mit der Adaption
 OAI-ORE, EDM, DM2E bieten Lösungen für
Digitalisierungsprojekte
 Erfordert Annahme von neuen Technologien und Umdenken
beim Metadatenmanagement
5.Carsten Klee - Zeitschriftendatenbank S. 18
Vielen Dank für Ihre Aufmerksamkeit!
 Berners-Lee, Tim: Design Issues. http://www.w3.org/DesignIssues/
 Pohl, Adrian: Darum Linked Open Data.
http://www.uebertext.org/2011/09/darum-linked-open-data.html
 Byrne, Gillian; Goddard, Lisa: The Strongest Link: Libraries and
Linked Data.
http://www.dlib.org/dlib/november10/byrne/11byrne.html
 Library Linked Data Incubator Group: Final Report.
http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/
 Chronical of America. http://chroniclingamerica.loc.gov/
 Pressemappe 20. Jahrhundert. http://zbw.eu/labs/de/project/p20
 Europeana Data Model. http://pro.europeana.eu/carare-edm
 DM2E. http://dm2e.eu/

Linked data und digitalisierungsprojekte

  • 1.
    Linked Data undDigitalisierungsprojekte Carsten Klee (ZDB)
  • 2.
    5.Carsten Klee -Zeitschriftendatenbank S. 2 Linked Data http://www.w3.org/DesignIssues/  Verknüpfen von Daten über das Web  alle "Dinge" werden mit einem URI identifiziert  möglichst HTTP-URIs verwenden um LookUps zu ermöglichen  eine Beschreibung des "Ding" in RDF (Resource)  Links auf andere Resources um (auch unbekannte) Informartionsbedarfe erfüllen zu können
  • 3.
    5.Carsten Klee -Zeitschriftendatenbank S. 3 Vorteile von Linked Data (LD)  Multilinguale Funktionalitäten wie multilinguale Bezeichnung von Klassifikationsstellen, Metadatenelementen etc.  Kollaborative Beschreibung von Ressourcen und einfache Nachnutzung von Informationen aus anderen Quellen  Einfache Zitierbarkeit von Beschreibungen  Flexiblerer Datenaustausch  Nicht gesamte Katalogeinträge müssen ausgetauscht werden, sondern - je nach Anwendung und Bedarf - auch nur einzelne Beschreibungsaspekte.
  • 4.
    5.Carsten Klee -Zeitschriftendatenbank S. 4 LD für Bibliotheken I  Auffindbarkeit von Bibliotheksdaten durch Suchmaschinen  bibliothekarische Formate erschweren die Nachnutzung durch externe Akteure  Bibliotheksdaten eher semi-strukturiert und nicht für maschinelle Verarbeitung optimiert.  Technologische Veränderungen in der Bibliothekswelt hängen von kommerziellen Softwareanbietern ab.
  • 5.
    5.Carsten Klee -Zeitschriftendatenbank S. 5 LD für Bibliotheken II  Bibliotheken beginnen ihre bibliographischen Daten in RDF zu publizieren  In vielen Bereichen ist LD aber immer noch nicht im Bewusstsein von Bibliotheken angekommen (Digitalisierung)  Gründe:  LD wird nur als weiteren Metadatenstandard angesehen  Datenschutz wird bei LD kritisch gesehen  Ängste vor Verlust der Kontrolle über die Daten  Rechte teils unklar, teilweise schwer zu managen
  • 6.
    5.Carsten Klee -Zeitschriftendatenbank S. 6 Library Linked Data Incubator Group Final Report http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/  Mehrwerte nicht immer gleich erkennbar  Verlinkung von Daten ist der wichtigste Faktor für eine Annäherung an den Informationsbedarf des Nutzers  Das Navigieren zwischen Bibliotheks- und anderen Informationen wird immer fließender  Verteilte Suchen werden besser und für den Nutzer gibt es großen Mehrwert durch ein reicheres Kontextangebot
  • 7.
    5.Carsten Klee -Zeitschriftendatenbank S. 7 LD für Bibliotheken III  Aufgaben für Bibliotheken: 1. Veröffentlichung von Sammlungen als LD  eventuell im Zusammenhang mit DDB und Europeana 1. Veröffentlichung von Thesauri, Normdatein, Mappings und Services als LD  z.B. Basisklassifikation (GBV) http://id.loc.gov/vocabulary/classSchemes/bkl 1. Veröffentlichung von Best Practice Guides und Lessons Learned  z.B. DINI KIM Empfehlungen zur RDF-Repräsentation bibliografischer Daten http://nbn-resolving.de/urn:nbn:de:kobv:11-100212769 1. Bibliotheken sollten für "offene" Daten eintreten
  • 8.
    5.Carsten Klee -Zeitschriftendatenbank S. 8 LD und Digitalisierung  Leuchtturmprojekte  Chronical of America http://chroniclingamerica.loc.gov/  ZDW – Pressemappe 20. Jahrhundert http://zbw.eu/labs/de/project/p20
  • 9.
    5.Carsten Klee -Zeitschriftendatenbank S. 9 Beispiel Pressemappe 20. Jahrhundert I  Ziele 1. Persistenter Identifier für Sammlung, Dossier, Dokument, Seite und sogar Suchresultate (zum Zitieren und Verlinken zum wissenschaftlichen Gebrauch) 2. Vernknüpfung von weiteren Webressourcen im Kontext der Metadaten (als erweitertes Nutzungsangebot) 3. Gleichzeitig Unterstützung von Standard-Image und -Metadatenviewern 4. Ermöglichen von automatisierten Harvesting und guter Nachnutzbarkeit der Metadaten für Applikationen wie Europeana oder Virtuelle Bibliotheken
  • 10.
    5.Carsten Klee -Zeitschriftendatenbank S. 10 Beispiel Pressemappe 20. Jahrhundert II  Einsatz von OAI-ORE  defines standards for the description and exchange of aggregations of Web resources  may combine distributed resources with multiple media types  Beschreibung von Objekten, die aus anderen Objekten bestehen http://challenge.semanticweb.org/submissions/swc2010_submission_6.pdf
  • 11.
    5.Carsten Klee -Zeitschriftendatenbank S. 11 Europeana und EDM http://pro.europeana.eu/carare-edm  EDM – Europeana Data Model  Brücke zwischen METS, LIDO, EAD und Europeana  basiert auf OAI-ORE und CIDOC-CRM  unterscheidet Objekt, Metadaten, Ansichten  Verlinkung von Objekten, Events, Personen, Orte etc.
  • 12.
    5.Carsten Klee -Zeitschriftendatenbank S. 12 EDM - Konzept http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum- heuristischen-potential-des-europeana-data-model
  • 13.
    5.Carsten Klee -Zeitschriftendatenbank S. 13 EDM – Verschiedene "Sichten" auf ein Objekt http://wiki.bib.uni-mannheim.de/dc-provenance/lib/exe/detail.php? id=europeana_example&media=europeana-ore.png
  • 14.
    5.Carsten Klee -Zeitschriftendatenbank S. 14 DM2E http://dm2e.eu/  Ziele: Erleichterung der Datenaggregation für Europeana und Entwicklung von Tools für die Weiterbearbeitung u.a. von digitalen Manuskripten http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum- heuristischen-potential-des-europeana-data-model
  • 15.
    5.Carsten Klee -Zeitschriftendatenbank S. 15 DM2E  Erweiterung und Spezifizierung von EDM  Fokus auf digitalisierte Handschriften http://de.slideshare.net/DM2E/edm-und-dm2e-anmerkungen-zum- heuristischen-potential-des-europeana-data-model
  • 16.
    5.Carsten Klee -Zeitschriftendatenbank S. 16 Worauf sollten Bibliotheken bei der Digitalisierung achten?  Definition der Functional Requirements (Was/nicht, für Wen, Wie)  Erstellung strukturierter Metadaten, Nutzung von Normdateien  Eindeutige Identifizierbarkeit von Metadaten-Entitäten (Personen, Institutionen, Orte, Events)  Eindeutige Identifizierbarkeit von Ressourcen/Objekten (Sammlungen, Dokumente, Editionen, Seiten etc.)  Formatunabhängige Datenhaltung (NoSQL-Datenbanken, Solr, Elastic Search, Triple-Stores)  METS ist ein sehr spezielles Austauschformat!!!!  Wie seiht es mit den Rechten aus?
  • 17.
    5.Carsten Klee -Zeitschriftendatenbank S. 17 Zusammenfassung  LD bietet enorme Vorteile gegenüber konventionellen Datenmanagement  Vorteile nicht sind immer sichtbar (kein  Mehrwerte gehen Hand in Hand mit der Verlinkung v. Daten, "Freigabe" der Daten und Akzeptanz von LD einher  Bibliotheken spielen eine wichtige (normierende) Rolle,  tun sich allerdings schwer mit der Adaption  OAI-ORE, EDM, DM2E bieten Lösungen für Digitalisierungsprojekte  Erfordert Annahme von neuen Technologien und Umdenken beim Metadatenmanagement
  • 18.
    5.Carsten Klee -Zeitschriftendatenbank S. 18 Vielen Dank für Ihre Aufmerksamkeit!  Berners-Lee, Tim: Design Issues. http://www.w3.org/DesignIssues/  Pohl, Adrian: Darum Linked Open Data. http://www.uebertext.org/2011/09/darum-linked-open-data.html  Byrne, Gillian; Goddard, Lisa: The Strongest Link: Libraries and Linked Data. http://www.dlib.org/dlib/november10/byrne/11byrne.html  Library Linked Data Incubator Group: Final Report. http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/  Chronical of America. http://chroniclingamerica.loc.gov/  Pressemappe 20. Jahrhundert. http://zbw.eu/labs/de/project/p20  Europeana Data Model. http://pro.europeana.eu/carare-edm  DM2E. http://dm2e.eu/

Hinweis der Redaktion

  • #5 Bibliotheksdaten sind nicht im Web integriert und somit nicht durch die Webcrawler von Suchmaschinen auffindbar. Die Daten sind vielmehr Teil des Deep Webs. Die Standards für bibliothekarische Daten werden nur in der Bibliothekswelt benutzt. Dies erschwert deren Nachnutzung durch andere Akteure oder die Kombination mit Daten aus anderen Quellen. Bibliotheksdaten gleichen eher natürlichen als maschinenlesbaren Texten. Sie sind nur schwach strukturiert und nicht für maschinelle Verarbeitung optimiert. Technologische Veränderungen in der Bibliothekswelt hängen von kommerzielen Softwareanbietern ab.
  • #7 It may not be obvious to users of library and cultural institution services when Linked Data is being employed because the changes will lie "under the hood." As the underlying structured data becomes more richly linked, however, the user may notice improved capabilities for discovering and using data. Navigation across library and non-library information resources will become more sophisticated. Federated searches will improve through the use of links to expand indexes, and users will have a richer set of pathways for browsing.
  • #11 ORE - Object Reuse and Exchange
  • #16 Erkundung von Benutzungsszenarien für die kombinierten EDM-Metadaten und Objektdaten in einer Forschungsplattform auf Basis eines RDF-Graphenmodells für geisteswissenschaftliche Forschung mit semantischer Annotation und spezialisierten Visualisierungs- und Inferenzmechanismen.