SlideShare ist ein Scribd-Unternehmen logo
Linked Data und Repositorien
Pascal-Nicolas Becker | Technische Universität Berlin | DINI Jahrestagung | Frankfurt, 27.10.2015
If not indicated otherwise content is licensed under CC BY 4.0
Creative Commons Attribution 4.0 International | https://creativecommons.org/licenses/by/4.0
Digitale Repositorien
Source: The Directory of Open Access Repositories,
http://www.opendoar.org, abgerufen am 06.06.2014.
Ein Repositorium ist ein System zur
sicheren Speicherung digitaler Objekte und
der die Objekte beschreibenden
strukturierten Metadaten.
Beispiele:
• Digitale Archive
• Institutionelle Repositorien (Preprints,
Postprints, OA-Publikationen, …)
• Digital Bilddatenbanken
• Forschungsdaten-Repositorien
• …
Mehr als 2500 OA-Repositorien weltweit
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 2
xxx.lanl.org / ArXiv.org
Quelle: Paul Ginsparg, First Steps Towards Electronic Research Communication. In: Computer in Physics, Vol. 8, No. 4, 1994, pp. 390-396.
Foto: Paul Ginsparg (privat)
“Although the WorldWideWeb still
represents only a small fraction of the
overall usage, this access mode is expected
to become dominant in the near future.”
Paul Ginsparg 1994
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 3
Bisheriger Datenaustausch mit Repositorien
• OAI-PMH (Open Archive Initiative – Protocol for Metadata Harvesting):
de-facto-Standard im Repositorienumfeld
• Aber auf das Repositorienumfeld begrenzt!
• Google unterstützt OAI-PMH seit 2008 nicht mehr
(zuvor als Alternative zum Sitemap Protocol genutzt)
• „Nur“ eine Schnittstelle, kein Format
 Linked Data ist ein generischer, nativer Weg Daten auszutauschen
 Linked Data ist nicht auf das Umfeld von Repositorien beschränkt
 Linked Data ist selbst beschreibend
 Linked Data vereinfacht den Datenaustausch mit Repositorien
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 4
Repositorieninhalte und das Semantic Web
• Informationen im Internet sind auf den menschlichen Konsum ausgerichtet
• Viele Informationen werden nur implizit über den Kontext zur Verfügung gestellt
• Grundidee des Semantic Web: Implizite Informationen explizit
machen, um sie automatisiert verarbeiten zu können
• Ein Repositorium „kennt“ den Titel eines Artikels
• Titel werden Fett und in größerer Schrift ausgegeben,
Autorennamen kursiv
• Wieso stellen wir diese Daten nicht auch maschinell
nutzbar bereit?
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 5
Repositorieninhalte sind besonders gut geeignet
Inhalte von Repositorien sind zur
Bereitstellung im Semantik Web besonders
gut geeignet:
• Metadaten existieren bereits in einer
strukturierten Form
• Sie müssen nicht erst generiert oder
aufwändig manuell zur Publikation als
Linked Data erzeugt werden
• Es geht “lediglich” um die Konvertierung
vorhandener Daten in RDF, um das
Hinzufügen von Links und das
Publizieren unter Berücksichtigung der
Linked Data Principles
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 6
Was speichern Repositorien?
 Unmöglich die Dateien zu konvertieren (technische Probleme, manuell nicht leistbar)
 Aber wir können die Metadaten konvertieren und die Dateien verlinken!
• Digitale Objekte
 Eine oder mehrere Dateien:
Dokumente (PDF, Text, …), Bilder (PNG,
Tiff, …), Tabellen (CSV, …), Audio (Wave,
OGG/VORBIS, …), Video, …
• Beschreibende Metadaten
 Strukturierte Metadaten in Key-Value-Form:
dc.title, dc.contributor.author, dc.description,
dc.date.available, dc.subject.lcsh,
dc.subject.ddc, …
“Ein Repositorium ist ein System zur sicheren Speicherung und Weitergabe
digitaler Objekte und der die Objekte beschreibenden Metadaten.“
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 7
Linked Data und Repositorien
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 8
• Bei der Entwicklung von Fedora 4 stand Linked Data im Mittelpunkt
 Erschienen im Dezember 2014
• DSpace 5 wurde um die Bereitstellung der Metadaten als Linked Data erweitert
 Erschienen im Januar 2015
• Linked Data Plattform als W3C Recommendatio im Februar 2015 verabschiedet
 Spezifikation zur Nutzung von HTTP für Zugriff und CRUD-Operationen auf
Servern, die ihre Inhalte als Linked Data anbieten.
• COAR Resource Type Vocabulary Draft im Juli 2015 vorgestellt
 Linked Data Frontend bereits für den ersten Draft
Beispiel: DSpace 5
• DSpace ist die weltweit am häufigsten eingesetzte Software für OA-Repositorien
• DSpace 5.0 wurde im Januar 2015 veröffentlicht (aktuell: 5.3)
• Die TU Berlin hat Linked Data Support in DSpace 5 eingebracht:
• Konvertierung der Metadaten in Linked Data
• Ausgabe als RDF/XML, Turtle, N-Triples
• SPARQL-Endpoint und Content Negotation
• Stark konfigurierbar, anpassbar und erweiterbar
• Standardkonfiguration mit ausgeliefert
• Test it yourself:
http://demo.dspace.org/data/handle/10673/5/ttl
http://demo.dspace.org/data/handle/10673/5/ttl?text
wget -O - --header=‘Accept: text/turtle’ http://demo.dspace.org/jspui/handle/10673/5
Wenn Sie DSpace 5.0 einsetzen, bitte schalten Sie den Linked Data Support ein!
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 9
Charakteristika von Repositorien
• Verschiedene Repositorien nutzen unterschiedliche Metadatenschemata
 Die Konvertierung muss stark konfigurierbar und erweiterbar sein
• Für Metadatenschemata können bereits Vokabulare existieren (z.B. DC, LCSH, …)
 Werte von Metadaten müssen in URIs/Links konvertiert werden können
• Repositorieninhalte ändern sich so gut wie nie (Zitierfähigkeit, Zuverlässigkeit),
die Konvertierung kann aber zeitaufwändig sein
 Daten konvertieren und in einem Cache speichern
• Repositorien erzeugen URIs zur Adressierung ihrer Inhalte
 Bestehende URIs nachnutzen und um Content Negotiation erweitern
• Persistent Identifier (handle, DOI, …) verstoßen gegen die Linked Data Principles
 Persistent Identifier sind in der Form als HTTP(S) URIs zu nutzen
(z.B. http://hdl.handle.net/..., http://dx.doi.org/... )
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 10
Repositoriensoftware erweitern
• Hinzufügen eines Triple Stores
• Nutzung als Cache für die konvertierten Daten
• Zur Bereitstellung eines SPARQL-Endpoints
• Methoden entwickeln zur Konvertierung in RDF und zur Ergänzung von Links
• Ein Modul zur Bereitstellung der konvertierten Daten als RDF-Serialisierung erstellen
• Content Negotiation unterstützen
File SystemFile System
Relational
Database
Relational
Database
Triple StoreTriple Store
RDF ConversionRDF Conversion
Authorization
System
Authorization
System
Browse and
Search
Browse and
Search
Persistent
Identifier Mgt.
Persistent
Identifier Mgt.
Event SystemEvent System
User
Administration
User
Administration
......
Web UIWeb UI
OAI-PMH
Interface
OAI-PMH
Interface
RESTREST
SWORDSWORD ......
RDF
Serialization
RDF
Serialization
InterfacesInterfaces
Business LogicBusiness Logic
Storage LayerStorage Layer
Konvertierung vorhandener Metadaten in RDF
• Repositoriensoftware um Metadatenschemata/Metadatenfelder erweiterbar
• Dublin Core wird oft genutzt, aber bei weitem nicht das einzige Schema
 Die Konvertierung muss stark konfigurierbar sein!
 Eine Konfiguration in RDF stellt die volle Funktionalität von RDF bereit
 „Reification“ zur Beschreibung der gewünschten Ergebnisse
 Platzhalter z.B. für URIs des Repositoriums
 Reguläre Ausdrücke um Literale und URIs aus Metadatenwerte zu generieren
 Es braucht ein Vokabular um solche Konfigurationen zu erstellen:
DSpace Metadata RDF Mapping Vocabulary:
http://digital-repositories.org/ontologies/dspace-metadata-mapping/
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 12
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix dm: <http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0#> .
@prefix : <#> .
:title
dm:metadataName "dc.title" ;
dm:creates [
dm:subject dm:DSpaceObjectIRI ;
dm:predicate dcterms:title ;
dm:object dm:DSpaceValue ;
] ;
.
Beispiel: DSpace Metadata RDF Mapping
:doi dm:metadataName „dc.identifier.doi" ;
dm:condition „^doi:“ ;
dm:creates [
dm:subject dm:DSpaceObjectIRI ;
dm:predicate dc:identifier;
dm:object [
a dm:ResourceGenerator ;
dm:modifier [
dm:matcher „^doi:(.*)$“ ;
dm:replacement „http://dx.doi.org/$1“ ;
] ;
dm:pattern „$DSpaceValue“ ;
] ;
] ;
.
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 13
Vermeidbare Fehler und Hindernisse
• URIs nachnutzen, wo immer möglich! Keine eigenen URIs erzeugen, wenn es bereits
adäquate gibt
• Beispiele: Für Klassifikationen, wie die Library of Congress Subject Headings
(LCSH) oder die Dewey Decimal Classification (DDC), existieren bereits URIs
• Erzeugung von URIs nur für „eigene“ Entitäten, Erzeugung von URIs nur wenn
ausreichend Informationen vorhanden sind
• Beispiel: Autoren
• Können verschiedene Autoren gleichen Namens differenziert werden?
• Sollten Autoren nicht eigene URIs erzeugen und hinterlegen können, anstatt von
„fremden“ Institutionen URIs zugewiesen zubekommen?
• Lösungen im Rahmen des Problems der Autorenidentifikation
(vielleicht mittels ORCID?)
Erzeugung von Links so oft wie möglich und eindeutig, Erzeugung von URIs nur für
Objekte des Repositoriums (da autoritativ)
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 14
Repositorien beschreiben
• Neben der Konvertierung der Metadaten sollten die Repositorien selbst beschrieben
werden
• Wer betreibt das Repositorium? Gibt es eine SWORD-Schnittstelle? Wo ist der
SPARQL-Endpoint zu finden? Wie ist das Repositorium strukturiert? …
• Auch braucht es ein Vokabular, um die Digitalen Objekte (Dateien) zu verlinken
• Für DSpace habe ich die DSpace Repository Ontology erstellt:
http://digital-repositories.org/ontologies/dspace/
• Es wäre wichtig eine Digital Repositories Ontology zu erstellen, unabhängig von der
genutzten Repositoriensoftware
• Ein Mapping zwischen einer solchen Ontologie und der DSpace Repository Ontology,
der EPrints Ontology, … wäre hilfreich!
• Vielleicht im Rahmen von DINI und/oder COAR?
Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015
Seite 15
Technische Universität Berlin
Universitätsbibliothek
Pascal-Nicolas Becker
p.becker@tu-berlin.de
Servicezentrum Forschungsdaten und –publikationen
http://www.szf.tu-berlin.de
Repositorium DepositOnce
http://depositonce.tu-berlin.de
Diplomarbeit „Repositorien und das Semantic Web“
http://www.pnjb.de/uni/diplomarbeit/

Weitere ähnliche Inhalte

Was ist angesagt?

The State of DSpace
The State of DSpaceThe State of DSpace
The State of DSpace
Pascal-Nicolas Becker
 
TIB DOI-Service und DataCite - PIDs, Best Practices
TIB DOI-Service und DataCite - PIDs, Best PracticesTIB DOI-Service und DataCite - PIDs, Best Practices
TIB DOI-Service und DataCite - PIDs, Best PracticesFrauke Ziedorn
 
DataCite Einführung: Der Metadata Store (MDS)
DataCite Einführung: Der Metadata Store (MDS)DataCite Einführung: Der Metadata Store (MDS)
DataCite Einführung: Der Metadata Store (MDS)
Frauke Ziedorn
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
Frauke Ziedorn
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischkostaedt
 
Ihr Weg zur DOI-Registrierung mit der TIB
Ihr Weg zur DOI-Registrierung mit der TIBIhr Weg zur DOI-Registrierung mit der TIB
Ihr Weg zur DOI-Registrierung mit der TIB
Frauke Ziedorn
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Felix Lohmeier
 
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
intranda GmbH
 
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014Empfehlungen der DataCite Business Practices Working Group - DataCite 2014
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014Frauke Ziedorn
 
1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend
intranda GmbH
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Dennis Zielke
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Felix Lohmeier
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Martin Kaltenböck
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Martin Kaltenböck
 
Linked Open Data Pilot Österreich - Beta Launch
Linked Open Data Pilot Österreich - Beta LaunchLinked Open Data Pilot Österreich - Beta Launch
Linked Open Data Pilot Österreich - Beta Launch
Martin Kaltenböck
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Felix Lohmeier
 
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
AI4BD GmbH
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- III
pscheir
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 

Was ist angesagt? (20)

The State of DSpace
The State of DSpaceThe State of DSpace
The State of DSpace
 
TIB DOI-Service und DataCite - PIDs, Best Practices
TIB DOI-Service und DataCite - PIDs, Best PracticesTIB DOI-Service und DataCite - PIDs, Best Practices
TIB DOI-Service und DataCite - PIDs, Best Practices
 
DataCite Einführung: Der Metadata Store (MDS)
DataCite Einführung: Der Metadata Store (MDS)DataCite Einführung: Der Metadata Store (MDS)
DataCite Einführung: Der Metadata Store (MDS)
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
 
Ihr Weg zur DOI-Registrierung mit der TIB
Ihr Weg zur DOI-Registrierung mit der TIBIhr Weg zur DOI-Registrierung mit der TIB
Ihr Weg zur DOI-Registrierung mit der TIB
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
 
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
 
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014Empfehlungen der DataCite Business Practices Working Group - DataCite 2014
Empfehlungen der DataCite Business Practices Working Group - DataCite 2014
 
1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend1. intranda Goobi Tag: Vom Tool zum Trend
1. intranda Goobi Tag: Vom Tool zum Trend
 
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Linked Open Data Pilot Österreich - Beta Launch
Linked Open Data Pilot Österreich - Beta LaunchLinked Open Data Pilot Österreich - Beta Launch
Linked Open Data Pilot Österreich - Beta Launch
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
 
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
Linked Data Service (LINDAS): Status quo of the linked data life-cycle and le...
 
Wissenstechnologie 2007- III
Wissenstechnologie 2007- IIIWissenstechnologie 2007- III
Wissenstechnologie 2007- III
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 

Andere mochten auch

DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU BerlinDepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
Pascal-Nicolas Becker
 
Strategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpaceStrategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpace
Pascal-Nicolas Becker
 
Zustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpaceZustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpace
Pascal-Nicolas Becker
 
Illuminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data SupportIlluminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data Support
Pascal-Nicolas Becker
 
SWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic WebSWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic Web
Pascal-Nicolas Becker
 
Open Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked DataOpen Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked Data
Pascal-Nicolas Becker
 
Basic aspects of Open Access
Basic aspects of Open AccessBasic aspects of Open Access
Basic aspects of Open Access
Pascal-Nicolas Becker
 
Presentación de Mirta Páez
Presentación de Mirta PáezPresentación de Mirta Páez
Presentación de Mirta Páez
Fundación AVINA
 
France connaissances_diverses_(1)
France  connaissances_diverses_(1)France  connaissances_diverses_(1)
France connaissances_diverses_(1)
School
 
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)Newday
 
Médias sociaux
Médias sociauxMédias sociaux
Patri.
Patri.Patri.
Patri.School
 
Diaporama des oeuvres exposées au SAFE 2012
Diaporama des oeuvres exposées au SAFE 2012Diaporama des oeuvres exposées au SAFE 2012
Diaporama des oeuvres exposées au SAFE 2012OT Massif du Sancy
 
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"Symposia 360°
 
10 6 session 23
10 6 session 2310 6 session 23
10 6 session 23
nblock
 
Raul m.
Raul m.Raul m.
Raul m.School
 
Andrea. mon enfance
Andrea. mon enfanceAndrea. mon enfance
Andrea. mon enfance
School
 
Francais
FrancaisFrancais
Francaissandra
 

Andere mochten auch (20)

DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU BerlinDepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
DepositOnce - Das Repositorium für Forschungsergebnisse der TU Berlin
 
Strategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpaceStrategic Development - Future Plans for DSpace
Strategic Development - Future Plans for DSpace
 
Zustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpaceZustand und Entwicklung von DSpace
Zustand und Entwicklung von DSpace
 
Illuminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data SupportIlluminating DSpace's Linked Data Support
Illuminating DSpace's Linked Data Support
 
SWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic WebSWIB14 Weaving repository contents into the Semantic Web
SWIB14 Weaving repository contents into the Semantic Web
 
Open Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked DataOpen Science Days 2014 - Becker - Repositories and Linked Data
Open Science Days 2014 - Becker - Repositories and Linked Data
 
Basic aspects of Open Access
Basic aspects of Open AccessBasic aspects of Open Access
Basic aspects of Open Access
 
Presentación de Mirta Páez
Presentación de Mirta PáezPresentación de Mirta Páez
Presentación de Mirta Páez
 
France connaissances_diverses_(1)
France  connaissances_diverses_(1)France  connaissances_diverses_(1)
France connaissances_diverses_(1)
 
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)
La fonction de Premier Ministre sous la Vème République (lettre Exprimeo)
 
Médias sociaux
Médias sociauxMédias sociaux
Médias sociaux
 
Patri.
Patri.Patri.
Patri.
 
Diaporama des oeuvres exposées au SAFE 2012
Diaporama des oeuvres exposées au SAFE 2012Diaporama des oeuvres exposées au SAFE 2012
Diaporama des oeuvres exposées au SAFE 2012
 
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"
SecTXL '11 | Frankfurt - Andreas Weiss: "Cloud Computing und SaaS - Sicher!"
 
Noralsy Manual
Noralsy ManualNoralsy Manual
Noralsy Manual
 
Les 15 3
Les 15 3Les 15 3
Les 15 3
 
10 6 session 23
10 6 session 2310 6 session 23
10 6 session 23
 
Raul m.
Raul m.Raul m.
Raul m.
 
Andrea. mon enfance
Andrea. mon enfanceAndrea. mon enfance
Andrea. mon enfance
 
Francais
FrancaisFrancais
Francais
 

Ähnlich wie 16. DINI-Jahrestagung: Linked Data und Repositorien

Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
Universitätsbibliothek der Technischen Universität Berlin
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadata
Felix Sasaki
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11scuy
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungenredsys
 
CKAN by Friedrich Lindenberg
CKAN by Friedrich LindenbergCKAN by Friedrich Lindenberg
CKAN by Friedrich Lindenberg
Semantic Web Company
 
Cloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von MetadatenCloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von Metadaten
Magnus Pfeffer
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
kostaedt
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
Ralf Toepfer
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMLydiaU
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Björn Muschall
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
Stefan Buddenbohm
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
Adrian Pohl
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Georg Rehm
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Felix Lohmeier
 
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBerlinOpenDataDay
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017
Jessica Rex
 
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic WebMagdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Webmontag
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphase
Björn Muschall
 

Ähnlich wie 16. DINI-Jahrestagung: Linked Data und Repositorien (20)

Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadata
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11
 
Einbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
 
CKAN by Friedrich Lindenberg
CKAN by Friedrich LindenbergCKAN by Friedrich Lindenberg
CKAN by Friedrich Lindenberg
 
Cloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von MetadatenCloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von Metadaten
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
 
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
 
OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017OpenAIRE guidelines for data and literature repositories webinar_28022017
OpenAIRE guidelines for data and literature repositories webinar_28022017
 
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic WebMagdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
 
amsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphase
 
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
 

16. DINI-Jahrestagung: Linked Data und Repositorien

  • 1. Linked Data und Repositorien Pascal-Nicolas Becker | Technische Universität Berlin | DINI Jahrestagung | Frankfurt, 27.10.2015 If not indicated otherwise content is licensed under CC BY 4.0 Creative Commons Attribution 4.0 International | https://creativecommons.org/licenses/by/4.0
  • 2. Digitale Repositorien Source: The Directory of Open Access Repositories, http://www.opendoar.org, abgerufen am 06.06.2014. Ein Repositorium ist ein System zur sicheren Speicherung digitaler Objekte und der die Objekte beschreibenden strukturierten Metadaten. Beispiele: • Digitale Archive • Institutionelle Repositorien (Preprints, Postprints, OA-Publikationen, …) • Digital Bilddatenbanken • Forschungsdaten-Repositorien • … Mehr als 2500 OA-Repositorien weltweit Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 2
  • 3. xxx.lanl.org / ArXiv.org Quelle: Paul Ginsparg, First Steps Towards Electronic Research Communication. In: Computer in Physics, Vol. 8, No. 4, 1994, pp. 390-396. Foto: Paul Ginsparg (privat) “Although the WorldWideWeb still represents only a small fraction of the overall usage, this access mode is expected to become dominant in the near future.” Paul Ginsparg 1994 Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 3
  • 4. Bisheriger Datenaustausch mit Repositorien • OAI-PMH (Open Archive Initiative – Protocol for Metadata Harvesting): de-facto-Standard im Repositorienumfeld • Aber auf das Repositorienumfeld begrenzt! • Google unterstützt OAI-PMH seit 2008 nicht mehr (zuvor als Alternative zum Sitemap Protocol genutzt) • „Nur“ eine Schnittstelle, kein Format  Linked Data ist ein generischer, nativer Weg Daten auszutauschen  Linked Data ist nicht auf das Umfeld von Repositorien beschränkt  Linked Data ist selbst beschreibend  Linked Data vereinfacht den Datenaustausch mit Repositorien Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 4
  • 5. Repositorieninhalte und das Semantic Web • Informationen im Internet sind auf den menschlichen Konsum ausgerichtet • Viele Informationen werden nur implizit über den Kontext zur Verfügung gestellt • Grundidee des Semantic Web: Implizite Informationen explizit machen, um sie automatisiert verarbeiten zu können • Ein Repositorium „kennt“ den Titel eines Artikels • Titel werden Fett und in größerer Schrift ausgegeben, Autorennamen kursiv • Wieso stellen wir diese Daten nicht auch maschinell nutzbar bereit? Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 5
  • 6. Repositorieninhalte sind besonders gut geeignet Inhalte von Repositorien sind zur Bereitstellung im Semantik Web besonders gut geeignet: • Metadaten existieren bereits in einer strukturierten Form • Sie müssen nicht erst generiert oder aufwändig manuell zur Publikation als Linked Data erzeugt werden • Es geht “lediglich” um die Konvertierung vorhandener Daten in RDF, um das Hinzufügen von Links und das Publizieren unter Berücksichtigung der Linked Data Principles Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 6
  • 7. Was speichern Repositorien?  Unmöglich die Dateien zu konvertieren (technische Probleme, manuell nicht leistbar)  Aber wir können die Metadaten konvertieren und die Dateien verlinken! • Digitale Objekte  Eine oder mehrere Dateien: Dokumente (PDF, Text, …), Bilder (PNG, Tiff, …), Tabellen (CSV, …), Audio (Wave, OGG/VORBIS, …), Video, … • Beschreibende Metadaten  Strukturierte Metadaten in Key-Value-Form: dc.title, dc.contributor.author, dc.description, dc.date.available, dc.subject.lcsh, dc.subject.ddc, … “Ein Repositorium ist ein System zur sicheren Speicherung und Weitergabe digitaler Objekte und der die Objekte beschreibenden Metadaten.“ Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 7
  • 8. Linked Data und Repositorien Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 8 • Bei der Entwicklung von Fedora 4 stand Linked Data im Mittelpunkt  Erschienen im Dezember 2014 • DSpace 5 wurde um die Bereitstellung der Metadaten als Linked Data erweitert  Erschienen im Januar 2015 • Linked Data Plattform als W3C Recommendatio im Februar 2015 verabschiedet  Spezifikation zur Nutzung von HTTP für Zugriff und CRUD-Operationen auf Servern, die ihre Inhalte als Linked Data anbieten. • COAR Resource Type Vocabulary Draft im Juli 2015 vorgestellt  Linked Data Frontend bereits für den ersten Draft
  • 9. Beispiel: DSpace 5 • DSpace ist die weltweit am häufigsten eingesetzte Software für OA-Repositorien • DSpace 5.0 wurde im Januar 2015 veröffentlicht (aktuell: 5.3) • Die TU Berlin hat Linked Data Support in DSpace 5 eingebracht: • Konvertierung der Metadaten in Linked Data • Ausgabe als RDF/XML, Turtle, N-Triples • SPARQL-Endpoint und Content Negotation • Stark konfigurierbar, anpassbar und erweiterbar • Standardkonfiguration mit ausgeliefert • Test it yourself: http://demo.dspace.org/data/handle/10673/5/ttl http://demo.dspace.org/data/handle/10673/5/ttl?text wget -O - --header=‘Accept: text/turtle’ http://demo.dspace.org/jspui/handle/10673/5 Wenn Sie DSpace 5.0 einsetzen, bitte schalten Sie den Linked Data Support ein! Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 9
  • 10. Charakteristika von Repositorien • Verschiedene Repositorien nutzen unterschiedliche Metadatenschemata  Die Konvertierung muss stark konfigurierbar und erweiterbar sein • Für Metadatenschemata können bereits Vokabulare existieren (z.B. DC, LCSH, …)  Werte von Metadaten müssen in URIs/Links konvertiert werden können • Repositorieninhalte ändern sich so gut wie nie (Zitierfähigkeit, Zuverlässigkeit), die Konvertierung kann aber zeitaufwändig sein  Daten konvertieren und in einem Cache speichern • Repositorien erzeugen URIs zur Adressierung ihrer Inhalte  Bestehende URIs nachnutzen und um Content Negotiation erweitern • Persistent Identifier (handle, DOI, …) verstoßen gegen die Linked Data Principles  Persistent Identifier sind in der Form als HTTP(S) URIs zu nutzen (z.B. http://hdl.handle.net/..., http://dx.doi.org/... ) Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 10
  • 11. Repositoriensoftware erweitern • Hinzufügen eines Triple Stores • Nutzung als Cache für die konvertierten Daten • Zur Bereitstellung eines SPARQL-Endpoints • Methoden entwickeln zur Konvertierung in RDF und zur Ergänzung von Links • Ein Modul zur Bereitstellung der konvertierten Daten als RDF-Serialisierung erstellen • Content Negotiation unterstützen File SystemFile System Relational Database Relational Database Triple StoreTriple Store RDF ConversionRDF Conversion Authorization System Authorization System Browse and Search Browse and Search Persistent Identifier Mgt. Persistent Identifier Mgt. Event SystemEvent System User Administration User Administration ...... Web UIWeb UI OAI-PMH Interface OAI-PMH Interface RESTREST SWORDSWORD ...... RDF Serialization RDF Serialization InterfacesInterfaces Business LogicBusiness Logic Storage LayerStorage Layer
  • 12. Konvertierung vorhandener Metadaten in RDF • Repositoriensoftware um Metadatenschemata/Metadatenfelder erweiterbar • Dublin Core wird oft genutzt, aber bei weitem nicht das einzige Schema  Die Konvertierung muss stark konfigurierbar sein!  Eine Konfiguration in RDF stellt die volle Funktionalität von RDF bereit  „Reification“ zur Beschreibung der gewünschten Ergebnisse  Platzhalter z.B. für URIs des Repositoriums  Reguläre Ausdrücke um Literale und URIs aus Metadatenwerte zu generieren  Es braucht ein Vokabular um solche Konfigurationen zu erstellen: DSpace Metadata RDF Mapping Vocabulary: http://digital-repositories.org/ontologies/dspace-metadata-mapping/ Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 12
  • 13. @prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix dm: <http://digital-repositories.org/ontologies/dspace-metadata-mapping/0.2.0#> . @prefix : <#> . :title dm:metadataName "dc.title" ; dm:creates [ dm:subject dm:DSpaceObjectIRI ; dm:predicate dcterms:title ; dm:object dm:DSpaceValue ; ] ; . Beispiel: DSpace Metadata RDF Mapping :doi dm:metadataName „dc.identifier.doi" ; dm:condition „^doi:“ ; dm:creates [ dm:subject dm:DSpaceObjectIRI ; dm:predicate dc:identifier; dm:object [ a dm:ResourceGenerator ; dm:modifier [ dm:matcher „^doi:(.*)$“ ; dm:replacement „http://dx.doi.org/$1“ ; ] ; dm:pattern „$DSpaceValue“ ; ] ; ] ; . Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 13
  • 14. Vermeidbare Fehler und Hindernisse • URIs nachnutzen, wo immer möglich! Keine eigenen URIs erzeugen, wenn es bereits adäquate gibt • Beispiele: Für Klassifikationen, wie die Library of Congress Subject Headings (LCSH) oder die Dewey Decimal Classification (DDC), existieren bereits URIs • Erzeugung von URIs nur für „eigene“ Entitäten, Erzeugung von URIs nur wenn ausreichend Informationen vorhanden sind • Beispiel: Autoren • Können verschiedene Autoren gleichen Namens differenziert werden? • Sollten Autoren nicht eigene URIs erzeugen und hinterlegen können, anstatt von „fremden“ Institutionen URIs zugewiesen zubekommen? • Lösungen im Rahmen des Problems der Autorenidentifikation (vielleicht mittels ORCID?) Erzeugung von Links so oft wie möglich und eindeutig, Erzeugung von URIs nur für Objekte des Repositoriums (da autoritativ) Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 14
  • 15. Repositorien beschreiben • Neben der Konvertierung der Metadaten sollten die Repositorien selbst beschrieben werden • Wer betreibt das Repositorium? Gibt es eine SWORD-Schnittstelle? Wo ist der SPARQL-Endpoint zu finden? Wie ist das Repositorium strukturiert? … • Auch braucht es ein Vokabular, um die Digitalen Objekte (Dateien) zu verlinken • Für DSpace habe ich die DSpace Repository Ontology erstellt: http://digital-repositories.org/ontologies/dspace/ • Es wäre wichtig eine Digital Repositories Ontology zu erstellen, unabhängig von der genutzten Repositoriensoftware • Ein Mapping zwischen einer solchen Ontologie und der DSpace Repository Ontology, der EPrints Ontology, … wäre hilfreich! • Vielleicht im Rahmen von DINI und/oder COAR? Linked Data und Repositorien | Pascal-Nicolas Becker | DINI Jahrestagung | Frankfurt a.M., 27.10.2015 Seite 15
  • 16. Technische Universität Berlin Universitätsbibliothek Pascal-Nicolas Becker p.becker@tu-berlin.de Servicezentrum Forschungsdaten und –publikationen http://www.szf.tu-berlin.de Repositorium DepositOnce http://depositonce.tu-berlin.de Diplomarbeit „Repositorien und das Semantic Web“ http://www.pnjb.de/uni/diplomarbeit/