Präsentation "Kataloganreicherung à la Linked Open Data" auf der Veranstaltung vom VdB, Landesverband Bayern, München am 2012-09-27 "Jenseits der Verbundkataloge. Die Zukunft der Recherche".
1. Pascal Christoph
Kataloganreicherung à la
Linked Open Data
VdB, Landesverband Bayern, München, 2012-09-27
Jenseits der Verbundkataloge. Die Zukunft der Recherche
2. Lizenz
2
Dieser Vortrag – inklusive der durch den Autor erstellten Grafiken auf den Folien 7, 8, 11,
13, 15, 16, 17, 18, 20, 21, 33, 62, 63 und 67 – steht unter der CC0 Lizenz :
https://creativecommons.org/about/cc0
Davon ausgenommen sind die übrigen verwendeten Grafiken, Bilder und Screenshots,
deren individuelle Rechte und Lizenzbedingungen fortgelten.
Insbesondere stehen die http://www.istockphoto.com/ Grafiken auf den Folien 47, 49, 50
und 83 unter einer CC-BY-ND Lizenz : http://creativecommons.org/licenses/by-nd/3.0/de/
Die Graphiken auf den Folien 22-26 entstammen dem “Linking Open Data cloud diagram,
by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
3. ÜBERSICHT
3
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
4. ÜBERSICHT
4
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
5. ÜBERSICHT
5
Werden Sie in 15 Minuten ein LOD Experte
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
6. ÜBERSICHT
6
Besser: z.B. einen Workshop besuchen !
z.B. auf der SWIB12
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
7. LOD – Basics: HTTP-URI
7
Jede Ressource erhält einen HTTP-URI
http://example.de/12345
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
8. LOD – Basics: HTTP-URI
8
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
9. LOD – Basics: HTTP-URI
9
HTTP-URIs sind z. B. einer URN-URI überlegen: sie können z. B. einfach im Browser
nachgeschlagen werden.
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
10. LOD–Basics: HTTP-URI derefenzieren
10
Wird die Ressource nachgeschlagen,
so wird die Ressource geliefert. Geht
dies nicht, z.B. weil es sich um einen
physischen Gegenstand handelt,
werden Daten über die Ressource
geliefert (aka Metadaten).
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
12. LOD – Basics: RDF Triple
12
Datenbeschreibung mittels RDF => Triple:
Subjekt Prädikat Objekt .
(Ein Triple ist die kleinste Informationseinheit.)
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
13. LOD – Basics: RDF Triple
13
Der obige Graph als NTriples in RDF ausgedrückt:
<http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/title> "With reference to reference" .
<http://lobid.org/resource/HT002948556> <http://purl.org/dc/terms/issued> "1983" .
<http://lobid.org/resource/HT002948556> <http://purl.org/ontology/bibo/isbn13> "9780915145539" .
<http://lobid.org/resource/HT002948556> <http://purl.org/dc/elements/1.1/creator> "Elgin, Catherine" .
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
14. LOD – Basics: RDF Triple
14
Ein Objekt kann Text sein:
„Elgin, Catherine“
Ein Objekt kann ein URI sein:
<http://d-nb.info/gnd/135539897>
=> Ressourcen in Ressourcen (aka „linked“)
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
15. LOD – Basics: linked
15
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
16. LOD – Basics: linked
16
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
17. LOD – Basics: linked
17
...
<http://lobid.org/resource/HT002948556>
<http://purl.org/dc/elements/1.1/creator>
<http://d-nb.info/gnd/135539897> .
...
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
18. LOD – Basics: linked
18
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
19.
20.
21. LOD - Definition „linked“
21
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
27. LOD - Definition „linked“
27 Ad astra ?
Addata ! ?
Ad astra
Ad data !
To boldly go where no data has gone before.
To boldly go where no data has gone before .
Bildquelle:http://hubblesite.org/gallery/album/star/pr2006050d
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
28. LOD – Basics: Resümee „linked“
28
●
Ein RDF Triple besteht aus Subjekt, Prädikat und Objekt
●
Ein RDF Triple ist die kleinstmögliche Aussage über etwas
●
RDF Triple können URIs enthalten, und somit wiederum Triple
●
Mehrere RDF Triple ergeben RDF Graphen
●
HTTP-URIs, und damit Daten, sind institutsübergreifend
●
Maschinen „verstehen“ Daten
●
Einfache Schnittstelle: z.B. Webseiten (RDFa in HTML)
=> globales Datennetz („Web of Data“)
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
29. ÜBERSICHT
29
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
30. LOD-Basics: „open“
30
http://opendefinition.org/
Wissen ist offen, wenn dessen
Verwendung
Wiederverwendung
Wiederverwertung
erlaubt ist.
(„A piece of knowledge is open if you are free to use, reuse and redistribute it.“)
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
31. LOD-Basics: „open“-wozu ?
31
Wozu Open Data ?
Um die Daten nutzbar zu
machen !
Jeder kann, ohne zu fragen, die Daten
nutzen, nach eigenem Gutdünken
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
32. LOD-Basics: „open“-wozu ?
32
Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
33. LOD-Basics: „open“-wozu ?
33
Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
34. LOD-Basics: „open“-wozu ?
34
Bildquelle: http://equity.lsnc.net/2008/08/maps-used-in-support-of-the-plaintiff%E2%80%99s-arguement-in-kennedy-et-al-v-city-of-zanesville-et-al/
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
35. LOD-Basics: „open“-wozu ?
35
Das Ganze ist mehr als
die Summe seiner Teile .
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
36. LOD-Basics: „open“-wozu ?
36
Data vs. Application
Bildquelle: https://github.com/jakobib/ticer2012 to be copied and modified under CC-BY-SA license.
„Data matures like Wine, Applications like Fish“
(James Governor)
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
38. LOD-Basics: „open“
38
Open Data - eine Frage von:
●
Lizenzen
●
Zugänglichkeit
●
Formate
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
39. LOD-Basics: Lizenzen
39
●
Attribution (ODC-BY)
●
Attribution-Share-Alike (OdbL)
●
Public Domain (CC0, PDDL)
Keine Non-Commercial Lizenz
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
40. LOD-Basics: Datenpotential
40
Open Data =>
Daten Mehrnutzung
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
41. LOD-Basics: Daten öffnen
41
Interessierte Akteure zusammenbringen
Bildquelle: http://www.flickr.com/photos/johnspooner/2199685678/
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
42. LOD-Basics: Daten öffnen
42
Mögliche rechtliche Probleme klären
●
Fremddaten im Katalog
●
Nutzungsbedingungen in den Verträgen
prüfen
- KiM: Empfehlungen zur Öffnung bibliothekarischer Daten
- Till Kreutzer: Open Data – Freigabe von Daten aus Bibliothekskatalogen
- Adrian Pohl: Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. 2010
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
43. LOD-Basics: Daten öffnen
43
●
Daten exportieren
●
Daten veröffentlichen
●
Daten lizensieren
●
Daten verzeichnen (http://thedatahub.org/)
●
Bekanntgeben
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
44. LOD-Basics: five stars
44
Sir Tim Berners Lee:
Bildquelle: http://www.w3.org/DesignIssues/LinkedData.html
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
46. ÜBERSICHT
46
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
48. Kataloganreicherung: Definition
48
Jegliche Ergänzung vorhandener Datensätze
um zusätzliche Informationen
Linkszum Volltext im WWW
Schlagwörter
Umschlagbilder
...
Herkunft egal (Benutzer, Bibliotheken,
Firmen...)
Neue Funktionen: nur mittelbar
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
51. ÜBERSICHT
51
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
52. Kataloganreicherung: Methoden
52
Bildquelle: http://findicons.com/about
Datenbank vs. Mashup
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
53. Kataloganreicherung: Methoden
53
Lokale DB: Dynamisches Mashup:
+ Aufwendigere + Aktuell
Zusammenführungen möglich
+ Relativ geringer Aufwand je Quelle
+ Daten nutzbar für Recherche
und weitere Funktionen - Benötigt (performante) API
- Hoher kontinuierlicher Aufwand - Keine Recherche über die Daten
für jede Quelle
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
54. Kataloganreicherung: Infrastruktur
54
RDF-basierte Speicherung mit SPARQL Endpoint:
Einfaches Hinzufügen neuer Daten
Nachnutzbar
„Selbst-beschreibender“ Dump
„API“ inbegriffen
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
56. Ausgangslage in lobid.org
56
RDF Store mit SPARQL Endpoint: 4store
Open Data aus dem Verbundkatalog „hbz01“
16 M Titeldatensätze <=> 700 M Triple
Verknüpfungen:
• 5.500 Projekt Gutenberg • 1.250.000 Open Library
• 12.000 DBpedia • 700.000 ZDB
• 70.000 b3kat • 800.000 LOC Iso-639-2
• 200.000 Dewey Decimal Class. • 22.000.000 gnd Normdatei
• 270.000 DNB Nationalbiografie • 32.000.000 lobid-organisations
• 420.000 OCLC
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
57. Praxisbeispiel: LODUM
57
Christoph - Kataloganreicherung à la Linked Open Data 24.05.2012
2012-09-27
58. ÜBERSICHT
58
Linked Open Data (LOD):
Basics
linked
open
Kataloganreicherung
Definition
Technik
Matching
Verlinkung
Fazit & Anwendungsbeispiel
Christoph - Kataloganreicherung à la Linked Open Data 2012-09-27
59. Verlinkungssoftware
59
Silk
Culturegraph
Google-refine
...
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
60. Matchingalgorithmen
60
Abhängig von Daten
Spannende Daten liegen „woanders“
=> andere Regelwerke
Beispiel DBpedia:
Autor,ISBN usw. fehlt meistens => bleibt Titel
Eingrenzungen:
deutsche DBpedia
category:Literarisches_Werk ,
category:Lexikon,_Enzyklopädie
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
61. Problem: Disambiguierung
61
Matching zu ungenau
Postprozessierung:
nur Bündel mit gleichem Autor zulassen
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
62. Bündel mit gleichem Autor
62
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
63. Bündel mit verschiedenen Autoren
63
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
64. LOW-HANGING
FRUIT
Kai Schreiber, „Reiche Ernte” 7. August 2005 via Flickr CC BY-SA 2.0
65. Triplifizierung
65
Prädikate finden oder selber prägen
rdrel:workManifested
=> Triple:
<lobid-resource> <rdrel:workManifested> <dbpedia-resource>
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
66. Indexierung
66
Lizenzfragen klären
Triples importieren in SPARQL-Endpoint
Eigener „named Graph“ bietet Vorteile:
Leichtlöschbar/veränderbar
Provenienz verfolgbar
Eingrenzung von Abfragen auf Named Graphs
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
67. Named Graphs
67
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
68. Was wurde erreicht?
68
12.000 „sichere“ Links zu 4.000 DBpedia
Ressourcen => 4.000 neue „Work“-Ebenen
(21.000 verworfene Links)
Durchschnittliche Bündelgröße: 3
Links nach freebase: 3.000
0.1 % Anreicherung
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
69. Was wurde erreicht?
69
5.500 Links zu 400 Project Gutenberg
Ressourcen (Volltexte in mehreren Formaten)
=> 0.05% Anreicherung
1.200.000 Links zur Work-Ebene der Open
Library
=> 12.5% Anreicherung
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
70. LOW-HANGING
FRUIT
Kai Schreiber, „Reiche Ernte” 7. August 2005 via Flickr CC BY-SA 2.0
71. Was wurde erreicht?
71
DBpedia Beispiel:
„Die Heilige Johanna der Schlachthöfe“
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
72.
73.
74.
75. Was wurde erreicht?
75
Open Library Beispiel:
„With reference to reference“
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
76.
77. Integration in Kataloge
77
Was darf übernommen werden, was nicht?
Was sollte übernommen werden, was nicht?
Menschen-lesbare Anzeige der Links/URIs
(Manche) Daten sollten lokal indexiert werden
(zur Recherche)
...
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
78. Warum Linked Open Data?
78
Richtig ist: „Warum nicht LOD?“
Linked Data impliziert kontrolliertes
Vokabular, Identifier, weitere Links …
<= ideal!
Linked Open Data: Daten lassen sich
nachnutzen/zwischenspeichern/verändern
<= ideal!
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
81. Anwendungsbeispiel
81
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
82. Anwendungsbeispiel
82
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
83.
84. FAZIT
84
Alles, was mit LOD erreicht werden kann, kann
auch anders erreicht werden.
Mit LOD ist es nur viel einfacher.
Jansen / Christoph - Kataloganreicherung mit LOD Data
Christoph - Kataloganreicherung à la Linked Open 24.05.2012
2012-09-27
86. 86 Quellenverzeichnis
- KiM: Empfehlungen zur Öffnung bibliothekarischer Daten
https://wiki.d-nb.de/pages/viewpage.action?pageId=45419980
- Till Kreutzer (2010): Open Data – Freigabe von Daten aus Bibliothekskatalogen
http://www.hbz-nrw.de/dokumentencenter/veroeffentlichungen/open-data-leitfaden.pdf
- Adrian Pohl (2010): Open Data im hbz-Verbund. Erschienen in: ProLibris. 3. Preprint:
http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2010_open-data.pdf
- Tim Berners Lee zu Open Data (2010): http://www.youtube.com/watch?v=3YcZ3Zqk0a8
- Jansen / Christoph: Dynamische Kataloganreicherung auf Basis von Linked Open Data
http://de.slideshare.net/h_jansen/dynamische-kataloganreicherung-auf-basis-von-linked-open-data
- Blog post: First results using SILK to link to DBpedia
https://wiki1.hbz-nrw.de/display/SEM/2012/05/03/First+results+using+SILK+to+link+to+DBpedia
- Blog post: 1.2 M links to Open Library
https://wiki1.hbz-nrw.de/display/SEM/2012/05/23/1.2+M+links+to+Open+Library
- Oliver Flimm (2010): LOD und die Open Library http://de.slideshare.net/flimm/lod-openlibrary20100512
- Datenverzeichnis „thedatahub“ aka CKAN: http://www.thedatahub.org/
- 49 bibliographische Datenquellen als LODhttp://thedatahub.org/group/bibliographic?tags=lod
- Workshop SWIB12: http://swib.org/swib12/programme.php