Linked Open Data  und die Open Library <ul><ul><li>Möglichkeiten der Zusammenarbeit und Prägung von Identifiern in Resourc...
Die Open Library <ul><li>Seit November 2007 Teilprojekt des Internet-Archivs </li></ul><ul><li>Ziel: Weltweiter Gesamtnach...
Technik <ul><li>Eigenentwicklung </li></ul><ul><ul><li>Open Source </li></ul></ul><ul><ul><li>Infobase (DB) + Infogami (Wi...
OL liefert Open Data <ul><li>Große Datenbasis für lokale Anreicherung </li></ul><ul><ul><li>lccn, lc_classifications, oclc...
Daten eines Beispieltitel in OL <ul><ul><li>{&quot; subtitle &quot;: &quot;ein Vorstoss zu den Grenzen von Berechenbarkeit...
Beispiele REST API <ul><li>Content </li></ul><ul><ul><li>curl http://openlibrary.org/books/OL1M.json </li></ul></ul><ul><l...
Prägung von Identifiern <ul><li>Erzeugung von  <ID>  durch  „guten“ (!!!) Matchkey-Algorithmus </li></ul><ul><li>Nachnutzu...
Nachnutzung bestehender & Erzeugung neuer Identifier <ul><li>Anforderungen </li></ul><ul><ul><li>Identifier selbst müssen ...
Identifier der OL bereits als URI konzipiert <ul><ul><li>„ [...]Open Library also gives people a URI for a work, an editio...
Nachnutzung von Identifiern der OL <ul><li>Identifier-Automat </li></ul><ul><ul><li>Lookup mit konkreten bibliogr. Daten <...
Vorteile <ul><li>Anforderungen durch OL erfüllt </li></ul><ul><li>Ankopplung an etabliertes globales Projekt und keine „In...
Noch zu lösende Probleme <ul><li>RAK vs. AACR2 </li></ul><ul><ul><li>Kompatibilität der erfassten Daten mit OL bei Lookup ...
Überdeckungsgrad der OL <ul><li>Abschätzung allein anhand der ISBN </li></ul><ul><li>Verschiedene Szenarien </li></ul><ul>...
Zahlen: KUG gesamt <ul><li>Titelaufnahmen insgesamt: 9.6 Mio., teilweise dublett (!!!) </li></ul><ul><li>Versch. ISBN's in...
Zahlen: Institut für Informatik <ul><li>Titelaufnahmen insgesamt: 8.594 </li></ul><ul><li>Versch. ISBN's insgesamt: 7.074 ...
Zahlen: USB Köln <ul><li>Titelaufnahmen insgesamt: 3.084.269 </li></ul><ul><li>Versch. ISBN's insgesamt: 708.704  </li></u...
Fazit <ul><li>Open Library bietet als globaler Kooperationspartner viele Vorteile </li></ul><ul><li>Überdeckungsquote via ...
Fragen?
Vielen Dank für Ihre Aufmerksamkeit <ul><li>Quellen: </li></ul><ul><li>Open Library (OL) -  http://openlibrary.org/ </li><...
Nächste SlideShare
Wird geladen in …5
×

Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und Prägung von Identifiern in Resource URI's

932 Aufrufe

Veröffentlicht am

Vortrag beim Arbeitstreffen Linked Open Data im hbz am 12.5.2010, in dem die Möglichkeit untersucht wird, in wieweit sich bei der Prägung von Identifiern im LOD-Bereich die IDs der OpenLibrary verwenden lassen.

Veröffentlicht in: Technologie, Bildung
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
932
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
92
Aktionen
Geteilt
0
Downloads
2
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und Prägung von Identifiern in Resource URI's

  1. 1. Linked Open Data und die Open Library <ul><ul><li>Möglichkeiten der Zusammenarbeit und Prägung von Identifiern in Resource URI's </li></ul></ul>Oliver Flimm <flimm@ub.uni-koeln.de> Arbeitstreffen Linked Open Data, hbz Köln 12.5.2010
  2. 2. Die Open Library <ul><li>Seit November 2007 Teilprojekt des Internet-Archivs </li></ul><ul><li>Ziel: Weltweiter Gesamtnachweis aller Bücher „ One web page for every book “ </li></ul><ul><li>Veröffentlichung als Open Data über Feeds (editions.json, authors.json) </li></ul><ul><li>Umfang (Stand 02/2010): </li></ul><ul><ul><li>19.8 Mio. Titel, 5.4 Mio. Personen </li></ul></ul>
  3. 3. Technik <ul><li>Eigenentwicklung </li></ul><ul><ul><li>Open Source </li></ul></ul><ul><ul><li>Infobase (DB) + Infogami (Wiki, Plugins) </li></ul></ul><ul><ul><li>Versionierung (Resource-History) !!! </li></ul></ul><ul><ul><li>Öffentliche ID vs. Interne ID </li></ul></ul><ul><ul><li>RESTful API (Content, Query, Modify, Add?) </li></ul></ul><ul><ul><li>Bulk-Upload möglich </li></ul></ul><ul><ul><ul><li>Einspielung mit Match-Algorithmen durch OL </li></ul></ul></ul><ul><ul><ul><li>Einladeformat ist MARC mit Fremd-Id Information </li></ul></ul></ul>
  4. 4. OL liefert Open Data <ul><li>Große Datenbasis für lokale Anreicherung </li></ul><ul><ul><li>lccn, lc_classifications, oclc_numbers, dewey_decimal_class, isbn_10, isbn_13, subjects, subject_place, languages, ocaid </li></ul></ul><ul><li>Cover, Inhaltsverzeichnisse, elektr. Volltexte (DAISY) </li></ul><ul><li>Zusammenfassung zu „Werken“ mit eigenem URI </li></ul><ul><li>Rudimentäre Kategorien, aber erweiterbar </li></ul>
  5. 5. Daten eines Beispieltitel in OL <ul><ul><li>{&quot; subtitle &quot;: &quot;ein Vorstoss zu den Grenzen von Berechenbarkeit und Erkenntnis : Quantenmechanik, Relativitätstheorie, Gravitation, Kosmologie, Chaostheorie, Prädikatenlogik&quot;, &quot; lc_classifications &quot;: [&quot;Q175 .K475 1999&quot;], &quot; id &quot;: 222492, &quot; title &quot;: &quot;Bedeutende Theorien des 20. Jahrhunderts&quot;, &quot; languages &quot;: [{&quot;key&quot;: &quot;/l/ger&quot;}], &quot; subjects &quot;: [&quot;Science -- Philosophy.&quot;, &quot;Science -- Methodology.&quot;], &quot; publish_country &quot;: &quot;gw &quot;, &quot; by_statement &quot;: &quot;Werner Kinnebrock.&quot;, &quot; oclc_numbers &quot;: [&quot;40364931&quot;], &quot; type &quot;: {&quot;key&quot;: &quot;/type/edition&quot;}, &quot; revision &quot;: 1, &quot; other_titles &quot;: [&quot;Bedeutende Theorien des zwanzigsten Jahrhunderts&quot;], &quot; publishers &quot;: [&quot;Oldenbourg&quot;], &quot; last_modified &quot;: {&quot;type&quot;: &quot;/type/datetime&quot;, &quot;value&quot;: &quot;2008-04-01 03:28:50.625462&quot;}, &quot; key &quot;: &quot;/b/OL134029M&quot;, &quot; authors &quot;: [{&quot;key&quot;: &quot;/a/OL88369A&quot;}], &quot; publish_places &quot; : [&quot;München&quot;], &quot; pagination &quot;: &quot;ix, 201 p. :ill. ;&quot;, &quot; dewey_decimal_class &quot;: [&quot;501&quot;], &quot; notes &quot;: {&quot;type&quot;: &quot;/type/text&quot;, &quot;value&quot;: &quot;Includes bibliographical refe rences (p. [203]-205).&quot;}, &quot; number_of_pages &quot;: 201, &quot; lccn &quot;: [&quot;99514096&quot;], &quot; isbn_10 &quot;: [&quot;3486247069&quot;], &quot; publish_date &quot;: &quot;1999&quot;} </li></ul></ul>
  6. 6. Beispiele REST API <ul><li>Content </li></ul><ul><ul><li>curl http://openlibrary.org/books/OL1M.json </li></ul></ul><ul><li>Query </li></ul><ul><ul><li>curl 'http://openlibrary.org/query.json?type=/type/edition&authors=/authors/OL1A' </li></ul></ul><ul><li>History </li></ul><ul><ul><li>curl http://openlibrary.org/books/OL1M.json?m=history </li></ul></ul><ul><li>Sowie: Save (via PUT), Login, Recent </li></ul>
  7. 7. Prägung von Identifiern <ul><li>Erzeugung von <ID> durch „guten“ (!!!) Matchkey-Algorithmus </li></ul><ul><li>Nachnutzung eines bestehenden externen Identifiers als <ID> </li></ul><ul><li>Erzeugung und Vergabe neuer eigener Identifier als <ID> </li></ul>ala http://globallinkeddata.org/resource/title/ <ID>
  8. 8. Nachnutzung bestehender & Erzeugung neuer Identifier <ul><li>Anforderungen </li></ul><ul><ul><li>Identifier selbst müssen vollständig offen und frei verwendbar sein (Offene Daten mit proprietären Identifiern sind ein Widerspruch in sich!) </li></ul></ul><ul><ul><li>Bibliographische Daten zu den Identifiern müssen für die lokale Anreicherung vollständig als Open Data vorliegen </li></ul></ul><ul><ul><li>Offenes System zur (ad-hoc) Generierung neuer Identifier </li></ul></ul>
  9. 9. Identifier der OL bereits als URI konzipiert <ul><ul><li>„ [...]Open Library also gives people a URI for a work, an edition or author or other book-ish resource that can be used as a pointer and connector for information about books; a Uniform Resource Identifier indeed.“ </li></ul></ul><ul><ul><li>aus: Open Library FAQ: What is Open Library </li></ul></ul>
  10. 10. Nachnutzung von Identifiern der OL <ul><li>Identifier-Automat </li></ul><ul><ul><li>Lookup mit konkreten bibliogr. Daten </li></ul></ul><ul><ul><li>Vorhanden? </li></ul></ul><ul><ul><ul><li>key als Identifier verwenden </li></ul></ul></ul><ul><ul><li>Nicht vorhanden? </li></ul></ul><ul><ul><ul><li>Bibliogr. Daten in die OL eintragen </li></ul></ul></ul><ul><ul><ul><li>Dafür vergebenen neuen key als Identifier verwenden </li></ul></ul></ul><ul><li>Vereinfacht durch freie Datenverfügbarkeit </li></ul>
  11. 11. Vorteile <ul><li>Anforderungen durch OL erfüllt </li></ul><ul><li>Ankopplung an etabliertes globales Projekt und keine „Insellösung“ USB/Köln  hbz/NRW  DNB/Deutschland </li></ul><ul><li>Perfekte Symbiose zum Vorteil von Open Data – OL und unsere offenen Daten profitieren gleichermaßen trotz Koexistenz </li></ul><ul><li>Stärkung der OL als freie Alternative zum WorldCat, OL als zentraler Aggregator </li></ul>
  12. 12. Noch zu lösende Probleme <ul><li>RAK vs. AACR2 </li></ul><ul><ul><li>Kompatibilität der erfassten Daten mit OL bei Lookup oder Upload, z.B. pagination </li></ul></ul><ul><ul><li>„Zersplitterung“ durch hierarchische Struktur </li></ul></ul><ul><li>Match-Algorithmus für Lookup in OL, ad-hoc Erzeugung neuer Katalogeinträge via REST-API </li></ul><ul><li>Dubletten, Datenqualität </li></ul><ul><li>(Noch) keine Bestandsnachweise in OL </li></ul>
  13. 13. Überdeckungsgrad der OL <ul><li>Abschätzung allein anhand der ISBN </li></ul><ul><li>Verschiedene Szenarien </li></ul><ul><ul><li>KUG allgemein </li></ul></ul><ul><ul><li>Katalog mit vielen modernen Titeln: Institut für Informatik </li></ul></ul><ul><ul><li>Katalog mit viel Altbestand: USB Köln </li></ul></ul><ul><li>Nächster Schritt: Verwendung anderer Identifikatoren bzw. Match-Algorithmus </li></ul>
  14. 14. Zahlen: KUG gesamt <ul><li>Titelaufnahmen insgesamt: 9.6 Mio., teilweise dublett (!!!) </li></ul><ul><li>Versch. ISBN's insgesamt: 1.316.641 </li></ul><ul><li>Davon in Open Library: 874.373 </li></ul><ul><li>Überdeckungsquote ISBN's: 66 Prozent </li></ul>
  15. 15. Zahlen: Institut für Informatik <ul><li>Titelaufnahmen insgesamt: 8.594 </li></ul><ul><li>Versch. ISBN's insgesamt: 7.074 </li></ul><ul><li>Davon in Open Library: 4.345 </li></ul><ul><li>Überdeckungsquote ISBN's: 61.4 Prozent </li></ul><ul><li>Überdeckungsquote gesamt: 50.5 Prozent </li></ul>
  16. 16. Zahlen: USB Köln <ul><li>Titelaufnahmen insgesamt: 3.084.269 </li></ul><ul><li>Versch. ISBN's insgesamt: 708.704 </li></ul><ul><li>Davon in Open Library: 482.807 </li></ul><ul><li>Überdeckungsquote ISBN's: 68.1 Prozent </li></ul><ul><li>Überdeckungsquote gesamt: 15.7 Prozent </li></ul>
  17. 17. Fazit <ul><li>Open Library bietet als globaler Kooperationspartner viele Vorteile </li></ul><ul><li>Überdeckungsquote via ISBN vielversprechend </li></ul><ul><li>Nächste Schritte müssten folgen </li></ul><ul><ul><li>Match-Algorithmus für Lookup </li></ul></ul><ul><ul><li>Upload einzelner Titel </li></ul></ul><ul><li>Alternative: eigener Identifier-Automat und Zusammenarbeit mit OL jenseits Identifier </li></ul>
  18. 18. Fragen?
  19. 19. Vielen Dank für Ihre Aufmerksamkeit <ul><li>Quellen: </li></ul><ul><li>Open Library (OL) - http://openlibrary.org/ </li></ul><ul><li>OL FAQ - http://openlibrary.org/help/faq </li></ul><ul><li>OL Technik - http://openlibrary.org/about/tech </li></ul><ul><li>OL REST API - http://openlibrary.org/dev/docs/restful_api </li></ul><ul><li>OL Upload - http://openlibrary.org/data </li></ul><ul><li>OL Feeds - http://www.archive.org/details/oldumps/ </li></ul>

×