Digitale Bibliothek Jakob Voß Semantic Web und Linked Open Data Eine Bibliothekarische Geschichte Bibliothek der Westsächsischen Hochschule Zwickau Montag, 12. April 2010
Semantic Web  und Linked Open Data Tim Berners-Lee: Waving the Web.  Harper,  1999 I have a dream  for the Web […] A  ‘Semantic Web’  [...] the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by  machines talking to machines . The  ‘intelligent agents’  people have touted for ages will finally materialize.
Idee des Semantic Web Computer sollen  „verstehen“ Heterogene Daten weltweit vernetzen Logische Beschreibung mit   Regeln und Schlussfolgerungen (KI) Science Fiction Inzwischen mehr: „ Linked Open   Data “ 2 1
Semantic Web und Linked Open  Data
Daten:  Strukturen aus unterscheidbarer Zeichen, die aufgrund von Verein-barungen Informationen darstellen. Semantic Web und Linked Open  Data
Bildrechte: Berlin-Verlag Semantic Web und Linked Open  Data Daten Drei Dramen In den Alpen Elfriede Jelineck Berlin Verlag ❄❄❄❄❄❄❄❄ Vereinbarung
Bildrechte: Berlin-Verlag Semantic Web und Linked Open  Data Metadaten  (über ➔) Untertitel:  Drei Dramen Titel:  In den Alpen Autor:  Elfriede Jelineck Verlag:  Berlin Verlag
Semantic Web und Linked Open  Data Strukturierte Daten Untertitel:  Drei Dramen Titel:  In den Alpen Autor:  Elfriede Jelineck Verlag:  Berlin Verlag Datensatz „ Elfriede Jelineck hat im Berlin Verlag   In den Alpen. Drei Dramen  veröffentlicht.“
Daten:  Strukturen aus unterscheidbarer Zeichen, die aufgrund von Verein-barungen Informationen darstellen. Alle Daten können binär kodiert werden 1100001 = A (Vereinbarung: ASCII) Computer speichern und verarbeiten Daten Semantic Web und Linked Open  Data
Kurze Geschichte der Datenspeicherung Ziel:  viele strukturierte Daten speichern und verfügbar machen
Kurze Geschichte der Datenspeicherung Ziel:  viele strukturierte Daten speichern und verfügbar machen Bücher Bibliotheken Bibliografien Biblioteca Universalis  1545ff
Bandkatalog, ETH Zurück (1922) http://ba.e-pics.ethz.ch/link.jsp?id=Ans_00339
Erfindung der Bibliografie Conrad Gesner Biblioteca Universalis  1545ff
Gesners Idee: Zerschneiden & Rekombinieren Titelaufnahmen der Bücher auf ein Papier schreiben Stichwörter hervorheben Blätter in Streifen schneiden Zettel in benötigter Ordnung aufkleben
Karteikarten statt Bücher zur Datenspeicherung Ziel:  viele strukturierte Daten speichern und verfügbar machen Bücher + Karteikarten Bibliotheken Bibliografien http://www.blyberg.net/card-generator/
Zettelkatalog, Universitätsbibliothek Graz Foto von Marcus Gossler (2005)
Verschiedene Sucheinstiege Autorenkatalog Titelkatalog Schlagwortkatalog … Gesamtkatalog „Mehrere Dimensionen“  Autoren Titel Schlagwörter
Bandkatalog Sequentielle Suche Grobe Sprungeinstiege Zettelkatalog Sequentielle Suche Viele Sprungeinstiege Leichter kopierbar Leichter rekombinierbar Mehrere Dimensionen
Standardisierung der Karteikarte Dewey-Decimal-Classification (DDC) American Library Association  (ALA) ab 1876 Kommerzieller Erfolg erst dank E. W. Sherman Melvil Dewey Library Bureau Catalog  (1886)
Mundaneum (1898)
Semantic  Zettelkatalog Paul Otlet
Zwischenfazit Zerschneiden & Rekombinieren Karteikarte zur Speicherung Standards zum Austausch Mehrere Sucheinstiege und Dimensionen
Kurze Geschichte der Datenspeicherung Ziel:  viele strukturierte Daten speichern und verfügbar machen Karten   Datensätze Kartei   Speicher Datenbank Hollerith-Lochkarte  (1895) IBM 305-Festplatten  (1956)
Kurze Geschichte der Datenspeicherung UNIVERSO Magnetband  (1951) IBM 305-Festplatten  (1956) Sequentiell Random Access
Bildrechte: Berlin-Verlag Untertitel:  Drei Dramen Titel:  In den Alpen Autor:  Elfriede Jelineck Verlag:  Berlin Verlag Relationales Datenbankmodell Zerschneiden & Rekombinieren
Beliebige Sucheinstiege Für jede Art von Suche (nach Autor, Titel,  Jahr, Signatur...) kann ein eigener Index eingerichtet werden Direktes Springen an die Treffer
Zettelkatalog Sequentielle Suche Viele Sprungeinstiege Leichter kopierbar Leichter rekombinierbar Mehrere Dimensionen Datenbank Indexbasierte Suche Direkte  Sprungeinstiege Beliebig  kopierbar Beliebig  rekombinierbar Beliebig  viele Dimensionen
Semantic  Web  und Linked Open  Data
Hyperlinks Ted Nelson Bild: ted.hyperland.com A File Structure for the Complex, the Changing and the Indeterminate  (1965)
Information Management: A Proposal  (1989) Tim Berners-Lee Das WWW Bild: captsolo@flickr
Das World Wide Web URL  - Einheitliche Adressierung HTTP  - Einheitlicher Transport HTML  - Einheitliche Kodierung
Before libraries join the " Semantic Web " (which exists, if I'm not mistaken, in  Unicorn-Land ), can they join the " Web Web "? For example, it would be nice if I could  link to a book in a library catalog […] Tim Spalding  (LibraryThing), NGC4LIB, 23.10.2009 http://serials.infomotions.com/ngc4lib/archive/2009/200910/1676.html
WWW falsch verstanden Portale als Gatekeeper, hinter denen Inhalte versteckt sind Eigene Protokolle statt  HTTP Dynamische Webseiten mit Sessions und Cookies statt eindeutige, stabile URLs ( Permalinks ) Bibliothekskataloge (u.A.) sind im  Web aber nicht  Teil des Web
Nicht Teil des Web: Beispiel Krücke:
Sigel:  Identifikator um auf einzelne Biblio-theken zu verweisen Inzw.  ISIL  (ISO 15511) z.B. HSB = DE-Zwi2 Referenzierbarkeit Erstes Sigelverzeichnis  (1914)
Datensatz  im Sigelverzeichnis
Grundregeln Linked Data (1/2) Benutze  URIs , um Objekte zu identifizieren Benutze  HTTP URIs  ( URLs ) , so dass Objekte nachgeschlagen werden können Tim Berners-Lee:  Linked Data Design Issues.  2006/2009 http://www.w3.org/DesignIssues/LinkedData.html
Data Linked Linked Open Data Information Management: A Proposal  (1989)
Viele Identifier, wenig URIs Publikationen:  ISSN, ISBN, DOI … Katalogisate: OCLC Number, LCCN EKI, VD16, VD17, VD18 ... Normdaten: LCSH ,  GND  (PND/GKD/SWD) ... Bibliotheken: ISIL Kataloge, Bibliotheksdienste:  ?
What makes a cool URI? A cool URI is one which does not change. What sorts of URI change? URIs don't change: people change them. Tim Berners Lee:  Cool URIs don‘t change.  1998 http://www.w3.org/Provider/Style/URI
Grundregeln Linked Data (2/2) Benutze  URIs , um Objekte zu identifizieren Benutze  HTTP URIs  ( URLs ) , so dass Objekte nachgeschlagen werden können Wenn jemand eine URI nachschlägt, biete  zweckdienliche Informationen  nach den  Standards RDF  oder SPARQL Biete  Links zu anderen URIs , so dass weitere Objekte [und Beziehungen] nachgeschlagen werden können.
Zweckdienliche Informationen
Resource Description Framework Jedes Objekt (Resource) hat eine URI Verknüpfung durch Links Jeder kann auf jeden verlinken
Resource Description Framework Jedes Objekt (Resource) hat eine URI Verknüpfung durch Links Jeder kann auf jeden verlinken
Resource Description Framework Jedes Objekt (Resource) hat eine URI Verknüpfung durch  getypte  Links Jeder kann auf jeden verlinken Auch Link- & Objekt-typen sind  Objekte
” Semantic Web ” 03/2009
Frei verfügbar Entsprechend Web-Standards Was nicht verfügbar ist, wird ignoriert Hier können Bibliotheken eine wichtige Rolle spielen (andernfalls machen es die Nutzer selber: Wikipedia, LibraryThing...) Voraussetzung: Open Data
Beispiele Siehe: Tim Berners-Lee: The year open data went worldwide. TED 2010 http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html
Bild: http://www.lsnc.net/equity/zanesville/
Bild: http://www.lsnc.net/equity/zanesville/
 
 
 
 
 
 
Vorteile Darstellung unabhängig vom Inhalt Einzelne Teile lassen sich herausnehmen   und in anderem Kontext weiterverwenden  Neue Fragen beantworten Data Mining Datenvisualisierung
Biblioteca Universalis  (Digitalisat des Exemplars) http://diglib.hab.de/drucke/49-1-quod-2f/start.htm Conrad Gesner  (in PND) http://d-nb.info/gnd/118694413  Biblioteca Universalis  (Exemplar) http://gso.gbv.de/DB=2.1/PPNSET?PPN=151089981 Herzog August Bibliothek Wolfenbüttel info:isil/DE-23 Biblioteca Universalis  (die Auflage) VD 16 G 1698 Biblioteca Universalis  (das Werk) http://www.librarything.de/work/9793769 dc:creator frbr:realization libo:exemplar frbr:owner frbr:reproduction
Der Weg ins „Semantic Web“ Datenquellen ermitteln URIs festlegen Ontologien festlegen Konvertierung nach RDF Daten unter HTTP URIs bereitstellen Joachim Neubert (ZBW): Praktische Erfahrungen aus der Linked Data Publikation bei der ZBW. SWIB09 (Folien und Mitschnitt unter http://www.swib09.de/programm_25-november.html)
Open Data aus Bibliotheken Schwedische Nationalbibliothek http://blog.libris.kb.se/semweb/ Hochschulbibliothekszentrum NRW http://www.hbz-nrw.de/projekte/linked_open_data/ Universitäts- und Stadtbibliothek Köln http://opendata.ub.uni-koeln.de/ Ghent University Library http://lib.ugent.be/info/en/exports.shtml OKF-AG Open Bibliographic Data http://wiki.okfn.org/wg/bibliography
Zusammenfassung Semantic Web und Linked Data ist keine Magie sonder basiert auf „Zerschneiden“ von Daten in Tripel Verwendung von Standards (RDF) Verlinkung von Daten Bereitstellung und Austausch von Daten Wichtiger als die konkrete Technik: Grundverständnis von Links und Daten Kopierbar- und Rekombinierbarkeit
Vielen Dank für Ihre Aufmerksamkeit! Fragen?

Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte

  • 1.
    Digitale Bibliothek JakobVoß Semantic Web und Linked Open Data Eine Bibliothekarische Geschichte Bibliothek der Westsächsischen Hochschule Zwickau Montag, 12. April 2010
  • 2.
    Semantic Web und Linked Open Data Tim Berners-Lee: Waving the Web. Harper, 1999 I have a dream for the Web […] A ‘Semantic Web’ [...] the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines . The ‘intelligent agents’ people have touted for ages will finally materialize.
  • 3.
    Idee des SemanticWeb Computer sollen „verstehen“ Heterogene Daten weltweit vernetzen Logische Beschreibung mit Regeln und Schlussfolgerungen (KI) Science Fiction Inzwischen mehr: „ Linked Open Data “ 2 1
  • 4.
    Semantic Web undLinked Open Data
  • 5.
    Daten: Strukturenaus unterscheidbarer Zeichen, die aufgrund von Verein-barungen Informationen darstellen. Semantic Web und Linked Open Data
  • 6.
    Bildrechte: Berlin-Verlag SemanticWeb und Linked Open Data Daten Drei Dramen In den Alpen Elfriede Jelineck Berlin Verlag ❄❄❄❄❄❄❄❄ Vereinbarung
  • 7.
    Bildrechte: Berlin-Verlag SemanticWeb und Linked Open Data Metadaten (über ➔) Untertitel: Drei Dramen Titel: In den Alpen Autor: Elfriede Jelineck Verlag: Berlin Verlag
  • 8.
    Semantic Web undLinked Open Data Strukturierte Daten Untertitel: Drei Dramen Titel: In den Alpen Autor: Elfriede Jelineck Verlag: Berlin Verlag Datensatz „ Elfriede Jelineck hat im Berlin Verlag In den Alpen. Drei Dramen veröffentlicht.“
  • 9.
    Daten: Strukturenaus unterscheidbarer Zeichen, die aufgrund von Verein-barungen Informationen darstellen. Alle Daten können binär kodiert werden 1100001 = A (Vereinbarung: ASCII) Computer speichern und verarbeiten Daten Semantic Web und Linked Open Data
  • 10.
    Kurze Geschichte derDatenspeicherung Ziel: viele strukturierte Daten speichern und verfügbar machen
  • 11.
    Kurze Geschichte derDatenspeicherung Ziel: viele strukturierte Daten speichern und verfügbar machen Bücher Bibliotheken Bibliografien Biblioteca Universalis 1545ff
  • 12.
    Bandkatalog, ETH Zurück(1922) http://ba.e-pics.ethz.ch/link.jsp?id=Ans_00339
  • 13.
    Erfindung der BibliografieConrad Gesner Biblioteca Universalis 1545ff
  • 14.
    Gesners Idee: Zerschneiden& Rekombinieren Titelaufnahmen der Bücher auf ein Papier schreiben Stichwörter hervorheben Blätter in Streifen schneiden Zettel in benötigter Ordnung aufkleben
  • 15.
    Karteikarten statt Bücherzur Datenspeicherung Ziel: viele strukturierte Daten speichern und verfügbar machen Bücher + Karteikarten Bibliotheken Bibliografien http://www.blyberg.net/card-generator/
  • 16.
    Zettelkatalog, Universitätsbibliothek GrazFoto von Marcus Gossler (2005)
  • 17.
    Verschiedene Sucheinstiege AutorenkatalogTitelkatalog Schlagwortkatalog … Gesamtkatalog „Mehrere Dimensionen“ Autoren Titel Schlagwörter
  • 18.
    Bandkatalog Sequentielle SucheGrobe Sprungeinstiege Zettelkatalog Sequentielle Suche Viele Sprungeinstiege Leichter kopierbar Leichter rekombinierbar Mehrere Dimensionen
  • 19.
    Standardisierung der KarteikarteDewey-Decimal-Classification (DDC) American Library Association (ALA) ab 1876 Kommerzieller Erfolg erst dank E. W. Sherman Melvil Dewey Library Bureau Catalog (1886)
  • 20.
  • 21.
  • 22.
    Zwischenfazit Zerschneiden &Rekombinieren Karteikarte zur Speicherung Standards zum Austausch Mehrere Sucheinstiege und Dimensionen
  • 23.
    Kurze Geschichte derDatenspeicherung Ziel: viele strukturierte Daten speichern und verfügbar machen Karten Datensätze Kartei Speicher Datenbank Hollerith-Lochkarte (1895) IBM 305-Festplatten (1956)
  • 24.
    Kurze Geschichte derDatenspeicherung UNIVERSO Magnetband (1951) IBM 305-Festplatten (1956) Sequentiell Random Access
  • 25.
    Bildrechte: Berlin-Verlag Untertitel: Drei Dramen Titel: In den Alpen Autor: Elfriede Jelineck Verlag: Berlin Verlag Relationales Datenbankmodell Zerschneiden & Rekombinieren
  • 26.
    Beliebige Sucheinstiege Fürjede Art von Suche (nach Autor, Titel, Jahr, Signatur...) kann ein eigener Index eingerichtet werden Direktes Springen an die Treffer
  • 27.
    Zettelkatalog Sequentielle SucheViele Sprungeinstiege Leichter kopierbar Leichter rekombinierbar Mehrere Dimensionen Datenbank Indexbasierte Suche Direkte Sprungeinstiege Beliebig kopierbar Beliebig rekombinierbar Beliebig viele Dimensionen
  • 28.
    Semantic Web und Linked Open Data
  • 29.
    Hyperlinks Ted NelsonBild: ted.hyperland.com A File Structure for the Complex, the Changing and the Indeterminate (1965)
  • 30.
    Information Management: AProposal (1989) Tim Berners-Lee Das WWW Bild: captsolo@flickr
  • 31.
    Das World WideWeb URL - Einheitliche Adressierung HTTP - Einheitlicher Transport HTML - Einheitliche Kodierung
  • 32.
    Before libraries jointhe " Semantic Web " (which exists, if I'm not mistaken, in Unicorn-Land ), can they join the " Web Web "? For example, it would be nice if I could link to a book in a library catalog […] Tim Spalding (LibraryThing), NGC4LIB, 23.10.2009 http://serials.infomotions.com/ngc4lib/archive/2009/200910/1676.html
  • 33.
    WWW falsch verstandenPortale als Gatekeeper, hinter denen Inhalte versteckt sind Eigene Protokolle statt HTTP Dynamische Webseiten mit Sessions und Cookies statt eindeutige, stabile URLs ( Permalinks ) Bibliothekskataloge (u.A.) sind im Web aber nicht Teil des Web
  • 34.
    Nicht Teil desWeb: Beispiel Krücke:
  • 35.
    Sigel: Identifikatorum auf einzelne Biblio-theken zu verweisen Inzw. ISIL (ISO 15511) z.B. HSB = DE-Zwi2 Referenzierbarkeit Erstes Sigelverzeichnis (1914)
  • 36.
    Datensatz imSigelverzeichnis
  • 37.
    Grundregeln Linked Data(1/2) Benutze URIs , um Objekte zu identifizieren Benutze HTTP URIs ( URLs ) , so dass Objekte nachgeschlagen werden können Tim Berners-Lee: Linked Data Design Issues. 2006/2009 http://www.w3.org/DesignIssues/LinkedData.html
  • 38.
    Data Linked LinkedOpen Data Information Management: A Proposal (1989)
  • 39.
    Viele Identifier, wenigURIs Publikationen: ISSN, ISBN, DOI … Katalogisate: OCLC Number, LCCN EKI, VD16, VD17, VD18 ... Normdaten: LCSH , GND (PND/GKD/SWD) ... Bibliotheken: ISIL Kataloge, Bibliotheksdienste: ?
  • 40.
    What makes acool URI? A cool URI is one which does not change. What sorts of URI change? URIs don't change: people change them. Tim Berners Lee: Cool URIs don‘t change. 1998 http://www.w3.org/Provider/Style/URI
  • 41.
    Grundregeln Linked Data(2/2) Benutze URIs , um Objekte zu identifizieren Benutze HTTP URIs ( URLs ) , so dass Objekte nachgeschlagen werden können Wenn jemand eine URI nachschlägt, biete zweckdienliche Informationen nach den Standards RDF oder SPARQL Biete Links zu anderen URIs , so dass weitere Objekte [und Beziehungen] nachgeschlagen werden können.
  • 42.
  • 43.
    Resource Description FrameworkJedes Objekt (Resource) hat eine URI Verknüpfung durch Links Jeder kann auf jeden verlinken
  • 44.
    Resource Description FrameworkJedes Objekt (Resource) hat eine URI Verknüpfung durch Links Jeder kann auf jeden verlinken
  • 45.
    Resource Description FrameworkJedes Objekt (Resource) hat eine URI Verknüpfung durch getypte Links Jeder kann auf jeden verlinken Auch Link- & Objekt-typen sind Objekte
  • 46.
    ” Semantic Web” 03/2009
  • 47.
    Frei verfügbar EntsprechendWeb-Standards Was nicht verfügbar ist, wird ignoriert Hier können Bibliotheken eine wichtige Rolle spielen (andernfalls machen es die Nutzer selber: Wikipedia, LibraryThing...) Voraussetzung: Open Data
  • 48.
    Beispiele Siehe: TimBerners-Lee: The year open data went worldwide. TED 2010 http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
    Vorteile Darstellung unabhängigvom Inhalt Einzelne Teile lassen sich herausnehmen und in anderem Kontext weiterverwenden Neue Fragen beantworten Data Mining Datenvisualisierung
  • 58.
    Biblioteca Universalis (Digitalisat des Exemplars) http://diglib.hab.de/drucke/49-1-quod-2f/start.htm Conrad Gesner (in PND) http://d-nb.info/gnd/118694413 Biblioteca Universalis (Exemplar) http://gso.gbv.de/DB=2.1/PPNSET?PPN=151089981 Herzog August Bibliothek Wolfenbüttel info:isil/DE-23 Biblioteca Universalis (die Auflage) VD 16 G 1698 Biblioteca Universalis (das Werk) http://www.librarything.de/work/9793769 dc:creator frbr:realization libo:exemplar frbr:owner frbr:reproduction
  • 59.
    Der Weg ins„Semantic Web“ Datenquellen ermitteln URIs festlegen Ontologien festlegen Konvertierung nach RDF Daten unter HTTP URIs bereitstellen Joachim Neubert (ZBW): Praktische Erfahrungen aus der Linked Data Publikation bei der ZBW. SWIB09 (Folien und Mitschnitt unter http://www.swib09.de/programm_25-november.html)
  • 60.
    Open Data ausBibliotheken Schwedische Nationalbibliothek http://blog.libris.kb.se/semweb/ Hochschulbibliothekszentrum NRW http://www.hbz-nrw.de/projekte/linked_open_data/ Universitäts- und Stadtbibliothek Köln http://opendata.ub.uni-koeln.de/ Ghent University Library http://lib.ugent.be/info/en/exports.shtml OKF-AG Open Bibliographic Data http://wiki.okfn.org/wg/bibliography
  • 61.
    Zusammenfassung Semantic Webund Linked Data ist keine Magie sonder basiert auf „Zerschneiden“ von Daten in Tripel Verwendung von Standards (RDF) Verlinkung von Daten Bereitstellung und Austausch von Daten Wichtiger als die konkrete Technik: Grundverständnis von Links und Daten Kopierbar- und Rekombinierbarkeit
  • 62.
    Vielen Dank fürIhre Aufmerksamkeit! Fragen?