Linked Open Projects

Nachnutzung von Projektergebnissen
         als Linked Data

                           Kai Eckert (Dipl.-Inf., Dipl.-Wirt.-Inf.)
                            kai.eckert@bib.uni-mannheim.de

                        Magnus Pfeffer (Dipl.-Inf., M.A. LIS)
                       magnus.pfeffer@bib.uni-mannheim.de




DGI-Konferenz, 8.10.2010                                               Linked Open Projects
Was denn für Projekte?
 Projekte, die Daten erzeugen
     In vielen (Bibliotheks-)Projekten werden Daten erzeugt
 Aber auch in anderen Bereichen:
     Umfragen
     Census of Marine Life
     Studien
     ...




DGI-Konferenz, 8.10.2010                        Linked Open Projects
Projekte


    G roße te                                Kleine Projekte
    Pr ojek

            n                   aftler Arbeits-         MBF
                                                             ,
        ente                nsch                       B
    Stud              W isse           gruppen         D FG..
                                                              .



                 e                                       “
           „ Hoh ät“                               reien
                lit                        „S piele
            Qu a
DGI-Konferenz, 8.10.2010                          Linked Open Projects
Was passiert mit den Daten?
 Die Nachnutzung der Daten ist wichtig
     ... laut den Projektanträgen
 Die Nachnutzung ist schwierig
     „Die Daten sind ja gar nicht repräsentativ...“
     „Da fehlen doch aber noch Daten...“
     „In der Qualität kann man das aber nicht verwenden...“
     „Da haben wir doch gar kein Feld mehr frei...“
     „Das ist ja gar nicht in XYZ 4.3...“
     „Wo kämen wir denn da hin...“
     ...




DGI-Konferenz, 8.10.2010                           Linked Open Projects
Und Recht haben sie!
 Unterschiedliche Ansprüche bei Datenerzeugern
    und Datennutzern.
   Konkrete Anwendungen können oft im Vorfeld
    noch gar nicht bekannt sein.
   Integration in bestehende Datenbanken ist
    schwierig.
   Trotzdem sind die Daten wertvoll.
   Insbesondere in der Gesamtheit all der vielen
    kleinen Projekte.


DGI-Konferenz, 8.10.2010               Linked Open Projects
Wo ist denn nun das Problem?
 Die Gesamtheit der Daten ist schwierig zu
  nutzen.
 Die Nachnutzung erfordert
     Aggregation der Daten,
     Integration der Daten.
 Und das ist ganz schön aufwändig.




DGI-Konferenz, 8.10.2010              Linked Open Projects
Umsetzung Bisher
                               Bisher
Zugang
   Einheitlicher Zugriff       Archive im Web
   Möglichkeit der Selektion
Datenformat
    Einheitliche Syntax
    Maschinenlesbar            CSV, XML
Vokabular
   Nachvollziehbare Semantik   Spaltenüberschrift
   Projektübergreifend         Feldbeschreibung
Ressourcen
   Verknüpfung mit den         Lokale/
   Ursprungsdaten              uneinheitliche ID


DGI-Konferenz, 8.10.2010                            Linked Open Projects
Umsetzung Bisher
                               Bisher
Zugang
   Einheitlicher Zugriff       Archive im Web       ← Unhandlich
   Möglichkeit der Selektion                        ← Grob
Datenformat
    Einheitliche Syntax
    Maschinenlesbar            CSV, XML             ← OK
Vokabular
   Nachvollziehbare Semantik   Spaltenüberschrift
   Projektübergreifend         Feldbeschreibung     ← Uneinheitlich
Ressourcen
   Verknüpfung mit den         Lokale/
   Ursprungsdaten              uneinheitliche ID    ← Nicht eindeutig


DGI-Konferenz, 8.10.2010                              Linked Open Projects
Alternative: Linked Data
                               Bisher               Linked Data
Zugang
   Einheitlicher Zugriff       Archive im Web       URI Dereferencing
   Möglichkeit der Selektion                        Sparql
Datenformat
    Einheitliche Syntax
    Maschinenlesbar            CSV, XML             RDF
Vokabular
   Nachvollziehbare Semantik   Spaltenüberschrift   externes Vokabular
   Projektübergreifend         Feldbeschreibung     Verknüpfbar
Ressourcen
   Verknüpfung mit den         Lokale/              URI
   Ursprungsdaten              uneinheitliche ID


DGI-Konferenz, 8.10.2010                              Linked Open Projects
Projekte



DGI-Konferenz, 8.10.2010              Linked Open Projects
Projekte mit Metadaten
 Konkordanzen
     Verknüpfung Katalogeintrag mit Katalogeintrag
     Verknüpfung Normdateneintrag mit Normdateneintrag
 Anreicherung
     Verknüpfung Katalogeintrag mir sonstigen Daten
 Erschließung
     Verknüpfung Katalogeintrag mit Normdateneintrag
 Datenservice
     Katalogdaten für Forschung und Lehre
     Zentrale Normdatenverwaltung



DGI-Konferenz, 8.10.2010                      Linked Open Projects
Automatische Erschließung
 DFG Projekt (2007-2009)
 Automatische Verschlagwortung nach STW
 Umfang: > 10.000 Abstracts
 Ziel: Qualitative Bewertung der Verfahren
 Daten im CSV-Format




DGI-Konferenz, 8.10.2010              Linked Open Projects
Anreicherung von Katalogdaten
 SWBPlus
 Kooperation im Südwestverbund
 Zusatzinformationen für den Katalog:
     Inhaltsveerzeichnisse
     Klappentexte
     Cover
 Umfang: Alle Neuerscheinungen im Verbund
 Daten in XML
 Geschlossener Nutzerkreis


DGI-Konferenz, 8.10.2010             Linked Open Projects
Konkordanzen
 Abgleich SWB/HeBIS
 Umfang: 22 Millionen Titeldaten
 Ziel: Übernahme von Erschließungsdaten
 Daten im CSV-Format




DGI-Konferenz, 8.10.2010            Linked Open Projects
Linked Data Service (LDS)
        der UB Mannheim


DGI-Konferenz, 8.10.2010   Linked Open Projects
DGI-Konferenz, 8.10.2010   Linked Open Projects
Linked Data Service der UB Mannheim
 Prototyp und Testsystem
     Vergleich von Softwaresystemen
     Skalierung bei großen Datenmengen
     Alternativen bei Darstellungen in RDF
    
 Showcase
     HTML Ansicht und RDF/XML Download
     Metadaten und Normdaten als Linked Data
     Verknüpfung mit bestehenden Angeboten
     Hosting von verschiedenen Projektdaten




DGI-Konferenz, 8.10.2010                        Linked Open Projects
URI                                Beschreibung
http://data.bib.uni-              Titel aus dem Südwestdeutschen
mannheim.de/data/swb/<PPN>        Bibliotheksverbund (SWB), <PPN> entspricht der
                                  internen Identifikationsnummer des SWB.
http://data.bib.uni-              Titel aus dem Hessischen
mannheim.de/data/hebis/<PPN>      Bibliotheksinformationssystem (HeBIS), <PPN>
                                  entspricht der internen Identifikationsnummer des
                                  HeBIS.
http://data.bib.uni-              Titel aus dem Hochschulbibliothekszentrum des
mannheim.de/data/hbz/<PPN>        Landes Nordrhein-Westfalen (HBZ), <PPN>
                                  entspricht der internen Identifikationsnummer des
                                  HBZ.
http://data.bib.uni-              Klassifikationen nach der Regensburger
mannheim.de/data/rvk/<NOTATION>   Verbundklassifikation (RVK). <NOTATION>
                                  entspricht der RVK-Notation, das Leerzeichen
                                  wurde durch _ ersetzt (z.B. FB_1575).




 DGI-Konferenz, 8.10.2010                                     Linked Open Projects
URI       Bezeichnung                                  Hinweis
dc:title         Titel           Haupttitel in Vorlageform plus Zusatz
dc:creator       Urheber         Autoren in Ansetzungsform “Nachname, Vorname” oder
                                 Bezeichnung der Körperschaft.
dc:contributor   Mitwirkende/r   Weitere Beteiligte, wie Herausgeber o.ä., in Ansetzungform
                                 “Nachname, Vorname” oder Bezeichnung der Körperschaft.
dc:date          Zeitangabe      Erscheinungsjahr
dc:publisher     Verleger(in)    Verlag
isbd:P1008       has edition     Informationen zur Auflage
                 statement
dc:identifier    Identifikator   Die ISBN als URI: uri:ISBN:<ISBN>
dc:language      Sprache         Die Sprache, nach ISO 639-2 (B)
dc:subject       Thema           Schlagworte nach SWD mit URI der DNB, Klassifikationen nach
                                 RVK mit URI der UB Mannheim (s.o.).
rdfs:seeAlso     siehe auch      Links zu anderen Linked Data Angeboten, z.Z. zum Book Mashup
                                 Dienst der FU Berlin.
ubma:equals      Andere          Hierbei handelt es sich um das Ergebnis eines Projekts der UB
For              Ausgabe         Mannheim, das durch diesen Dienst leicht nachgenutzt werden
Classification                   kann.

  DGI-Konferenz, 8.10.2010                                               Linked Open Projects
HeBIS
                                                                     ion
                                                              c at
                                                     as   sifi                                            uals
                                                  rCl                                               a: eq
                                                o                                               ubm
                                        ua   lsF                                                 For ification
                                 : eq                                                            Clas
                                                                                                      s
                           ub ma

   UBMA
                                              ForClassifica
                                                            tio            n                      USB
                                  ubma:equals
                                                                                                  Köln
     SWB
                             dc:subject                                    rdfs:seeAlso

                                                                                    RDF
                               GND                                                  Book-
                                                                                   mashup
DGI-Konferenz, 8.10.2010                                                                  Linked Open Projects
Linked Data Service (Public Beta)
 Website / Dokumentation
     http://data.bib.uni-mannheim.de/
 SparQL Endpoint
     http://data.bib.uni-mannheim.de/sparql/
 URI-Dereferencing (httpRange-14)
     303 Verweis auf HTML oder RDF Darstellung
 Technische Basis
     Zur Zeit Virtuoso Universal Server
     Andere Systeme in Evaluation




DGI-Konferenz, 8.10.2010                        Linked Open Projects
DGI-Konferenz, 8.10.2010   Linked Open Projects
Einfache Nachnutzung
 Standardisierte Schnittstelle:
    select distinct ?titles where {
       <http://data.bib.uni-mannheim.de/data/swb/305776088>
            ubma:equalsForClassification ?titles.
    }

    titles
    http://data.bib.uni-mannheim.de/data/hebis/214418405
    http://data.bib.uni-mannheim.de/data/hebis/212760327




DGI-Konferenz, 8.10.2010                     Linked Open Projects
Studentenprojekt
 Rechercheportal Wirtschaftsinformatik
 Laufzeit: 1 Jahr (HWS 2010, FSS 2011)
 10 Studenten
 Aufbereitung bibliographischer Daten, Mashup
 Zugriff auf Daten der UB Mannheim via LDS
 Bedingung: Jegliche Datenaufbereitung wird als
   RDF, bzw, via Sparql-Endpoint zur Verfügung
   gestellt.


DGI-Konferenz, 8.10.2010             Linked Open Projects
Ideen und Pläne
 Einbindung weiterer Datensätze.
     Verlinkung von Personen und Körperschaften mit der PND.
     Vollständige Implementierung der RVK als Linked Data.
 Integration von Projektergebnissen und neuen
   Daten:
     Studentenprojekt(e)
     Automatische Inhaltserschließung
     Automatisch und manuell erstellte Konkordanzen
 Provenienzinformationen zu den gelinkten und
  geladenen Daten.
 Know-How-Transfer.
DGI-Konferenz, 8.10.2010                      Linked Open Projects
Viel Spaß beim Spielen!

                http://data.bib.uni-mannheim.de/

            Vielen Dank für Ihre Aufmerksamkeit!

                      http://slideshare.net/kaiec


DGI-Konferenz, 8.10.2010                            Linked Open Projects

Linked Open Projects (DGI-Konferenz)

  • 1.
    Linked Open Projects Nachnutzungvon Projektergebnissen als Linked Data Kai Eckert (Dipl.-Inf., Dipl.-Wirt.-Inf.) kai.eckert@bib.uni-mannheim.de Magnus Pfeffer (Dipl.-Inf., M.A. LIS) magnus.pfeffer@bib.uni-mannheim.de DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 2.
    Was denn fürProjekte?  Projekte, die Daten erzeugen  In vielen (Bibliotheks-)Projekten werden Daten erzeugt  Aber auch in anderen Bereichen:  Umfragen  Census of Marine Life  Studien  ... DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 3.
    Projekte G roße te Kleine Projekte Pr ojek n aftler Arbeits- MBF , ente nsch B Stud W isse gruppen D FG.. . e “ „ Hoh ät“ reien lit „S piele Qu a DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 4.
    Was passiert mitden Daten?  Die Nachnutzung der Daten ist wichtig  ... laut den Projektanträgen  Die Nachnutzung ist schwierig  „Die Daten sind ja gar nicht repräsentativ...“  „Da fehlen doch aber noch Daten...“  „In der Qualität kann man das aber nicht verwenden...“  „Da haben wir doch gar kein Feld mehr frei...“  „Das ist ja gar nicht in XYZ 4.3...“  „Wo kämen wir denn da hin...“  ... DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 5.
    Und Recht habensie!  Unterschiedliche Ansprüche bei Datenerzeugern und Datennutzern.  Konkrete Anwendungen können oft im Vorfeld noch gar nicht bekannt sein.  Integration in bestehende Datenbanken ist schwierig.  Trotzdem sind die Daten wertvoll.  Insbesondere in der Gesamtheit all der vielen kleinen Projekte. DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 6.
    Wo ist dennnun das Problem?  Die Gesamtheit der Daten ist schwierig zu nutzen.  Die Nachnutzung erfordert  Aggregation der Daten,  Integration der Daten.  Und das ist ganz schön aufwändig. DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 7.
    Umsetzung Bisher Bisher Zugang Einheitlicher Zugriff Archive im Web Möglichkeit der Selektion Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML Vokabular Nachvollziehbare Semantik Spaltenüberschrift Projektübergreifend Feldbeschreibung Ressourcen Verknüpfung mit den Lokale/ Ursprungsdaten uneinheitliche ID DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 8.
    Umsetzung Bisher Bisher Zugang Einheitlicher Zugriff Archive im Web ← Unhandlich Möglichkeit der Selektion ← Grob Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML ← OK Vokabular Nachvollziehbare Semantik Spaltenüberschrift Projektübergreifend Feldbeschreibung ← Uneinheitlich Ressourcen Verknüpfung mit den Lokale/ Ursprungsdaten uneinheitliche ID ← Nicht eindeutig DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 9.
    Alternative: Linked Data Bisher Linked Data Zugang Einheitlicher Zugriff Archive im Web URI Dereferencing Möglichkeit der Selektion Sparql Datenformat Einheitliche Syntax Maschinenlesbar CSV, XML RDF Vokabular Nachvollziehbare Semantik Spaltenüberschrift externes Vokabular Projektübergreifend Feldbeschreibung Verknüpfbar Ressourcen Verknüpfung mit den Lokale/ URI Ursprungsdaten uneinheitliche ID DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 10.
  • 11.
    Projekte mit Metadaten Konkordanzen  Verknüpfung Katalogeintrag mit Katalogeintrag  Verknüpfung Normdateneintrag mit Normdateneintrag  Anreicherung  Verknüpfung Katalogeintrag mir sonstigen Daten  Erschließung  Verknüpfung Katalogeintrag mit Normdateneintrag  Datenservice  Katalogdaten für Forschung und Lehre  Zentrale Normdatenverwaltung DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 12.
    Automatische Erschließung  DFGProjekt (2007-2009)  Automatische Verschlagwortung nach STW  Umfang: > 10.000 Abstracts  Ziel: Qualitative Bewertung der Verfahren  Daten im CSV-Format DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 13.
    Anreicherung von Katalogdaten SWBPlus  Kooperation im Südwestverbund  Zusatzinformationen für den Katalog:  Inhaltsveerzeichnisse  Klappentexte  Cover  Umfang: Alle Neuerscheinungen im Verbund  Daten in XML  Geschlossener Nutzerkreis DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 14.
    Konkordanzen  Abgleich SWB/HeBIS Umfang: 22 Millionen Titeldaten  Ziel: Übernahme von Erschließungsdaten  Daten im CSV-Format DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 15.
    Linked Data Service(LDS) der UB Mannheim DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 16.
    DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 17.
    Linked Data Serviceder UB Mannheim  Prototyp und Testsystem  Vergleich von Softwaresystemen  Skalierung bei großen Datenmengen  Alternativen bei Darstellungen in RDF   Showcase  HTML Ansicht und RDF/XML Download  Metadaten und Normdaten als Linked Data  Verknüpfung mit bestehenden Angeboten  Hosting von verschiedenen Projektdaten DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 18.
    URI Beschreibung http://data.bib.uni- Titel aus dem Südwestdeutschen mannheim.de/data/swb/<PPN> Bibliotheksverbund (SWB), <PPN> entspricht der internen Identifikationsnummer des SWB. http://data.bib.uni- Titel aus dem Hessischen mannheim.de/data/hebis/<PPN> Bibliotheksinformationssystem (HeBIS), <PPN> entspricht der internen Identifikationsnummer des HeBIS. http://data.bib.uni- Titel aus dem Hochschulbibliothekszentrum des mannheim.de/data/hbz/<PPN> Landes Nordrhein-Westfalen (HBZ), <PPN> entspricht der internen Identifikationsnummer des HBZ. http://data.bib.uni- Klassifikationen nach der Regensburger mannheim.de/data/rvk/<NOTATION> Verbundklassifikation (RVK). <NOTATION> entspricht der RVK-Notation, das Leerzeichen wurde durch _ ersetzt (z.B. FB_1575). DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 19.
    URI Bezeichnung Hinweis dc:title Titel Haupttitel in Vorlageform plus Zusatz dc:creator Urheber Autoren in Ansetzungsform “Nachname, Vorname” oder Bezeichnung der Körperschaft. dc:contributor Mitwirkende/r Weitere Beteiligte, wie Herausgeber o.ä., in Ansetzungform “Nachname, Vorname” oder Bezeichnung der Körperschaft. dc:date Zeitangabe Erscheinungsjahr dc:publisher Verleger(in) Verlag isbd:P1008 has edition Informationen zur Auflage statement dc:identifier Identifikator Die ISBN als URI: uri:ISBN:<ISBN> dc:language Sprache Die Sprache, nach ISO 639-2 (B) dc:subject Thema Schlagworte nach SWD mit URI der DNB, Klassifikationen nach RVK mit URI der UB Mannheim (s.o.). rdfs:seeAlso siehe auch Links zu anderen Linked Data Angeboten, z.Z. zum Book Mashup Dienst der FU Berlin. ubma:equals Andere Hierbei handelt es sich um das Ergebnis eines Projekts der UB For Ausgabe Mannheim, das durch diesen Dienst leicht nachgenutzt werden Classification kann. DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 20.
    HeBIS ion c at as sifi uals rCl a: eq o ubm ua lsF For ification : eq Clas s ub ma UBMA ForClassifica tio n USB ubma:equals Köln SWB dc:subject rdfs:seeAlso RDF GND Book- mashup DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 21.
    Linked Data Service(Public Beta)  Website / Dokumentation  http://data.bib.uni-mannheim.de/  SparQL Endpoint  http://data.bib.uni-mannheim.de/sparql/  URI-Dereferencing (httpRange-14)  303 Verweis auf HTML oder RDF Darstellung  Technische Basis  Zur Zeit Virtuoso Universal Server  Andere Systeme in Evaluation DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 22.
    DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 23.
    Einfache Nachnutzung  StandardisierteSchnittstelle: select distinct ?titles where { <http://data.bib.uni-mannheim.de/data/swb/305776088> ubma:equalsForClassification ?titles. } titles http://data.bib.uni-mannheim.de/data/hebis/214418405 http://data.bib.uni-mannheim.de/data/hebis/212760327 DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 24.
    Studentenprojekt  Rechercheportal Wirtschaftsinformatik Laufzeit: 1 Jahr (HWS 2010, FSS 2011)  10 Studenten  Aufbereitung bibliographischer Daten, Mashup  Zugriff auf Daten der UB Mannheim via LDS  Bedingung: Jegliche Datenaufbereitung wird als RDF, bzw, via Sparql-Endpoint zur Verfügung gestellt. DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 25.
    Ideen und Pläne Einbindung weiterer Datensätze.  Verlinkung von Personen und Körperschaften mit der PND.  Vollständige Implementierung der RVK als Linked Data.  Integration von Projektergebnissen und neuen Daten:  Studentenprojekt(e)  Automatische Inhaltserschließung  Automatisch und manuell erstellte Konkordanzen  Provenienzinformationen zu den gelinkten und geladenen Daten.  Know-How-Transfer. DGI-Konferenz, 8.10.2010 Linked Open Projects
  • 26.
    Viel Spaß beimSpielen! http://data.bib.uni-mannheim.de/ Vielen Dank für Ihre Aufmerksamkeit! http://slideshare.net/kaiec DGI-Konferenz, 8.10.2010 Linked Open Projects