OA-Netzwerk - semantische Anreicherung und
Vernetzung von wissenschaftlichen OA-Inhalten




     WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Initiiert durch                Gefördert durch




                  Projektpartner
Ziele


   Förderung der Sichtbarkeit deutscher Repositorieninhalte (textbasierte)


   Nationaler Aggregationsknoten (Infrastrukturaufbau)


   Förderung des „DINI-Zertifikat für Dokumenten- und Publikationsservices“


   Stärkung des Kooperationsnetzes aus OA-Projekten




            WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Herausforderungen


  Steigerung der Anzahl DINI-zertifizierter Repositorien


  Heterogenität der Metadaten (teilweise trotz DINI-Zertifikats)


  Trainingsdaten für DDC-Klassifikation


  flaches Metadatenformat Dublin Core




           WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Aktueller Schwerpunkt


  semantische Anreicherung der Metadaten


  Vernetzung mit externen Datenquellen im Sinne des Linked Data


  Aggregation von Enhanced Publications




          WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Beispiel: Vernetzung mit der DNB ohne Personenidentifikator


  1. Erzeugung eines RDF-Dumps mithilfe des D2R-Servers

  2. Verwendung des DNB RDF-Dumps als externe Datenquelle

  3. Einsatz des Kontextualisierungstools „SILK“

  4. Nutzung des Vor- und Nachnamens als Matching-Kriterium

  → Erzeugung von 80.000 owl:sameAs Links von OAN zur DNB




           WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Beispiel: Vernetzung mit der DNB ohne Personenidentifikator


  Ergebnis: Personennamen-Matching nicht ausreichend

  5. zusätzliches Titeldaten-Matching (2nd Level Comparison)

  → knapp 18.000 verifizierte Links
    jedoch auch jetzt keine 100% Bestätigung

  Optional: weitere Felder in die Verifizierung einbeziehen




           WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Ergebnisse


  Ausführliche Informationen und Ratgeber für angehende Repositorienbetreiber

  Infrastruktur für Aggregationsknoten (Open Source)

  Mehrwertdienste für Wissenschaftler (Rechercheplattform)

  Mehrwertdienste für OA-Institutionen (Validator)

  Offener Datenpool für Entwickler/OA-Projekte (REST-API, LOD)

  Technische Dienste für spezifische Problemfelder (Metadatenanreicherung,
  Metadatengenerierung, semantische Vernetzung)



           WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Zahlen, bitte!
OAN-Datenraum


  41 DINI-zertifizierte Repositorien

  268.000 Datensätze

  Volltextsuche über 160.000 OA-Publikationen

  ~ 35% des nationalen Datenraums (OAI-PMH)
    (basierend auf „2012 Census of Open Access Repositories in Germany“)

  voraussichtliche Verdopplung des Datenraums bis zum Jahresende
Ausblick


  Ausweitung des Datenraums

  Sammeln von Kontextdaten zu Compound Objects

  Identifikatoren für Autoren

  Anbindung an höhere Datenquellen (Europeana, DDB, Bibliotheksverbünde)




           WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
Vielen Dank für die Aufmerksamkeit!




WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David

Oan wisskom2012

  • 1.
    OA-Netzwerk - semantischeAnreicherung und Vernetzung von wissenschaftlichen OA-Inhalten WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 2.
    Initiiert durch Gefördert durch Projektpartner
  • 3.
    Ziele Förderung der Sichtbarkeit deutscher Repositorieninhalte (textbasierte) Nationaler Aggregationsknoten (Infrastrukturaufbau) Förderung des „DINI-Zertifikat für Dokumenten- und Publikationsservices“ Stärkung des Kooperationsnetzes aus OA-Projekten WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 4.
    Herausforderungen Steigerungder Anzahl DINI-zertifizierter Repositorien Heterogenität der Metadaten (teilweise trotz DINI-Zertifikats) Trainingsdaten für DDC-Klassifikation flaches Metadatenformat Dublin Core WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 5.
    Aktueller Schwerpunkt semantische Anreicherung der Metadaten Vernetzung mit externen Datenquellen im Sinne des Linked Data Aggregation von Enhanced Publications WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 8.
    Beispiel: Vernetzung mitder DNB ohne Personenidentifikator 1. Erzeugung eines RDF-Dumps mithilfe des D2R-Servers 2. Verwendung des DNB RDF-Dumps als externe Datenquelle 3. Einsatz des Kontextualisierungstools „SILK“ 4. Nutzung des Vor- und Nachnamens als Matching-Kriterium → Erzeugung von 80.000 owl:sameAs Links von OAN zur DNB WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 9.
    Beispiel: Vernetzung mitder DNB ohne Personenidentifikator Ergebnis: Personennamen-Matching nicht ausreichend 5. zusätzliches Titeldaten-Matching (2nd Level Comparison) → knapp 18.000 verifizierte Links jedoch auch jetzt keine 100% Bestätigung Optional: weitere Felder in die Verifizierung einbeziehen WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 18.
    Ergebnisse AusführlicheInformationen und Ratgeber für angehende Repositorienbetreiber Infrastruktur für Aggregationsknoten (Open Source) Mehrwertdienste für Wissenschaftler (Rechercheplattform) Mehrwertdienste für OA-Institutionen (Validator) Offener Datenpool für Entwickler/OA-Projekte (REST-API, LOD) Technische Dienste für spezifische Problemfelder (Metadatenanreicherung, Metadatengenerierung, semantische Vernetzung) WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 19.
  • 20.
    OAN-Datenraum 41DINI-zertifizierte Repositorien 268.000 Datensätze Volltextsuche über 160.000 OA-Publikationen ~ 35% des nationalen Datenraums (OAI-PMH) (basierend auf „2012 Census of Open Access Repositories in Germany“) voraussichtliche Verdopplung des Datenraums bis zum Jahresende
  • 26.
    Ausblick Ausweitungdes Datenraums Sammeln von Kontextdaten zu Compound Objects Identifikatoren für Autoren Anbindung an höhere Datenquellen (Europeana, DDB, Bibliotheksverbünde) WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David
  • 27.
    Vielen Dank fürdie Aufmerksamkeit! WissKom 2012 – Jülich - Julia Iwanowa, Maxi Kindling, Sammy David