The ZBW is a member of the Leibniz Association.
Chancen und Herausforderungen einer
komplementären Nutzung von GND und Wikidata
Joachim Neubert
ZBW – Leibniz-Informationszentrum Wirtschaft, Kiel/Hamburg
GNDCon, Frankfurt am Main, 4.12.2018
page 2
Überblick
• Ist-Stand GND/Wikidata
• Chancen einer komplementären Datenpflege
• Mögliche Workflows: Gedankenexperiment & Code
• Herausforderungen
page 3
GND-Wikidata: überlappende Daten I
…
page 4
GND-Wikidata: überlappende Daten II
Nutzersicht – Best of Breed
page 5
Doppelaufwände – bei Knappheit der Ressourcen
page 6
• Begrenzte Ressourcen bei der DNB, bei den Verbünden und den Partner-
Bibliotheken
• Jetzt schon empfindliche Engpässen – z.B.
• Zusatzaufwände (z.B. X höchstgerankte Wirtschaftswissenschaftler*innen)
schwer zu stemmen
• zwei Jahre Backlog bei gemeldeten Personendubletten
• immer noch SWD-/GKD-Dubletten aus 2012
• geplante und systematische Arbeitsteilung mit Wikidata kann Ressourcen
freisetzen
page 7
Strukturelle Chancen mit Wikidata
• Multilingualität „eingebaut“
• Viele Millionen Links zu tausenden von externen „Normdaten“beständen
• Links zu allen existierenden Wikipedia-Seiten
• Erweiterbarkeit um neue Felder ohne technische Barrieren
• Versionsgeschichte und Referenzen für jedes einzelne Statement
• große, aktive und fachkundige Community
Mechanik der Verknüpfung GND-Wikidata
page 8
• Bestehende Verknüpfungen ausbauen – in Wikidata!
• GND ID derzeit in rund 700.000 Wikidata-Items gesetzt
• Mechanismen zur Qualitätskontrolle und Lösung von Konflikten in Wikidata
nutzen
• nicht zwingend, aber sehr wünschenswert: Replikation der Wikidata-IDs in
die GND (read-only)
“Kandidaten” für die Speicherung in Wikidata
page 9
• Externe Identifier (z.B. RePEc author ID, aber m.E. auch ORCID)
• Einfache Feldwerte (z.B. Geburts-/Sterbeort)
• Affiliationen
• große Gewinne, da diese Angaben sich relativ häufig ändern, aber z.B.
von Forschungsinformationssystemen möglichst aktuell und vollständig
gebraucht werden
• aber: setzt vorherige automatische Eintragung oder parallele Neuanlage
der Institutionen voraus
Gedankenexperiment: Workflows
page 10
• Welche Workflows bräuchten wir, um Teile der GND-Informationen in
Wikidata zu erfassen und zu pflegen?
Workflow I: Aufruf des verlinkten Wikidata-Items
page 11
Code
Workflow I: Aufruf des verlinkten Wikidata-Items
page 12
Workflow I: Aufruf des verlinkten Wikidata-Items
page 13
Workflow II: Zugehöriges Item in Wikidata suchen
page 14
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.: Code
Workflow II: Zugehöriges Item in Wikidata suchen
page 15
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.:
Workflow II: Zugehöriges Item in Wikidata suchen
page 16
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.:
Workflow III: Wikidata-Item neu aus GND erzeugen
page 17
• Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
Script -> QuickStatements
Workflow III: Wikidata-Item neu aus GND erzeugen
page 18
• Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
Workflows: Desiderate
page 19
• Übergreifende Ansicht - eine gemeinsame Sicht auf in der GND und in
Wikidata gespeicherte Daten muss jederzeit und auf komfortable Weise
möglich sein, jeweils mit Provenance und idealerweise mit Hervorhebung von
Unterschieden/Widersprüchen
• Check-Prozeduren für „verdächtige“ Änderungen (Löschungen/Änderungen
von GND-Einträgen in Wikidata-Items)
Herausforderungen
page 20
• Die Arbeitsprozesse werden sich spürbar ändern
• Das Regelwerk muss angepasst werden
• Wir geben Kontrolle auf!
• Was wollen wir als Bibliotheken auch künftig allein kontrollieren?
• Wo bringen wir uns in eine – zunächst fremde – Community ein, um auf
Augenhöhe zusammenzuarbeiten?
Kontakt:
j.neubert@zbw.eu
https://www.wikidata.org/wiki/User:Jneubert
http://zbw.eu/labs/en/user/joachim-neubert
http://zbw.eu/labs/en/blog/wikidata-as-authority-linking-hub-connecting-repec-
and-gnd-researcher-identifiers
Danke für’s Zuhören –
ich freue mich auf die Diskussion!
page 21

Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata

  • 1.
    The ZBW isa member of the Leibniz Association. Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata Joachim Neubert ZBW – Leibniz-Informationszentrum Wirtschaft, Kiel/Hamburg GNDCon, Frankfurt am Main, 4.12.2018
  • 2.
    page 2 Überblick • Ist-StandGND/Wikidata • Chancen einer komplementären Datenpflege • Mögliche Workflows: Gedankenexperiment & Code • Herausforderungen
  • 3.
  • 4.
  • 5.
    Nutzersicht – Bestof Breed page 5
  • 6.
    Doppelaufwände – beiKnappheit der Ressourcen page 6 • Begrenzte Ressourcen bei der DNB, bei den Verbünden und den Partner- Bibliotheken • Jetzt schon empfindliche Engpässen – z.B. • Zusatzaufwände (z.B. X höchstgerankte Wirtschaftswissenschaftler*innen) schwer zu stemmen • zwei Jahre Backlog bei gemeldeten Personendubletten • immer noch SWD-/GKD-Dubletten aus 2012 • geplante und systematische Arbeitsteilung mit Wikidata kann Ressourcen freisetzen
  • 7.
    page 7 Strukturelle Chancenmit Wikidata • Multilingualität „eingebaut“ • Viele Millionen Links zu tausenden von externen „Normdaten“beständen • Links zu allen existierenden Wikipedia-Seiten • Erweiterbarkeit um neue Felder ohne technische Barrieren • Versionsgeschichte und Referenzen für jedes einzelne Statement • große, aktive und fachkundige Community
  • 8.
    Mechanik der VerknüpfungGND-Wikidata page 8 • Bestehende Verknüpfungen ausbauen – in Wikidata! • GND ID derzeit in rund 700.000 Wikidata-Items gesetzt • Mechanismen zur Qualitätskontrolle und Lösung von Konflikten in Wikidata nutzen • nicht zwingend, aber sehr wünschenswert: Replikation der Wikidata-IDs in die GND (read-only)
  • 9.
    “Kandidaten” für dieSpeicherung in Wikidata page 9 • Externe Identifier (z.B. RePEc author ID, aber m.E. auch ORCID) • Einfache Feldwerte (z.B. Geburts-/Sterbeort) • Affiliationen • große Gewinne, da diese Angaben sich relativ häufig ändern, aber z.B. von Forschungsinformationssystemen möglichst aktuell und vollständig gebraucht werden • aber: setzt vorherige automatische Eintragung oder parallele Neuanlage der Institutionen voraus
  • 10.
    Gedankenexperiment: Workflows page 10 •Welche Workflows bräuchten wir, um Teile der GND-Informationen in Wikidata zu erfassen und zu pflegen?
  • 11.
    Workflow I: Aufrufdes verlinkten Wikidata-Items page 11 Code
  • 12.
    Workflow I: Aufrufdes verlinkten Wikidata-Items page 12
  • 13.
    Workflow I: Aufrufdes verlinkten Wikidata-Items page 13
  • 14.
    Workflow II: ZugehörigesItem in Wikidata suchen page 14 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.: Code
  • 15.
    Workflow II: ZugehörigesItem in Wikidata suchen page 15 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.:
  • 16.
    Workflow II: ZugehörigesItem in Wikidata suchen page 16 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.:
  • 17.
    Workflow III: Wikidata-Itemneu aus GND erzeugen page 17 • Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat Script -> QuickStatements
  • 18.
    Workflow III: Wikidata-Itemneu aus GND erzeugen page 18 • Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
  • 19.
    Workflows: Desiderate page 19 •Übergreifende Ansicht - eine gemeinsame Sicht auf in der GND und in Wikidata gespeicherte Daten muss jederzeit und auf komfortable Weise möglich sein, jeweils mit Provenance und idealerweise mit Hervorhebung von Unterschieden/Widersprüchen • Check-Prozeduren für „verdächtige“ Änderungen (Löschungen/Änderungen von GND-Einträgen in Wikidata-Items)
  • 20.
    Herausforderungen page 20 • DieArbeitsprozesse werden sich spürbar ändern • Das Regelwerk muss angepasst werden • Wir geben Kontrolle auf! • Was wollen wir als Bibliotheken auch künftig allein kontrollieren? • Wo bringen wir uns in eine – zunächst fremde – Community ein, um auf Augenhöhe zusammenzuarbeiten?
  • 21.