SlideShare ist ein Scribd-Unternehmen logo
1 von 21
Downloaden Sie, um offline zu lesen
The ZBW is a member of the Leibniz Association.
Chancen und Herausforderungen einer
komplementären Nutzung von GND und Wikidata
Joachim Neubert
ZBW – Leibniz-Informationszentrum Wirtschaft, Kiel/Hamburg
GNDCon, Frankfurt am Main, 4.12.2018
page 2
Überblick
• Ist-Stand GND/Wikidata
• Chancen einer komplementären Datenpflege
• Mögliche Workflows: Gedankenexperiment & Code
• Herausforderungen
page 3
GND-Wikidata: überlappende Daten I
…
page 4
GND-Wikidata: überlappende Daten II
Nutzersicht – Best of Breed
page 5
Doppelaufwände – bei Knappheit der Ressourcen
page 6
• Begrenzte Ressourcen bei der DNB, bei den Verbünden und den Partner-
Bibliotheken
• Jetzt schon empfindliche Engpässen – z.B.
• Zusatzaufwände (z.B. X höchstgerankte Wirtschaftswissenschaftler*innen)
schwer zu stemmen
• zwei Jahre Backlog bei gemeldeten Personendubletten
• immer noch SWD-/GKD-Dubletten aus 2012
• geplante und systematische Arbeitsteilung mit Wikidata kann Ressourcen
freisetzen
page 7
Strukturelle Chancen mit Wikidata
• Multilingualität „eingebaut“
• Viele Millionen Links zu tausenden von externen „Normdaten“beständen
• Links zu allen existierenden Wikipedia-Seiten
• Erweiterbarkeit um neue Felder ohne technische Barrieren
• Versionsgeschichte und Referenzen für jedes einzelne Statement
• große, aktive und fachkundige Community
Mechanik der Verknüpfung GND-Wikidata
page 8
• Bestehende Verknüpfungen ausbauen – in Wikidata!
• GND ID derzeit in rund 700.000 Wikidata-Items gesetzt
• Mechanismen zur Qualitätskontrolle und Lösung von Konflikten in Wikidata
nutzen
• nicht zwingend, aber sehr wünschenswert: Replikation der Wikidata-IDs in
die GND (read-only)
“Kandidaten” für die Speicherung in Wikidata
page 9
• Externe Identifier (z.B. RePEc author ID, aber m.E. auch ORCID)
• Einfache Feldwerte (z.B. Geburts-/Sterbeort)
• Affiliationen
• große Gewinne, da diese Angaben sich relativ häufig ändern, aber z.B.
von Forschungsinformationssystemen möglichst aktuell und vollständig
gebraucht werden
• aber: setzt vorherige automatische Eintragung oder parallele Neuanlage
der Institutionen voraus
Gedankenexperiment: Workflows
page 10
• Welche Workflows bräuchten wir, um Teile der GND-Informationen in
Wikidata zu erfassen und zu pflegen?
Workflow I: Aufruf des verlinkten Wikidata-Items
page 11
Code
Workflow I: Aufruf des verlinkten Wikidata-Items
page 12
Workflow I: Aufruf des verlinkten Wikidata-Items
page 13
Workflow II: Zugehöriges Item in Wikidata suchen
page 14
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.: Code
Workflow II: Zugehöriges Item in Wikidata suchen
page 15
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.:
Workflow II: Zugehöriges Item in Wikidata suchen
page 16
• unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata)
• Beispiel Dunning, John H.:
Workflow III: Wikidata-Item neu aus GND erzeugen
page 17
• Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
Script -> QuickStatements
Workflow III: Wikidata-Item neu aus GND erzeugen
page 18
• Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
Workflows: Desiderate
page 19
• Übergreifende Ansicht - eine gemeinsame Sicht auf in der GND und in
Wikidata gespeicherte Daten muss jederzeit und auf komfortable Weise
möglich sein, jeweils mit Provenance und idealerweise mit Hervorhebung von
Unterschieden/Widersprüchen
• Check-Prozeduren für „verdächtige“ Änderungen (Löschungen/Änderungen
von GND-Einträgen in Wikidata-Items)
Herausforderungen
page 20
• Die Arbeitsprozesse werden sich spürbar ändern
• Das Regelwerk muss angepasst werden
• Wir geben Kontrolle auf!
• Was wollen wir als Bibliotheken auch künftig allein kontrollieren?
• Wo bringen wir uns in eine – zunächst fremde – Community ein, um auf
Augenhöhe zusammenzuarbeiten?
Kontakt:
j.neubert@zbw.eu
https://www.wikidata.org/wiki/User:Jneubert
http://zbw.eu/labs/en/user/joachim-neubert
http://zbw.eu/labs/en/blog/wikidata-as-authority-linking-hub-connecting-repec-
and-gnd-researcher-identifiers
Danke für’s Zuhören –
ich freue mich auf die Diskussion!
page 21

Weitere ähnliche Inhalte

Ähnlich wie Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata

Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
Matthias Arnold
 

Ähnlich wie Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata (9)

Econ Desk - Die Online-Auskunft für die Wirtschaftswissenschaften
Econ Desk - Die Online-Auskunft für die WirtschaftswissenschaftenEcon Desk - Die Online-Auskunft für die Wirtschaftswissenschaften
Econ Desk - Die Online-Auskunft für die Wirtschaftswissenschaften
 
Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
Republikzeitliche chinesische Presse – Crowdsourcing und andere Wege in Richt...
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
 
Wikidata (für Archive)
Wikidata (für Archive)Wikidata (für Archive)
Wikidata (für Archive)
 
Collaboration mit Wiki – klappt im Intranet und Extranet.
Collaboration mit Wiki – klappt im Intranet und Extranet.Collaboration mit Wiki – klappt im Intranet und Extranet.
Collaboration mit Wiki – klappt im Intranet und Extranet.
 
Selbermachen!
Selbermachen! Selbermachen!
Selbermachen!
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement Semantic MediaWiki im Projektmanagement
Semantic MediaWiki im Projektmanagement
 

Mehr von Joachim Neubert

Wikidata as authority linking hub
Wikidata as authority linking hubWikidata as authority linking hub
Wikidata as authority linking hub
Joachim Neubert
 

Mehr von Joachim Neubert (20)

Linking the 20th century paper history to the sum of all knowledge
Linking the 20th century paper history to the sum of all knowledgeLinking the 20th century paper history to the sum of all knowledge
Linking the 20th century paper history to the sum of all knowledge
 
Exploring and mapping the category system of the world‘s largest public press...
Exploring and mapping the category system of the world‘s largest public press...Exploring and mapping the category system of the world‘s largest public press...
Exploring and mapping the category system of the world‘s largest public press...
 
Donating data to Wikidata: First experiences from the „20th Century Press Arc...
Donating data to Wikidata: First experiences from the „20th Century Press Arc...Donating data to Wikidata: First experiences from the „20th Century Press Arc...
Donating data to Wikidata: First experiences from the „20th Century Press Arc...
 
Wikidata as a hub for the linked data cloud
Wikidata as a hub for the linked data cloudWikidata as a hub for the linked data cloud
Wikidata as a hub for the linked data cloud
 
Wikidata as opportunity for special collections: the 20th Century Press Archi...
Wikidata as opportunity for special collections: the 20th Century Press Archi...Wikidata as opportunity for special collections: the 20th Century Press Archi...
Wikidata as opportunity for special collections: the 20th Century Press Archi...
 
20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata
 
Pressemappe 20. Jahrhundert: Personen- und Firmendossiers
Pressemappe 20. Jahrhundert: Personen- und FirmendossiersPressemappe 20. Jahrhundert: Personen- und Firmendossiers
Pressemappe 20. Jahrhundert: Personen- und Firmendossiers
 
20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata
 
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)
 
Making Wikidata fit as a Linking Hub for Knowledge Organization Systems
Making Wikidata fit as a Linking Hub for Knowledge Organization SystemsMaking Wikidata fit as a Linking Hub for Knowledge Organization Systems
Making Wikidata fit as a Linking Hub for Knowledge Organization Systems
 
Linking authorities through Wikidata
Linking authorities through WikidataLinking authorities through Wikidata
Linking authorities through Wikidata
 
Wikidata as a linking hub for knowledge organization systems? Integrating an ...
Wikidata as a linking hub for knowledge organization systems? Integrating an ...Wikidata as a linking hub for knowledge organization systems? Integrating an ...
Wikidata as a linking hub for knowledge organization systems? Integrating an ...
 
Wikidata as authority linking hub
Wikidata as authority linking hubWikidata as authority linking hub
Wikidata as authority linking hub
 
EconBiz Research Dataset (SWIB16 Lightning Talk)
EconBiz Research Dataset (SWIB16 Lightning Talk)EconBiz Research Dataset (SWIB16 Lightning Talk)
EconBiz Research Dataset (SWIB16 Lightning Talk)
 
Using Wikidata as an Authority for the SowiDataNet Research Data Repository
Using Wikidata as an Authority for the SowiDataNet Research Data RepositoryUsing Wikidata as an Authority for the SowiDataNet Research Data Repository
Using Wikidata as an Authority for the SowiDataNet Research Data Repository
 
Change Tracking in Knowledge Organization Systems with skos-history
Change Tracking in Knowledge Organization Systems with skos-historyChange Tracking in Knowledge Organization Systems with skos-history
Change Tracking in Knowledge Organization Systems with skos-history
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
 
Leveraging SKOS to trace the overhaul of the STW Thesaurus for Economics
Leveraging SKOS to trace the overhaul of the STW Thesaurus for EconomicsLeveraging SKOS to trace the overhaul of the STW Thesaurus for Economics
Leveraging SKOS to trace the overhaul of the STW Thesaurus for Economics
 
skos-history: Tracking the evolution of Knowledge Organization Systems
skos-history: Tracking the evolution of Knowledge Organization Systemsskos-history: Tracking the evolution of Knowledge Organization Systems
skos-history: Tracking the evolution of Knowledge Organization Systems
 
KOS evolution in Linked Data
KOS evolution in Linked DataKOS evolution in Linked Data
KOS evolution in Linked Data
 

Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata

  • 1. The ZBW is a member of the Leibniz Association. Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata Joachim Neubert ZBW – Leibniz-Informationszentrum Wirtschaft, Kiel/Hamburg GNDCon, Frankfurt am Main, 4.12.2018
  • 2. page 2 Überblick • Ist-Stand GND/Wikidata • Chancen einer komplementären Datenpflege • Mögliche Workflows: Gedankenexperiment & Code • Herausforderungen
  • 5. Nutzersicht – Best of Breed page 5
  • 6. Doppelaufwände – bei Knappheit der Ressourcen page 6 • Begrenzte Ressourcen bei der DNB, bei den Verbünden und den Partner- Bibliotheken • Jetzt schon empfindliche Engpässen – z.B. • Zusatzaufwände (z.B. X höchstgerankte Wirtschaftswissenschaftler*innen) schwer zu stemmen • zwei Jahre Backlog bei gemeldeten Personendubletten • immer noch SWD-/GKD-Dubletten aus 2012 • geplante und systematische Arbeitsteilung mit Wikidata kann Ressourcen freisetzen
  • 7. page 7 Strukturelle Chancen mit Wikidata • Multilingualität „eingebaut“ • Viele Millionen Links zu tausenden von externen „Normdaten“beständen • Links zu allen existierenden Wikipedia-Seiten • Erweiterbarkeit um neue Felder ohne technische Barrieren • Versionsgeschichte und Referenzen für jedes einzelne Statement • große, aktive und fachkundige Community
  • 8. Mechanik der Verknüpfung GND-Wikidata page 8 • Bestehende Verknüpfungen ausbauen – in Wikidata! • GND ID derzeit in rund 700.000 Wikidata-Items gesetzt • Mechanismen zur Qualitätskontrolle und Lösung von Konflikten in Wikidata nutzen • nicht zwingend, aber sehr wünschenswert: Replikation der Wikidata-IDs in die GND (read-only)
  • 9. “Kandidaten” für die Speicherung in Wikidata page 9 • Externe Identifier (z.B. RePEc author ID, aber m.E. auch ORCID) • Einfache Feldwerte (z.B. Geburts-/Sterbeort) • Affiliationen • große Gewinne, da diese Angaben sich relativ häufig ändern, aber z.B. von Forschungsinformationssystemen möglichst aktuell und vollständig gebraucht werden • aber: setzt vorherige automatische Eintragung oder parallele Neuanlage der Institutionen voraus
  • 10. Gedankenexperiment: Workflows page 10 • Welche Workflows bräuchten wir, um Teile der GND-Informationen in Wikidata zu erfassen und zu pflegen?
  • 11. Workflow I: Aufruf des verlinkten Wikidata-Items page 11 Code
  • 12. Workflow I: Aufruf des verlinkten Wikidata-Items page 12
  • 13. Workflow I: Aufruf des verlinkten Wikidata-Items page 13
  • 14. Workflow II: Zugehöriges Item in Wikidata suchen page 14 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.: Code
  • 15. Workflow II: Zugehöriges Item in Wikidata suchen page 15 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.:
  • 16. Workflow II: Zugehöriges Item in Wikidata suchen page 16 • unter Nutzung aller Namensansetzung (GND) und Alias-Namen (Wikidata) • Beispiel Dunning, John H.:
  • 17. Workflow III: Wikidata-Item neu aus GND erzeugen page 17 • Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat Script -> QuickStatements
  • 18. Workflow III: Wikidata-Item neu aus GND erzeugen page 18 • Automatische Umsetzung aus dem GND-RDF-Format ins Wikidata-Inputformat
  • 19. Workflows: Desiderate page 19 • Übergreifende Ansicht - eine gemeinsame Sicht auf in der GND und in Wikidata gespeicherte Daten muss jederzeit und auf komfortable Weise möglich sein, jeweils mit Provenance und idealerweise mit Hervorhebung von Unterschieden/Widersprüchen • Check-Prozeduren für „verdächtige“ Änderungen (Löschungen/Änderungen von GND-Einträgen in Wikidata-Items)
  • 20. Herausforderungen page 20 • Die Arbeitsprozesse werden sich spürbar ändern • Das Regelwerk muss angepasst werden • Wir geben Kontrolle auf! • Was wollen wir als Bibliotheken auch künftig allein kontrollieren? • Wo bringen wir uns in eine – zunächst fremde – Community ein, um auf Augenhöhe zusammenzuarbeiten?