WikidataWikidata
(für Archive)(für Archive)
AK ARCHIVE DER LEIBNIZ-GEMEINSCHAFTAK ARCHIVE DER LEIBNIZ-GEMEINSCHAFT
BONN, 1.10.2019BONN, 1.10.2019
Joachim Neubert
https://jneubert.github.io/slides/wd-ak-archive-2019/
AgendaAgenda
1. Was ist und wie funktioniert Wikidata?
2. Wie können Archive
es nutzen?
sich verlinken?
beitragen?
Wikidata ist ...Wikidata ist ...
... eine freie, kollaborative und vielsprachige Wissensdatenbank.
Daten für alle Zwecke frei verfügbar (CC0-Lizenz)
jede/r kann ändern (wie in Wikipedia)
Inhalte für alle Sprachen verfügbar
Strukturierte DatenStrukturierte Daten
value
property
qualifiers
statement
reference
(collapsed)
estimation
June 2012
population (P1082) 8 173 900
London (Q84)
> 1 reference
determination method (P459)
point in time (P585)
item label
(with id)
item id
Beispiel-ItemBeispiel-Item
Nutzung - SchnittstellenNutzung - Schnittstellen
← Wikipedia verlinkt auf Items (
)
Abfragen über (SPARQL)
Gesamt-Datendumps
API (JSON)
Applikationen auf Grundlage der API
Website Wikidata-Datenobjekt, unter
Werkzeuge
http://query.wikidata.org/
Verlinkung zu externen Daten - BeispielVerlinkung zu externen Daten - Beispiel
eigene Sektion auf den Wikidata-Webseiten:
Identifier / Bezeichner
Verlinkungs-MechanismusVerlinkungs-Mechanismus
ca. 4000 Properties vom Datentyp "external-id"
große Vielfalt, z.B.:
GND / VIAF / Geonames IDs
Proteine
afrikanische Pflanzen
schwedische Kulturerbe-Objekte
funktionsfähige Links (in Verbindung mit einem URL-Template)
die Einrichtung von neuen Properties kann jede/r beantragen
Toolunterstützung, insbesondere
(Beispiel)
Mix-n-Match
Wie können Archive beitragen?Wie können Archive beitragen?
Links zu ihren Beständen
fehlende Werte für Properties ergänzen (mit Tools wie )
fehlende Items ergänzen (dito)
s.a.
QuickStatements
Relevanzkriterien
z.B. Pressemappe 20. Jahrhundertz.B. Pressemappe 20. Jahrhundert
alle 5.266 Personenmappen verlinkt (346 neue Items)
zusätzliche Daten (z.B. Berufsangaben für Wirtschaftswissenschaftler/innen)
zusätzliche Verknüpfungen (z.B. Familie Warburg)
in Abfragen und Anwendungen nutzbar
z.B. Karte von Wirtschaftswissenschaftler/innen der Pressemappe per
Wikidata-Abfrage
Agieren in der Wikidata-CommunityAgieren in der Wikidata-Community
Beteiligung mit individuellem User (tunlichst unter Offenlegung der beruflichen
Einbindung - )
keine zentrale Entscheidungsstruktur
Konsensbildung, mit dem als wichtigstem Forum
Mailingliste / "Weekly Summary"
WikiProjects, um Themen zu fokussieren (oft auch gute Anlaufstelle für
Datenstrukturierung)
Beispiel
Project Chat
z.B.z.B.
Wikidata für ArchiveWikidata für Archive
erhöhte Sichtbarkeit (zusätzlicher Discovery-Kanal)
Kontextualisierung für die eigenen Bestände, ohne die Daten selbst
erheben/speichern zu müssen
Crowdsourcing für eine erweiterte Erschließung?
Andocken an weltgrößten Linking Hub
niedrigschwelliger Einstieg in Linked Open Data
Vielen Dank -Vielen Dank -
Fragen willkommen!Fragen willkommen!
auf Wikidata:
Joachim Neubert
j.neubert@zbw.eu
Jneubert
zusätzliches Materialzusätzliches Material
Qualitätssicherung bei WikidataQualitätssicherung bei Wikidata
Jeder kann alles ändern: Chancen des Crowdsourcings ./. Gefahr der
Kompromittierung
Grundansatz: Anforderung, für jeden einzelnen Fakt Quellen zu benennen
Unterstützung von Autor/innen bei der Eingabe durch (z.B.
Format ISBN, z.B. Geburtsdatum < Todesdatum)
alle Versionen bleiben mit Autor, Änderungszeitpunkt und Inhalt erhalten
Zurücksetzen einer Änderung technisch sehr einfach
Constraints
Automatische Tools zur VandalismuserkennungAutomatische Tools zur Vandalismuserkennung
ist Handarbeit => Fokussierung unerlässlich
Tools zur Filterung aller händischen Änderungen auf "verdächtige" (z.B. "neuer
Editor löscht Statement")
zunehmender Einsatz von regelbasierten oder machine-learning Tools
Patroling

Wikidata (für Archive)

  • 1.
    WikidataWikidata (für Archive)(für Archive) AKARCHIVE DER LEIBNIZ-GEMEINSCHAFTAK ARCHIVE DER LEIBNIZ-GEMEINSCHAFT BONN, 1.10.2019BONN, 1.10.2019 Joachim Neubert https://jneubert.github.io/slides/wd-ak-archive-2019/
  • 2.
    AgendaAgenda 1. Was istund wie funktioniert Wikidata? 2. Wie können Archive es nutzen? sich verlinken? beitragen?
  • 3.
    Wikidata ist ...Wikidataist ... ... eine freie, kollaborative und vielsprachige Wissensdatenbank. Daten für alle Zwecke frei verfügbar (CC0-Lizenz) jede/r kann ändern (wie in Wikipedia) Inhalte für alle Sprachen verfügbar
  • 4.
    Strukturierte DatenStrukturierte Daten value property qualifiers statement reference (collapsed) estimation June2012 population (P1082) 8 173 900 London (Q84) > 1 reference determination method (P459) point in time (P585) item label (with id) item id
  • 5.
  • 6.
    Nutzung - SchnittstellenNutzung- Schnittstellen ← Wikipedia verlinkt auf Items ( ) Abfragen über (SPARQL) Gesamt-Datendumps API (JSON) Applikationen auf Grundlage der API Website Wikidata-Datenobjekt, unter Werkzeuge http://query.wikidata.org/
  • 7.
    Verlinkung zu externenDaten - BeispielVerlinkung zu externen Daten - Beispiel eigene Sektion auf den Wikidata-Webseiten: Identifier / Bezeichner
  • 8.
    Verlinkungs-MechanismusVerlinkungs-Mechanismus ca. 4000 Propertiesvom Datentyp "external-id" große Vielfalt, z.B.: GND / VIAF / Geonames IDs Proteine afrikanische Pflanzen schwedische Kulturerbe-Objekte funktionsfähige Links (in Verbindung mit einem URL-Template) die Einrichtung von neuen Properties kann jede/r beantragen Toolunterstützung, insbesondere (Beispiel) Mix-n-Match
  • 9.
    Wie können Archivebeitragen?Wie können Archive beitragen? Links zu ihren Beständen fehlende Werte für Properties ergänzen (mit Tools wie ) fehlende Items ergänzen (dito) s.a. QuickStatements Relevanzkriterien
  • 10.
    z.B. Pressemappe 20.Jahrhundertz.B. Pressemappe 20. Jahrhundert alle 5.266 Personenmappen verlinkt (346 neue Items) zusätzliche Daten (z.B. Berufsangaben für Wirtschaftswissenschaftler/innen) zusätzliche Verknüpfungen (z.B. Familie Warburg) in Abfragen und Anwendungen nutzbar z.B. Karte von Wirtschaftswissenschaftler/innen der Pressemappe per Wikidata-Abfrage
  • 11.
    Agieren in derWikidata-CommunityAgieren in der Wikidata-Community Beteiligung mit individuellem User (tunlichst unter Offenlegung der beruflichen Einbindung - ) keine zentrale Entscheidungsstruktur Konsensbildung, mit dem als wichtigstem Forum Mailingliste / "Weekly Summary" WikiProjects, um Themen zu fokussieren (oft auch gute Anlaufstelle für Datenstrukturierung) Beispiel Project Chat
  • 12.
  • 14.
    Wikidata für ArchiveWikidatafür Archive erhöhte Sichtbarkeit (zusätzlicher Discovery-Kanal) Kontextualisierung für die eigenen Bestände, ohne die Daten selbst erheben/speichern zu müssen Crowdsourcing für eine erweiterte Erschließung? Andocken an weltgrößten Linking Hub niedrigschwelliger Einstieg in Linked Open Data
  • 15.
    Vielen Dank -VielenDank - Fragen willkommen!Fragen willkommen! auf Wikidata: Joachim Neubert j.neubert@zbw.eu Jneubert
  • 16.
  • 17.
    Qualitätssicherung bei WikidataQualitätssicherungbei Wikidata Jeder kann alles ändern: Chancen des Crowdsourcings ./. Gefahr der Kompromittierung Grundansatz: Anforderung, für jeden einzelnen Fakt Quellen zu benennen Unterstützung von Autor/innen bei der Eingabe durch (z.B. Format ISBN, z.B. Geburtsdatum < Todesdatum) alle Versionen bleiben mit Autor, Änderungszeitpunkt und Inhalt erhalten Zurücksetzen einer Änderung technisch sehr einfach Constraints
  • 19.
    Automatische Tools zurVandalismuserkennungAutomatische Tools zur Vandalismuserkennung ist Handarbeit => Fokussierung unerlässlich Tools zur Filterung aller händischen Änderungen auf "verdächtige" (z.B. "neuer Editor löscht Statement") zunehmender Einsatz von regelbasierten oder machine-learning Tools Patroling