Perspektivwechsel
Normdaten:
ein neues Nutzungskonzept
an der UB und HMT Leipzig
103. Bibliothekartag, Bremen, 5.6.2014
Ma...
Normdatenimplementierung
als finc Milestone
Normdaten = Potentiale
Großer Bestandteil klassischer Katalogisierungsarbeit
Normdaten = Potentiale
Enorme Datensammlungen
http://d-nb.info/gnd/118576291
Normdaten = Potentiale
GND als übergreifendes Normierungssystem
https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GN...
Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte
http://de.wikipedia.org/wiki/Gustav_Mahler
Normdaten = Potentiale
Steigerung des
Suchkomforts für unsere
Nutzer/innen!
Bisherige Anwendungsfelder
„klassische“ Datenauswertung: Verweissysteme
•Personennamen und Körperschaften
•Schlagworte
•(m...
Personennamen und
Körperschaften
Anreicherung des Titelsatzes mit den Verweisungsformen der verknüpften
Personen
https://k...
Schlagworte
Anreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der
verknüpften Schlagworte
https://kat...
(musikalische) Werktitel
Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel,
Tonart, Werkverz...
EST: Konzerte, Vc Orch, G 479
Violoncellokonzert, Nr. 2
Cellokonzert, D-Dur
EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36
Strei...
Länderbezug
Auswertung der DIN-Ländercodes am
Personen-Normsätzen --> Facettenbildung
„Haben Sie Noten von Komponisten
Rum...
Grenzen?!
• Bislang nur für lokale Bibliotheksdaten (SWB) –
externe Quellen im Discovery System werden
bislang nicht berüc...
Vier Beispiele
• Perspektivwechsel Normdaten: ein neues
Nutzungskonzept an der UB und HMT.
• 05.06.2014 1000
Überblick
• Intro – 1
• Namensvarianten via GND – 7
• Alternative Sucheinstiege – 1
• Knowledge Graph – 2
• Querschnittssu...
Intro
• Ein rotes Band – die GND
• Ein anderes – Nutzung von Indizes als (NoSQL)
Datenbanken
GND-Anreicherung
externer Quellen
Datensatz der externen Quelle
„Naxos Music Library“
http://d-nb.info/gnd/118638157
Namensvarianten 1
• GND basierte Erweiterung von MARC-Records
um Namensvarianten
• gnd.es:variantNameForThePerson
• Angewe...
Namensvarianten 2
• Nutzung eines Normdatenindex für
Kandidatensuche
• Nutzung einer minimalen HTTP–API für
Taxonomieabfra...
Namensvarianten 3
• Suche aller MARC 100.a Einträge der externen
Quelle im Normdatenindex
• Für alle Kandidaten–GNDs, über...
Namensvarianten 4
• Naxos - 71815
• RISM - 11241
• IMSLP - 51722
• Gallica - 23754
Namensvarianten 5
• 54339 Name insgesamt
• 5051 Namen in Naxos und GND
• 719 Namen konnten zugeordnet werden
Namensvarianten 6
• Naxos – 719 Namen mit hoher
Wahrscheinlichkeit korrekt
• RISM – 415
• IMSLP – variabel
• Gallica – 268...
Namensvarianten 7
• Alternative Implementierung – zum Beispiel
über eine Abfrage der Normdaten vor der
eigentlichen Suche
Sucheinstiege 1
• API um die GND–Daten
• narrower terms, broader terms, [synonyms]
• siehe Namesvarianten (gehört Musikeri...
Optimierte Datennutzung
für Suchanfragen
optimierte Nutzung der Taxonomie der Schlagwörter
Darstellung der semantischer Be...
Knowledge Graph 1
• Inspiration – Google Knowledge Graph
• Indexierung von GND, VIAF und DBPedia
• technische Herausforder...
Knowledge Graph 2
• Beispiel Goethe
• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...
• {“birthDate”: “…”, “deathDate”: “…...
Querschnittssuchen 1
• Menschen gruppieren Dinge auch außerhalb
von Facetten
• Wikipedia–Kategorien
Weitere Datenpools und
Services:
„Wikipedia-Querschnittssuche“
http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)
Querschnittssuche 2
• Zutaten: GND–Index, Wikipedia–Normdaten–
Index, Wikipedia–Category–Index
Querschnittssuche 3
• {"p": "dnb.es:placeOfBusiness", "s":
"gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd...
Querschnittssuche 4
• {"p": "dnb.es:placeOfBusiness", "s":
"gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd...
Querschnittssuche 5
• Beispiel – Kategorie:Romantik_(Musik)
• 1225 Seiten unter der Kategorie
• 1082 GNDs
• Mit diesen GND...
Ausblick 1
• verwendete Daten – GND, VIAF, DBPedia
• noch nicht einbezogen: Freebase,
Authoritydaten anderer Nationalbibli...
Ausblick 2
• Index – Elasticsearch*
• Workflowmanagement – luigi*, gluish*
• Konverter – gomarckit*, nttoldj*, wptoldj*
• ...
Ausblick 3
• * Open source
• Linked Data schafft neue Verbindungen
Normdaten = Potentiale!
Voraussetzungen und
Perspektiven
• Übernahme der VIAF-IDs in die Datensätze der GND
• Bereitstellu...
Übernahme der VIAF-IDs in
die Datensätze der GND
http://viaf.org/viaf/99258155
Bereitstellung von IDs in
Initiativen zur Datenfreigabe
https://opac.rism.info/search?id=653004096&db=251&View=rism
https:...
Konsistentere Nutzung der
GND in Bibliotheken
Sacherschließungsquote im Buchbestand der HMT: 42,4%
Nachnutzung der GND in
nicht-bibliothekarischen
Projekten
http://pdr.bbaw.de/projekt
http://in2n.de/
Danke für Ihre Aufmerksamkeit!
http://blog.finc.info
Martin Czygan
martin.czygan@uni-leipzig.de
Anke Hofmann
anke.hofmann@...
Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig
Nächste SlideShare
Wird geladen in …5
×

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

6.921 Aufrufe

Veröffentlicht am

Perspektivwechsel Normdaten:
ein neues Nutzungskonzept
an der UB und HMT Leipzig

Veröffentlicht in: Bildung
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
6.921
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
4.942
Aktionen
Geteilt
0
Downloads
6
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

  1. 1. Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig 103. Bibliothekartag, Bremen, 5.6.2014 Martin Czygan, Universitätsbibliothek Leipzig Anke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig
  2. 2. Normdatenimplementierung als finc Milestone
  3. 3. Normdaten = Potentiale Großer Bestandteil klassischer Katalogisierungsarbeit
  4. 4. Normdaten = Potentiale Enorme Datensammlungen http://d-nb.info/gnd/118576291
  5. 5. Normdaten = Potentiale GND als übergreifendes Normierungssystem https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu
  6. 6. Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte http://de.wikipedia.org/wiki/Gustav_Mahler
  7. 7. Normdaten = Potentiale Steigerung des Suchkomforts für unsere Nutzer/innen!
  8. 8. Bisherige Anwendungsfelder „klassische“ Datenauswertung: Verweissysteme •Personennamen und Körperschaften •Schlagworte •(musikalische) Werktitel Weitere Datenauswertung •Länderbezug für Autor/innen und Komponist/innen •Geofacette
  9. 9. Personennamen und Körperschaften Anreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900
  10. 10. Schlagworte Anreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950
  11. 11. (musikalische) Werktitel Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung) fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807
  12. 12. EST: Konzerte, Vc Orch, G 479 Violoncellokonzert, Nr. 2 Cellokonzert, D-Dur EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36 Streichquartette, op. 20 (musikalische) Werktitel Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)
  13. 13. Länderbezug Auswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung „Haben Sie Noten von Komponisten Rumänischer Herkunft?“ “Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer: http://www.ub.uni-heidelberg.de/archiv/12555 Auswertung und Indexierung der geografischen Codes an Schlagwort-Normsätzen
  14. 14. Grenzen?! • Bislang nur für lokale Bibliotheksdaten (SWB) – externe Quellen im Discovery System werden bislang nicht berücksichtigt • Relativ simples Verwendungsmuster: Synonymverweisungen • Keine visuelle Umsetzung der Inhalte eines Normsatzes • GND als einziger Datenpool
  15. 15. Vier Beispiele • Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT. • 05.06.2014 1000
  16. 16. Überblick • Intro – 1 • Namensvarianten via GND – 7 • Alternative Sucheinstiege – 1 • Knowledge Graph – 2 • Querschnittssuche – 5 • Ausblick – 3
  17. 17. Intro • Ein rotes Band – die GND • Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken
  18. 18. GND-Anreicherung externer Quellen Datensatz der externen Quelle „Naxos Music Library“ http://d-nb.info/gnd/118638157
  19. 19. Namensvarianten 1 • GND basierte Erweiterung von MARC-Records um Namensvarianten • gnd.es:variantNameForThePerson • Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP
  20. 20. Namensvarianten 2 • Nutzung eines Normdatenindex für Kandidatensuche • Nutzung einer minimalen HTTP–API für Taxonomieabfragen
  21. 21. Namensvarianten 3 • Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex • Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt • Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind
  22. 22. Namensvarianten 4 • Naxos - 71815 • RISM - 11241 • IMSLP - 51722 • Gallica - 23754
  23. 23. Namensvarianten 5 • 54339 Name insgesamt • 5051 Namen in Naxos und GND • 719 Namen konnten zugeordnet werden
  24. 24. Namensvarianten 6 • Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt • RISM – 415 • IMSLP – variabel • Gallica – 268 • generelle Frage der Qualitätsprüfung
  25. 25. Namensvarianten 7 • Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche
  26. 26. Sucheinstiege 1 • API um die GND–Daten • narrower terms, broader terms, [synonyms] • siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?) • Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)
  27. 27. Optimierte Datennutzung für Suchanfragen optimierte Nutzung der Taxonomie der Schlagwörter Darstellung der semantischer Beziehungen von GND- Einträgen untereinander http://melvil.d-nb.de/swd-search?term=oboenrohr
  28. 28. Knowledge Graph 1 • Inspiration – Google Knowledge Graph • Indexierung von GND, VIAF und DBPedia • technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)
  29. 29. Knowledge Graph 2 • Beispiel Goethe • Lebensdaten, Wirkungsort, Einflüsse, Werke, ... • {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}
  30. 30. Querschnittssuchen 1 • Menschen gruppieren Dinge auch außerhalb von Facetten • Wikipedia–Kategorien
  31. 31. Weitere Datenpools und Services: „Wikipedia-Querschnittssuche“ http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)
  32. 32. Querschnittssuche 2 • Zutaten: GND–Index, Wikipedia–Normdaten– Index, Wikipedia–Category–Index
  33. 33. Querschnittssuche 3 • {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"} • {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"} • {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
  34. 34. Querschnittssuche 4 • {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"} • {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"} • {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
  35. 35. Querschnittssuche 5 • Beispiel – Kategorie:Romantik_(Musik) • 1225 Seiten unter der Kategorie • 1082 GNDs • Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen
  36. 36. Ausblick 1 • verwendete Daten – GND, VIAF, DBPedia • noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ... • Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)
  37. 37. Ausblick 2 • Index – Elasticsearch* • Workflowmanagement – luigi*, gluish* • Konverter – gomarckit*, nttoldj*, wptoldj* • SQL für TSV: textql* • Unix – awk*, cat*, cut*, grep*, sed*
  38. 38. Ausblick 3 • * Open source • Linked Data schafft neue Verbindungen
  39. 39. Normdaten = Potentiale! Voraussetzungen und Perspektiven • Übernahme der VIAF-IDs in die Datensätze der GND • Bereitstellung von IDs in Initiativen zur Datenfreigabe • Konsistentere Nutzung der GND in Bibliotheken • Projekte zur rückwirkenden Anreicherung in Bibliotheken • Nachnutzung der GND / VIAF auch in nichtbibliothekarischen Projekten
  40. 40. Übernahme der VIAF-IDs in die Datensätze der GND http://viaf.org/viaf/99258155
  41. 41. Bereitstellung von IDs in Initiativen zur Datenfreigabe https://opac.rism.info/search?id=653004096&db=251&View=rism https://opac.rism.info/id/rismid/653004096?format=marc
  42. 42. Konsistentere Nutzung der GND in Bibliotheken Sacherschließungsquote im Buchbestand der HMT: 42,4%
  43. 43. Nachnutzung der GND in nicht-bibliothekarischen Projekten http://pdr.bbaw.de/projekt http://in2n.de/
  44. 44. Danke für Ihre Aufmerksamkeit! http://blog.finc.info Martin Czygan martin.czygan@uni-leipzig.de Anke Hofmann anke.hofmann@hmt-leipzig.de

×