Integration von Normdaten inBibliotheksanwendungen auf der Basisvon Webservices mit Semantic Web-TechnologieDr. Timo Borst...
Übersicht1. Ausgangslage: Verteiltes Datenmanagement in   Bibliotheksanswendungen2. Bisherige Ansätze zur Aggregierung und...
Ausgangslage•   Klassische Bibliotheksanwendungen erzeugen und verwalten    jeweils idiosynkratische (Meta-)Datenbestände ...
AusgangslageBeispiel Repositorien und ihre Vernetzung•   Repositorien sind allgemein genutzte Erfassungs-/Retrieval-    /V...
Ausgangslage„The major difficulty we have found is with DSpace’s handling ofmetadata. While we feel that the number of fie...
AusgangslageTypische Mängel•   Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber,    Dokumenttypen etc.) werden...
Bisherige Ansätze zur Aggregierung &Homogenisierung                                                                       ...
Bisherige Ansätze zur Aggregierung &Homogenisierung                                       Seite 8
Bisherige Lösungsansätze zur Aggregierung &HomogenisierungHomogenisierung im Vorhinein• Festlegung eines relativ granulare...
Integration und Aggregation von Normdaten -Grundidee                                              Seite 10
Integration und Aggregation von Normdaten -IdeeBeispieldaten und -anfragen (zu Personen und Themen):http://zbw.eu/beta/stw...
Anwendungsfall_1: Verschlagwortung mitNormdaten• DER Anwendungsfall für Bibliothekarinnen und Bibliothekare• Nutzergruppen...
Anwendungsfall_1: VerschlagwortungErfassungsmaske unter https://econstor.eu                                            Sei...
Anwendungsfall_1: VerschlagwortungErfassungsmaske unter https://econstor.eu                                            Sei...
Anwendungsfall_2: Suche•   Der häufigste Anwendungsfall in Bibliotheksanwendungen•   Nutzergruppen: Bibliothekarinnen und ...
Anwendungsfall_2: SucheErweiterte Suche unter http://econstor.eu nach „Finanzkrise“                                       ...
Anwendungsfall_2: Suche                          Seite 17
Anwendungsfall_2: Suche                          Seite 18
“Leichtgewichtige” Integration in bestehende Systeme                                                Seite 19
“Leichtgewichtige” Integration in bestehende SystemeVorteile•   „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme...
Zusammenfassung und Fazit• Bibliotheksanwendungen erzeugen und verwalten jeweils eigene  idiosynkratische Datenbestände.• ...
Vielen Dank!Dr. Timo BorstDeutsche Zentralbibliothek fürWirtschaftswissenschaften /Leibniz-InformationszentrumWirtschaft (...
Anwendungsfall_3: Erfassung von Autoren  •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher  der Ausnahme...
Anwendungsfall_3: Erfassung von Autoren•Erfassungsmaske unter http://87.106.250.18/beta/econstor/                         ...
Bisherige Lösungsansätze zur Aggregierung &Homogenisierung  •Metadatensuche durch Aggregatoren  •     Parallele Abfrage en...
•[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_ValuesLiteratur  •[2] http://minds.wisconsin.edu/handl...
Nächste SlideShare
Wird geladen in …5
×

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

563 Aufrufe

Veröffentlicht am

Veröffentlicht in: Bildung
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
563
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
4
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

  1. 1. Integration von Normdaten inBibliotheksanwendungen auf der Basisvon Webservices mit Semantic Web-TechnologieDr. Timo BorstIT-EntwicklungDeutsche Zentralbibliothek für Wirtschaftswissenschaften /Leibniz-Informationszentrum WirtschaftKiel/HamburgI-KNOW Praxisforum1.-3. September 2010 in Graz Die ZBW ist Mitglied der Leibniz-Gemeinschaft
  2. 2. Übersicht1. Ausgangslage: Verteiltes Datenmanagement in Bibliotheksanswendungen2. Bisherige Ansätze zur Aggregierung und Homogenisierung3. Integration und Aggregation von Normdaten auf der Basis von Semantic Web-Technologien a) Grundidee b) Anwendungsfall_1: Verschlagwortung c) Anwendungsfall_2: Suche d) Anwendungsfall_3: Erfassung von Autoren4. “Leichtgewichtige” Integration in bestehende Systeme5. Zusammenfassung und Fazit Seite 2
  3. 3. Ausgangslage• Klassische Bibliotheksanwendungen erzeugen und verwalten jeweils idiosynkratische (Meta-)Datenbestände (“Datensilos”)…• …die dann im Web über jeweils eigene Frontends verfügbar gemacht werden• Wie können hinsichtlich • Formate • Schemata • Vokabulare zur Erschließung • Erschließungsregeln • Vollständigkeit (Abstract ja/nein) • Herkunft prinzipiell heterogene Metadaten zueinander in Beziehung gesetzt werden? Seite 3
  4. 4. AusgangslageBeispiel Repositorien und ihre Vernetzung• Repositorien sind allgemein genutzte Erfassungs-/Retrieval- /Verbreitungssysteme („Data Provider“), zumeist OSS und Community- getrieben• Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren• Vernetzungsinitiativen, z.B. OA-Netzwerk• „OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI- zertifizierten Repositorien bereit […] u.a. vorgesehen: Aggregation, Harmonisierung und Ähnlichkeitsanalyse“ http://www.dini.de/fileadmin/workshops/oa-statistik-was-zaehlt/02_gerlach- oas.pdf• Einschlägige OSS-Repositoriensoftware (DSpace, EPrints, OPUS) unterstützt derzeit noch nicht die Integration extern kontrollierter Normdaten Seite 4
  5. 5. Ausgangslage„The major difficulty we have found is with DSpace’s handling ofmetadata. While we feel that the number of fields in Dublin Core isadequate for most if not all uses (DCMI Usage Board 2006), we aretroubled by the lack of authority control when completing its fields.Without some control over uniform titles, authors and subjectsaccessing the items in the future will very problematic.“S. Chabot (http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/) „Neither the standards nor the software unterlying institutional repositories anticipated performing naming authority control on widely disparate metadata from highly unreliable sources.“ D. Salo (http://minds.wisconsin.edu/handle/1793/31735) Seite 5
  6. 6. AusgangslageTypische Mängel• Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber, Dokumenttypen etc.) werden ohne semantische und syntaktische Anleitungen und Restriktionen teilweise im Freitext erfasst• (Syntaktische) Suchen liefern nur eingeschränkte oder uneindeutige Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse (Trunkierung etc.) (Suche nach „Abbott, Philip“ liefert nur Treffer für Nr. 2/3)• Namensänderungen sind praktisch nicht nachvollziehbar• Selbst wenn syntaktische und semantische Eindeutigkeit in einem Repository lokal erzielt werden können, erneuert und verschärft sich das Problem auf Seiten der Aggregatoren Seite 6
  7. 7. Bisherige Ansätze zur Aggregierung &Homogenisierung Seite 7 http://www.economistsonline.org/publications?page=3&q=thys-clement&lang=de
  8. 8. Bisherige Ansätze zur Aggregierung &Homogenisierung Seite 8
  9. 9. Bisherige Lösungsansätze zur Aggregierung &HomogenisierungHomogenisierung im Vorhinein• Festlegung eines relativ granularen Metadatenschemas• Möglichst verbindliches und explizites Regelwerk, das auch von allen Beteiligten konsequent befolgt wird• Verwendung einheitlicher Namen + Vokabulare• Lokale Anpassungen• Zentrales Harvesting bei minimierter DatenaufbereitungHomogenisierung im Nachhinein• Beibehaltung der lokalen Ausprägungen bei kleinstem gemeinsamen Nenner (etwa “Dublin Core”-Elemente)• Nachträgliche Maßnahmen zur Homogenisierung, u.a. “Name Disambiguation”• Zentrales Harvesting bei aufwändiger DatenaufbereitungBeide Ansätze sind nicht optimal! Seite 9
  10. 10. Integration und Aggregation von Normdaten -Grundidee Seite 10
  11. 11. Integration und Aggregation von Normdaten -IdeeBeispieldaten und -anfragen (zu Personen und Themen):http://zbw.eu/beta/stw-ws/suggest?query=finanzkr…liefert alle Terme, die mit “finanzkr” beginnenhttp://zbw.eu/beta/stw-ws/stw-ws-wrapper.php?service=labels&concept=http://zbw.eu/stw/descriptor/19664-4&lang=en…liefert alle englischen Synonyme zu “Finanzkrise: Seite 11
  12. 12. Anwendungsfall_1: Verschlagwortung mitNormdaten• DER Anwendungsfall für Bibliothekarinnen und Bibliothekare• Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?)• Vorgang: Eingabe von beschreibenden Metadaten, die häufig aus einem kontrollierten Vokabular stammen• Crosskonkordanzen herstellen zwischen verschiedenen kontrollierten Vokabularen• Bestandteil von Open Access relevanten Vorgängen wie das „self-publishing“, das „self-archiving“ oder das „social tagging“• Zielstellung: Den Vorgang der Verschlagwortung mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so dass man einerseits zu „besseren“ im Sinne von normierten Metadaten kommt, die andererseits aber auch Flexibilität im Rahmen eines KOS erlauben („Lokalisierung“): • Alternative Schreibweisen bei Namen • Synonyme sowie Ober-/Unterbegriffe bei Schlagworten Seite 12
  13. 13. Anwendungsfall_1: VerschlagwortungErfassungsmaske unter https://econstor.eu Seite 13
  14. 14. Anwendungsfall_1: VerschlagwortungErfassungsmaske unter https://econstor.eu Seite 14
  15. 15. Anwendungsfall_2: Suche• Der häufigste Anwendungsfall in Bibliotheksanwendungen• Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen + BibliotheksnutzerInnen• Vorgang: Zumeist einfache Volltextsuche über Metadatenfelder (Titel/Abstract) und/oder Volltexte (soweit letztere verfügbar sind und im Suchmaschinenindex liegen)• Zielstellung: Den Vorgang der Suche mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so so dass man zu besseren Suchergebnissen gelangt (Erhöhung von Recall + Precision) Seite 15
  16. 16. Anwendungsfall_2: SucheErweiterte Suche unter http://econstor.eu nach „Finanzkrise“ Seite 16
  17. 17. Anwendungsfall_2: Suche Seite 17
  18. 18. Anwendungsfall_2: Suche Seite 18
  19. 19. “Leichtgewichtige” Integration in bestehende Systeme Seite 19
  20. 20. “Leichtgewichtige” Integration in bestehende SystemeVorteile• „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme• Strategie des „minimalen Eingriffs“• Keine Änderungen am Systemkern, minimale Änderungen am Datenmodell nötig (Erweiterung um eine Spalte für den Authority-Key)• Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise zwanglos erweitern ließen: • Repositorien (zumeist OSS, Plugin-Architektur) • Kataloge (zumeist proprietäre SW und monolithisch) • Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) -> WebService zur Verbesserung des Retrievals und zur Erzeugung von Mash- Ups • …sowie alle offenen Systeme mit kollaborativ-verteilter Verschlagwortung (z.B. Academic Linkshare) Seite 20
  21. 21. Zusammenfassung und Fazit• Bibliotheksanwendungen erzeugen und verwalten jeweils eigene idiosynkratische Datenbestände.• Dies erschwert die Pflege, den Austausch, die Aggregation und die Homogenisierung der (Meta-)Daten für erweiterte Dienste.• Vorgelagerte Webservices als Teil einer übergreifenden Normdaten- Infrastruktur können frühzeitig zur Homogenisierung der Metadaten beitragen (bei gleichzeitiger Lokalisierung).• Wenn diese Webservices verbreitet entstehen und genutzt werden, besteht die Chance zu einer weitergehenden Vernetzung lokal gepflegter Metadaten bei gleichzeitiger Verbesserung der datenbasierten Services.• Die Möglichkeit zur „leichtgewichtigen Integration“ ist ein Angebot an Betreiber von Bibliotheksanwendungen, diese Webservices mit möglichst minimalem Aufwand in ihre Anwendungen zu integrieren. Seite 21
  22. 22. Vielen Dank!Dr. Timo BorstDeutsche Zentralbibliothek fürWirtschaftswissenschaften /Leibniz-InformationszentrumWirtschaft (ZBW)t.borst@zbw.eu Seite 22
  23. 23. Anwendungsfall_3: Erfassung von Autoren •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher der Ausnahmefall •Nutzergruppen: BibliothekarInnen + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?) •Vorgang: Eingabe von AutorInnen-Namen •Zielstellung: Den Vorgang der Autorenerfassung mit Hilfe von Normdaten zu verbessern, die durch Webservices bereit gestellt werden Seite 23
  24. 24. Anwendungsfall_3: Erfassung von Autoren•Erfassungsmaske unter http://87.106.250.18/beta/econstor/ Seite 24
  25. 25. Bisherige Lösungsansätze zur Aggregierung &Homogenisierung •Metadatensuche durch Aggregatoren • Parallele Abfrage entfernt-verteilter Systeme • Rückgabe und Aufbereitung des Suchergebnisses als zusammengesetzte Trefferliste •Harvesting • Regelmäßiges Einsammeln von entfernt-verteilten Metadaten • Homogenisierung ex ante oder ex post •Föderierte Suche •… Seite 25
  26. 26. •[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_ValuesLiteratur •[2] http://minds.wisconsin.edu/handle/1793/31735 •[3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3 •[4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/ •[5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn •[6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma-199/PDF/subirats.pdf •[7] http://www.jisc.ac.uk/media/documents/programmes/sharedservices/na mes-phase-one-final-report,.pdf •[8] http://idea.library.drexel.edu/bitstream/1860/3173/1/20070051011.pdf •[9] http://ptsefton.com/blog/2006/06/06/the_affiliation_issue_in _institutional_repository_software/ •[10] http://library.ust.hk/info/nac/nac-technical.html •[11] http://www.seco.tkk.fi/publications/2009/kurki-hyvonen-onki-people-2009.pdf •[12] http://journals.sfu.ca/archivar/index.php/archivaria/article/download/11883/12836 •[13] http://www.dini.de/fileadmin/workshops/oa-netzwerk- juni2009/vernetzungstage_2009_malitz.pdf Seite 26

×