Resource Discovery neu definiert

2.161 Aufrufe

Veröffentlicht am

Presentation at MPDL Pubman Days 2013
SLUB Dresden and Avantgarde Labs have developed a multilingual semantic catalogue search SLUBsemantics. Taking this development a step further, they are now implementig a LOD-based data management platform for the integration, deduplication, normalization, FRBRization and semantic enrichment of library data. This provides the infrastructure for upcoming library services focused on all stages of the research process.

Veröffentlicht in: Technologie
0 Kommentare
2 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.161
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
98
Aktionen
Geteilt
0
Downloads
10
Kommentare
0
Gefällt mir
2
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Resource Discovery neu definiert

  1. 1. Resource Discovery neu definiert Die multilinguale, semantische Katalogsuche der SLUB Dresden 24. Oktober 2013 Sächsische Landesbibliothek – Dresden Dr. Jens Mittelbach, SLUB Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden
  2. 2. Resource Discovery neu definiert Die multilinguale, semantische Katalogsuche der SLUB Dresden 1. Das Konzept “Resource Discovery” in Bibliotheken 2. SLUBsemantics: Ein erster Schritt zu einer neuen Form von Discovery 3. EFRE-Projekt Datenmanagement-Plattform: Ein zweiter Schritt 4. Discovery und die Rolle von Bibliotheken im Digitalen Zeitalter Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 2 © by SLUB Dresden slub-dresden.de
  3. 3. “Resource Discovery” in Bibliotheken Discovery als neues Paradigma • Konzept Resource Discovery seit Anfang des Jahrzehnts: Summons, EBSCO Discovery Service, Primo … • „One Stop Shop“-Idee, integrierte Suche und integrierter Zugang zu in getrennten Datensilos verteilten Ressourcen • Normalisierung/Homogenisierung heterogener Daten aus unterschiedlichen Quellsystemen • Suchmaschinentechnologie statt feldbasierte Datenbanksuche • Normdaten aus unterschiedlichen Systemen als Strings indexiert und damit für Suche und Facettierung nutzbar Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 3 © by SLUB Dresden slub-dresden.de
  4. 4. “Resource Discovery” in Bibliotheken Herausforderungen für Discovery-Systeme Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-MatchAlgorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 4 © by SLUB Dresden slub-dresden.de
  5. 5. “Resource Discovery” in Bibliotheken Herausforderungen für Discovery-Systeme Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-Match-Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt Lösung I: Benutze keine Bibliothekskataloge – oder benutze sie nur für “known item searches” Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 5 © by SLUB Dresden slub-dresden.de
  6. 6. SLUBsemantics Erster Schritt zu neuartiger Discovery Herausforderung I Benutzer sind heute durch Google sozialisiert; sie erwarten Volltextindizes und denken nicht in Metadaten Herausforderung II Gängige Discovery-Systeme basieren auf dem String-Match-Algorithmus; unscharfe bzw. thematische Suchen werden daher nur begrenzt unterstützt Lösung II: SLUBsemantics – Multilinguale und semantische Suche automatisch angereicherter Katalogdaten Mögliche Abfragen: Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 6 © by SLUB Dresden slub-dresden.de
  7. 7. SLUBsemantics Wie funktioniert es? Wikipedia: die größte Wissensbasis der Welt, die “nach dem Prinzip des kollaborativen Schreibens fortwährend gemeinschaftlich korrigiert, erweitert und aktualisiert” wird Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 7 © by SLUB Dresden slub-dresden.de
  8. 8. SLUBsemantics Phase 1: Anreicherung der Katalogdaten • (Stapelweise) Verarbeitung bibliografischer Daten auf der Grundlage von Data- und Text-Mining-Algorithmen sowie Wikipedia-Dumps • Katalog-Sätze werden mit Wikipedia-Konzepten durch stabile URIs aus dbpedia verbunden • Speicherung angereicherter Indexdaten in einem Search Server Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 8 © by SLUB Dresden slub-dresden.de
  9. 9. SLUBsemantics Phase 1: Anreicherung der Katalogdaten Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 9 © by SLUB Dresden slub-dresden.de
  10. 10. SLUBsemantics Phase 2a: Retrieval-Prozess 1. Suchanfrage wird an einen lokalen vorprozessierten Wikipedia-Korpus gesendet 2. Ursprüngliche Suchanfrage wird erweitert durch IDs der für diese Anfrage als relevant eingeschätzten Wikipedia-Artikel 3. Erweiterte Suchanfrage wird gegen den in Phase 1 angereicherten Katalogindex gesendet (Metadaten & mehrsprachige Wikipedia-Konzepte) Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 10 © by SLUB Dresden slub-dresden.de
  11. 11. SLUBsemantics Phase 2b: Facetten-Erzeugung Disambiguierung des Begriffes „chicken game“ mithilfe des Facettenbaumes, der on the fly aus dem WikipediaKategoriensystem generiert wird: Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 11 © by SLUB Dresden slub-dresden.de
  12. 12. SLUBsemantics Demonstration • Search demonstrator für die British Library: http://sem.avantgarde-labs.de/ • Suche im SLUB-Katalog: http://www.slub-dresden.de: − Multilingualität: Suche nach „steamboat paddlewheel“ − Disambiguierung: Suche nach „python“ − Semantik: Suche nach „gra w cykora“ (i.e. chicken game) Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 12 © by SLUB Dresden slub-dresden.de
  13. 13. Projekt Datenmanagement-Plattform Zweiter Schritt zu neuartiger Discovery • Datenmanagement-Plattform als Middleware-Lösung • Verarbeitung sämtlicher bibliothekarischer Daten • Existierender technologische Infrastrukturen einer Bibliothek können beibehalten werden • Alle internen und extern relevanten Datenquellen werden in kontinuierlich laufenden Datenverarbeitungsprozess integriert • Daten werden zusammengeführt, dedupliziert, semantisiert, FRBRisiert und normalisiert • Bereitstellung einer Single Version of the Truth (SVOT) • SVOT wird in einem RDF-Format im Sinne von Linked Open Data publiziert • SVOT ist Basis für verschiedene Datenpräsentationsanwendungen der Bibliothek Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 13 © by SLUB Dresden slub-dresden.de
  14. 14. Projekt Datenmanagement-Plattform: Architekturkonzept Frontend: … Frontend: … App: Resource Management Parallelisierte Massendatenverarbeitung Frontend: Web-Katalog Datenhaltung Ereignisgesteuerte Verarbeitung Zentrales Job Repository Datenintegrationstools Datenquellen (interne und externe Datenbestände) Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 14 © by SLUB Dresden slub-dresden.de
  15. 15. Projekt Datenmanagement-Plattform: Web-Applikation Zweiter Schritt zu neuartiger Discovery Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 15 © by SLUB Dresden slub-dresden.de
  16. 16. Projekt Datenmanagement-Plattform: Agiles Entwicklen Zweiter Schritt zu neuartiger Discovery Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 16 © by SLUB Dresden slub-dresden.de
  17. 17. Projekt Datenmanagement-Plattform Entwicklung und Finanzierung  Aus Mitteln des Europäischen Fonds für Regionale Entwicklung (EFRE)  Gemeinschaftsprojekt der SLUB Dresden (Plattform Datenmanagement) und der UB Leipzig (Frontend-Applikation Electronic Resource ManagementSystem)  Zusammenarbeit mit Avantgarde Labs und der Research Group Agile Knowledge Engineering and Semantic Web (AKSW) (Softwareentwicklung, Marketing)  Kollaboration mit der Community  Bevorzugung von quelloffenen Werkzeugen  Agile Softwareentwicklung (möglichst wenig bürokratischer Aufwand, klare Rollenverteilung, iteratives Vorgehen)  Begleitendes Marketingkonzept  Ausführliche Projektbeschreibung erhältlich Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 17 © by SLUB Dresden slub-dresden.de
  18. 18. Discovery und die neue Rolle von Bibliotheken The British Library Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 18 © by SLUB Dresden slub-dresden.de
  19. 19. Discovery und die neue Rolle von Bibliotheken Das ist nicht unser Ansatz: „Knowledge is of two kinds: We know a subject ourselves, or we know where we can find information on it.“ Samuel Johnson Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 19 © by SLUB Dresden slub-dresden.de
  20. 20. Discovery und die neue Rolle von Bibliotheken Das digitale Zeitalter • Bereitsteller von Convenient Services statt bloßem Zugang zu Ressourcen • Beförderer von Wissenschaft und Forschung statt Wächter des Wissens Verwertung Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information Erzeugung, Selektion, Verarbeitung, Speicherung … Geisteswissenschaften Verarbeitung Naturwissenschaften Erwerbung Lebenswissenschaften • Technological Stewards statt Skeptiker des Kulturwandels Management, Wissensextraktion, Metadaten, Ontologien Analyse, Publikation, Portale, ARchivierung 24. Oktober 2013 | Seite 20 © by SLUB Dresden slub-dresden.de
  21. 21. Discovery und die neue Rolle von Bibliotheken Semantic Resource Discovery als Service • Überwindung traditioneller Konzepte von Discovery • Zusammenführen von Informationen statt Reduzierung auf kleinste gemeinsame Nenner • Big Data statt sorgfältiger Auswahl und partieller Genauigkeit bei der Behandlung von Bibliotheksdaten • Automatische Anreicherung, Crowd sourcing und Games with a Purpose statt exklusive Sacherschließung durch Experten • Semantisches, graph-basiertes Retrieval statt String-Suche • Möglichkeit zur intuitiven Entdeckung und Exploration von Wissen statt Vermittlung von Suchexpertenwissen • Wissen statt Information Wissensexploration und neuartiges Resource Discovery als Service Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 21 © by SLUB Dresden slub-dresden.de
  22. 22. Discovery und die neue Rolle von Bibliotheken Weitere Services in Bibliotheken • Digitalisierung und Digitalisierungs-Support (s. www.goobi.org) • Digitale Forschung: Text-Mining-Plattformen und Virtuelle Forschungsumgebungen • Informations-Services: Wissenschaftskartografie und Alerting Aervices • Akademisches Community Building: Profilseiten für Wissenschaftler (FIS), Campus-Community-Plattformen, Experten-Informationssysteme • Wissenschaftliches Schreiben und Publizieren: Bibliometrie, PublikationsSupport, Open Access (s. Wissensbar der SLUB Dresden) • Konzept der “blended library”, die physische und digitale Dienstleistungen wieder integriert (s. Gebäudeinformationssystem der SLUB und mapongo) Die Perspektive: Digitale Services in einer digitalen Kultur für eine digitale Community Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 22 © by SLUB Dresden slub-dresden.de
  23. 23. Discovery und die neue Rolle von Bibliotheken Weitere Services in Bibliotheken Sächsische Landesbibliothek – Staats- und Universitätsbibliothek Dresden Dr. Jens Mittelbach | Leiter der Abteilung Benutzung und Information 24. Oktober 2013 | Seite 23 © by SLUB Dresden slub-dresden.de
  24. 24. Resource Discovery neu definiert Danke für Ihre Aufmerksamkeit! 24.10.2013 Sächsische Landesbibliothek – Dresden Dr. Jens Mittelbach, SLUB Staats- und Universitätsbibliothek Dresden slub-dresden.de © by SLUB Dresden

×