2. Überblick
Vom Katalog zum Resource Discovery System
Umsetzung durch kommerzielle Anbieter
Herausforderungen und Probleme in der Suche
Chancen für die Bibliotheken
Ausblick
12. April 2013 Fortbildung VdB, Braunschweig 2
3. Vom Katalog zum
Resource Discovery System
12. April 2013 Fortbildung VdB, Braunschweig 3
4. Kataloge
Boolesche Suche
Differenzierte Indexe
Erweiterte Suche als Standard
Langsame Suche
Hardware/Software begrenzen die
Suchgeschwindigkeit
Begrenzte Datenmenge
Für jeden Bestand eine eigene Datenbank
12. April 2013 Fortbildung VdB, Braunschweig 4
5. Generation Google
Einfache Suche
Undifferenzierter „Google-Schlitz“
Erweiterte Suchmöglichkeiten verborgen
Schnelle Ergebnisse
Suchgeschwindigkeit nur durch Bandbreite begrenzt
Allumfassend
Wenn Google es nicht findet, existiert es nicht
12. April 2013 Fortbildung VdB, Braunschweig 5
7. Resource Discovery
Fokus für neue Entwicklungen
Suchmaschinentechnologie
Modernes und einheitliches User Interface
Nutzung durch mobile Endgeräte
Kein neuer Katalog
Gleichberechtigter, einheitlicher Zugang zu allen
Beständen der Bibliothek
Volltext-Indexierung
Web-Scale Discovery
Nach Breeding (2010)
12. April 2013 Fortbildung VdB, Braunschweig 7
9. Produkte
Summon (Serial Solutions/Proquest)
http://www.serialssolutions.com/en/services/summon
Primo mit Primo Central (Ex Libris)
http://www.exlibrisgroup.com/de/category/PrimoUeberblick
EBSCO Discovery Service
http://www.ebscohost.com/discovery/
Vgl. Jansen et. al. (2010)
12. April 2013 Fortbildung VdB, Braunschweig 9
10. Komponenten
Suchoberfläche
Rechercheportal im modernen Look
Facettiertes Browsen der Ergebnisse
Integration von Link Resolvern (Volltextzugang)
Anbindung an Bibliothekssystem
12. April 2013 Fortbildung VdB, Braunschweig 10
11. Oberfläche mit facettierter Suche
Erweiterung des Suchraums
Eingabemaske mit Stichwortsuche
Trefferliste
Facetten zur
Einschränkung
der Treffermenge
12. April 2013 Fortbildung VdB, Braunschweig 11
13. Komponenten
Zentraler Index
Beim Anbieter gehostet
Bibliografische Daten für alle Kunden
Kunden können Ausschnitte wählen
Lokaler Index
Eigene bibliografische Daten
12. April 2013 Fortbildung VdB, Braunschweig 13
14. Eigenschaften der Indexe
„Megaindex“
Mehrere 100 Millionen Datensätze
Nicht nur Metadaten, oft auch Volltexte indexiert
Hauptverkaufsargument der Anbieter
Hetrogene Herkunft
Verlage und Datenbankproduzenten
Bibliothekskataloge
Frei verfügbares Open Access Material
12. April 2013 Fortbildung VdB, Braunschweig 14
15. Eigenschaften der Indexe
Heterogene Inhalte
Zeitschriften-/ Konferenzbeiträge
Print- und E-Books
Zeitungsartikel, Rezensionen, Working Papers, …
Aber: sehr wenig deutsche/deutschsprachige Inhalte
12. April 2013 Fortbildung VdB, Braunschweig 15
16. Unterschiede der Implementierung
Installation
Lokal auf eigenem Server
Gehostet beim Anbieter: Software-as-a-service
Komponenten
Oberfläche + Index vom Anbieter
Zentraler Index als Datenquelle für eigene Oberfläche
12. April 2013 Fortbildung VdB, Braunschweig 16
17. Unterschiede der Implementierung
Selektion des Suchraums
Standardsuchraum
Reduktion auf „klassischen“ Katalogbestand
Erweiterung auf das „web scale discovery“
Navigation
Anordnung und Inhalte der Facetten
Drill-down nach formalen und inhaltlichen Aspekten
12. April 2013 Fortbildung VdB, Braunschweig 17
18. KonSearch
RDS der UB Konstanz
Summon Oberfläche und Index
Beim Anbieter gehostet
12. April 2013 Fortbildung VdB, Braunschweig 18
19. Wissensportal Primo
RDS der TU Berlin
Primo Oberfläche und Index
Beim KOBV gehostet
12. April 2013 Fortbildung VdB, Braunschweig 19
20. HEIDI
RDS der UB Heidelberg
Eigene Oberfläche + Summon Index
Lokale Installation
12. April 2013 Fortbildung VdB, Braunschweig 20
21. SULB Wissensportal
RDS der Saarländischen Universitäts-
und Landesbibliothek
Ebsco Discovery Service Oberfläche und Index
Beim Anbieter gehostet
12. April 2013 Fortbildung VdB, Braunschweig 21
22. Katalog Plus
RDS der UB Freiburg
Ebsco Discovery Service
Eigene Oberfläche + Index vom Anbieter
12. April 2013 Fortbildung VdB, Braunschweig 22
23. Zusammenfassung RDS
Einfache Suche
Einheitlicher Zugang
Modernes Interface
Schnelle Ergebnisse
Suchmaschinentechnologie
Umfassend
Zugang zu allen Beständen der Bibliothek
Erweiterter Suchraum durch zentralen Index
→ Erwartungen werden erfüllt
12. April 2013 Fortbildung VdB, Braunschweig 23
25. Normierung
Heterogene Quellen → Heterogene Inhalte
Elemente der Titelaufnahmen
Ansetzung von Personennamen
Inhaltliche Erschließung
Beobachtung
Häufige Dubletten
Titel
Erschließungselemente
Verweisungsformen sind nicht suchbar
12. April 2013 Fortbildung VdB, Braunschweig 25
26. Heterogene Erschließung
Suche nach „Linked Open Data“
Schlagwortfacette
EDS, UB Freiburg: 100(!) Einträge
Darunter für das Konzept „Linked Open Data“
Linked Data
Linked Data (Ld)
Linked Data (Semantic Web)
Linked Open Data
Linked Open Data (Lod)
12. April 2013 Fortbildung VdB, Braunschweig 26
29. Nachvollziehbarkeit
Inhalte der zentralen Indexe sind nicht dokumentiert
Anbieter sehen den zentralen Index als Möglichkeit,
sich von den Wettbewerbern abzugrenzen
Oft nur allgemeine Angaben
Verlage
Fachgesellschaften
Selten: Zeitschriften
Keine Aussagen zum Umfang bestimmter Inhalte
Inhalte des zentralen Index sind nicht stabil
Entfernung von Inhalten aufgrund ausgelaufener
Lizenzen
12. April 2013 Fortbildung VdB, Braunschweig 29
30. Nachvollziehbarkeit
Indexing und Retrieval ist nicht dokumentiert
Indexbasis
Metadaten
Abstracts
Volltext
Normalisierung und linguistische Bearbeitung
Umlaute
Grammatische Reduktion (z.b. Plural)
Synonymerweiterung
Ranking
12. April 2013 Fortbildung VdB, Braunschweig 30
31. Indexing und Ranking
Konsearch
Suche nach „Linked open data libraries“
Treffer 1 bis 3
12. April 2013 Fortbildung VdB, Braunschweig 31
32. Treffermengen
Undifferenzierte Suche als Standard
Metadaten und Volltext indexiert
Auch spezifische Anfragen liefern riesige Mengen
TU Berlin
UB Freiburg
12. April 2013 Fortbildung VdB, Braunschweig 32
35. … für besseres Suchen und Finden
Zusammenbringen und Differenzieren
Alles zu einem bestimmten Thema finden
Alles von einem Autor finden
Klare Trennung von inhaltlich verschiedenem
Nutzer nicht mit großen Treffermengen alleine lassen
Sinnvolle Facettierung der Ergebnisse
Nicht nur formal, sondern auch inhaltlich
12. April 2013 Fortbildung VdB, Braunschweig 35
36. Transparenz
Inhalte
Was kann recherchiert werden? Was nicht?
Und warum nicht?
Suchprozess
Wie wird indexiert?
Welche Normalisierungen wurden verwendet?
Wurde die Suche verändert?
12. April 2013 Fortbildung VdB, Braunschweig 36
38. Ja!
Bild: Wikipedia / Public Domain
12. April 2013 Fortbildung VdB, Braunschweig 38
39. Systemaufbau
Präsentation
Oberfläche
Such- und
Logik Kontoverwaltung
Datenbank
Index
12. April 2013 Fortbildung VdB, Braunschweig 39
40. Präsentation
Manipulation der Anzeige
Anbieten von externen Informationen
Anbieten von alternativen Sucheinstiegen
Manipulation der Sucheingabe
Erkennen von Personen
Sucherweiterung um alternative Schreibweisen
Erkennen von Konzepten
Sucherweiterung um Synonyme
Anbieten von Disambiguierung
Anbieten von Ober- und Unterbegriffen für die Suche
12. April 2013 Fortbildung VdB, Braunschweig 40
43. Mock-Up
Mehr Infomationen
● GND Eintrag
● Wikipedia
● Lexika
Neue Suchen
●Vom gleichen Autor
● Über diesen Autor
12. April 2013 Fortbildung VdB, Braunschweig 43
44. Datenbankschicht
Ziel: Homogenisierung der Daten
Anpassen von Datenelementen
Anreichern der Daten
Anpassen der Indexierung
Aber: Zentraler Index im „Besitz“ der Anbieter
→ Zugang zu den Daten existentiell
12. April 2013 Fortbildung VdB, Braunschweig 44
46. Auswertung der Hierarchie
Erschließung auf unterschiedlichen Ebenen
Verlag / Reihe
Zeitschrift / Sammelband
Aufsatz
Ansatz: Akkumulieren und Verteilen
„von unten nach oben“
„von oben nach unten“
12. April 2013 Fortbildung VdB, Braunschweig 46
47. Auswertung der Redundanz
„Echte“ Dubletten
Sehr ähnliche Einträge
Ausgaben
Print, Elektronisch, Paperback, International
Auflagen und Versionen
Working Paper, Pre- / Postprint
Übersetzungen
Ansatz: Übertragung von inhaltlicher und formaler
Erschließung aus Dubletten und anderen Ausgaben
12. April 2013 Fortbildung VdB, Braunschweig 47
48. Forschungsprojekt
Clustering von Katalogdaten zur Übertragung von
Erschließungsinformationen
Daten
SWB
Katalog des Südwestdeutschen Bibliotheksverbundes
Hebis
Katalog des Hessischen Bibliotheks- und Informationssystems
HBZ
Katalog des Hochschulbibliothekszentrum des Landes Nordrhein-
Westfalen
B3Kat
Gemeinsamer Verbundkatalog von Bibliotheksverbund Bayern und
dem Kooperativen Bibliotheksverbund Berlin-Brandenburg
12. April 2013 Fortbildung VdB, Braunschweig 48
51. (Linked) Open Data
Bereitstellung in offenen Formaten
Bereitstellung unter freien Lizenzen
Verfügbarkeit großer bibliografischer
Datensammlungen
Nationalbibliografien
Kataloge von Bibliotheken und /-verbünden
Fachbibliografien
Open-Access Repositorien
Verlagsdaten
Normdaten
12. April 2013 Fortbildung VdB, Braunschweig 51
52. Gemeinsame Infrastruktur
Culturegraph.org
Initiative von DNB und HBZ
Ziel: Zusammenführen von bibliografischen
Informationen, die als Linked Open Data zur Verfügung
stehen
Open Source Infrastruktur
Parametrisierbare Metadatenverarbeitung
Erweiterbar (Java)
Skalierbar (Hadoop)
→ Ideale Ausgangsbasis zur Verarbeitung großer
Datenmengen
12. April 2013 Fortbildung VdB, Braunschweig 52
53. Freie Softwarelösung
vufind
Gemeinsame Entwicklung von Bibliotheken
Leistungsfähige Softwarebasis
Großer Anwenderkreis
12. April 2013 Fortbildung VdB, Braunschweig 53
56. Berufsfeld
Metadatenmanagement als eine zentrale Aufgabe
Damit auch künftiger Ausbildungsschwerpunkt
Ziel: Zusammenführen von Metadaten in eigenem
Index
Homogenisierung der Daten
Formal
Inhaltlich
Anreicherung mit externen Quellen
Empfehlungen
Verknüpfungen
Zusatzinformationen
12. April 2013 Fortbildung VdB, Braunschweig 56
57. Die Konkurrenz schläft nicht
Google analysiert die Nutzereingaben
Erkannt werden:
Personen
Kunstwerke
Bücher
Filme
Computerspiele
….
(auch abstrakte Konzepte)
Angezeigt werden Kurzinformationen
und sinnvolle Verknüpfungen
zu anderen Entitäten
12. April 2013 Fortbildung VdB, Braunschweig 57
58. Danke für Ihre Aufmerksamkeit!
Folien online unter
http://www.slideshare.net/MagnusPfeffer/
Dieses Werk bzw. Inhalt steht unter einer
Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.
12. April 2013 Fortbildung VdB, Braunschweig 58
60. Quellen
Marshall Breeding: The State of the Art in Library Discovery 2010, in:
Computers in Libraries, 30 (1), 2010, S. 31
Heiko Jansen, Kirstin Kemner-Heek, Roswitha Schweitzer:
Konkurrenzanalyse ausgewählter kommerzieller Suchindizes, Online-
Veröffentlichung, 2010
Magnus Pfeffer: Using clustering across union catalogues to enrich entries
with indexing information, in: Data Analysis, Machine Learning and
Knowledge Discovery – Proceedings of the 36th Annual Conference of the
German Classification Society, Springer, Heidelberg/Berlin, 2012 (noch
nicht erschienen)
Heidrun Wiesenmüller: Resource Discovery Systeme, Vortrag auf der 36.
Jahrestagung der Gesellschaft für Klassifikation, 2012
12. April 2013 Fortbildung VdB, Braunschweig 60