KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur'
1. Der Kölner
UniversitätsGesamtkatalog
Praxisbericht
'Betrieb einer Recherche-Infrastruktur'
Oliver Flimm <flimm@ub.uni-koeln.de>
ZBIW: DV-Systembetreuung in Hochschulbibliotheken
28.11.2014
Universität zu Köln
2. „Der KUG“
• Zentrale Recherche-Infrastruktur für
die Bestände der Universität zu Köln
• Umfang (Stand 11/2014): 17.2 Mio.
Titel in 212 separaten Katalogen
• Integriert verschiedene Prinzipien und
Funktionen aus dem Social- und
Semantic Web
• Realisiert mit der Open-Source
Software OpenBib (GPL, seit 1997)
Universität zu Köln
7. Infrastruktur: Ziele
Universität zu Köln
• Eine Lösung für
– Endnutzer im Web-Browser
– Integration in andere Dienste (USB-Portal)
– Semantic Web
• Durchgehender 24/7 Betrieb
– Möglichst keine Downtimes bei
Erweiterungen/Updates
• Größtmögliche Flexibilität und
Erweiterbarkeit
8. Infrastruktur: Zentrale Prinzipien
• Trennung von Resourcen und
verschiedenen Repräsentationen
– Content-/Language-Negotiation per 303
Redirect
– HTML, INCLUDE, JSON, RDF, RSS, CSV,
TXT, ICAL
• REST für einzelne Resourcen (JSON)
– GET, POST, PUT, DELETE
Universität zu Köln
9. Beispiel: URI's
Resource:
– /portal/<view>/databases (GET,POST)
Repräsentationen:
– /portal/<view>/databases.html?l=de
– /portal/<view>/databases.json?l=de
– /portal/<view>/admin/databases.html?l=de
– /portal/<view>/admin/databases.json?l=de
Universität zu Köln
10. Beispiel: URI's II
Resource:
– /portal/<view>/databases/id/mdz
(GET,PUT,DELETE)
Repräsentationen:
– /portal/<view>/databases/id/mdz.html?l=de
– /portal/<view>/databases/id/mdz.json?l=de
– /portal/<view>/admin/databases/id/mdz.html?l=de
– /portal/<view>/admin/databases/id/mdz.json?l=de
Universität zu Köln
12. Architektur für 24/7
Universität zu Köln
USB-Portal KUG
Frontend S0
S1 S2 S3 S4
Cluster A
System /
User DB
Cluster B
HaProxy
Recherche Update
13. Architektur: 24/7 II
• Frontend-Server mit Proxy und
externer Steuerung
option httpchk HEAD /portal/openbib/server_is_active
• Alternierende Cluster für Recherche
und Updates
Universität zu Köln
14. Aggregation externer Daten als
Kataloge
• Standard-Schnittstellen (OAI) und
Formate (DC, MARC21) nutzen, sonst API
(YouTube/OER) und/oder eigene
Konverter
• Zentrale OAI-Aggregation mit REPOX
• Open Data nutzen (BVB, SWB, hbz)
– Beispiel: Nomos Online Premium
Universität zu Köln
16. Anreicherungen
Problem Sacherschliessung
– RVK, DDC, Schlagworte, Links auf
Inhaltsverzeichnisse aus Open Data Dumps
– Verschlankung verschiedener Systematiken
zu 20 Themengebieten über Konkordanzen
- 370.000 Titel mit BK vs. 1.1 Mio Titel mit
Themengebiet
– Referenzierende Artikelnamen aus der
Wikipedia als 'Schlagworte'
Universität zu Köln
17. Anreicherungen II
Mehr finden:
– ISBN10 und ISBN13
– „Erscheinungsjahre“ bei Zeitschriften
– Schiller-Räuber-Problem
– Medientyp, Sprache
– Synonym-Wörterbücher
Universität zu Köln
18. Administration
• Grundlegende Administration muss
an Nicht-Techniker delegierbar sein
– Web-Oberfläche für Administratoren
• Gleiches gilt für die textuelle
Betreuung von Sammlungsportalen
durch externe Wissenschaftler
(Präsentation von Forschungsdaten)
Universität zu Köln
21. Elementare Bedürfnisse der
Nutzer im Blick behalten
• Relevantes Finden und Einordnen
– Rechercheanreicherungen
– Livesearch, Rechtschreibkorrektur, Toleranzen
– Systematische Einordnung (Themengebiete)
Universität zu Köln
• Wie komme ich dran?
– Facettierung nach Standort und Zugriffs-Status
– Priorität: Online > ausleihbar > einsehbar
25. Vielen Dank für Ihre
Aufmerksamkeit
Quellen:
KUG - http://kug.ub.uni-koeln.de/
OpenBib - http://www.openbib.org/
OpenBib Wiki - http://wiki.openbib.org/
OpenBibBlog - http://blog.openbib.org/
Projektseite – http://code.google.com/p/openbib/
Xapian Suchmaschine - http://www.xapian.org/
Universität zu Köln