KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur'

Der Kölner
UniversitätsGesamtkatalog
Praxisbericht
'Betrieb einer Recherche-Infrastruktur'
Oliver Flimm <flimm@ub.uni-koeln.de>
ZBIW: DV-Systembetreuung in Hochschulbibliotheken
28.11.2014
Universität zu Köln

„Der KUG“
• Zentrale Recherche-Infrastruktur für
die Bestände der Universität zu Köln
• Umfang (Stand 11/2014): 17.2 Mio.
Titel in 212 separaten Katalogen
• Integriert verschiedene Prinzipien und
Funktionen aus dem Social- und
Semantic Web
• Realisiert mit der Open-Source
Software OpenBib (GPL, seit 1997)

Besonderheiten
• Open Source als zentrales Prinzip
– Softwareverteilung über öffentliches SVN
Repository (Google Code)
• LAPPX (Linux, Apache, PostgreSQL,
Perl, Xapian)
• Eine Infrastruktur für effiziente
Bereitstellung vieler separater Portale
– Objektorientiertes Templating

Flexibles Templating
Verschiedene Abstraktionsebenen
(Kataloge, Views, Katalogprofile)
Default: 701 Alle: 3621
/titles_record
/_databases/mdz/titles_record
/_views/gdz/titles_record
/_profiles/kug/titles_record
/_profiles/kug/_databases/mdz/titles_record
/_profiles/sammlungen/_views/muenzen/titles_record

Infrastruktur: Ziele
• Eine Lösung für
– Endnutzer im Web-Browser
– Integration in andere Dienste (USB-Portal)
– Semantic Web
• Durchgehender 24/7 Betrieb
– Möglichst keine Downtimes bei
Erweiterungen/Updates
• Größtmögliche Flexibilität und
Erweiterbarkeit

Infrastruktur: Zentrale Prinzipien
• Trennung von Resourcen und
verschiedenen Repräsentationen
– Content-/Language-Negotiation per 303
Redirect
– HTML, INCLUDE, JSON, RDF, RSS, CSV,
TXT, ICAL
• REST für einzelne Resourcen (JSON)
– GET, POST, PUT, DELETE

Beispiel: URI's
Resource:
– /portal/<view>/databases (GET,POST)
Repräsentationen:
– /portal/<view>/databases.html?l=de
– /portal/<view>/databases.json?l=de
– /portal/<view>/admin/databases.html?l=de
– /portal/<view>/admin/databases.json?l=de

Beispiel: URI's II
Resource:
– /portal/<view>/databases/id/mdz
(GET,PUT,DELETE)
Repräsentationen:
– /portal/<view>/databases/id/mdz.html?l=de
– /portal/<view>/databases/id/mdz.json?l=de
– /portal/<view>/admin/databases/id/mdz.html?l=de
– /portal/<view>/admin/databases/id/mdz.json?l=de

Beispiel: URI's III oder JSON RuleZ
{
"link": {
"rel": "self",
"href": "http://kug.ub.uni-koeln.de/portal/kug/databases.json?l=de"
},
"databases": [
{
"link": {
"rel": "self",
"href": "http://kug.ub.uni-koeln.de/portal/kug/databases/id/afrikaans.json?l=de"
},
"system": "Sisis",
"active": 1,
"description": "Sammlung Afrikaans",
"dbname": "afrikaans",
"sigel": "afri",
"url": "http://www.ub.uni-koeln.de",
"id": "afrikaans"
},

Architektur für 24/7
USB-Portal KUG
Frontend S0
S1 S2 S3 S4
Cluster A
System /
User DB
Cluster B
HaProxy
Recherche Update

Architektur: 24/7 II
• Frontend-Server mit Proxy und
externer Steuerung
option httpchk HEAD /portal/openbib/server_is_active
• Alternierende Cluster für Recherche
und Updates

Aggregation externer Daten als
Kataloge
• Standard-Schnittstellen (OAI) und
Formate (DC, MARC21) nutzen, sonst API
(YouTube/OER) und/oder eigene
Konverter
• Zentrale OAI-Aggregation mit REPOX
• Open Data nutzen (BVB, SWB, hbz)
– Beispiel: Nomos Online Premium

Anreicherungen
Problem Sacherschliessung
– RVK, DDC, Schlagworte, Links auf
Inhaltsverzeichnisse aus Open Data Dumps
– Verschlankung verschiedener Systematiken
zu 20 Themengebieten über Konkordanzen
- 370.000 Titel mit BK vs. 1.1 Mio Titel mit
Themengebiet
– Referenzierende Artikelnamen aus der
Wikipedia als 'Schlagworte'

Anreicherungen II
Mehr finden:
– ISBN10 und ISBN13
– „Erscheinungsjahre“ bei Zeitschriften
– Schiller-Räuber-Problem
– Medientyp, Sprache
– Synonym-Wörterbücher

Administration
• Grundlegende Administration muss
an Nicht-Techniker delegierbar sein
– Web-Oberfläche für Administratoren
• Gleiches gilt für die textuelle
Betreuung von Sammlungsportalen
durch externe Wissenschaftler
(Präsentation von Forschungsdaten)

Elementare Bedürfnisse der
Nutzer im Blick behalten
• Relevantes Finden und Einordnen
– Rechercheanreicherungen
– Livesearch, Rechtschreibkorrektur, Toleranzen
– Systematische Einordnung (Themengebiete)
• Wie komme ich dran?
– Facettierung nach Standort und Zugriffs-Status
– Priorität: Online > ausleihbar > einsehbar

Tools
• REPOX
• Yslow
• YAML Framework
• ORM
• CGI::Application

Fragen?

Vielen Dank für Ihre
Aufmerksamkeit
Quellen:
KUG - http://kug.ub.uni-koeln.de/
OpenBib - http://www.openbib.org/
OpenBib Wiki - http://wiki.openbib.org/
OpenBibBlog - http://blog.openbib.org/
Projektseite – http://code.google.com/p/openbib/
Xapian Suchmaschine - http://www.xapian.org/

KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur'

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur'

Ähnlich wie KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur' (20)

KUG Praxisbericht - 'Betrieb einer Recherche-Infrastruktur'