Metasuche mit pazpar2
Sven-S. Porst

Niedersächsische Staats- und
Universitätsbibliothek Göttingen
danke
selbst vorstellen...
Metasuche
• Was ist Metasuche?
• … hört sich an wie ein Albtraum
• … ist aber manchmal unvermeidlich
Metasuche mit pazpar2...
Schritte
1. Daten holen
2. Daten normalisieren
3. Ergebnisse verfügbar machen

Metasuche mit pazpar2 • Sven-S. Porst, SUB ...
bisherige Lösungen
•
•
•

ohne Support (alt oder selbstgebaut)
monolithisch (feste Oberfläche)
an der SUB Göttingen Entsch...
pazpar2
•
•
•
•

http://indexdata.com/pazpar2
open source
aktive Entwicklung durch Index Data
Daten, keine Nutzeroberfläch...
1. Daten holen
•

basiert auf yaz

•
•
•

Z39.50, SRU, Solr
… und zugehörige Abfragesprachen

liest XML und MARC 21 Daten
...
2. XML Workflow
•

internes Datenformat ist XML
… mit frei definierbaren Feldern

•

Normalisierung durch XSLT

•

XSLTs v...
Internes Datenformat
•

XSLT für MARC 21 enthalten

•
•
•

gibt ein gutes Datenformat vor

Facettierung pro Feld
Deduplizi...
MARC 21 → pazpar2

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Datensatz aus OLC SS...
3. Abfrage
•
•

keine Weboberfläche
http/XML Schnittstelle

•
•

sessionbasiert: init / search / show
JavaScript zur Kommu...
Anzeige
•
•

elementarer JavaScript Client dabei
erweitert für SUB Göttingen:

•
•
•
•

Interface auf Deutsch und Englisch...
Bemerkungen
•
•
•
•

Entwicklungen: Facettierung, Solr
Zugriffskontrolle mit pazpar2-access
TYPO3 Einbindung
Beispiele:

•...
Demo

http://geo-leo.de/bibtag

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Demo: S...
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
Vielen Dank
•
•
•

http://github.com/ssp/pazpar2-all
porst@sub.uni-goettingen.de
Fragen?

Metasuche mit pazpar2 • Sven-S. ...
Nächste SlideShare
Wird geladen in …5
×

Metasuche mit pazpar2

685 Aufrufe

Veröffentlicht am

Vortrag zur Metasuche mit pazpar2 auf dem Bibliothekartag 2012.

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
685
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
3
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Metasuche mit pazpar2

  1. 1. Metasuche mit pazpar2 Sven-S. Porst Niedersächsische Staats- und Universitätsbibliothek Göttingen danke selbst vorstellen arbeite an der SUB, an Metasuche und virtuellen Fachbibliotheken insbesondere Lib AAC, GEO-LEO, SUB Metasuche
  2. 2. Metasuche • Was ist Metasuche? • … hört sich an wie ein Albtraum • … ist aber manchmal unvermeidlich Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Was: Metasuche / förderierte Suche / verteilte Suche gleichzeitige Abfrage aus mehreren entfernten Datenquellen gemeinsame Anzeige der Ergebnisse Albtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten) also: technisch problematisch + potentiell schlechte user experience also: wenn möglich vermeiden + lokalen Index nutzen Aber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
  3. 3. Schritte 1. Daten holen 2. Daten normalisieren 3. Ergebnisse verfügbar machen Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 1. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO 2709, XML) 2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache) 3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?
  4. 4. bisherige Lösungen • • • ohne Support (alt oder selbstgebaut) monolithisch (feste Oberfläche) an der SUB Göttingen Entscheidung für pazpar2 als Ersatz Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 SUB früher: iPort + eigenes GEO-LEO andere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebunden Entscheidung der SUB für: homogene Infrastruktur,
  5. 5. pazpar2 • • • • http://indexdata.com/pazpar2 open source aktive Entwicklung durch Index Data Daten, keine Nutzeroberfläche • als Dienst einbindbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz … bieten Support an »Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
  6. 6. 1. Daten holen • basiert auf yaz • • • Z39.50, SRU, Solr … und zugehörige Abfragesprachen liest XML und MARC 21 Daten Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr) Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten tmarc? liest Daten in 20er Schritten
  7. 7. 2. XML Workflow • internes Datenformat ist XML … mit frei definierbaren Feldern • Normalisierung durch XSLT • XSLTs verkett- und nachnutzbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 ISO 2709 wird in MARC XML oder tmarc konvertiert XSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
  8. 8. Internes Datenformat • XSLT für MARC 21 enthalten • • • gibt ein gutes Datenformat vor Facettierung pro Feld Deduplizierung Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefe tmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …) Facetten: gute Normalisierung wichtig, ICU Filter anwendbar Deduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S. Lohrum)
  9. 9. MARC 21 → pazpar2 Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Datensatz aus OLC SSG-Geo, Artikel Autoren in MARC 700 Sprache unbekannt Artikeldetails in MARC 773
  10. 10. 3. Abfrage • • keine Weboberfläche http/XML Schnittstelle • • sessionbasiert: init / search / show JavaScript zur Kommunikation: pz2.js Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 weitere Befehle: ping / bytarget / termlist / record / settings /
  11. 11. Anzeige • • elementarer JavaScript Client dabei erweitert für SUB Göttingen: • • • • Interface auf Deutsch und Englisch ZDB-JOP, Google Books und Maps Exportformate Nutzungsanalyse mit piwik Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Export RIS/BibTeX/COiNS piwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export 1%, Google Books 2% Histogramm
  12. 12. Bemerkungen • • • • Entwicklungen: Facettierung, Solr Zugriffskontrolle mit pazpar2-access TYPO3 Einbindung Beispiele: • • GEO-LEO: geo-leo.de Lib AAC: aac.sub.uni-goettingen.de Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 auch: Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)
  13. 13. Demo http://geo-leo.de/bibtag Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Demo: Suche nach Solling Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP Facette Karte Sonderblatt Waldfunktionenkarte + Google Maps Histogramm
  14. 14. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  15. 15. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  16. 16. Vielen Dank • • • http://github.com/ssp/pazpar2-all porst@sub.uni-goettingen.de Fragen? Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

×