Metasuche mit pazpar2

683 Aufrufe

Veröffentlicht am

Vortrag zur Metasuche mit pazpar2 auf dem Bibliothekartag 2012.

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
683
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
5
Aktionen
Geteilt
0
Downloads
3
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Metasuche mit pazpar2

  1. 1. Metasuche mit pazpar2 Sven-S. Porst Niedersächsische Staats- und Universitätsbibliothek Göttingen danke selbst vorstellen arbeite an der SUB, an Metasuche und virtuellen Fachbibliotheken insbesondere Lib AAC, GEO-LEO, SUB Metasuche
  2. 2. Metasuche • Was ist Metasuche? • … hört sich an wie ein Albtraum • … ist aber manchmal unvermeidlich Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Was: Metasuche / förderierte Suche / verteilte Suche gleichzeitige Abfrage aus mehreren entfernten Datenquellen gemeinsame Anzeige der Ergebnisse Albtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten) also: technisch problematisch + potentiell schlechte user experience also: wenn möglich vermeiden + lokalen Index nutzen Aber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand
  3. 3. Schritte 1. Daten holen 2. Daten normalisieren 3. Ergebnisse verfügbar machen Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 1. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO 2709, XML) 2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache) 3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?
  4. 4. bisherige Lösungen • • • ohne Support (alt oder selbstgebaut) monolithisch (feste Oberfläche) an der SUB Göttingen Entscheidung für pazpar2 als Ersatz Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 SUB früher: iPort + eigenes GEO-LEO andere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebunden Entscheidung der SUB für: homogene Infrastruktur,
  5. 5. pazpar2 • • • • http://indexdata.com/pazpar2 open source aktive Entwicklung durch Index Data Daten, keine Nutzeroberfläche • als Dienst einbindbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz … bieten Support an »Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt
  6. 6. 1. Daten holen • basiert auf yaz • • • Z39.50, SRU, Solr … und zugehörige Abfragesprachen liest XML und MARC 21 Daten Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr) Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten tmarc? liest Daten in 20er Schritten
  7. 7. 2. XML Workflow • internes Datenformat ist XML … mit frei definierbaren Feldern • Normalisierung durch XSLT • XSLTs verkett- und nachnutzbar Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 ISO 2709 wird in MARC XML oder tmarc konvertiert XSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung
  8. 8. Internes Datenformat • XSLT für MARC 21 enthalten • • • gibt ein gutes Datenformat vor Facettierung pro Feld Deduplizierung Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefe tmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …) Facetten: gute Normalisierung wichtig, ICU Filter anwendbar Deduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S. Lohrum)
  9. 9. MARC 21 → pazpar2 Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Datensatz aus OLC SSG-Geo, Artikel Autoren in MARC 700 Sprache unbekannt Artikeldetails in MARC 773
  10. 10. 3. Abfrage • • keine Weboberfläche http/XML Schnittstelle • • sessionbasiert: init / search / show JavaScript zur Kommunikation: pz2.js Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 weitere Befehle: ping / bytarget / termlist / record / settings /
  11. 11. Anzeige • • elementarer JavaScript Client dabei erweitert für SUB Göttingen: • • • • Interface auf Deutsch und Englisch ZDB-JOP, Google Books und Maps Exportformate Nutzungsanalyse mit piwik Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Export RIS/BibTeX/COiNS piwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export 1%, Google Books 2% Histogramm
  12. 12. Bemerkungen • • • • Entwicklungen: Facettierung, Solr Zugriffskontrolle mit pazpar2-access TYPO3 Einbindung Beispiele: • • GEO-LEO: geo-leo.de Lib AAC: aac.sub.uni-goettingen.de Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 auch: Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)
  13. 13. Demo http://geo-leo.de/bibtag Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012 Demo: Suche nach Solling Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP Facette Karte Sonderblatt Waldfunktionenkarte + Google Maps Histogramm
  14. 14. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  15. 15. Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012
  16. 16. Vielen Dank • • • http://github.com/ssp/pazpar2-all porst@sub.uni-goettingen.de Fragen? Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

×