SlideShare ist ein Scribd-Unternehmen logo
Aufbau eines zentralen Indexes  im GBV Till Kinstler,  [email_address] http://twitter.com/tillk Verbundzentrale des GBV (VZG)
Wir haben im zentralen  Metadatenmanagementsystem  des GBVs (CBS) rund 100 Millionen interessante Datensätze: klassische OPAC-Daten (GVK), Online Contents (OLC), Nationallizenzen, … Und was machen wir damit?
 
 
 
 
 
„ In addition, we have also found that the  poor usability, high complexity, and lack of integration  of many electronic resource discovery systems, have raised the entry threshold of information technology literacy. This acts as a barrier to information search and retrieval. […] Users find database structures hinder . They have to learn the procedural knowledge for using a particular database as well as have some basic knowledge of how the data table is organised and what subject matter the built-in thesauri refers to; both have limited transferability. The participants did not appear to lack information technology or digital literacy, as they had demonstrated they were able to use other internet-based search and retrieval tools.“ (Wong, W. ; Stelmaszewska, H. ; Barn, B. ; Bhimani, N. ; Barn, S.: JISC User Behaviour Observational Study: User Behaviour in Resource Discovery. Final Report / JISC. Version: November 2009.  http://www.jisc.ac.uk/media/documents/publications/programme/2010/ubirdfinalreport.pdf )
Idee: Nur noch ein Zugangspunkt für alle Bestände (und Dienste ?!?) einer Bibliothek im Web
-> große, aggregierte / integrierte Suchindexe (die alle Bestände einer Bibliothek abbilden: Monographien, Artikel, elektronische Bestände, Webseiten, ...)
-> „einfach“ zu benutzende Oberflächen
-> fehlt oft: gute Integration aller angebotenen Dienste (Ausleihe, Fernleihe, elektronischer Zugang,...) Konsequenzen
Konsequenzen Endlich Abkehr vom Paradigma exakter, boolescher Suche: „The conventional Boolean retrieval methodology is not well adapted to the information retrieval task“ (Gerard Salton, 1984)
Stattdessen einfache, „best match“ Suche („wie im Web“): „A best match search matches the set of query stems against the sets of stems corresponding to each of the documents in the database, calculates a measure of similarity between the query and each document, and then  sorts the documents into order of decreasing similarity with the query .“ (Peter Willett, 1988)
-> „unpräzise“ Suche (egal ob [Nachname, Vorname] oder [Vorname Nachname], Stemming, nur ein Teil der Suchbegriffe muss vorkommen, automatische Erweiterung der Suchanfrage, ...)
-> Relevanzsortierung (-> was ist Relevanz?)
-> Möglichkeiten zum Browsen, Verfeinern, Entdecken (Facetten, „ähnliche Treffer“, Vorschläge/Recommendations), ...

Weitere ähnliche Inhalte

Was ist angesagt?

Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Bedeutung der Webarchivierung am Beispiel von Web@rchiv ÖsterreichBedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Web@rchive Austria
 
Mit Webservices zum Katalog 2.0
Mit Webservices zum Katalog 2.0Mit Webservices zum Katalog 2.0
Mit Webservices zum Katalog 2.0
Jakob .
 
Österreich liest Vortrag zum Web@rchiv Österreich
Österreich liest Vortrag zum Web@rchiv ÖsterreichÖsterreich liest Vortrag zum Web@rchiv Österreich
Österreich liest Vortrag zum Web@rchiv Österreich
Web@rchive Austria
 
TextGrid 2.0 @ Bibliothekartag 2012
TextGrid 2.0 @ Bibliothekartag 2012TextGrid 2.0 @ Bibliothekartag 2012
TextGrid 2.0 @ Bibliothekartag 2012
Felix Lohmeier
 
Bam Clio
Bam ClioBam Clio
Bam Clio
Frank von Hagel
 
2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf
Stadt Wien
 
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
Stadt Wien
 
Open Access auf Länderebene - das Beispiel Baden-Württemberg
Open Access auf Länderebene - das Beispiel Baden-WürttembergOpen Access auf Länderebene - das Beispiel Baden-Württemberg
Open Access auf Länderebene - das Beispiel Baden-Württemberg
Karlsruhe Institute of Technology (KIT)
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Felix Lohmeier
 
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
intranda GmbH
 
E-Content & Open Access 2008
E-Content & Open Access 2008E-Content & Open Access 2008
E-Content & Open Access 2008
open-access.net
 
2022_46.OpenDataMeetUp.pdf
2022_46.OpenDataMeetUp.pdf2022_46.OpenDataMeetUp.pdf
2022_46.OpenDataMeetUp.pdf
Stadt Wien
 
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Felix Lohmeier
 
Bibliotheken @ Google
Bibliotheken @ GoogleBibliotheken @ Google
Bibliotheken @ Google
Inga Overkamp
 
OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010
Lorenz Matzat
 
Google als Partner schätzen lernen: Austrian Books Online
Google als Partner schätzen lernen: Austrian Books OnlineGoogle als Partner schätzen lernen: Austrian Books Online
Google als Partner schätzen lernen: Austrian Books Online
Max Kaiser
 

Was ist angesagt? (20)

Entdecken Sie Deutschlands Datenschätze! (03/2014)
Entdecken Sie Deutschlands Datenschätze! (03/2014)Entdecken Sie Deutschlands Datenschätze! (03/2014)
Entdecken Sie Deutschlands Datenschätze! (03/2014)
 
Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Bedeutung der Webarchivierung am Beispiel von Web@rchiv ÖsterreichBedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
Bedeutung der Webarchivierung am Beispiel von Web@rchiv Österreich
 
Mit Webservices zum Katalog 2.0
Mit Webservices zum Katalog 2.0Mit Webservices zum Katalog 2.0
Mit Webservices zum Katalog 2.0
 
Österreich liest Vortrag zum Web@rchiv Österreich
Österreich liest Vortrag zum Web@rchiv ÖsterreichÖsterreich liest Vortrag zum Web@rchiv Österreich
Österreich liest Vortrag zum Web@rchiv Österreich
 
TextGrid 2.0 @ Bibliothekartag 2012
TextGrid 2.0 @ Bibliothekartag 2012TextGrid 2.0 @ Bibliothekartag 2012
TextGrid 2.0 @ Bibliothekartag 2012
 
Bam Clio
Bam ClioBam Clio
Bam Clio
 
2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf2022_46.OpenDataMeetup_MA13.pdf
2022_46.OpenDataMeetup_MA13.pdf
 
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
2022_46.OpenDataMeetUp_Publikationsserver_MA9.pdf
 
Open Access auf Länderebene - das Beispiel Baden-Württemberg
Open Access auf Länderebene - das Beispiel Baden-WürttembergOpen Access auf Länderebene - das Beispiel Baden-Württemberg
Open Access auf Länderebene - das Beispiel Baden-Württemberg
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
 
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
 
EconStor - ein vernetztes Fach-Repositorium
EconStor - ein vernetztes Fach-RepositoriumEconStor - ein vernetztes Fach-Repositorium
EconStor - ein vernetztes Fach-Repositorium
 
Informationsbeschaffung in Bibliotheken
Informationsbeschaffung in BibliothekenInformationsbeschaffung in Bibliotheken
Informationsbeschaffung in Bibliotheken
 
E-Content & Open Access 2008
E-Content & Open Access 2008E-Content & Open Access 2008
E-Content & Open Access 2008
 
2022_46.OpenDataMeetUp.pdf
2022_46.OpenDataMeetUp.pdf2022_46.OpenDataMeetUp.pdf
2022_46.OpenDataMeetUp.pdf
 
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
Leitbild Openness - Bibliotheken als Wächter für den (dauerhaft) freien Zugan...
 
Bibliotheken @ Google
Bibliotheken @ GoogleBibliotheken @ Google
Bibliotheken @ Google
 
OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010
 
Wie verbreitet sich die digitale Publikation im Netz?
Wie verbreitet sich die digitale Publikation im Netz?Wie verbreitet sich die digitale Publikation im Netz?
Wie verbreitet sich die digitale Publikation im Netz?
 
Google als Partner schätzen lernen: Austrian Books Online
Google als Partner schätzen lernen: Austrian Books OnlineGoogle als Partner schätzen lernen: Austrian Books Online
Google als Partner schätzen lernen: Austrian Books Online
 

Andere mochten auch

Leaving Blackboxes Behind - ELAG 2016
Leaving Blackboxes Behind - ELAG 2016Leaving Blackboxes Behind - ELAG 2016
Leaving Blackboxes Behind - ELAG 2016
Annika Domin
 
Sortierung von Suchergebnissen
Sortierung von SuchergebnissenSortierung von Suchergebnissen
Sortierung von Suchergebnissen
Till Kinstler
 
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
Es war einmal... Die VuFind Märchenstunde mit Till und GeraldEs war einmal... Die VuFind Märchenstunde mit Till und Gerald
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
Till Kinstler
 
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Falk Neubert
 
Open Source Software in Bibliotheken
Open Source Software in BibliothekenOpen Source Software in Bibliotheken
Open Source Software in Bibliotheken
Till Kinstler
 
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
Valeria Pesce
 
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Leander Seige
 
Seige arndt-lightning talk swib13
Seige arndt-lightning talk swib13Seige arndt-lightning talk swib13
Seige arndt-lightning talk swib13
Leander Seige
 
Torsten Grote: Freie Software
Torsten Grote: Freie SoftwareTorsten Grote: Freie Software
Torsten Grote: Freie Software
StefanMz
 
Ohne offenes wissen keine informationelle Selbstbestimmung
Ohne offenes wissen keine informationelle SelbstbestimmungOhne offenes wissen keine informationelle Selbstbestimmung
Ohne offenes wissen keine informationelle Selbstbestimmung
Open Data Network
 
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
Björn Muschall
 
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
The State of Sales & Marketing at the 50 Fastest-Growing B2B CompaniesThe State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
Mattermark
 
WTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx versionWTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx version
Tim O'Reilly
 

Andere mochten auch (13)

Leaving Blackboxes Behind - ELAG 2016
Leaving Blackboxes Behind - ELAG 2016Leaving Blackboxes Behind - ELAG 2016
Leaving Blackboxes Behind - ELAG 2016
 
Sortierung von Suchergebnissen
Sortierung von SuchergebnissenSortierung von Suchergebnissen
Sortierung von Suchergebnissen
 
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
Es war einmal... Die VuFind Märchenstunde mit Till und GeraldEs war einmal... Die VuFind Märchenstunde mit Till und Gerald
Es war einmal... Die VuFind Märchenstunde mit Till und Gerald
 
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
Stolpersteine und Chancen bei Open-Source Lösungen in der Arbeitswelt.
 
Open Source Software in Bibliotheken
Open Source Software in BibliothekenOpen Source Software in Bibliotheken
Open Source Software in Bibliotheken
 
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
AgriVIVO: A Global Ontology-Driven RDF Store Based on a Distributed Architect...
 
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
Die finc Nutzergemeinschaft - bis zur Unendlichkeit und noch viel weiter...
 
Seige arndt-lightning talk swib13
Seige arndt-lightning talk swib13Seige arndt-lightning talk swib13
Seige arndt-lightning talk swib13
 
Torsten Grote: Freie Software
Torsten Grote: Freie SoftwareTorsten Grote: Freie Software
Torsten Grote: Freie Software
 
Ohne offenes wissen keine informationelle Selbstbestimmung
Ohne offenes wissen keine informationelle SelbstbestimmungOhne offenes wissen keine informationelle Selbstbestimmung
Ohne offenes wissen keine informationelle Selbstbestimmung
 
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
amsl - Anwendungsworkshop und hands-on (L. Unterdörfel, S. Nuck)
 
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
The State of Sales & Marketing at the 50 Fastest-Growing B2B CompaniesThe State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
The State of Sales & Marketing at the 50 Fastest-Growing B2B Companies
 
WTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx versionWTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx version
 

Ähnlich wie Aufbau eines zentralen Indexes im GBV

Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Thomas Hapke
 
ZBIW: Discovery
ZBIW: DiscoveryZBIW: Discovery
ZBIW: Discovery
Christian Hauschke
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Stefan Dietze
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
redsys
 
Visualisierung bibliographischer Daten
Visualisierung bibliographischer DatenVisualisierung bibliographischer Daten
Visualisierung bibliographischer Daten
Ralf Stockmann
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?
Martin Blenkle
 
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
kostaedt
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
Martin Blenkle
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
Adrian Pohl
 
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Jakob .
 
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
L3T - Lehrbuch für Lehren und Lernen mit Technologie
 
Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic Web
Jakob .
 
Medientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
Martin Blenkle
 
Potential of Bots for Encylclopedias
Potential of Bots for EncylclopediasPotential of Bots for Encylclopedias
Potential of Bots for Encylclopedias
Educational Technology
 
20110505 linked openeuropeanalswt2011
20110505 linked openeuropeanalswt201120110505 linked openeuropeanalswt2011
20110505 linked openeuropeanalswt2011
Stefan Gradmann
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
Martin Voigt
 
Was Wissenschaftler wirklich Wollen
Was Wissenschaftler wirklich WollenWas Wissenschaftler wirklich Wollen
Was Wissenschaftler wirklich Wollen
Ralf Stockmann
 
Tagging und Social Cataloging für Bibliothekare
Tagging und Social Cataloging für BibliothekareTagging und Social Cataloging für Bibliothekare
Tagging und Social Cataloging für Bibliothekare
Jakob .
 

Ähnlich wie Aufbau eines zentralen Indexes im GBV (20)

Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
Informationskompetenz in sich ständig verändernden Informationsumgebungen - z...
 
ZBIW: Discovery
ZBIW: DiscoveryZBIW: Discovery
ZBIW: Discovery
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Visualisierung bibliographischer Daten
Visualisierung bibliographischer DatenVisualisierung bibliographischer Daten
Visualisierung bibliographischer Daten
 
Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?Neue Kataloge – wo geht die Reise hin?
Neue Kataloge – wo geht die Reise hin?
 
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
Softwareentwicklung in Bibliotheken und Verbundzentralen - Ist das sinnvoll?
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische GeschichteSemantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
Semantic Web und Linked Open Data. Eine Bibliothekarische Geschichte
 
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
Literatur und Information - Datenbanken, Fachliteratur, Literaturrecherche un...
 
Einführung in das Semantic Web
Einführung in das Semantic WebEinführung in das Semantic Web
Einführung in das Semantic Web
 
Medientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
 
Potential of Bots for Encylclopedias
Potential of Bots for EncylclopediasPotential of Bots for Encylclopedias
Potential of Bots for Encylclopedias
 
20110505 linked openeuropeanalswt2011
20110505 linked openeuropeanalswt201120110505 linked openeuropeanalswt2011
20110505 linked openeuropeanalswt2011
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
 
Was Wissenschaftler wirklich Wollen
Was Wissenschaftler wirklich WollenWas Wissenschaftler wirklich Wollen
Was Wissenschaftler wirklich Wollen
 
Tagging und Social Cataloging für Bibliothekare
Tagging und Social Cataloging für BibliothekareTagging und Social Cataloging für Bibliothekare
Tagging und Social Cataloging für Bibliothekare
 

Aufbau eines zentralen Indexes im GBV

  • 1. Aufbau eines zentralen Indexes im GBV Till Kinstler, [email_address] http://twitter.com/tillk Verbundzentrale des GBV (VZG)
  • 2. Wir haben im zentralen Metadatenmanagementsystem des GBVs (CBS) rund 100 Millionen interessante Datensätze: klassische OPAC-Daten (GVK), Online Contents (OLC), Nationallizenzen, … Und was machen wir damit?
  • 3.  
  • 4.  
  • 5.  
  • 6.  
  • 7.  
  • 8. „ In addition, we have also found that the poor usability, high complexity, and lack of integration of many electronic resource discovery systems, have raised the entry threshold of information technology literacy. This acts as a barrier to information search and retrieval. […] Users find database structures hinder . They have to learn the procedural knowledge for using a particular database as well as have some basic knowledge of how the data table is organised and what subject matter the built-in thesauri refers to; both have limited transferability. The participants did not appear to lack information technology or digital literacy, as they had demonstrated they were able to use other internet-based search and retrieval tools.“ (Wong, W. ; Stelmaszewska, H. ; Barn, B. ; Bhimani, N. ; Barn, S.: JISC User Behaviour Observational Study: User Behaviour in Resource Discovery. Final Report / JISC. Version: November 2009. http://www.jisc.ac.uk/media/documents/publications/programme/2010/ubirdfinalreport.pdf )
  • 9. Idee: Nur noch ein Zugangspunkt für alle Bestände (und Dienste ?!?) einer Bibliothek im Web
  • 10. -> große, aggregierte / integrierte Suchindexe (die alle Bestände einer Bibliothek abbilden: Monographien, Artikel, elektronische Bestände, Webseiten, ...)
  • 11. -> „einfach“ zu benutzende Oberflächen
  • 12. -> fehlt oft: gute Integration aller angebotenen Dienste (Ausleihe, Fernleihe, elektronischer Zugang,...) Konsequenzen
  • 13. Konsequenzen Endlich Abkehr vom Paradigma exakter, boolescher Suche: „The conventional Boolean retrieval methodology is not well adapted to the information retrieval task“ (Gerard Salton, 1984)
  • 14. Stattdessen einfache, „best match“ Suche („wie im Web“): „A best match search matches the set of query stems against the sets of stems corresponding to each of the documents in the database, calculates a measure of similarity between the query and each document, and then sorts the documents into order of decreasing similarity with the query .“ (Peter Willett, 1988)
  • 15. -> „unpräzise“ Suche (egal ob [Nachname, Vorname] oder [Vorname Nachname], Stemming, nur ein Teil der Suchbegriffe muss vorkommen, automatische Erweiterung der Suchanfrage, ...)
  • 16. -> Relevanzsortierung (-> was ist Relevanz?)
  • 17. -> Möglichkeiten zum Browsen, Verfeinern, Entdecken (Facetten, „ähnliche Treffer“, Vorschläge/Recommendations), ...
  • 18. Suchtechnik: Oft basierend auf Vektorraummodell (-> Termstastistik als Grundlage der Sortierung), z.B. Lucene/Solr/ElasticSearch/..., Xapian, …
  • 19. Salton, Gerard (1984): The Use of Extended Boolean Logic in Information Retrieval, in: Proceedings of the 1984 ACM SIGMOD International Conference on Management of Data, ACM Press, 277.
  • 20. Willett, Peter (1988): Document retrieval systems, Vol. 3, Foundations of Information Science, Taylor Graham.
  • 21. Aggregierte Suchindexe Kommerzielle Angebote: Serials Solutions Summon, ExLibris Primo Central, EBSCO Discovery Service, WorldCat local metasearch, … Projekte/DIY: Suchkiste (Nationallizenzen), Swissbib (schweizer Bibliotheken), ETH Knowledge Portal (gesamter Bestand der Bibliothek plus Webseiten), The European Library (europäische Nationalbibliotheken), Hathi Trust (US-amerikanische Digitalisierungsprojekte), ...
  • 23. Zentraler GBV Index Inhalt: GVK (33 Mio. Titel) ÖVK (6 Mio. Titel) Online Contents OLC (33 Mio. Aufsätze aus ca. 27000 Zeitschriften seit 1993) Fachausschnitte OLC Nationallizenzen (23 Mio. Aufsätze, 0,4 Mio. E-Books) Bibliografien: BMS, WAO, u.w. nationale Projekte: VD17, IKAR, usw.
  • 24. Zentraler GBV Index Suchmaschine: Solr/Lucene (Open Source): http://lucene.apache.org/solr/ Indexierung von MARC21-Daten aus CBS mittels solrmarc (Open Source): http://code.google.com/p/solrmarc/ Suche über „Solr-Protokoll“ (-> beliebige Oberflächen mit Schnittstellen zu Solr nutzbar, z.B. OCLC Touchpoint, VuFind, ExLibris Primo, Blacklight...) Support der Verbundzentrale für OCLC Touchpoint, VuFind
  • 25. Flexible Sichten, individuelle Ausschnitte (bibliotheks- oder nutzerspezifisch, lizenzspezifisch, thematisch, ...) auf Index mittels Filter
  • 26. Derzeit Testbetrieb in zwei Installationen TUBfind, TU Hamburg-Harbug (VuFind) TouchPoint UB Weimar
  • 27. Problemchen Datenhandling (Normalisierung, Austausch, Anreicherung, Deduplizierung,...)
  • 28. Akzeptanz: „In both cases, the recall-oriented Solr has proven to be a very disruptive indexing technology for librarians accustomed to traditional indexes.“ (Garrison, Boston, Bair 2011)
  • 29. Integration bestehender Infrastruktur (Dienste!) -> Weiterdenken: Discovery findet eh „überall“ statt. Angebot von Bibliotheken ist der Zugang zu entdeckten Ressourcen. Also Zugang statt „Suche“ optimieren? Garrison, Scott; Boston, George; Bair, Sheila (2011): Taming Lightning in More Than One Bottle: Implementing a Local Next-Generation Catalog Versus a Hosted Web-Scale Discovery Service, in: Proceedings of the ACRL 2011 Conference, http://www.ala.org/ala/mgrps/divs/acrl/events/national/2011/papers/taming_lightning.pdf
  • 30. Foto von http://de.wikipedia.org/wiki/Datei:Fleischwolf.ganz.jpg Till Kinstler [email_address] http://twitter.com/tillk

Hinweis der Redaktion

  1. Was ist VuFind? („Villanova University Find“) - „Next Generation Catalog“/„Katalog 2.0“/„Discovery Interface“ für alle Ressourcen einer Bibliothek - Ziel: einfach zu benutzen! -> professionelles Oberflächendesign! - begonnen an der Falvey Memorial Library der Villanova University, PA, seit 2007 als OS-Projekt Erste Installation in Betrieb: NLA Mittlerweile mindestens 50 Installationen im Produktivbetrieb weltweit, vorwiegend in USA und Australien