SlideShare ist ein Scribd-Unternehmen logo
Jetzt kommt zusammen,
          was zusammen gehört

Verbundübergreifende Datenkonsolidierung und wie
man damit große Bestände effizient retroklassifiziert


               Prof. Magnus Pfeffer
          Hochschule der Medien, Stuttgart
            pfeffer@hdm-stuttgart.de
Überblick
   Ausgangslage
   Konsolidierung von Erschließungsdaten
   Softwaregestützte Retroklassifikation
   Ausblick




 22. Mai 2012         101. Bibliothekartag, Hamburg   2
Ausgangslage




22. Mai 2012   101. Bibliothekartag, Hamburg   3
Anlass
   Retroklassifikation Freihandbestand UB Mannheim
       Seit 2001
       5 große Bibliotheksbereiche statt 11 kleine
        Bereichsbibliotheken
       RVK als einheitliche Klassifikation
       Wunsch nach mehr Fremddaten
            2004: Weniger als 50% der Titel mit RVK




 22. Mai 2012                101. Bibliothekartag, Hamburg   4
Inkonsistente Erschließung
   Herzfeld, Hans: Der erste Weltkrieg
       18 Titelsätze im BVB
           davon 11 mit RSWK, 8 mit RVK
   Friedell, Egon: Kulturgeschichte der Neuzeit
       31 Titelsätze im BVB
           davon 21 mit SWD, 17 mit RVK
   Tanenbaum, Andrew S.: Computer Networks
       44 Titelsätze im BVB
           davon 19 Deutsch, 15 Englisch, 1 Chinesisch
           davon 38 mit RSWK, 31 mit RVK


 22. Mai 2012               101. Bibliothekartag, Hamburg   5
Inkonsistente Erschließung
   Tanenbaum, Andrew S.: Computer Networks
       RVK Notationen
           ST 200: 31 Titel
                   Informatik-Monografien-Vernetzung, verteilte Systeme-Allgemeines,
                    Netzmanagement
           ST 205: 3 Titel
                   Informatik-Monografien-Vernetzung, verteilte Systeme-Internet
                    allgemein
           QH 500: 2 Titel
                   Wirtschaftswissenschaften-Mathematik. Statistik. Ökonometrie.
                    Unternehmensforschung-Wirtschaftsinformatik. Datenverarbeitung
           MS 7965: 1 Titel
                   Soziologie-Spezielle Soziologien-Soziologie der
                    Massenkommunikation und öffentlichen Meinung, Mediensoziologie-
                    Internet, neue Medien

 22. Mai 2012                       101. Bibliothekartag, Hamburg                    6
Konsolidierung von Erschließungsdaten




22. Mai 2012              101. Bibliothekartag, Hamburg   7
Projekt 2010-2011
   Grundidee: Übernahme von SWD und RVK aus
       Vorauflagen
       Parallelausgaben
       Übersetzungen


   Ausgangsdaten
       Verbunddatenbank Südwestverbund und Hebis
       MAB2 Format




 22. Mai 2012              101. Bibliothekartag, Hamburg   8
Umsetzung
   Vergleich auf Basis von
                                                        Übernahme bei
       Einheitssachtitel                       identischem (Einheitsach-)Titel
                                                 UND einer Übereinstimmung
            Feld 304_
                                                   bei Person/Körperschaft
       Titel und Untertitel
            Felder 331_, 335_
       Autoren und Urheber
            Felder 100_, 104a, 108a, 200_, 204a, 208a
       beteiligte Personen und Körperschaften
            Felder 100b, 104b, 108b, 200b, 204b, 208b




 22. Mai 2012                101. Bibliothekartag, Hamburg                   9
Umsetzung
   Algorithmus
       Berechne für alle Titel
            Wenn Feld 304_ vorhanden
                
                    Suche Titel mit identischem Feld 304_
                   Vergleiche Autoren, Urheber und beteiligte
                     
                         MATCH, wenn eine Übereinstimmung vorhanden
            Sonst (nur Feld 331_ und 335_ vorhanden)
                
                    Suche Titel mit identischen Feldern 331_ und 335_
                   Vergleiche Autoren, Urheber und beteiligte
                     
                         MATCH, wenn eine Übereinstimmung vorhanden

   Technische Umsetzung
       Perl unter Linux
       Indexstrukturen im Hauptspeicher (>4GB)

 22. Mai 2012                        101. Bibliothekartag, Hamburg      10
Ergebnisse: SWB
   5.809.349 Titel mit mindestens einem Match
       Davon
            3.269.340 ohne SWD
            3.627.017 ohne RVK
       Anreicherung durch Übernahme möglich bei
            636.462 mit SWD
            959.419 mit RVK




 22. Mai 2012              101. Bibliothekartag, Hamburg   11
Ergebnisse: Hebis
   4.535.618 Titel mit mindestens einem Match
       Davon
            3.068.968 ohne SWD
            3.071.022 ohne RVK
       Anreicherung durch Übernahme möglich bei
            1.179.133 mit SWD
            992.046 mit RVK




 22. Mai 2012              101. Bibliothekartag, Hamburg   12
Nachnutzung
   Daten zum Download
       Textformat, bz2-Archiv
       Titel-ID und gefundene Matches
   Linked Open Data
       RDF-Tripel der Form ID-equalsForClassification-ID
       http://data.bib.uni-mannheim.de
   Daten an die Verbundzentralen
       Titel und gefundene SWD-IDs und RVK-Notationen




 22. Mai 2012            101. Bibliothekartag, Hamburg      13
Prüfung
   Online im Linked-Data Web
       Verbünde erlaubten Titeldarstellung
       Matches untereinander verlinkt
       Wer: Externe Interessierte
   Testdatenbanken der Verbünde
       Einspielung der gelieferten Daten in Auszügen
       Stichproben und Recherchen möglich
       Wer: Sacherschließer und interessierte Verbundnutzer


→ Hohe Qualität der Ergebnisse bestätigt

 22. Mai 2012            101. Bibliothekartag, Hamburg    14
Mehr Quellen – mehr Daten?
   Beispiel Schlagwörter im SWB
       451.677 angereicherte Titel bei Daten nur aus SWB
       636.462 bei SWB plus Hebis




 22. Mai 2012           101. Bibliothekartag, Hamburg       15
Mehr Quellen – mehr Daten?
   Beispiel RVK UB Mannheim
       Bibliotheksbereich A5, Sozialwissenschaften
       63.300 Titel zu bearbeiten
       44.991 Titel mit RVK-Notationen im SWB
       45.610 Titel mit Übernahme aus SWB und Hebis
       48.454 Titel mit Übernahme aus SWB, Hebis, BVB
            (Nur experimentell; Suchen der Titel über den BVB-
             Verbundkatalog)




 22. Mai 2012                101. Bibliothekartag, Hamburg        16
Softwaregestützte Retroklassifikation




22. Mai 2012              101. Bibliothekartag, Hamburg   17
Software-Tool
    Anforderungen
         Aggregation möglichst vieler Fremddaten
         Einfache Auswahl bereits vorhandener Notationen
         Bearbeiten großer Datenbestände (>100.000 Titel)
         Intuitive Bedienung
         Keine aufwändige Installation




    22. Mai 2012           101. Bibliothekartag, Hamburg     18
Software-Tool
    Umsetzung
         Datenkonsolidierung wie beschrieben
         Einschränken der Metadaten auf relevante Felder
         Eigene, lokale Datenbank
               Schneller Zugriff
               Optimiert auf eine Anwendung
         Programmiersprache Java
               Alle Elemente für die GUI vorhanden
               Plattformunabhängig
               Einfache Installation des Programms




    22. Mai 2012                101. Bibliothekartag, Hamburg   19
Hauptfenster



                          Spalten=Metadatenelemente

                         Sortierung auf- und absteigend

         Zeilenhöhe einstellbar


                                        RVK Notationen

                                  Mouseover: RVK-Hierarchie
                                     Anklicken: Auswahl




 22. Mai 2012                       101. Bibliothekartag, Hamburg   20
Schnellfilter




 22. Mai 2012   101. Bibliothekartag, Hamburg   21
Erweiterte Filter




 22.29. März 2012
     Mai 2012       101. Bibliothekartag, Hamburg
                              Seminar RVK           22
Farbige Hervorhebung




 22. Mai 2012   101. Bibliothekartag, Hamburg   23
Strategie: Inhaltlich homogene Liste




 22. Mai 2012     101. Bibliothekartag, Hamburg   24
Strategie: Eindeutige RVK




 22. Mai 2012    101. Bibliothekartag, Hamburg   25
Links zu externen Quellen
                                     Dynamische Links
                                     Suche in Katalogen und
                                      anderen Quellen
                                     Anpassbar




 22. Mai 2012    101. Bibliothekartag, Hamburg            26
Praktischer Einsatz
    Referent 1
         Bestand etwa 57.000 Titel
         123 Sitzungen an 56 Tagen über 8 Monate
         176 Stunden, Durchschnitt 324 Titel pro Stunde


    Referent 2
         Bestand etwa 12.500 Titel
         28 Sitzungen an 21 Tagen über 6 Monate
         29 Stunden, Durchschnitt 430 Titel pro Stunde



    22. Mai 2012           101. Bibliothekartag, Hamburg   27
Lernkurve




 22. Mai 2012   101. Bibliothekartag, Hamburg   28
Selber ausprobieren
    Entwickler: Kai Eckert, UB Mannheim
    http://www.kaiec.org/reclassification.html




    22. Mai 2012        101. Bibliothekartag, Hamburg   29
Ausblick




22. Mai 2012   101. Bibliothekartag, Hamburg   30
Stand Datenkonsolidierung
    SWB und Hebis
         Projekt abgeschlossen
         Ergebnisse wurden in Produktivdatenbank eingespielt
    HBZ und BVB
         Verbundabzüge vorhanden
         Aktuell: Datenaufbereitung und Abgleich
         Datenlieferung voraussichtlich Juli oder August
         Ergänzungslieferung an SWB und Hebis geplant




    22. Mai 2012           101. Bibliothekartag, Hamburg    31
Fragen und Diskussion




                     ?
 22. Mai 2012   101. Bibliothekartag, Hamburg   32

Weitere ähnliche Inhalte

Was ist angesagt?

Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?
Magnus Pfeffer
 
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
flimm
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
Joachim Neubert
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
Pascal-Nicolas Becker
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Felix Lohmeier
 
Linked Open Projects
Linked Open ProjectsLinked Open Projects
Linked Open Projects
Kai Eckert
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
kostaedt
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Felix Lohmeier
 
Bam Vortrag Fh Lb
Bam Vortrag Fh LbBam Vortrag Fh Lb
Bam Vortrag Fh Lb
Frank von Hagel
 
Dynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open DataDynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open Data
h_jansen
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
Martin Blenkle
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Felix Lohmeier
 
Katalogisierung mit dem Open-Source-Bibliothekssystem Koha
Katalogisierung mit dem Open-Source-Bibliothekssystem KohaKatalogisierung mit dem Open-Source-Bibliothekssystem Koha
Katalogisierung mit dem Open-Source-Bibliothekssystem Koha
hemmefelix
 

Was ist angesagt? (15)

Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?
 
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
Linked Open Data und die Open Library - Möglichkeiten der Zusammenarbeit und ...
 
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
 
Repositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellen
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
 
Linked Open Projects
Linked Open ProjectsLinked Open Projects
Linked Open Projects
 
Format-Umstieg MAB2 => MARC 21
Format-Umstieg MAB2 => MARC 21Format-Umstieg MAB2 => MARC 21
Format-Umstieg MAB2 => MARC 21
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
 
Bam Vortrag Fh Lb
Bam Vortrag Fh LbBam Vortrag Fh Lb
Bam Vortrag Fh Lb
 
Dynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open DataDynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open Data
 
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
10 Jahre E-LIB Bremen – Erfahrungen beim Betrieb eines etwas anderen Kataloges
 
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
 
Katalogisierung mit dem Open-Source-Bibliothekssystem Koha
Katalogisierung mit dem Open-Source-Bibliothekssystem KohaKatalogisierung mit dem Open-Source-Bibliothekssystem Koha
Katalogisierung mit dem Open-Source-Bibliothekssystem Koha
 

Andere mochten auch

Bibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedBibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data Extended
Magnus Pfeffer
 
Derechos del niño
Derechos del niñoDerechos del niño
Derechos del niño
antoniaesec
 
Examen T8 1º Bachillerato
Examen T8 1º BachilleratoExamen T8 1º Bachillerato
Examen T8 1º Bachillerato
lagartiger
 
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
Deutsche Börse AG
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivas
BRYA_N
 
Puentemaslindosdelmundo
PuentemaslindosdelmundoPuentemaslindosdelmundo
Puentemaslindosdelmundo
Aucencio Medina
 
Presentacion internet
Presentacion   internetPresentacion   internet
Presentacion internet
dannyismael
 
55 مشكلة حب
55 مشكلة حب55 مشكلة حب
55 مشكلة حب
Samira Brahim
 
FOROS
FOROSFOROS
Una carta a garcia
Una carta a garciaUna carta a garcia
Una carta a garcia
diana9121
 
Desarrollo sostenible
Desarrollo sostenibleDesarrollo sostenible
Desarrollo sostenible
alexnilmar
 
Definicions
DefinicionsDefinicions
Definicions
Isela Hernandez
 
2 normas de convivencia
2 normas de convivencia2 normas de convivencia
2 normas de convivencia
Ktalina Valencia
 
De enciclomedia a HDT
De enciclomedia a HDTDe enciclomedia a HDT
De enciclomedia a HDT
reyna_castro
 
Siebenmarketing Torsten Pyzalski Be different or die
Siebenmarketing Torsten Pyzalski Be different or dieSiebenmarketing Torsten Pyzalski Be different or die
Siebenmarketing Torsten Pyzalski Be different or die
tosi7m
 
RECORDAR ES VOLVER A VIVIR II
RECORDAR ES VOLVER A VIVIR IIRECORDAR ES VOLVER A VIVIR II
RECORDAR ES VOLVER A VIVIR II
Aucencio Medina
 
Compactadores manuales
Compactadores manualesCompactadores manuales
Compactadores manuales
Irvin Campos
 
Puente mas lindos del mundo
Puente mas lindos del mundoPuente mas lindos del mundo
Puente mas lindos del mundo
Aucencio Medina
 
TÉNÉRÉ EXPERIENCE TOURS 2012
TÉNÉRÉ EXPERIENCE TOURS 2012TÉNÉRÉ EXPERIENCE TOURS 2012
TÉNÉRÉ EXPERIENCE TOURS 2012
fotopower
 

Andere mochten auch (20)

Bibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedBibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data Extended
 
Derechos del niño
Derechos del niñoDerechos del niño
Derechos del niño
 
Examen T8 1º Bachillerato
Examen T8 1º BachilleratoExamen T8 1º Bachillerato
Examen T8 1º Bachillerato
 
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
ETFs – ein ganzer Markt in einer Order. Wie Sie den passenden Indexfonds find...
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivas
 
Beilage 7 12-itnt
Beilage 7 12-itntBeilage 7 12-itnt
Beilage 7 12-itnt
 
Puentemaslindosdelmundo
PuentemaslindosdelmundoPuentemaslindosdelmundo
Puentemaslindosdelmundo
 
Presentacion internet
Presentacion   internetPresentacion   internet
Presentacion internet
 
55 مشكلة حب
55 مشكلة حب55 مشكلة حب
55 مشكلة حب
 
FOROS
FOROSFOROS
FOROS
 
Una carta a garcia
Una carta a garciaUna carta a garcia
Una carta a garcia
 
Desarrollo sostenible
Desarrollo sostenibleDesarrollo sostenible
Desarrollo sostenible
 
Definicions
DefinicionsDefinicions
Definicions
 
2 normas de convivencia
2 normas de convivencia2 normas de convivencia
2 normas de convivencia
 
De enciclomedia a HDT
De enciclomedia a HDTDe enciclomedia a HDT
De enciclomedia a HDT
 
Siebenmarketing Torsten Pyzalski Be different or die
Siebenmarketing Torsten Pyzalski Be different or dieSiebenmarketing Torsten Pyzalski Be different or die
Siebenmarketing Torsten Pyzalski Be different or die
 
RECORDAR ES VOLVER A VIVIR II
RECORDAR ES VOLVER A VIVIR IIRECORDAR ES VOLVER A VIVIR II
RECORDAR ES VOLVER A VIVIR II
 
Compactadores manuales
Compactadores manualesCompactadores manuales
Compactadores manuales
 
Puente mas lindos del mundo
Puente mas lindos del mundoPuente mas lindos del mundo
Puente mas lindos del mundo
 
TÉNÉRÉ EXPERIENCE TOURS 2012
TÉNÉRÉ EXPERIENCE TOURS 2012TÉNÉRÉ EXPERIENCE TOURS 2012
TÉNÉRÉ EXPERIENCE TOURS 2012
 

Ähnlich wie Jetzt kommt zusammen, was zusammen gehört

Ik1 ws 2011 12
Ik1 ws 2011 12Ik1 ws 2011 12
Einführung in die Literaturrecherche - HSW
Einführung in die Literaturrecherche - HSWEinführung in die Literaturrecherche - HSW
Einführung in die Literaturrecherche - HSW
Bibliothek der Hochschule Hannover
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
Alexander Haffner
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
GESIS
 
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataDer Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Anne Christensen
 
Stefan Wiederkehr + Matti Stöhr - geschichtswissenschaftliche Fachbibliograp...
Stefan Wiederkehr + Matti Stöhr -  geschichtswissenschaftliche Fachbibliograp...Stefan Wiederkehr + Matti Stöhr -  geschichtswissenschaftliche Fachbibliograp...
Stefan Wiederkehr + Matti Stöhr - geschichtswissenschaftliche Fachbibliograp...
Zukunftswerkstatt
 
Linked Open Data
Linked Open DataLinked Open Data
Linked Open Data
kostaedt
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
Adrian Pohl
 
Literaturverwaltung und Publikationsstrategien
Literaturverwaltung und PublikationsstrategienLiteraturverwaltung und Publikationsstrategien
Literaturverwaltung und Publikationsstrategien
TIB Hannover
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
Christoph Lange
 
Arbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat NaturwissenschaftenArbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat Naturwissenschaften
Haake
 
Freie Katalogdaten und Linked Data
Freie Katalogdaten und Linked DataFreie Katalogdaten und Linked Data
Freie Katalogdaten und Linked Data
Adrian Pohl
 
Grundformen Digitaler Bibliotheken
Grundformen Digitaler BibliothekenGrundformen Digitaler Bibliotheken
Grundformen Digitaler Bibliotheken
Jakob .
 
UB Bochum - RUB Bibliographie
UB Bochum - RUB BibliographieUB Bochum - RUB Bibliographie
UB Bochum - RUB Bibliographie
VeronikaJ
 
UB Bochum - RUB Bibliographie
UB Bochum - RUB BibliographieUB Bochum - RUB Bibliographie
UB Bochum - RUB Bibliographie
guestec7f4f8
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
LydiaU
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Björn Muschall
 
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Mediencommunity 2.0
 

Ähnlich wie Jetzt kommt zusammen, was zusammen gehört (20)

Ik1 ws 2011 12
Ik1 ws 2011 12Ik1 ws 2011 12
Ik1 ws 2011 12
 
Einführung in die Literaturrecherche - HSW
Einführung in die Literaturrecherche - HSWEinführung in die Literaturrecherche - HSW
Einführung in die Literaturrecherche - HSW
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
 
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open DataDer Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
Der Bibliothekskatalog 3.0 oder: Bibliografische Daten als Linked Open Data
 
Stefan Wiederkehr + Matti Stöhr - geschichtswissenschaftliche Fachbibliograp...
Stefan Wiederkehr + Matti Stöhr -  geschichtswissenschaftliche Fachbibliograp...Stefan Wiederkehr + Matti Stöhr -  geschichtswissenschaftliche Fachbibliograp...
Stefan Wiederkehr + Matti Stöhr - geschichtswissenschaftliche Fachbibliograp...
 
Linked Open Data
Linked Open DataLinked Open Data
Linked Open Data
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Literaturverwaltung und Publikationsstrategien
Literaturverwaltung und PublikationsstrategienLiteraturverwaltung und Publikationsstrategien
Literaturverwaltung und Publikationsstrategien
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
 
Arbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat NaturwissenschaftenArbeitsgruppe Fachreferat Naturwissenschaften
Arbeitsgruppe Fachreferat Naturwissenschaften
 
Publikationsverhalten in den Wirtschaftswissenschaften, von Ralf Toepfer
Publikationsverhalten in den Wirtschaftswissenschaften, von Ralf ToepferPublikationsverhalten in den Wirtschaftswissenschaften, von Ralf Toepfer
Publikationsverhalten in den Wirtschaftswissenschaften, von Ralf Toepfer
 
Freie Katalogdaten und Linked Data
Freie Katalogdaten und Linked DataFreie Katalogdaten und Linked Data
Freie Katalogdaten und Linked Data
 
Grundformen Digitaler Bibliotheken
Grundformen Digitaler BibliothekenGrundformen Digitaler Bibliotheken
Grundformen Digitaler Bibliotheken
 
UB Bochum - RUB Bibliographie
UB Bochum - RUB BibliographieUB Bochum - RUB Bibliographie
UB Bochum - RUB Bibliographie
 
UB Bochum - RUB Bibliographie
UB Bochum - RUB BibliographieUB Bochum - RUB Bibliographie
UB Bochum - RUB Bibliographie
 
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERMPräsentation amsl Deutscher Bibliothekartag 2014 ERM
Präsentation amsl Deutscher Bibliothekartag 2014 ERM
 
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
Projekt AMSL: Entwicklung eines Electronic Resource Management Systems für Bi...
 
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...Drupal-basierte Infrastruktur zur Vermittlung von  Fachterminologie. Das Konz...
Drupal-basierte Infrastruktur zur Vermittlung von Fachterminologie. Das Konz...
 

Mehr von Magnus Pfeffer

Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Magnus Pfeffer
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...
Magnus Pfeffer
 
Automatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsAutomatic creation of mappings between classification systems
Automatic creation of mappings between classification systems
Magnus Pfeffer
 
Automatisches Generieren von Konkordanzen
Automatisches Generieren von KonkordanzenAutomatisches Generieren von Konkordanzen
Automatisches Generieren von Konkordanzen
Magnus Pfeffer
 
Bibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedBibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data Reduced
Magnus Pfeffer
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
Magnus Pfeffer
 
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Magnus Pfeffer
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Magnus Pfeffer
 
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
Magnus Pfeffer
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
Magnus Pfeffer
 
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Magnus Pfeffer
 

Mehr von Magnus Pfeffer (11)

Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...
 
Automatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsAutomatic creation of mappings between classification systems
Automatic creation of mappings between classification systems
 
Automatisches Generieren von Konkordanzen
Automatisches Generieren von KonkordanzenAutomatisches Generieren von Konkordanzen
Automatisches Generieren von Konkordanzen
 
Bibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedBibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data Reduced
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
 
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
 

Jetzt kommt zusammen, was zusammen gehört

  • 1. Jetzt kommt zusammen, was zusammen gehört Verbundübergreifende Datenkonsolidierung und wie man damit große Bestände effizient retroklassifiziert Prof. Magnus Pfeffer Hochschule der Medien, Stuttgart pfeffer@hdm-stuttgart.de
  • 2. Überblick  Ausgangslage  Konsolidierung von Erschließungsdaten  Softwaregestützte Retroklassifikation  Ausblick 22. Mai 2012 101. Bibliothekartag, Hamburg 2
  • 3. Ausgangslage 22. Mai 2012 101. Bibliothekartag, Hamburg 3
  • 4. Anlass  Retroklassifikation Freihandbestand UB Mannheim  Seit 2001  5 große Bibliotheksbereiche statt 11 kleine Bereichsbibliotheken  RVK als einheitliche Klassifikation  Wunsch nach mehr Fremddaten  2004: Weniger als 50% der Titel mit RVK 22. Mai 2012 101. Bibliothekartag, Hamburg 4
  • 5. Inkonsistente Erschließung  Herzfeld, Hans: Der erste Weltkrieg  18 Titelsätze im BVB  davon 11 mit RSWK, 8 mit RVK  Friedell, Egon: Kulturgeschichte der Neuzeit  31 Titelsätze im BVB  davon 21 mit SWD, 17 mit RVK  Tanenbaum, Andrew S.: Computer Networks  44 Titelsätze im BVB  davon 19 Deutsch, 15 Englisch, 1 Chinesisch  davon 38 mit RSWK, 31 mit RVK 22. Mai 2012 101. Bibliothekartag, Hamburg 5
  • 6. Inkonsistente Erschließung  Tanenbaum, Andrew S.: Computer Networks  RVK Notationen  ST 200: 31 Titel  Informatik-Monografien-Vernetzung, verteilte Systeme-Allgemeines, Netzmanagement  ST 205: 3 Titel  Informatik-Monografien-Vernetzung, verteilte Systeme-Internet allgemein  QH 500: 2 Titel  Wirtschaftswissenschaften-Mathematik. Statistik. Ökonometrie. Unternehmensforschung-Wirtschaftsinformatik. Datenverarbeitung  MS 7965: 1 Titel  Soziologie-Spezielle Soziologien-Soziologie der Massenkommunikation und öffentlichen Meinung, Mediensoziologie- Internet, neue Medien 22. Mai 2012 101. Bibliothekartag, Hamburg 6
  • 7. Konsolidierung von Erschließungsdaten 22. Mai 2012 101. Bibliothekartag, Hamburg 7
  • 8. Projekt 2010-2011  Grundidee: Übernahme von SWD und RVK aus  Vorauflagen  Parallelausgaben  Übersetzungen  Ausgangsdaten  Verbunddatenbank Südwestverbund und Hebis  MAB2 Format 22. Mai 2012 101. Bibliothekartag, Hamburg 8
  • 9. Umsetzung  Vergleich auf Basis von Übernahme bei  Einheitssachtitel identischem (Einheitsach-)Titel UND einer Übereinstimmung  Feld 304_ bei Person/Körperschaft  Titel und Untertitel  Felder 331_, 335_  Autoren und Urheber  Felder 100_, 104a, 108a, 200_, 204a, 208a  beteiligte Personen und Körperschaften  Felder 100b, 104b, 108b, 200b, 204b, 208b 22. Mai 2012 101. Bibliothekartag, Hamburg 9
  • 10. Umsetzung  Algorithmus  Berechne für alle Titel  Wenn Feld 304_ vorhanden  Suche Titel mit identischem Feld 304_  Vergleiche Autoren, Urheber und beteiligte  MATCH, wenn eine Übereinstimmung vorhanden  Sonst (nur Feld 331_ und 335_ vorhanden)  Suche Titel mit identischen Feldern 331_ und 335_  Vergleiche Autoren, Urheber und beteiligte  MATCH, wenn eine Übereinstimmung vorhanden  Technische Umsetzung  Perl unter Linux  Indexstrukturen im Hauptspeicher (>4GB) 22. Mai 2012 101. Bibliothekartag, Hamburg 10
  • 11. Ergebnisse: SWB  5.809.349 Titel mit mindestens einem Match  Davon  3.269.340 ohne SWD  3.627.017 ohne RVK  Anreicherung durch Übernahme möglich bei  636.462 mit SWD  959.419 mit RVK 22. Mai 2012 101. Bibliothekartag, Hamburg 11
  • 12. Ergebnisse: Hebis  4.535.618 Titel mit mindestens einem Match  Davon  3.068.968 ohne SWD  3.071.022 ohne RVK  Anreicherung durch Übernahme möglich bei  1.179.133 mit SWD  992.046 mit RVK 22. Mai 2012 101. Bibliothekartag, Hamburg 12
  • 13. Nachnutzung  Daten zum Download  Textformat, bz2-Archiv  Titel-ID und gefundene Matches  Linked Open Data  RDF-Tripel der Form ID-equalsForClassification-ID  http://data.bib.uni-mannheim.de  Daten an die Verbundzentralen  Titel und gefundene SWD-IDs und RVK-Notationen 22. Mai 2012 101. Bibliothekartag, Hamburg 13
  • 14. Prüfung  Online im Linked-Data Web  Verbünde erlaubten Titeldarstellung  Matches untereinander verlinkt  Wer: Externe Interessierte  Testdatenbanken der Verbünde  Einspielung der gelieferten Daten in Auszügen  Stichproben und Recherchen möglich  Wer: Sacherschließer und interessierte Verbundnutzer → Hohe Qualität der Ergebnisse bestätigt 22. Mai 2012 101. Bibliothekartag, Hamburg 14
  • 15. Mehr Quellen – mehr Daten?  Beispiel Schlagwörter im SWB  451.677 angereicherte Titel bei Daten nur aus SWB  636.462 bei SWB plus Hebis 22. Mai 2012 101. Bibliothekartag, Hamburg 15
  • 16. Mehr Quellen – mehr Daten?  Beispiel RVK UB Mannheim  Bibliotheksbereich A5, Sozialwissenschaften  63.300 Titel zu bearbeiten  44.991 Titel mit RVK-Notationen im SWB  45.610 Titel mit Übernahme aus SWB und Hebis  48.454 Titel mit Übernahme aus SWB, Hebis, BVB  (Nur experimentell; Suchen der Titel über den BVB- Verbundkatalog) 22. Mai 2012 101. Bibliothekartag, Hamburg 16
  • 17. Softwaregestützte Retroklassifikation 22. Mai 2012 101. Bibliothekartag, Hamburg 17
  • 18. Software-Tool  Anforderungen  Aggregation möglichst vieler Fremddaten  Einfache Auswahl bereits vorhandener Notationen  Bearbeiten großer Datenbestände (>100.000 Titel)  Intuitive Bedienung  Keine aufwändige Installation 22. Mai 2012 101. Bibliothekartag, Hamburg 18
  • 19. Software-Tool  Umsetzung  Datenkonsolidierung wie beschrieben  Einschränken der Metadaten auf relevante Felder  Eigene, lokale Datenbank  Schneller Zugriff  Optimiert auf eine Anwendung  Programmiersprache Java  Alle Elemente für die GUI vorhanden  Plattformunabhängig  Einfache Installation des Programms 22. Mai 2012 101. Bibliothekartag, Hamburg 19
  • 20. Hauptfenster Spalten=Metadatenelemente Sortierung auf- und absteigend Zeilenhöhe einstellbar RVK Notationen Mouseover: RVK-Hierarchie Anklicken: Auswahl 22. Mai 2012 101. Bibliothekartag, Hamburg 20
  • 21. Schnellfilter 22. Mai 2012 101. Bibliothekartag, Hamburg 21
  • 22. Erweiterte Filter 22.29. März 2012 Mai 2012 101. Bibliothekartag, Hamburg Seminar RVK 22
  • 23. Farbige Hervorhebung 22. Mai 2012 101. Bibliothekartag, Hamburg 23
  • 24. Strategie: Inhaltlich homogene Liste 22. Mai 2012 101. Bibliothekartag, Hamburg 24
  • 25. Strategie: Eindeutige RVK 22. Mai 2012 101. Bibliothekartag, Hamburg 25
  • 26. Links zu externen Quellen  Dynamische Links  Suche in Katalogen und anderen Quellen  Anpassbar 22. Mai 2012 101. Bibliothekartag, Hamburg 26
  • 27. Praktischer Einsatz  Referent 1  Bestand etwa 57.000 Titel  123 Sitzungen an 56 Tagen über 8 Monate  176 Stunden, Durchschnitt 324 Titel pro Stunde  Referent 2  Bestand etwa 12.500 Titel  28 Sitzungen an 21 Tagen über 6 Monate  29 Stunden, Durchschnitt 430 Titel pro Stunde 22. Mai 2012 101. Bibliothekartag, Hamburg 27
  • 28. Lernkurve 22. Mai 2012 101. Bibliothekartag, Hamburg 28
  • 29. Selber ausprobieren  Entwickler: Kai Eckert, UB Mannheim  http://www.kaiec.org/reclassification.html 22. Mai 2012 101. Bibliothekartag, Hamburg 29
  • 30. Ausblick 22. Mai 2012 101. Bibliothekartag, Hamburg 30
  • 31. Stand Datenkonsolidierung  SWB und Hebis  Projekt abgeschlossen  Ergebnisse wurden in Produktivdatenbank eingespielt  HBZ und BVB  Verbundabzüge vorhanden  Aktuell: Datenaufbereitung und Abgleich  Datenlieferung voraussichtlich Juli oder August  Ergänzungslieferung an SWB und Hebis geplant 22. Mai 2012 101. Bibliothekartag, Hamburg 31
  • 32. Fragen und Diskussion ? 22. Mai 2012 101. Bibliothekartag, Hamburg 32