SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
Automatisches Generieren von
       Konkordanzen

        Prof. Magnus Pfeffer
   Hochschule der Medien, Stuttgart
    pfeffer@hdm-stuttgart.de
Überblick
   Grundidee
   Optimierung durch Clustering
   Projekt: Konkordanz RVK ↔ DDC




 13. März 2013      5. Kongress Bibliothek und Information
Grundidee




13. März 2013   5. Kongress Bibliothek und Information
Instanzbasierter Vergleich
    Datenbasis:
     Mehrfach erschlossene Einträge in Katalogen




    13. März 2013    5. Kongress Bibliothek und Information
Instanzbasierter Vergleich
    Annahmen
         Inhaltlich überlappende Klassen treten zusammen auf
         Häufigkeit des Auftretens ist ein Indiz für die Stärke des
          Zusammenhangs


    Aufbereitung
         Extraktion aller Paare aus zwei Erschließungssystemen
         Aufsummieren der vorkommenden Paare




    13. März 2013         5. Kongress Bibliothek und Information
Beispiel




 13. März 2013   5. Kongress Bibliothek und Information
Beispiel
    Titel 1                                     Paare
         DDC: 179.9                                   179.9 / CC 7200
         RVK: CC 7200                                 179.9 / CC 7250
         RVK: CC 7250                                 179.9 / CC 7200
    Titel 2
         DDC: 179.9
         RVK: CC 7200




    13. März 2013        5. Kongress Bibliothek und Information
Instanzbasierter Vergleich
    Auswertung
         am Beispiel zweier Klassifikationen A und B
         Zwei Klassen treten ausschließlich als Paar auf
               1:1 Zuordnung = exakte Übereinstimmung
         Klasse aus A hat immer denselben Partner aus B, der
          hat aber auch andere Partner aus A
               N:1 Zuordnung = Klasse aus A ist engeres Konzept
         Klasse aus A tritt mit mehreren Partnern auf
               1:N Zuordnung = Klasse aus A ist weiter gefasstes Konzept
         Aber: Klasse tritt nicht auf
               Keine Folgerung möglich


    13. März 2013             5. Kongress Bibliothek und Information
Beispiel
    Auswertung für DDC
         2 mal 179.9 / CC 7200
         1 mal 179.9 / CC 7250


    Ergebnis
         179.9 narrowMatch CC 7200
         179.9 narrowMatch CC 7250




    13. März 2013       5. Kongress Bibliothek und Information
Beispiel
    Auswertung für RVK
         2 mal CC 7200 / 179.9
         1 mal CC 7250 / 179.9


    Ergebnis
         CC 7200 broadMatch 179.9
         CC 7250 broadMatch 179.9




    13. März 2013       5. Kongress Bibliothek und Information
Optimierung durch Clustering




13. März 2013        5. Kongress Bibliothek und Information
Titeldaten sind anders
    Mehrere Auflagen




    Mehrere Ausgaben




    13. März 2013   5. Kongress Bibliothek und Information
Titeldaten
    Mehrere Ausgaben und Auflagen verfälschen die
     Statistik
         Paare werden mehrfach erfasst
         Keine Vergleichbarkeit der absoluten Häufigkeiten


    Lösung: Auswertung der Cluster anstelle der
     einzelnen Titel
         Häufigkeiten werden direkt vergleichbar
         „Stärke“ der Korrelationen können ermittelt werden
         „Ausreißer“ können sicher erkannt und entfernt werden


    13. März 2013        5. Kongress Bibliothek und Information
Projekt:
                Konkordanz RVK ↔ DDC




13. März 2013      5. Kongress Bibliothek und Information
Datenbasis
    Alle deutschen Verbundkataloge
         SWB
         BVB
         GBV
         HeBIS
         HBZ
    DNB




    13. März 2013   5. Kongress Bibliothek und Information
Umsetzung
    Metafactory
         Aufbereiten von MAB2 und MARC21 Daten
         Clustering auf Werksebene
               Keygenerierung für Matching-Prozess
               Matching und Clusterbildung (transitive Hülle)
               Sammeln der Erschließungsinformationen im Cluster
         Statistik
               Auszählen des gemeinsamen Auftretens von Klassen
         Ausgabe
               Mappings einzelner Klassen
               Beide Richtungen


    13. März 2013            5. Kongress Bibliothek und Information
Offene Fragen
    Enthalten die Titeldaten nach dem Clustering
     genügend auswertbare Erschließungen?


    Macht es Sinn, einen globalen Cut-Off zu verwenden,
     um Ausreißer zu verwerfen?
         Oder ist es besser, jede Klasse gesondert
          auszuwerten?


    Wie kann eine effiziente Qualitätssicherung betrieben
     werden?


    13. März 2013        5. Kongress Bibliothek und Information
Danke für Ihre Aufmerksamkeit!



                               Folien online unter
                    http://www.slideshare.net/MagnusPfeffer/



                                    Dieses Werk bzw. Inhalt steht unter einer
            Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.




13. März 2013                        5. Kongress Bibliothek und Information

Weitere ähnliche Inhalte

Andere mochten auch

Neumonía neumocóccica
Neumonía neumocóccicaNeumonía neumocóccica
Neumonía neumocóccicaarlingris
 
Lions Centennial Membership Awards (De)
Lions Centennial Membership Awards (De)Lions Centennial Membership Awards (De)
Lions Centennial Membership Awards (De)Anita Meier
 
Puente mas lindos del mundo
Puente mas lindos del mundoPuente mas lindos del mundo
Puente mas lindos del mundoAucencio Medina
 
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.Gabriel Rath
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivasBRYA_N
 
Examen de 1º de Bach. del T5
Examen de 1º de Bach. del T5Examen de 1º de Bach. del T5
Examen de 1º de Bach. del T5lagartiger
 
De enciclomedia a HDT
De enciclomedia a HDTDe enciclomedia a HDT
De enciclomedia a HDTreyna_castro
 
Das Konzept - Was ist Vectron?
Das Konzept - Was ist Vectron?Das Konzept - Was ist Vectron?
Das Konzept - Was ist Vectron?RollingOnRails
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivasBRYA_N
 
2012 Rede CEO Francioni Bilanzpressekonferenz
2012 Rede CEO Francioni Bilanzpressekonferenz2012 Rede CEO Francioni Bilanzpressekonferenz
2012 Rede CEO Francioni BilanzpressekonferenzDeutsche Börse AG
 
Axiologia.camilo
Axiologia.camiloAxiologia.camilo
Axiologia.camilokailo2011
 
Hardware negrin 4b
Hardware negrin 4bHardware negrin 4b
Hardware negrin 4baleneca
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivasBRYA_N
 
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallen
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.GallenDo's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallen
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallensoultank AG
 
Visual thinking, Usability Coffee, Zug, 14.04.2015
Visual thinking, Usability Coffee, Zug, 14.04.2015Visual thinking, Usability Coffee, Zug, 14.04.2015
Visual thinking, Usability Coffee, Zug, 14.04.2015soultank AG
 

Andere mochten auch (20)

Neumonía neumocóccica
Neumonía neumocóccicaNeumonía neumocóccica
Neumonía neumocóccica
 
Lions Centennial Membership Awards (De)
Lions Centennial Membership Awards (De)Lions Centennial Membership Awards (De)
Lions Centennial Membership Awards (De)
 
Puente mas lindos del mundo
Puente mas lindos del mundoPuente mas lindos del mundo
Puente mas lindos del mundo
 
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.
Gabriel Rath: Warum IT Unternehmen ein gutes Marketing bitter nötig haben.
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivas
 
Examen de 1º de Bach. del T5
Examen de 1º de Bach. del T5Examen de 1º de Bach. del T5
Examen de 1º de Bach. del T5
 
De enciclomedia a HDT
De enciclomedia a HDTDe enciclomedia a HDT
De enciclomedia a HDT
 
Das Konzept - Was ist Vectron?
Das Konzept - Was ist Vectron?Das Konzept - Was ist Vectron?
Das Konzept - Was ist Vectron?
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivas
 
Recursos humanos
Recursos humanosRecursos humanos
Recursos humanos
 
2012 Rede CEO Francioni Bilanzpressekonferenz
2012 Rede CEO Francioni Bilanzpressekonferenz2012 Rede CEO Francioni Bilanzpressekonferenz
2012 Rede CEO Francioni Bilanzpressekonferenz
 
Egipto.
Egipto.Egipto.
Egipto.
 
Axiologia.camilo
Axiologia.camiloAxiologia.camilo
Axiologia.camilo
 
Hardware negrin 4b
Hardware negrin 4bHardware negrin 4b
Hardware negrin 4b
 
Metodologia diapositivas
Metodologia diapositivasMetodologia diapositivas
Metodologia diapositivas
 
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallen
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.GallenDo's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallen
Do's und Dont's bei Online-Formularen, Usability Coffee, Zug und St.Gallen
 
Ecci valores
Ecci valoresEcci valores
Ecci valores
 
Geschäftsbericht light
Geschäftsbericht lightGeschäftsbericht light
Geschäftsbericht light
 
Visual thinking, Usability Coffee, Zug, 14.04.2015
Visual thinking, Usability Coffee, Zug, 14.04.2015Visual thinking, Usability Coffee, Zug, 14.04.2015
Visual thinking, Usability Coffee, Zug, 14.04.2015
 
Axiología anomía
Axiología  anomíaAxiología  anomía
Axiología anomía
 

Mehr von Magnus Pfeffer

Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementOpen Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementMagnus Pfeffer
 
Linked Data in der Lehre
Linked Data in der LehreLinked Data in der Lehre
Linked Data in der LehreMagnus Pfeffer
 
Cloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von MetadatenCloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von MetadatenMagnus Pfeffer
 
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMagnus Pfeffer
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Magnus Pfeffer
 
Automatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsAutomatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsMagnus Pfeffer
 
Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?Magnus Pfeffer
 
Clustering auf Werksebene
Clustering auf WerksebeneClustering auf Werksebene
Clustering auf WerksebeneMagnus Pfeffer
 
Resource Discovery: Herausforderung und Chance für die Sacherschließung
Resource Discovery:  Herausforderung und Chance für die SacherschließungResource Discovery:  Herausforderung und Chance für die Sacherschließung
Resource Discovery: Herausforderung und Chance für die SacherschließungMagnus Pfeffer
 
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...Magnus Pfeffer
 
Jetzt kommt zusammen, was zusammen gehört
Jetzt kommt zusammen, was zusammen gehörtJetzt kommt zusammen, was zusammen gehört
Jetzt kommt zusammen, was zusammen gehörtMagnus Pfeffer
 
Bibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedBibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedMagnus Pfeffer
 
Bibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedBibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedMagnus Pfeffer
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open DataMagnus Pfeffer
 
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Magnus Pfeffer
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenMagnus Pfeffer
 
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...Magnus Pfeffer
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open DataMagnus Pfeffer
 
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Magnus Pfeffer
 

Mehr von Magnus Pfeffer (19)

Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementOpen Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
 
Linked Data in der Lehre
Linked Data in der LehreLinked Data in der Lehre
Linked Data in der Lehre
 
Cloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von MetadatenCloud Computing für die Verarbeitung von Metadaten
Cloud Computing für die Verarbeitung von Metadaten
 
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata ProvenanceMetadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
Metadata Provenance Tutorial Part 2: Interoperable Metadata Provenance
 
Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...Automatic creation of mappings between classification systems for bibliograph...
Automatic creation of mappings between classification systems for bibliograph...
 
Automatic creation of mappings between classification systems
Automatic creation of mappings between classification systemsAutomatic creation of mappings between classification systems
Automatic creation of mappings between classification systems
 
Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?Resource Discovery - Sacherschließung am Ende?
Resource Discovery - Sacherschließung am Ende?
 
Clustering auf Werksebene
Clustering auf WerksebeneClustering auf Werksebene
Clustering auf Werksebene
 
Resource Discovery: Herausforderung und Chance für die Sacherschließung
Resource Discovery:  Herausforderung und Chance für die SacherschließungResource Discovery:  Herausforderung und Chance für die Sacherschließung
Resource Discovery: Herausforderung und Chance für die Sacherschließung
 
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...
 
Jetzt kommt zusammen, was zusammen gehört
Jetzt kommt zusammen, was zusammen gehörtJetzt kommt zusammen, was zusammen gehört
Jetzt kommt zusammen, was zusammen gehört
 
Bibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data ExtendedBibliotheken und Linked Open Data Extended
Bibliotheken und Linked Open Data Extended
 
Bibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data ReducedBibliotheken und Linked Open Data Reduced
Bibliotheken und Linked Open Data Reduced
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
Fallbasierte automatische Klassifikation nach der RVK - k-nearest neighbour a...
 
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzenAusleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
Ausleihdaten aus Bibliotheken als Linked Open Data publizieren und nutzen
 
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
 
Bibliotheken und Linked Open Data
Bibliotheken und Linked Open DataBibliotheken und Linked Open Data
Bibliotheken und Linked Open Data
 
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
Altbestandserschließung: Automatische Übernahme von RVK und SWD über Verbundg...
 

Automatisches Generieren von Konkordanzen

  • 1. Automatisches Generieren von Konkordanzen Prof. Magnus Pfeffer Hochschule der Medien, Stuttgart pfeffer@hdm-stuttgart.de
  • 2. Überblick  Grundidee  Optimierung durch Clustering  Projekt: Konkordanz RVK ↔ DDC 13. März 2013 5. Kongress Bibliothek und Information
  • 3. Grundidee 13. März 2013 5. Kongress Bibliothek und Information
  • 4. Instanzbasierter Vergleich  Datenbasis: Mehrfach erschlossene Einträge in Katalogen 13. März 2013 5. Kongress Bibliothek und Information
  • 5. Instanzbasierter Vergleich  Annahmen  Inhaltlich überlappende Klassen treten zusammen auf  Häufigkeit des Auftretens ist ein Indiz für die Stärke des Zusammenhangs  Aufbereitung  Extraktion aller Paare aus zwei Erschließungssystemen  Aufsummieren der vorkommenden Paare 13. März 2013 5. Kongress Bibliothek und Information
  • 6. Beispiel 13. März 2013 5. Kongress Bibliothek und Information
  • 7. Beispiel  Titel 1  Paare  DDC: 179.9  179.9 / CC 7200  RVK: CC 7200  179.9 / CC 7250  RVK: CC 7250  179.9 / CC 7200  Titel 2  DDC: 179.9  RVK: CC 7200 13. März 2013 5. Kongress Bibliothek und Information
  • 8. Instanzbasierter Vergleich  Auswertung  am Beispiel zweier Klassifikationen A und B  Zwei Klassen treten ausschließlich als Paar auf  1:1 Zuordnung = exakte Übereinstimmung  Klasse aus A hat immer denselben Partner aus B, der hat aber auch andere Partner aus A  N:1 Zuordnung = Klasse aus A ist engeres Konzept  Klasse aus A tritt mit mehreren Partnern auf  1:N Zuordnung = Klasse aus A ist weiter gefasstes Konzept  Aber: Klasse tritt nicht auf  Keine Folgerung möglich 13. März 2013 5. Kongress Bibliothek und Information
  • 9. Beispiel  Auswertung für DDC  2 mal 179.9 / CC 7200  1 mal 179.9 / CC 7250  Ergebnis  179.9 narrowMatch CC 7200  179.9 narrowMatch CC 7250 13. März 2013 5. Kongress Bibliothek und Information
  • 10. Beispiel  Auswertung für RVK  2 mal CC 7200 / 179.9  1 mal CC 7250 / 179.9  Ergebnis  CC 7200 broadMatch 179.9  CC 7250 broadMatch 179.9 13. März 2013 5. Kongress Bibliothek und Information
  • 11. Optimierung durch Clustering 13. März 2013 5. Kongress Bibliothek und Information
  • 12. Titeldaten sind anders  Mehrere Auflagen  Mehrere Ausgaben 13. März 2013 5. Kongress Bibliothek und Information
  • 13. Titeldaten  Mehrere Ausgaben und Auflagen verfälschen die Statistik  Paare werden mehrfach erfasst  Keine Vergleichbarkeit der absoluten Häufigkeiten  Lösung: Auswertung der Cluster anstelle der einzelnen Titel  Häufigkeiten werden direkt vergleichbar  „Stärke“ der Korrelationen können ermittelt werden  „Ausreißer“ können sicher erkannt und entfernt werden 13. März 2013 5. Kongress Bibliothek und Information
  • 14. Projekt: Konkordanz RVK ↔ DDC 13. März 2013 5. Kongress Bibliothek und Information
  • 15. Datenbasis  Alle deutschen Verbundkataloge  SWB  BVB  GBV  HeBIS  HBZ  DNB 13. März 2013 5. Kongress Bibliothek und Information
  • 16. Umsetzung  Metafactory  Aufbereiten von MAB2 und MARC21 Daten  Clustering auf Werksebene  Keygenerierung für Matching-Prozess  Matching und Clusterbildung (transitive Hülle)  Sammeln der Erschließungsinformationen im Cluster  Statistik  Auszählen des gemeinsamen Auftretens von Klassen  Ausgabe  Mappings einzelner Klassen  Beide Richtungen 13. März 2013 5. Kongress Bibliothek und Information
  • 17. Offene Fragen  Enthalten die Titeldaten nach dem Clustering genügend auswertbare Erschließungen?  Macht es Sinn, einen globalen Cut-Off zu verwenden, um Ausreißer zu verwerfen?  Oder ist es besser, jede Klasse gesondert auszuwerten?  Wie kann eine effiziente Qualitätssicherung betrieben werden? 13. März 2013 5. Kongress Bibliothek und Information
  • 18. Danke für Ihre Aufmerksamkeit! Folien online unter http://www.slideshare.net/MagnusPfeffer/ Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz. 13. März 2013 5. Kongress Bibliothek und Information