SlideShare ist ein Scribd-Unternehmen logo
Thematische
 Vernetzung heterogener
  Informationsbestände
                     Johannes Hercher
    Doktorandenworkshop der Informationswissenschaft,
               07-08.06.2012, DIPF Berlin


http://jhercher.de                         @jhercher
Thematische
Vernetzung heterogener
 Informationsbestände
 Netz von Begriffen, Bezeichnern, Instanzen

Konkordanzen zwischen Begriffen und
   Relationen zwischen Instanzen
  Digitale Sammlungen z.B. auf Dokumentenserver,
 Bookmarks, Forschungsdaten, Unterichtsmaterial...
Motivation

 ■ Fachgebiete müssen stärker miteinander in den Dialog treten:
   -> neue Verbindungen ihrer Terminologien schaffen
 ■ Informationsmanagement von Wissenschaftlern verbessern:
   -> von den Tags zum persönlichen KOS
 ■ Pflege von Terminologien erleichtern:
   -> kollaborative Verfahren und Vernetzung


                                      - Agenda -

                         1) Hintergrund

                         2) Beobachtung
                                       en
                        3) Forschungsfr
                                        agen
                        4) Stand der Arb
                                         eit


Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   3 / 27
Das Projekt mediaglobe




                                                                                     {
Unterstützung von Filmarchiven, bei:

  Digitalisierung
                                                               Projektlaufzeit:
                                                               2009 – 2012
       Erschließung und

            Verwertung

von audiovisuellen Materialien.


         Aufgaben (HPI)

          Medienanalyse & Metadatengenerierung
          semantische Analyse & semantische Suche
          innovative Benutzerschnittstellen


Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   4 / 27
Publikationen


Seth van Hooland, Ruben Verborgh, Max De Wilde, Johannes Hercher, Erik Mannens, Rik Van de Walle : Evaluating the the success of vocabulary
reconciliation for cultural heritage collections. In Journal of the American Society for Information Science and Technology (JASIST) (accepted).
Christian Hentschel, Johannes Hercher, Magnus Knuth, Johannes Osterhoff, Bernhard Quehl, Harald Sack, Nadine Steinmetz, Jörg Waitelonis, Haojin Yang: Open
Up Cultural Heritage in Video Archives with Mediaglobe, In Proc. of the 12th International Conference on Innovative Internet Community Systems (I2CS 2012),
June 13-15, 2012, Lecture Notes in Informatics, Vol. 204, Springer, pp. (to appear).
Magnus Knuth, Johannes Hercher, Harald Sack: Collaboratively Patching Linked Data, 2nd International Workshop on Usage Analysis and the Web of Data
(USEWOD2012), Workshop at WWW 2012, Lyon, France, April 17th, 2012.
Johannes Hercher, Marcel Ruhl, Harald Sack: Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung
der DGI, Frankfurt a. M., Mar. 22-23, 2012, Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt, pp.
251-262.
Johannes Hercher, Anita Mitzscherlich, Harald Sack: Bestandsanalyse, Metadaten und Systematisierung. Vogel, A. & Effenberg, P. (Hrsg.) Digitalisierungsfibel,
Leitfaden für audiovisuelle Archive, Potsdam, Germany, transfermedia, 2011, pp. 82-101.
Seth van Hooland, Ruben Verborgh, Max De Wilde, Johannes Hercher, Erik Mannens, Rik Van de Walle: Free your metadata – Integrating cultural heritage
collections through Google Refine reconciliation, Pre-submission, Oct. 2011.
Johannes Hercher, Harald Sack: Building a Research Context with Linked Bibliographic Data, Submission to the OFKN Open Bibliographic Data Challenge,
Feb. 18, 2011.
Jörg Waitelonis, Magnus Knuth, Lina Wolf, Johannes Hercher, Harald Sack: The Path is the Destination - Enabling a New Search Paradigm with Linked Data.
In Proc. of the Workshop on Linked Data in the Future Internet at the Future Internet Assembly, December 16-17, 2010, Ghent, Belgium, CEUR Workshop
Proceedings Vol. 700, 2010.
Johannes Hercher, Harald Sack: Indexing German Audiovisual Heritage ― SKOSification Made Easy, In 9th European NKOS Workshop at the 14th ECDL
Conference, September 9-10, 2010, Glasgow, Scotland, 2010.
Jörg Waitelonis, Harald Sack, Zalan Kramer, Johannes Hercher: Semantically Enabled Exploratory Video Search. In Proc. of the 3rd Int. (WWW), 26-30 April
2010, Raleigh, NC, USA, Semantic Search Workshop at the 19th Int. World Wide Web Conf., ACM, 2010, pp. 1-8.
Johannes Hercher: Bedarfsorientierte Gewinnung von Metadaten: Am Beispiel der Online-Artikel eines IT-Fachverlags, Fachhochschule Potsdam, 2009.
Johannes Hercher , Sabine Jahn, Silke Grossmann: Einführung Social Tagging/Computing, Einsteigertutorials der Fachhochschule Potsdam zur International
Conference on Dublin Core and Metadata Applications, Neuroth, H. ; Büttner, S. (Hrsg.), 22.09.2008, online, FH Potsdam, 2008, pp. 70-112.


Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.                                            5 / 27
Aufgaben im Projekt Mediaglobe

                                                  ■ Analyse von Benutzern, Inhalten,
                                                    Rahmenbedingungen für V-MAM


                                             Archive                                                      AV Sektor
                                                                 CDWA
                                                                           REM
                                                       ULAN                      BBC SMEF

■ Auswahl und Evaluierung                    ISAD(G)          EAD          CWS          FIAF
                                                                                                      MPEG-7


                                                                                                               MPEG-21
  von Metadatenstandards                  CIDOC-CRM                     Dublin Core            P_Meta
                                                                                                                  TV-Anytime
                                                           TGN                UKAT
                                                                    IPTC
                                                                                               LCSH
                                               MARC/MAB                               VRA
                                                                    DDC                                 OAI-ORE

                                                                                                                WWW
                                            Bibliotheken                   RDA                 MODS




                                                                                       ■ Entwicklung eines Datenmodells
                                                                                         zur Auswahl v. Metadatenelementen
                                                                                       ■ Realisierung einer Ontologie
                                                                                         http://bit.ly/mgOntology
Text




   Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.                   6 / 27
Verzetteln: Entwicklung eines KOS




           Stadtbild (145)                                                               Statue (27)



                                                           Wohnung (20)                 Grünanlage (14)




Kirche, Schloss, Burg (64)


                                                                              Industrieanlage (147)
Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   14 / 27
                                                                                                            7
...Mapping eines indiv. KOS in die LOD Cloud




       Problem 1: Mehrdeutigkeiten
         •Innerdeutsche Grenze (...) -> geogr. / thematisch?
         •Zusammengesetzte Begriffe -> Einzelbegriffe?
         •Akronyme -> DDR
       Problem 2: Umgebung f. Pflege + Vokabular-Matchings


                                                                                            XY




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   8 / 27
Auswahl von Normdaten und Terminologien

       FIAF Corp.                                                                                GTAA Genre
         Names           VIAF                                               IPTC NC (Genre)
GTAA
Names     Person                                                           EBU         Typen
          ULAN           PND                                             Audience                     LCGFT
                                                                                BA-Gattungen
      Matchings zwischen Themen-Vokabularen
      sind aufwändig und existierende
      Matchings sind schwer zugänglich
               MARC
                                                                                 IPTC Mediatopics
              CountryCodes
   MARC                                                                     BA-Thema    DDC LCSH
Geogr. Areas UKAT World Gazetteer
 ZBW           Einige große Projekte:
             ISO 3166
                         Geonames                                               Topic                SWD
               MACS, CATCH-STITCH, KoMoHe,                              ZBW        UDC
                     FIAF Country                                                        DRA/DDR
TGN
      Place    CrissCross ...
                        Listings                                                         Thesaurus
                                                                            FIAF Subj. Headings
OpenStreetMap            Reuters Regions
         TVA Place Type

  Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   9 / 27
Die ursprüngliche Idee:
   ■ Vernetzung von Filmkollektionen

                                                                      mit Hilfe von Klassifikationen & Thesauri


                                                                                          Kulturelles Filmerbe in Deutschland

                          > 1000 collections                                              > 1.200 film Kollektionen*
                          need connections                                                > 200 Institutionen mit mehr als 100h
                                                                                          Filmmaterial**
                                                                                          ~ 83% planen Digitalisierung, EU-Förderprogramme




*) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der
    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.
Bundesrepublik Deutschland. Koblen                                                                                                                                          10 / 27
**) Mediaglobe, Deliverable-1.1 Report 2010.
Die ursprüngliche Idee:
   ■ Vernetzung von Filmkollektionen

                                                                      mit Hilfe von Klassifikationen & Thesauri


                                                                                          Kulturelles Filmerbe in Deutschland

                          > 1000 collections                                              > 1.200 film Kollektionen*
 Kleine Vokabulare werden oft nicht
           need connections         > 200 Institutionen mit mehr als 100h
 gemappt, obwohl das nützlich für die
                                    Filmmaterial**
 Contentaggregation wäre.           ~ 83% planen Digitalisierung, EU-Förderprogramme




*) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der
    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.
Bundesrepublik Deutschland. Koblen                                                                                                                                          10 / 27
**) Mediaglobe, Deliverable-1.1 Report 2010.
Die ursprüngliche Idee:
   ■ Vernetzung von Filmkollektionen

                                                                      mit Hilfe von Klassifikationen & Thesauri


                                                                                          Kulturelles Filmerbe in Deutschland

                          > 1000 collections                                              > 1.200 film Kollektionen*
 Kleine Vokabulare werden oft nicht
           need connections         > 200 Institutionen mit mehr als 100h
 gemappt, obwohl das nützlich für die
                                    Filmmaterial**
 Contentaggregation wäre.           ~ 83% planen Digitalisierung, EU-Förderprogramme



                                   zu "kleinen" Vokabularen zählen auch:
                                   - Tags in Social Media Services:
                                     Delicious, Zotero, Bibsonomy...
                                   - Ordnerstruktur z.B. im Intranet
                                   - ...


*) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der
    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.
Bundesrepublik Deutschland. Koblen                                                                                                                                          10 / 27
**) Mediaglobe, Deliverable-1.1 Report 2010.
Cross-Recherche ist bereits möglich...




                                         OPAC xy

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   11 / 27
Cross-Recherche ist bereits möglich...




                            Keine (selten) Serviceübergreifende
                            Recherche bzw. Integration der
                            Ergebnisse




                                         OPAC xy

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   11 / 27
Cross-Recherche ist bereits möglich...



                                 Austausch nutzergenerierter                                                  Kommentare

                                 Metadaten, thematisch verwandter
         Kommentare
                                                                                                   Tags
Tags
                                 Objekte findet nicht statt.                                                        Ratings
              Ratings




                                   Keine (selten) Serviceübergreifende
                                   Recherche bzw. Integration der
                                   Ergebnisse




                                                OPAC xy

       Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.    11 / 27
Was wird benötigt? Der Lösungsvorschlag:

 Cross-Recherche mit individuellen Begriffsmodellen (thematisch)




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

     Cross-Recherche mit individuellen Begriffsmodellen (thematisch)


                     :Person
   :Annotation
                               :Ereignis



             :Begriff            :Zeitraum
 Notation
  Definition
   prefLabel                   :Ort
        altLabel
Thema A
                               annotiert



      hat        A




    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

      Cross-Recherche mit individuellen Begriffsmodellen (thematisch)

                                                                                                   :Ereignis
                     :Person
   :Annotation
                               :Ereignis                                                 :Person



                                 :Zeitraum                                            :Zeitraum          :Begriff
             :Begriff
 Notation
  Definition
   prefLabel                   :Ort                                                         :Ort
        altLabel
Thema A                                                                                                   Thema B
                               annotiert                                        annotiert



      hat        A                                                                                  B           hat




    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

      Cross-Recherche mit individuellen Begriffsmodellen (thematisch)

                                                                                                   :Ereignis
                     :Person
   :Annotation
                               :Ereignis                                                 :Person



                                 :Zeitraum                                            :Zeitraum          :Begriff
             :Begriff
 Notation
  Definition
   prefLabel                   :Ort                                                         :Ort
        altLabel
Thema A                                                                                                   Thema B
                               annotiert                                        annotiert



      hat        A                                                                                  B           hat
                                                            ?!




    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

      Cross-Recherche mit individuellen Begriffsmodellen (thematisch)

                                                                                                   :Ereignis
                     :Person
   :Annotation
                               :Ereignis                                                 :Person



                                 :Zeitraum                                            :Zeitraum          :Begriff
             :Begriff
 Notation
  Definition
   prefLabel                   :Ort                                                         :Ort
        altLabel
Thema A                                                                                                   Thema B
                               annotiert                                        annotiert



      hat        A                                                                                  B           hat
                                                            ?!




                                                          ?!

    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

      Cross-Recherche mit individuellen Begriffsmodellen (thematisch)

                                                                                                   :Ereignis
                                                            owl:sameAs
                     :Person
   :Annotation
                               :Ereignis                                                 :Person



                                 :Zeitraum                                            :Zeitraum          :Begriff
             :Begriff
 Notation
  Definition
   prefLabel                   :Ort                                                         :Ort
        altLabel
Thema A                                                                                                   Thema B
                               annotiert                                        annotiert



      hat        A                                                                                  B           hat
                                                            ?!




                                                          ?!

    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Was wird benötigt? Der Lösungsvorschlag:

      Cross-Recherche mit individuellen Begriffsmodellen (thematisch)

                                                                                                   :Ereignis
                                                            owl:sameAs
                     :Person
   :Annotation
                               :Ereignis                                                 :Person



                                 :Zeitraum              skos:narrowMatch              :Zeitraum          :Begriff
             :Begriff
 Notation
  Definition
   prefLabel                   :Ort                                                         :Ort
        altLabel
Thema A                                                                                                   Thema B
                               annotiert                                        annotiert



      hat        A                                                                                  B           hat
                                                            ?!




                                                          ?!

    Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   12 / 27
Eigene Matchings Herstellen?
Ansätze für automatische Integration von Ontologien/KOS


         Matching-Strategien
              ■ lexikalisch
              ■ strukturell                                                          > 1000 collections
                                                                                     adasdsdf
                                                                                     need connections
              ■ semantisch




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   13 / 27
Eigene Matchings Herstellen?
Ansätze für automatische Integration von Ontologien/KOS


         Matching-Strategien
              ■ lexikalisch
              ■ strukturell                                                          > 1000 collections
                                                                                     adasdsdf
                                                                                     need connections
              ■ semantisch




 ■ >50 Algorithmen und Tools (Nguyen2011)


 ■ einige Frameworks und Editoren mit Mapping Funktion
   FOAM, COMA++, MAFRA, Alignment API, Web Service Modelling
   Toolkit (WSMT), NeOn, Protegé PROMT, Chimera, Google Refine...


Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   13 / 27
Eigene Matchings Herstellen?
Ansätze für automatische Integration von Ontologien/KOS


         Matching-Strategien
              ■ lexikalisch
              ■ strukturell                  Klassische R/P Evaluation der Matching-
                                                                       > 1000 collections
                                             Qualität erfordert eine Ground Truth.
                                                                       adasdsdf
                                                                       need connections
              ■ semantisch

                                               Relationen sind (oft) eine individuelle
                                               Entscheidung!

 ■ >50 Algorithmen und Tools (Nguyen2011)


 ■ einige Frameworks und Editoren mit Mapping Funktion
   FOAM, COMA++, MAFRA, Alignment API, Web Service Modelling
   Toolkit (WSMT), NeOn, Protegé PROMT, Chimera, Google Refine...


Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   13 / 27
Zwischenstand: aktuelle Problemfelder u. Ziele


Kleine KOS sind nicht interoperabel und nachnutzbar vernetzt
 ■ Ziel: Crossrecherche, Empfehlungen, kollaborative
   Terminologiepflege


Automatische (lexikalische, strukturelle, semantische) matching-
Verfahren benötigen einen Gold Standard.
 ■ Ziel: Goldstandards für evaluation Terminologiemapping
   bereitstellen.


Matchings zwischen KOS sind aufwändig und die Ergebnisse sind schwer
zugänglich.
 ■ Ziel: Matchings nachnutzbar publizieren, Nutzung erleichtern



Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   14 / 27
Forschungsfragen


 ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular
   Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das
   ggf. nicht sinnvoll?


 ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein
   Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer
   Workflow aus? Wie können Verknüpfungen effizient erstellt und
   gepflegt werden?


 ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen
   interoperabel publizieren und effizient nutzen?


 ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem
   Arbeiten messen?

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   15 / 27
Forschungsfragen


 ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular
   Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das
   ggf. nicht sinnvoll?


 ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein
   Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer
   Workflow aus? Wie können Verknüpfungen effizient erstellt und
   gepflegt werden?


 ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen
   interoperabel publizieren und effizient nutzen?


 ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem
   Arbeiten messen?

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   16 / 27
Wem nützt ein thematischer Zugang?


Wissensintensive Berufsfelder mit interdisziplinärem Bezug:
Wissenschaftler, Journalisten, Kreative Berufe, Sozialarbeiter, Politik...
 ■ => interdisziplinärer Zugang gilt als "kreativitätsfördernd"...
Szenarien:
 ■ Ein Student schreibt eine Hausarbeit und sucht nach Studenten, die
   ähnliche Themen bearbeiten.
 ■ Ein Terminologiemanager/Dokumentar möchte neue verwandte
   Begriffe in seinen Thesaurus einpflegen.
 ■ Ein Journalist definiert einen Interessensbereich und nutzt das Modell
   für die Aggregation und Ranking von Quellen.
Wem nützt es nicht:
 ■ Softwareherstellern,
 ■ bestimmte Disziplinen,
 ■ ...
Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   17 / 27
Forschungsfragen


 ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular
   Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das
   ggf. nicht sinnvoll?


 ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein
   Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer
   Workflow aus? Wie können Verknüpfungen effizient erstellt und
   gepflegt werden?


 ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen
   interoperabel publizieren und effizient nutzen?


 ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem
   Arbeiten messen?

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   18 / 27
Motivation und Barrieren zur Verwendung nutzergenerierter
          Metadaten >> Perspektive der Einrichtungen




                                                                                                                                                          http://en.wikipedia.org/wiki/File:Melk_-_Abbey_-_Library.jpg
      Motivation                                                                       Barrieren
                                                                                                                                                                                                                         P


       • Enger Kontakt zu den Nutzern                                                 • Keine personellen und finanziellen
                                                                                           Reserven
       • Publicity und Nutzerzufriedenheit                                            • unklares Kosten-Nutzenverhältnis
          durch neue Funktionen


       • Unterstützung durch Nutzer (z.B. Hilfe                                       • Rechtliche Unsicherheiten, z.B. in
          bei Korrektur von Metadaten)                                                     Bezug auf Datenschutz



Johannes Hercher, Marcel Ruhl, Harald Sack:
Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Frankfurt a. M., Mar. 22.-23., 2012,
Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt.
           Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.                                 19 / 27
Motivation und Barrieren zur Verwendung nutzergenerierter
     Metadaten >> Perspektive der Benutzer




 Motivation                                                                        Barrieren
  • Spaßfaktor & gute Usability                                                    • schlechte Usability

  • Kommunikation mit Gleichgesinnten.                                             • Community zu klein

  • Persönlicher Vorteil / Arbeitserleichterung                                    • Bedenken z. Datenschutz / Reputation.




Johannes Hercher, Marcel Ruhl, Harald Sack:
Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Frankfurt a. M., Mar. 22.-23., 2012,
Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt.
      Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.                                 20 / 27
Workflow

                                          Manage:
               KOS-Ingest:
                                          update &
                 Skosify
                                         complement




provide
                Evaluate:                                               Use:
alignments       discuss &                                          Annotate &
                   select                                            Search w/
                alignments                                          Linked Data




                                           Aggregate
                                            & Align:
                                          Collaborative
                                            Matching



                                                 match


 Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   / 27
Forschungsfragen


 ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular
   Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das
   ggf. nicht sinnvoll?


 ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein
   Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer
   Workflow aus? Wie können Verknüpfungen effizient erstellt und
   gepflegt werden?


 ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen
   interoperabel publizieren und effizient nutzen?


 ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem
   Arbeiten messen?

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   22 / 27
Eine Ontologie zur Publikation von Alignments




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   23 / 27
Forschungsfragen


 ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular
   Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das
   ggf. nicht sinnvoll?


 ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein
   Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer
   Workflow aus? Wie können Verknüpfungen effizient erstellt und
   gepflegt werden?


 ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen
   interoperabel publizieren und effizient nutzen?


 ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem
   Arbeiten messen?

Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   24 / 27
Überlegungen zur Evaluation


 ■ Hier sind noch Ideen gefragt:
 ■ ... Service wird genutzt
 ■ ... beschränken sich die Verknüpfungen auf bestimmte Disziplinen?
 ■ ... Übereinstimmung mit automatischen Verfahren?
 ■ ...




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   25 / 27
Nächste Schritte




 ■ Plattform auf der Vokabulare publiziert werden,


 ■ Nutzer (Einrichtungen/Forscher) zur Publikation motivieren


 ■ Annotation mit diversen Vokabularen ermöglichen


 ■ Vokabular Matchings für Nutzer vorschlagen u. validieren lassen


 ■ Matchings für Wissensexploration nutzen




Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   26 / 27
Johannes Hercher

mail@jhercher.de

http://johannes.jhercher.de

@jhercher




                  ank für
         iele n D           mk eit!
       V
                    mer ksa
            re A uf
       Ih
Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin.   27 / 27

Weitere ähnliche Inhalte

Ähnlich wie 20120608_Thematische Vernetzung heterogener Informationsbestände

Ziziphus/Tamboti
Ziziphus/TambotiZiziphus/Tamboti
Ziziphus/Tamboti
Matthias Arnold
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
Christoph Lange
 
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
Institute for Digital Humanities, University of Cologne
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
redsys
 
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Matthias Arnold
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Georg Rehm
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
Becker Hans-Georg
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
Archäologische Dateninfrastrukturen
Archäologische DateninfrastrukturenArchäologische Dateninfrastrukturen
Archäologische Dateninfrastrukturen
Kai-Christian Bruhn
 
09 pisa finale
09 pisa finale09 pisa finale
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?
Semantic Web Company
 
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMSDeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
Anja Lorenz
 
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
Institute for Digital Humanities, University of Cologne
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
Björn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
LydiaU
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
Stefan Buddenbohm
 

Ähnlich wie 20120608_Thematische Vernetzung heterogener Informationsbestände (20)

Ziziphus/Tamboti
Ziziphus/TambotiZiziphus/Tamboti
Ziziphus/Tamboti
 
Web-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-GruppeWeb-2.0-Forschung der KWARC-Gruppe
Web-2.0-Forschung der KWARC-Gruppe
 
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
SoSem 2015 | IT-Zertifikat: Tools & Methods in Digital Humanities - 01_Digita...
 
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
 
21 voss dach_open_databonn
21 voss dach_open_databonn21 voss dach_open_databonn
21 voss dach_open_databonn
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
 
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
Videoannotationsdatenbank Pan.do/ra in der HRA ("Loosing my religion" - Kunst...
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
 
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: TextBit SoSem 2014 | Basisinformationstechnologie I - 04: Text
Bit SoSem 2014 | Basisinformationstechnologie I - 04: Text
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
 
Archäologische Dateninfrastrukturen
Archäologische DateninfrastrukturenArchäologische Dateninfrastrukturen
Archäologische Dateninfrastrukturen
 
09 pisa finale
09 pisa finale09 pisa finale
09 pisa finale
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?
 
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMSDeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
DeLFI Doktorandenforum: Kooperationsunterstützung in einem LCMS
 
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_TextBIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
BIT I SoSem 2015 | Basisinformationstechnologie II - 04_Text
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 

20120608_Thematische Vernetzung heterogener Informationsbestände

  • 1. Thematische Vernetzung heterogener Informationsbestände Johannes Hercher Doktorandenworkshop der Informationswissenschaft, 07-08.06.2012, DIPF Berlin http://jhercher.de @jhercher
  • 2. Thematische Vernetzung heterogener Informationsbestände Netz von Begriffen, Bezeichnern, Instanzen Konkordanzen zwischen Begriffen und Relationen zwischen Instanzen Digitale Sammlungen z.B. auf Dokumentenserver, Bookmarks, Forschungsdaten, Unterichtsmaterial...
  • 3. Motivation ■ Fachgebiete müssen stärker miteinander in den Dialog treten: -> neue Verbindungen ihrer Terminologien schaffen ■ Informationsmanagement von Wissenschaftlern verbessern: -> von den Tags zum persönlichen KOS ■ Pflege von Terminologien erleichtern: -> kollaborative Verfahren und Vernetzung - Agenda - 1) Hintergrund 2) Beobachtung en 3) Forschungsfr agen 4) Stand der Arb eit Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 3 / 27
  • 4. Das Projekt mediaglobe { Unterstützung von Filmarchiven, bei: Digitalisierung Projektlaufzeit: 2009 – 2012 Erschließung und Verwertung von audiovisuellen Materialien. Aufgaben (HPI) Medienanalyse & Metadatengenerierung semantische Analyse & semantische Suche innovative Benutzerschnittstellen Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 4 / 27
  • 5. Publikationen Seth van Hooland, Ruben Verborgh, Max De Wilde, Johannes Hercher, Erik Mannens, Rik Van de Walle : Evaluating the the success of vocabulary reconciliation for cultural heritage collections. In Journal of the American Society for Information Science and Technology (JASIST) (accepted). Christian Hentschel, Johannes Hercher, Magnus Knuth, Johannes Osterhoff, Bernhard Quehl, Harald Sack, Nadine Steinmetz, Jörg Waitelonis, Haojin Yang: Open Up Cultural Heritage in Video Archives with Mediaglobe, In Proc. of the 12th International Conference on Innovative Internet Community Systems (I2CS 2012), June 13-15, 2012, Lecture Notes in Informatics, Vol. 204, Springer, pp. (to appear). Magnus Knuth, Johannes Hercher, Harald Sack: Collaboratively Patching Linked Data, 2nd International Workshop on Usage Analysis and the Web of Data (USEWOD2012), Workshop at WWW 2012, Lyon, France, April 17th, 2012. Johannes Hercher, Marcel Ruhl, Harald Sack: Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Frankfurt a. M., Mar. 22-23, 2012, Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt, pp. 251-262. Johannes Hercher, Anita Mitzscherlich, Harald Sack: Bestandsanalyse, Metadaten und Systematisierung. Vogel, A. & Effenberg, P. (Hrsg.) Digitalisierungsfibel, Leitfaden für audiovisuelle Archive, Potsdam, Germany, transfermedia, 2011, pp. 82-101. Seth van Hooland, Ruben Verborgh, Max De Wilde, Johannes Hercher, Erik Mannens, Rik Van de Walle: Free your metadata – Integrating cultural heritage collections through Google Refine reconciliation, Pre-submission, Oct. 2011. Johannes Hercher, Harald Sack: Building a Research Context with Linked Bibliographic Data, Submission to the OFKN Open Bibliographic Data Challenge, Feb. 18, 2011. Jörg Waitelonis, Magnus Knuth, Lina Wolf, Johannes Hercher, Harald Sack: The Path is the Destination - Enabling a New Search Paradigm with Linked Data. In Proc. of the Workshop on Linked Data in the Future Internet at the Future Internet Assembly, December 16-17, 2010, Ghent, Belgium, CEUR Workshop Proceedings Vol. 700, 2010. Johannes Hercher, Harald Sack: Indexing German Audiovisual Heritage ― SKOSification Made Easy, In 9th European NKOS Workshop at the 14th ECDL Conference, September 9-10, 2010, Glasgow, Scotland, 2010. Jörg Waitelonis, Harald Sack, Zalan Kramer, Johannes Hercher: Semantically Enabled Exploratory Video Search. In Proc. of the 3rd Int. (WWW), 26-30 April 2010, Raleigh, NC, USA, Semantic Search Workshop at the 19th Int. World Wide Web Conf., ACM, 2010, pp. 1-8. Johannes Hercher: Bedarfsorientierte Gewinnung von Metadaten: Am Beispiel der Online-Artikel eines IT-Fachverlags, Fachhochschule Potsdam, 2009. Johannes Hercher , Sabine Jahn, Silke Grossmann: Einführung Social Tagging/Computing, Einsteigertutorials der Fachhochschule Potsdam zur International Conference on Dublin Core and Metadata Applications, Neuroth, H. ; Büttner, S. (Hrsg.), 22.09.2008, online, FH Potsdam, 2008, pp. 70-112. Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 5 / 27
  • 6. Aufgaben im Projekt Mediaglobe ■ Analyse von Benutzern, Inhalten, Rahmenbedingungen für V-MAM Archive AV Sektor CDWA REM ULAN BBC SMEF ■ Auswahl und Evaluierung ISAD(G) EAD CWS FIAF MPEG-7 MPEG-21 von Metadatenstandards CIDOC-CRM Dublin Core P_Meta TV-Anytime TGN UKAT IPTC LCSH MARC/MAB VRA DDC OAI-ORE WWW Bibliotheken RDA MODS ■ Entwicklung eines Datenmodells zur Auswahl v. Metadatenelementen ■ Realisierung einer Ontologie http://bit.ly/mgOntology Text Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 6 / 27
  • 7. Verzetteln: Entwicklung eines KOS Stadtbild (145) Statue (27) Wohnung (20) Grünanlage (14) Kirche, Schloss, Burg (64) Industrieanlage (147) Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 14 / 27 7
  • 8. ...Mapping eines indiv. KOS in die LOD Cloud Problem 1: Mehrdeutigkeiten •Innerdeutsche Grenze (...) -> geogr. / thematisch? •Zusammengesetzte Begriffe -> Einzelbegriffe? •Akronyme -> DDR Problem 2: Umgebung f. Pflege + Vokabular-Matchings XY Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 8 / 27
  • 9. Auswahl von Normdaten und Terminologien FIAF Corp. GTAA Genre Names VIAF IPTC NC (Genre) GTAA Names Person EBU Typen ULAN PND Audience LCGFT BA-Gattungen Matchings zwischen Themen-Vokabularen sind aufwändig und existierende Matchings sind schwer zugänglich MARC IPTC Mediatopics CountryCodes MARC BA-Thema DDC LCSH Geogr. Areas UKAT World Gazetteer ZBW Einige große Projekte: ISO 3166 Geonames Topic SWD MACS, CATCH-STITCH, KoMoHe, ZBW UDC FIAF Country DRA/DDR TGN Place CrissCross ... Listings Thesaurus FIAF Subj. Headings OpenStreetMap Reuters Regions TVA Place Type Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 9 / 27
  • 10. Die ursprüngliche Idee: ■ Vernetzung von Filmkollektionen mit Hilfe von Klassifikationen & Thesauri Kulturelles Filmerbe in Deutschland > 1000 collections > 1.200 film Kollektionen* need connections > 200 Institutionen mit mehr als 100h Filmmaterial** ~ 83% planen Digitalisierung, EU-Förderprogramme *) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. Bundesrepublik Deutschland. Koblen 10 / 27 **) Mediaglobe, Deliverable-1.1 Report 2010.
  • 11. Die ursprüngliche Idee: ■ Vernetzung von Filmkollektionen mit Hilfe von Klassifikationen & Thesauri Kulturelles Filmerbe in Deutschland > 1000 collections > 1.200 film Kollektionen* Kleine Vokabulare werden oft nicht need connections > 200 Institutionen mit mehr als 100h gemappt, obwohl das nützlich für die Filmmaterial** Contentaggregation wäre. ~ 83% planen Digitalisierung, EU-Förderprogramme *) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. Bundesrepublik Deutschland. Koblen 10 / 27 **) Mediaglobe, Deliverable-1.1 Report 2010.
  • 12. Die ursprüngliche Idee: ■ Vernetzung von Filmkollektionen mit Hilfe von Klassifikationen & Thesauri Kulturelles Filmerbe in Deutschland > 1000 collections > 1.200 film Kollektionen* Kleine Vokabulare werden oft nicht need connections > 200 Institutionen mit mehr als 100h gemappt, obwohl das nützlich für die Filmmaterial** Contentaggregation wäre. ~ 83% planen Digitalisierung, EU-Förderprogramme zu "kleinen" Vokabularen zählen auch: - Tags in Social Media Services: Delicious, Zotero, Bibsonomy... - Ordnerstruktur z.B. im Intranet - ... *) Bockhorn, V; Morsbach; Ronneburg, S; Schmidt, W. (1996). Topographie audiovisueller Quellenüberlieferung - Film- und Videobestände in Archiven und archivischen Einrichtungen in der Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. Bundesrepublik Deutschland. Koblen 10 / 27 **) Mediaglobe, Deliverable-1.1 Report 2010.
  • 13. Cross-Recherche ist bereits möglich... OPAC xy Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 11 / 27
  • 14. Cross-Recherche ist bereits möglich... Keine (selten) Serviceübergreifende Recherche bzw. Integration der Ergebnisse OPAC xy Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 11 / 27
  • 15. Cross-Recherche ist bereits möglich... Austausch nutzergenerierter Kommentare Metadaten, thematisch verwandter Kommentare Tags Tags Objekte findet nicht statt. Ratings Ratings Keine (selten) Serviceübergreifende Recherche bzw. Integration der Ergebnisse OPAC xy Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 11 / 27
  • 16. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 17. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Person :Annotation :Ereignis :Begriff :Zeitraum Notation Definition prefLabel :Ort altLabel Thema A annotiert hat A Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 18. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Ereignis :Person :Annotation :Ereignis :Person :Zeitraum :Zeitraum :Begriff :Begriff Notation Definition prefLabel :Ort :Ort altLabel Thema A Thema B annotiert annotiert hat A B hat Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 19. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Ereignis :Person :Annotation :Ereignis :Person :Zeitraum :Zeitraum :Begriff :Begriff Notation Definition prefLabel :Ort :Ort altLabel Thema A Thema B annotiert annotiert hat A B hat ?! Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 20. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Ereignis :Person :Annotation :Ereignis :Person :Zeitraum :Zeitraum :Begriff :Begriff Notation Definition prefLabel :Ort :Ort altLabel Thema A Thema B annotiert annotiert hat A B hat ?! ?! Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 21. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Ereignis owl:sameAs :Person :Annotation :Ereignis :Person :Zeitraum :Zeitraum :Begriff :Begriff Notation Definition prefLabel :Ort :Ort altLabel Thema A Thema B annotiert annotiert hat A B hat ?! ?! Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 22. Was wird benötigt? Der Lösungsvorschlag: Cross-Recherche mit individuellen Begriffsmodellen (thematisch) :Ereignis owl:sameAs :Person :Annotation :Ereignis :Person :Zeitraum skos:narrowMatch :Zeitraum :Begriff :Begriff Notation Definition prefLabel :Ort :Ort altLabel Thema A Thema B annotiert annotiert hat A B hat ?! ?! Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 12 / 27
  • 23. Eigene Matchings Herstellen? Ansätze für automatische Integration von Ontologien/KOS Matching-Strategien ■ lexikalisch ■ strukturell > 1000 collections adasdsdf need connections ■ semantisch Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 13 / 27
  • 24. Eigene Matchings Herstellen? Ansätze für automatische Integration von Ontologien/KOS Matching-Strategien ■ lexikalisch ■ strukturell > 1000 collections adasdsdf need connections ■ semantisch ■ >50 Algorithmen und Tools (Nguyen2011) ■ einige Frameworks und Editoren mit Mapping Funktion FOAM, COMA++, MAFRA, Alignment API, Web Service Modelling Toolkit (WSMT), NeOn, Protegé PROMT, Chimera, Google Refine... Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 13 / 27
  • 25. Eigene Matchings Herstellen? Ansätze für automatische Integration von Ontologien/KOS Matching-Strategien ■ lexikalisch ■ strukturell Klassische R/P Evaluation der Matching- > 1000 collections Qualität erfordert eine Ground Truth. adasdsdf need connections ■ semantisch Relationen sind (oft) eine individuelle Entscheidung! ■ >50 Algorithmen und Tools (Nguyen2011) ■ einige Frameworks und Editoren mit Mapping Funktion FOAM, COMA++, MAFRA, Alignment API, Web Service Modelling Toolkit (WSMT), NeOn, Protegé PROMT, Chimera, Google Refine... Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 13 / 27
  • 26. Zwischenstand: aktuelle Problemfelder u. Ziele Kleine KOS sind nicht interoperabel und nachnutzbar vernetzt ■ Ziel: Crossrecherche, Empfehlungen, kollaborative Terminologiepflege Automatische (lexikalische, strukturelle, semantische) matching- Verfahren benötigen einen Gold Standard. ■ Ziel: Goldstandards für evaluation Terminologiemapping bereitstellen. Matchings zwischen KOS sind aufwändig und die Ergebnisse sind schwer zugänglich. ■ Ziel: Matchings nachnutzbar publizieren, Nutzung erleichtern Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 14 / 27
  • 27. Forschungsfragen ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das ggf. nicht sinnvoll? ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer Workflow aus? Wie können Verknüpfungen effizient erstellt und gepflegt werden? ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen interoperabel publizieren und effizient nutzen? ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem Arbeiten messen? Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 15 / 27
  • 28. Forschungsfragen ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das ggf. nicht sinnvoll? ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer Workflow aus? Wie können Verknüpfungen effizient erstellt und gepflegt werden? ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen interoperabel publizieren und effizient nutzen? ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem Arbeiten messen? Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 16 / 27
  • 29. Wem nützt ein thematischer Zugang? Wissensintensive Berufsfelder mit interdisziplinärem Bezug: Wissenschaftler, Journalisten, Kreative Berufe, Sozialarbeiter, Politik... ■ => interdisziplinärer Zugang gilt als "kreativitätsfördernd"... Szenarien: ■ Ein Student schreibt eine Hausarbeit und sucht nach Studenten, die ähnliche Themen bearbeiten. ■ Ein Terminologiemanager/Dokumentar möchte neue verwandte Begriffe in seinen Thesaurus einpflegen. ■ Ein Journalist definiert einen Interessensbereich und nutzt das Modell für die Aggregation und Ranking von Quellen. Wem nützt es nicht: ■ Softwareherstellern, ■ bestimmte Disziplinen, ■ ... Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 17 / 27
  • 30. Forschungsfragen ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das ggf. nicht sinnvoll? ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer Workflow aus? Wie können Verknüpfungen effizient erstellt und gepflegt werden? ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen interoperabel publizieren und effizient nutzen? ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem Arbeiten messen? Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 18 / 27
  • 31. Motivation und Barrieren zur Verwendung nutzergenerierter Metadaten >> Perspektive der Einrichtungen http://en.wikipedia.org/wiki/File:Melk_-_Abbey_-_Library.jpg Motivation Barrieren P • Enger Kontakt zu den Nutzern • Keine personellen und finanziellen Reserven • Publicity und Nutzerzufriedenheit • unklares Kosten-Nutzenverhältnis durch neue Funktionen • Unterstützung durch Nutzer (z.B. Hilfe • Rechtliche Unsicherheiten, z.B. in bei Korrektur von Metadaten) Bezug auf Datenschutz Johannes Hercher, Marcel Ruhl, Harald Sack: Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Frankfurt a. M., Mar. 22.-23., 2012, Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt. Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 19 / 27
  • 32. Motivation und Barrieren zur Verwendung nutzergenerierter Metadaten >> Perspektive der Benutzer Motivation Barrieren • Spaßfaktor & gute Usability • schlechte Usability • Kommunikation mit Gleichgesinnten. • Community zu klein • Persönlicher Vorteil / Arbeitserleichterung • Bedenken z. Datenschutz / Reputation. Johannes Hercher, Marcel Ruhl, Harald Sack: Quo vadis nutzergenerierte Metadaten? In Social Media and Web Science, 2. DGI Konferenz, 64. Jahrestagung der DGI, Frankfurt a. M., Mar. 22.-23., 2012, Düsseldorf, Germany Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis, Frankfurt. Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 20 / 27
  • 33. Workflow Manage: KOS-Ingest: update & Skosify complement provide Evaluate: Use: alignments discuss & Annotate & select Search w/ alignments Linked Data Aggregate & Align: Collaborative Matching match Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. / 27
  • 34. Forschungsfragen ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das ggf. nicht sinnvoll? ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer Workflow aus? Wie können Verknüpfungen effizient erstellt und gepflegt werden? ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen interoperabel publizieren und effizient nutzen? ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem Arbeiten messen? Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 22 / 27
  • 35. Eine Ontologie zur Publikation von Alignments Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 23 / 27
  • 36. Forschungsfragen ■ HINTERGRUND: Welche Zielgruppen profitieren von Vokabular Mapping bzw. einem interdisziplinäreren Wissenszugang? Wo ist das ggf. nicht sinnvoll? ■ KONZEPT: Was sind Anforderungen und die Erfolgsfaktoren für ein Crowdsourcing der Terminologiearbeit? Wie sieht ein idealer Workflow aus? Wie können Verknüpfungen effizient erstellt und gepflegt werden? ■ NUTZUNG: Wie lassen sich Terminologie-Konkordanzen interoperabel publizieren und effizient nutzen? ■ EVALUATION: Wie lässt sich der Erfolg von interdisziplinärem Arbeiten messen? Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 24 / 27
  • 37. Überlegungen zur Evaluation ■ Hier sind noch Ideen gefragt: ■ ... Service wird genutzt ■ ... beschränken sich die Verknüpfungen auf bestimmte Disziplinen? ■ ... Übereinstimmung mit automatischen Verfahren? ■ ... Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 25 / 27
  • 38. Nächste Schritte ■ Plattform auf der Vokabulare publiziert werden, ■ Nutzer (Einrichtungen/Forscher) zur Publikation motivieren ■ Annotation mit diversen Vokabularen ermöglichen ■ Vokabular Matchings für Nutzer vorschlagen u. validieren lassen ■ Matchings für Wissensexploration nutzen Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 26 / 27
  • 39. Johannes Hercher mail@jhercher.de http://johannes.jhercher.de @jhercher ank für iele n D mk eit! V mer ksa re A uf Ih Johannes Hercher: Thematische Vernetzung heterogener Informationsbestände, DIPF Workshop, 8.06.12 Berlin. 27 / 27