SlideShare ist ein Scribd-Unternehmen logo
Integration von Normdaten in
Bibliotheksanwendungen auf der Basis
von Webservices mit Semantic Web-
Technologie
Dr. Timo Borst

IT-Entwicklung
Deutsche Zentralbibliothek für Wirtschaftswissenschaften /
Leibniz-Informationszentrum Wirtschaft
Kiel/Hamburg

I-KNOW Praxisforum
1.-3. September 2010 in Graz

                                            Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Übersicht
1. Ausgangslage: Verteiltes Datenmanagement in
   Bibliotheksanswendungen

2. Bisherige Ansätze zur Aggregierung und Homogenisierung

3. Integration und Aggregation von Normdaten auf der Basis von
   Semantic Web-Technologien
         a) Grundidee
         b) Anwendungsfall_1: Verschlagwortung
         c) Anwendungsfall_2: Suche
         d) Anwendungsfall_3: Erfassung von Autoren

4. “Leichtgewichtige” Integration in bestehende Systeme

5. Zusammenfassung und Fazit

                                                                 Seite 2
Ausgangslage
•   Klassische Bibliotheksanwendungen erzeugen und verwalten
    jeweils idiosynkratische (Meta-)Datenbestände (“Datensilos”)…

•   …die dann im Web über jeweils eigene Frontends verfügbar
    gemacht werden

•   Wie können hinsichtlich

     •   Formate
     •   Schemata
     •   Vokabulare zur Erschließung
     •   Erschließungsregeln
     •   Vollständigkeit (Abstract ja/nein)
     •   Herkunft

    prinzipiell heterogene Metadaten zueinander in Beziehung
    gesetzt werden?
                                                                Seite 3
Ausgangslage

Beispiel Repositorien und ihre Vernetzung
•   Repositorien sind allgemein genutzte Erfassungs-/Retrieval-
    /Verbreitungssysteme („Data Provider“), zumeist OSS und Community-
    getrieben
•   Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren
•   Vernetzungsinitiativen, z.B. OA-Netzwerk
•   „OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI-
    zertifizierten Repositorien bereit […] u.a. vorgesehen: Aggregation,
    Harmonisierung und Ähnlichkeitsanalyse“
    http://www.dini.de/fileadmin/workshops/oa-statistik-was-zaehlt/02_gerlach-
    oas.pdf
•   Einschlägige OSS-Repositoriensoftware (DSpace, EPrints, OPUS)
    unterstützt derzeit noch nicht die Integration extern kontrollierter Normdaten

                                                                             Seite 4
Ausgangslage
„The major difficulty we have found is with DSpace’s handling of
metadata. While we feel that the number of fields in Dublin Core is
adequate for most if not all uses (DCMI Usage Board 2006), we are
troubled by the lack of authority control when completing its fields.
Without some control over uniform titles, authors and subjects
accessing the items in the future will very problematic.“
S. Chabot (http://subjectobject.net/2006/11/09/the-dspace-digital-
repository-a-project-analysis/)
       „Neither the standards nor the software unterlying
      institutional repositories anticipated performing naming
      authority control on widely disparate metadata from
      highly unreliable sources.“
      D. Salo (http://minds.wisconsin.edu/handle/1793/31735)


                                                                     Seite 5
Ausgangslage

Typische Mängel
•   Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber,
    Dokumenttypen etc.) werden ohne semantische und syntaktische
    Anleitungen und Restriktionen teilweise im Freitext erfasst
•   (Syntaktische) Suchen liefern nur eingeschränkte oder uneindeutige
    Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse
    (Trunkierung etc.) (Suche nach „Abbott, Philip“ liefert nur Treffer für Nr.
    2/3)
•   Namensänderungen sind praktisch nicht nachvollziehbar
•   Selbst wenn syntaktische und semantische Eindeutigkeit in einem
    Repository lokal erzielt werden können, erneuert und verschärft sich das
    Problem auf Seiten der Aggregatoren




                                                                             Seite 6
Bisherige Ansätze zur Aggregierung &
Homogenisierung




                                                                                Seite 7
   http://www.economistsonline.org/publications?page=3&q=thys-clement&lang=de
Bisherige Ansätze zur Aggregierung &
Homogenisierung




                                       Seite 8
Bisherige Lösungsansätze zur Aggregierung &
Homogenisierung
Homogenisierung im Vorhinein
• Festlegung eines relativ granularen Metadatenschemas
• Möglichst verbindliches und explizites Regelwerk, das auch von allen
  Beteiligten konsequent befolgt wird
• Verwendung einheitlicher Namen + Vokabulare
• Lokale Anpassungen
• Zentrales Harvesting bei minimierter Datenaufbereitung
Homogenisierung im Nachhinein
• Beibehaltung der lokalen Ausprägungen bei kleinstem gemeinsamen
  Nenner (etwa “Dublin Core”-Elemente)
• Nachträgliche Maßnahmen zur Homogenisierung, u.a. “Name
  Disambiguation”
• Zentrales Harvesting bei aufwändiger Datenaufbereitung
Beide Ansätze sind nicht optimal!

                                                                Seite 9
Integration und Aggregation von Normdaten -
Grundidee




                                              Seite 10
Integration und Aggregation von Normdaten -
Idee
Beispieldaten und -anfragen (zu Personen und Themen):




http://zbw.eu/beta/stw-ws/suggest?query=finanzkr
…liefert alle Terme, die mit “finanzkr” beginnen

http://zbw.eu/beta/stw-ws/stw-ws-wrapper.php?service=labels&
concept=http://zbw.eu/stw/descriptor/19664-4&lang=en
…liefert alle englischen Synonyme zu “Finanzkrise:

                                                               Seite 11
Anwendungsfall_1: Verschlagwortung mit
Normdaten
• DER Anwendungsfall für Bibliothekarinnen und Bibliothekare
• Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen (?)
    + BibliotheksnutzerInnen (?)
•   Vorgang: Eingabe von beschreibenden Metadaten, die häufig aus einem
    kontrollierten Vokabular stammen
•   Crosskonkordanzen herstellen zwischen verschiedenen kontrollierten
    Vokabularen
•   Bestandteil von Open Access relevanten Vorgängen wie das „self-publishing“,
    das „self-archiving“ oder das „social tagging“
•   Zielstellung: Den Vorgang der Verschlagwortung mit Hilfe von kontrollierten
    Vokabularen und Webservices unterstützen, so dass man einerseits zu
    „besseren“ im Sinne von normierten Metadaten kommt, die andererseits aber
    auch Flexibilität im Rahmen eines KOS erlauben („Lokalisierung“):
      • Alternative Schreibweisen bei Namen
      • Synonyme sowie Ober-/Unterbegriffe bei Schlagworten
                                                                       Seite 12
Anwendungsfall_1: Verschlagwortung

Erfassungsmaske unter https://econstor.eu




                                            Seite 13
Anwendungsfall_1: Verschlagwortung
Erfassungsmaske unter https://econstor.eu




                                            Seite 14
Anwendungsfall_2: Suche
•   Der häufigste Anwendungsfall in Bibliotheksanwendungen
•   Nutzergruppen: Bibliothekarinnen und Bibliothekare +
    WissenschaftlerInnen + BibliotheksnutzerInnen
•   Vorgang: Zumeist einfache Volltextsuche über
    Metadatenfelder (Titel/Abstract) und/oder Volltexte (soweit
    letztere verfügbar sind und im Suchmaschinenindex liegen)
•   Zielstellung: Den Vorgang der Suche mit Hilfe von
    kontrollierten Vokabularen und Webservices unterstützen,
    so so dass man zu besseren Suchergebnissen gelangt
    (Erhöhung von Recall + Precision)



                                                            Seite 15
Anwendungsfall_2: Suche

Erweiterte Suche unter http://econstor.eu nach „Finanzkrise“




                                                               Seite 16
Anwendungsfall_2: Suche




                          Seite 17
Anwendungsfall_2: Suche




                          Seite 18
“Leichtgewichtige” Integration in bestehende Systeme




                                                Seite 19
“Leichtgewichtige” Integration in bestehende Systeme

Vorteile
•   „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme

•   Strategie des „minimalen Eingriffs“

•   Keine Änderungen am Systemkern, minimale Änderungen am
    Datenmodell nötig (Erweiterung um eine Spalte für den Authority-Key)

•   Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise
    zwanglos erweitern ließen:
    •   Repositorien (zumeist OSS, Plugin-Architektur)
    •   Kataloge (zumeist proprietäre SW und monolithisch)
    •   Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) ->
        WebService zur Verbesserung des Retrievals und zur Erzeugung von Mash-
        Ups
    •   …sowie alle offenen Systeme mit kollaborativ-verteilter Verschlagwortung
        (z.B. Academic Linkshare)

                                                                                     Seite 20
Zusammenfassung und Fazit
• Bibliotheksanwendungen erzeugen und verwalten jeweils eigene
  idiosynkratische Datenbestände.
• Dies erschwert die Pflege, den Austausch, die Aggregation und die
  Homogenisierung der (Meta-)Daten für erweiterte Dienste.
• Vorgelagerte Webservices als Teil einer übergreifenden Normdaten-
  Infrastruktur können frühzeitig zur Homogenisierung der Metadaten
  beitragen (bei gleichzeitiger Lokalisierung).
• Wenn diese Webservices verbreitet entstehen und genutzt werden,
  besteht die Chance zu einer weitergehenden Vernetzung lokal
  gepflegter Metadaten bei gleichzeitiger Verbesserung der
  datenbasierten Services.
• Die Möglichkeit zur „leichtgewichtigen Integration“ ist ein Angebot an
  Betreiber von Bibliotheksanwendungen, diese Webservices mit
  möglichst minimalem Aufwand in ihre Anwendungen zu integrieren.
                                                                   Seite 21
Vielen Dank!


Dr. Timo Borst
Deutsche Zentralbibliothek für
Wirtschaftswissenschaften /
Leibniz-Informationszentrum
Wirtschaft (ZBW)

t.borst@zbw.eu



                                 Seite 22
Anwendungsfall_3: Erfassung von Autoren


  •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher
  der Ausnahmefall
  •Nutzergruppen: BibliothekarInnen + WissenschaftlerInnen (?) +
  BibliotheksnutzerInnen (?)
  •Vorgang: Eingabe von AutorInnen-Namen
  •Zielstellung: Den Vorgang der Autorenerfassung mit Hilfe von
  Normdaten zu verbessern, die durch Webservices bereit gestellt werden




                                                                          Seite 23
Anwendungsfall_3: Erfassung von Autoren
•Erfassungsmaske unter http://87.106.250.18/beta/econstor/




                                                             Seite 24
Bisherige Lösungsansätze zur Aggregierung &
Homogenisierung
  •Metadatensuche durch Aggregatoren
  •     Parallele Abfrage entfernt-verteilter Systeme
  •     Rückgabe und Aufbereitung des Suchergebnisses als
        zusammengesetzte Trefferliste
  •Harvesting
  •     Regelmäßiges Einsammeln von entfernt-verteilten
        Metadaten
  •     Homogenisierung ex ante oder ex post
  •Föderierte Suche
  •…

                                                            Seite 25
•[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_Values
Literatur
  •[2] http://minds.wisconsin.edu/handle/1793/31735
   •[3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3
   •[4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/
   •[5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn
   •[6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma-199/PDF/subirats.pdf
   •[7] http://www.jisc.ac.uk/media/documents/programmes/sharedservices/na
   mes-phase-one-final-report,.pdf
   •[8] http://idea.library.drexel.edu/bitstream/1860/3173/1/20070051011.pdf
   •[9] http://ptsefton.com/blog/2006/06/06/the_affiliation_issue_in
   _institutional_repository_software/
   •[10] http://library.ust.hk/info/nac/nac-technical.html
   •[11] http://www.seco.tkk.fi/publications/2009/kurki-hyvonen-onki-people-2009.pdf
   •[12] http://journals.sfu.ca/archivar/index.php/archivaria/article/download/11883/12836
   •[13] http://www.dini.de/fileadmin/workshops/oa-netzwerk-
   juni2009/vernetzungstage_2009_malitz.pdf




                                                                                    Seite 26

Weitere ähnliche Inhalte

Was ist angesagt?

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Felix Lohmeier
 
Infotreff: Persistent Identifier
Infotreff: Persistent IdentifierInfotreff: Persistent Identifier
Infotreff: Persistent Identifier
Pascal-Nicolas Becker
 
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
GESIS - Leibniz-Institut für Sozialwissenschaften
 
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
TIB Hannover
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
kostaedt
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Felix Lohmeier
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
Ralf Toepfer
 
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
intranda GmbH
 
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Matti Stöhr
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
Frauke Ziedorn
 
Forschungsdaten und DSpace
Forschungsdaten und DSpaceForschungsdaten und DSpace
Forschungsdaten und DSpace
Pascal-Nicolas Becker
 
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Martin Blenkle
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
Pascal-Nicolas Becker
 
Grundformen Digitaler Bibliotheken
Grundformen Digitaler BibliothekenGrundformen Digitaler Bibliotheken
Grundformen Digitaler Bibliotheken
Jakob .
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
Alexander Haffner
 
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Matti Stöhr
 
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
Pascal-Nicolas Becker
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
Martin Blenkle
 

Was ist angesagt? (20)

Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
Campus Community / Institutionelle Virtuelle Forschungsumgebung. Eine Aufgabe...
 
Literaturverwaltung & Bibliotheken - Das zentrale Portal für Informationen ...
Literaturverwaltung & Bibliotheken  - Das zentrale Portal  für Informationen ...Literaturverwaltung & Bibliotheken  - Das zentrale Portal  für Informationen ...
Literaturverwaltung & Bibliotheken - Das zentrale Portal für Informationen ...
 
Infotreff: Persistent Identifier
Infotreff: Persistent IdentifierInfotreff: Persistent Identifier
Infotreff: Persistent Identifier
 
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...
Anforderungen an bibliographische Datenbanken in Hinblick auf szientometrisch...
 
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
 
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
Der Bibliothekskatalog als offene Plattform im Web - und als Werkzeug des per...
 
Semantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktischSemantic Web in Bibliotheken mal praktisch
Semantic Web in Bibliotheken mal praktisch
 
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
Fachreferat 3.0 - mit Campus Communities den Forschungsdiskurs auf digitaler ...
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
 
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
3. intranda viewer Tag: Digitale Langzeitarchivierung an der TIB
 
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
Jenseits von Campuslizenzen - bibliothekarische Services für alternative Lite...
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
 
Forschungsdaten und DSpace
Forschungsdaten und DSpaceForschungsdaten und DSpace
Forschungsdaten und DSpace
 
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
 
Grundformen Digitaler Bibliotheken
Grundformen Digitaler BibliothekenGrundformen Digitaler Bibliotheken
Grundformen Digitaler Bibliotheken
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
 
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
Mehr als Citavi-Schulung und EndNote-Campuslizenz. Über die Vielfalt biblioth...
 
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
 
Die Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten GenerationDie Zukunft der Portale - Kataloge der nächsten Generation
Die Zukunft der Portale - Kataloge der nächsten Generation
 

Andere mochten auch

Dios habla-con-las-personas
Dios habla-con-las-personasDios habla-con-las-personas
Dios habla-con-las-personas
Parroquia La Purisima
 
Avis Kustom Store Motorcycles sur les bagages
Avis Kustom Store Motorcycles sur les bagagesAvis Kustom Store Motorcycles sur les bagages
Avis Kustom Store Motorcycles sur les bagages
Kustom Store Motorcycles
 
Asincar
AsincarAsincar
Asincar
Jesús Amor
 
Introducción
IntroducciónIntroducción
Introducción
gonzalvo2
 
Tic`s
Tic`sTic`s
Microsoft powert point
Microsoft powert point Microsoft powert point
Microsoft powert point
alexaaguilar
 
Les Llengües a Europa
Les Llengües a EuropaLes Llengües a Europa
Les Llengües a Europa
ciclesuperiorlaroda
 
Anamariamatute
AnamariamatuteAnamariamatute
Anamariamatute
anamartinezponteareas
 
Donde nació el fast45
Donde nació el fast45Donde nació el fast45
Donde nació el fast45
guitarisk
 
Brand kpi 5 - extra light sans club des annonceurs
Brand kpi   5 - extra light sans club des annonceursBrand kpi   5 - extra light sans club des annonceurs
Brand kpi 5 - extra light sans club des annonceurs
yves Simeon
 
Te, amo
Te, amoTe, amo
Te, amo
VeRe Nice
 
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
Estudio de caso: Área Vitivinicola Norte de Mendoza, ArgentinaEstudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
ConectaDEL
 
Primera reunion consejo conectaDEL 10 dic. 2010
Primera reunion consejo conectaDEL 10 dic. 2010 Primera reunion consejo conectaDEL 10 dic. 2010
Primera reunion consejo conectaDEL 10 dic. 2010
ConectaDEL
 
Presentacion 1
Presentacion 1Presentacion 1
Presentacion 1
Max LV
 
Poliedros
PoliedrosPoliedros
Poliedros
Lucila Paz
 
Primera reunion seminario
Primera reunion seminarioPrimera reunion seminario
Primera reunion seminario
ultrapegaso
 
Instalación lion
Instalación lionInstalación lion
Instalación lion
Gabriel Flores
 
espanol
espanolespanol
espanol
brendaykarla
 
Geogebra carlangas
Geogebra carlangasGeogebra carlangas
Geogebra carlangas
Carlangas Samaniego
 
Lazarillo
LazarilloLazarillo
Lazarillo
alex949
 

Andere mochten auch (20)

Dios habla-con-las-personas
Dios habla-con-las-personasDios habla-con-las-personas
Dios habla-con-las-personas
 
Avis Kustom Store Motorcycles sur les bagages
Avis Kustom Store Motorcycles sur les bagagesAvis Kustom Store Motorcycles sur les bagages
Avis Kustom Store Motorcycles sur les bagages
 
Asincar
AsincarAsincar
Asincar
 
Introducción
IntroducciónIntroducción
Introducción
 
Tic`s
Tic`sTic`s
Tic`s
 
Microsoft powert point
Microsoft powert point Microsoft powert point
Microsoft powert point
 
Les Llengües a Europa
Les Llengües a EuropaLes Llengües a Europa
Les Llengües a Europa
 
Anamariamatute
AnamariamatuteAnamariamatute
Anamariamatute
 
Donde nació el fast45
Donde nació el fast45Donde nació el fast45
Donde nació el fast45
 
Brand kpi 5 - extra light sans club des annonceurs
Brand kpi   5 - extra light sans club des annonceursBrand kpi   5 - extra light sans club des annonceurs
Brand kpi 5 - extra light sans club des annonceurs
 
Te, amo
Te, amoTe, amo
Te, amo
 
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
Estudio de caso: Área Vitivinicola Norte de Mendoza, ArgentinaEstudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
Estudio de caso: Área Vitivinicola Norte de Mendoza, Argentina
 
Primera reunion consejo conectaDEL 10 dic. 2010
Primera reunion consejo conectaDEL 10 dic. 2010 Primera reunion consejo conectaDEL 10 dic. 2010
Primera reunion consejo conectaDEL 10 dic. 2010
 
Presentacion 1
Presentacion 1Presentacion 1
Presentacion 1
 
Poliedros
PoliedrosPoliedros
Poliedros
 
Primera reunion seminario
Primera reunion seminarioPrimera reunion seminario
Primera reunion seminario
 
Instalación lion
Instalación lionInstalación lion
Instalación lion
 
espanol
espanolespanol
espanol
 
Geogebra carlangas
Geogebra carlangasGeogebra carlangas
Geogebra carlangas
 
Lazarillo
LazarilloLazarillo
Lazarillo
 

Ähnlich wie Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
TIB Hannover
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
redsys
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
Universitätsbibliothek der Technischen Universität Berlin
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
Joachim Neubert
 
Entscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic WebEntscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic Web
Wirtschaftsinformatik an der TU Chemnitz
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
Björn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
LydiaU
 
Einführung in die Literaturverwaltung
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die Literaturverwaltung
TIB Hannover
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
Stefan Buddenbohm
 
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Thomas Koch
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
GESIS
 
schema.org und Bibliotheken
schema.org und Bibliothekenschema.org und Bibliotheken
schema.org und Bibliotheken
Adrian Pohl
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Katrin Weller
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
Staatsbibliothek zu Berlin
 
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
K15t
 
Anforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein AusblickAnforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein Ausblick
guest32606b
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
kostaedt
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
ETH-Bibliothek
 

Ähnlich wie Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices (20)

Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
 
Repositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellenRepositorieninhalte als LinkedData bereitstellen
Repositorieninhalte als LinkedData bereitstellen
 
Anforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic WebAnforderungen an Thesauri im Semantic Web
Anforderungen an Thesauri im Semantic Web
 
Entscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic WebEntscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic Web
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Einführung in die Literaturverwaltung
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die Literaturverwaltung
 
Von der Sammlung gedruckter Statistiken zum Datenrepository
Von der Sammlung gedruckter Statistiken zum DatenrepositoryVon der Sammlung gedruckter Statistiken zum Datenrepository
Von der Sammlung gedruckter Statistiken zum Datenrepository
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
Offenes kollaboratives Schreiben: Eine „Open Science“-Infrastruktur am Beispi...
 
schema.org und Bibliotheken
schema.org und Bibliothekenschema.org und Bibliotheken
schema.org und Bibliotheken
 
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
 
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
Mythos und Wahrheit: Wikis für die Technische Dokumentation at tekom-Regional...
 
Anforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein AusblickAnforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein Ausblick
 
2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data2013-10-10 Semantic Web und (Linked) Open Data
2013-10-10 Semantic Web und (Linked) Open Data
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
 

Kürzlich hochgeladen

Lehramt an der Universität Duisburg Essen
Lehramt an der Universität Duisburg EssenLehramt an der Universität Duisburg Essen
Lehramt an der Universität Duisburg Essen
Team Studienorientierung (Universität Duisburg-Essen)
 
Das Biologiestudium an der Universität Duisburg-Essen
Das Biologiestudium an der Universität Duisburg-EssenDas Biologiestudium an der Universität Duisburg-Essen
Das Biologiestudium an der Universität Duisburg-Essen
Team Studienorientierung (Universität Duisburg-Essen)
 
Psychologie an der Universität Duisburg-Essen
Psychologie an der Universität Duisburg-EssenPsychologie an der Universität Duisburg-Essen
Psychologie an der Universität Duisburg-Essen
Team Studienorientierung (Universität Duisburg-Essen)
 
Unterrichten der Programmierung 📚 Python 🐍
Unterrichten der Programmierung 📚 Python 🐍Unterrichten der Programmierung 📚 Python 🐍
Unterrichten der Programmierung 📚 Python 🐍
Miguel Delamontagne
 
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
kylerkelson6767
 
Microsoft Roadshow Stuttgart AI-Presentation Wurzer
Microsoft Roadshow Stuttgart AI-Presentation WurzerMicrosoft Roadshow Stuttgart AI-Presentation Wurzer
Microsoft Roadshow Stuttgart AI-Presentation Wurzer
MIPLM
 
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
Wolfgang Geiler
 
Medizin an der Universität Duisburg - Essen
Medizin an der Universität Duisburg - EssenMedizin an der Universität Duisburg - Essen
Medizin an der Universität Duisburg - Essen
Team Studienorientierung (Universität Duisburg-Essen)
 

Kürzlich hochgeladen (8)

Lehramt an der Universität Duisburg Essen
Lehramt an der Universität Duisburg EssenLehramt an der Universität Duisburg Essen
Lehramt an der Universität Duisburg Essen
 
Das Biologiestudium an der Universität Duisburg-Essen
Das Biologiestudium an der Universität Duisburg-EssenDas Biologiestudium an der Universität Duisburg-Essen
Das Biologiestudium an der Universität Duisburg-Essen
 
Psychologie an der Universität Duisburg-Essen
Psychologie an der Universität Duisburg-EssenPsychologie an der Universität Duisburg-Essen
Psychologie an der Universität Duisburg-Essen
 
Unterrichten der Programmierung 📚 Python 🐍
Unterrichten der Programmierung 📚 Python 🐍Unterrichten der Programmierung 📚 Python 🐍
Unterrichten der Programmierung 📚 Python 🐍
 
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
Abortion Pills In Dubai☎️ "+971)555095267 " to buy abortion pills in Dubai, A...
 
Microsoft Roadshow Stuttgart AI-Presentation Wurzer
Microsoft Roadshow Stuttgart AI-Presentation WurzerMicrosoft Roadshow Stuttgart AI-Presentation Wurzer
Microsoft Roadshow Stuttgart AI-Presentation Wurzer
 
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
Klimaabkühlung durch die CO2 Kanone, Konvektionskreislauf,Klimaabkühlung stat...
 
Medizin an der Universität Duisburg - Essen
Medizin an der Universität Duisburg - EssenMedizin an der Universität Duisburg - Essen
Medizin an der Universität Duisburg - Essen
 

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semantic Webservices

  • 1. Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Webservices mit Semantic Web- Technologie Dr. Timo Borst IT-Entwicklung Deutsche Zentralbibliothek für Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft Kiel/Hamburg I-KNOW Praxisforum 1.-3. September 2010 in Graz Die ZBW ist Mitglied der Leibniz-Gemeinschaft
  • 2. Übersicht 1. Ausgangslage: Verteiltes Datenmanagement in Bibliotheksanswendungen 2. Bisherige Ansätze zur Aggregierung und Homogenisierung 3. Integration und Aggregation von Normdaten auf der Basis von Semantic Web-Technologien a) Grundidee b) Anwendungsfall_1: Verschlagwortung c) Anwendungsfall_2: Suche d) Anwendungsfall_3: Erfassung von Autoren 4. “Leichtgewichtige” Integration in bestehende Systeme 5. Zusammenfassung und Fazit Seite 2
  • 3. Ausgangslage • Klassische Bibliotheksanwendungen erzeugen und verwalten jeweils idiosynkratische (Meta-)Datenbestände (“Datensilos”)… • …die dann im Web über jeweils eigene Frontends verfügbar gemacht werden • Wie können hinsichtlich • Formate • Schemata • Vokabulare zur Erschließung • Erschließungsregeln • Vollständigkeit (Abstract ja/nein) • Herkunft prinzipiell heterogene Metadaten zueinander in Beziehung gesetzt werden? Seite 3
  • 4. Ausgangslage Beispiel Repositorien und ihre Vernetzung • Repositorien sind allgemein genutzte Erfassungs-/Retrieval- /Verbreitungssysteme („Data Provider“), zumeist OSS und Community- getrieben • Zahlreiche Installationen an Hochschulen, Bibliotheken, Rechenzentren • Vernetzungsinitiativen, z.B. OA-Netzwerk • „OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI- zertifizierten Repositorien bereit […] u.a. vorgesehen: Aggregation, Harmonisierung und Ähnlichkeitsanalyse“ http://www.dini.de/fileadmin/workshops/oa-statistik-was-zaehlt/02_gerlach- oas.pdf • Einschlägige OSS-Repositoriensoftware (DSpace, EPrints, OPUS) unterstützt derzeit noch nicht die Integration extern kontrollierter Normdaten Seite 4
  • 5. Ausgangslage „The major difficulty we have found is with DSpace’s handling of metadata. While we feel that the number of fields in Dublin Core is adequate for most if not all uses (DCMI Usage Board 2006), we are troubled by the lack of authority control when completing its fields. Without some control over uniform titles, authors and subjects accessing the items in the future will very problematic.“ S. Chabot (http://subjectobject.net/2006/11/09/the-dspace-digital- repository-a-project-analysis/) „Neither the standards nor the software unterlying institutional repositories anticipated performing naming authority control on widely disparate metadata from highly unreliable sources.“ D. Salo (http://minds.wisconsin.edu/handle/1793/31735) Seite 5
  • 6. Ausgangslage Typische Mängel • Daten (Autorennamen, beschreibende Schlagwörter, Herausgeber, Dokumenttypen etc.) werden ohne semantische und syntaktische Anleitungen und Restriktionen teilweise im Freitext erfasst • (Syntaktische) Suchen liefern nur eingeschränkte oder uneindeutige Ergebnisse, erfordern ggf. aus Anwendersicht subtilere Suchkenntnisse (Trunkierung etc.) (Suche nach „Abbott, Philip“ liefert nur Treffer für Nr. 2/3) • Namensänderungen sind praktisch nicht nachvollziehbar • Selbst wenn syntaktische und semantische Eindeutigkeit in einem Repository lokal erzielt werden können, erneuert und verschärft sich das Problem auf Seiten der Aggregatoren Seite 6
  • 7. Bisherige Ansätze zur Aggregierung & Homogenisierung Seite 7 http://www.economistsonline.org/publications?page=3&q=thys-clement&lang=de
  • 8. Bisherige Ansätze zur Aggregierung & Homogenisierung Seite 8
  • 9. Bisherige Lösungsansätze zur Aggregierung & Homogenisierung Homogenisierung im Vorhinein • Festlegung eines relativ granularen Metadatenschemas • Möglichst verbindliches und explizites Regelwerk, das auch von allen Beteiligten konsequent befolgt wird • Verwendung einheitlicher Namen + Vokabulare • Lokale Anpassungen • Zentrales Harvesting bei minimierter Datenaufbereitung Homogenisierung im Nachhinein • Beibehaltung der lokalen Ausprägungen bei kleinstem gemeinsamen Nenner (etwa “Dublin Core”-Elemente) • Nachträgliche Maßnahmen zur Homogenisierung, u.a. “Name Disambiguation” • Zentrales Harvesting bei aufwändiger Datenaufbereitung Beide Ansätze sind nicht optimal! Seite 9
  • 10. Integration und Aggregation von Normdaten - Grundidee Seite 10
  • 11. Integration und Aggregation von Normdaten - Idee Beispieldaten und -anfragen (zu Personen und Themen): http://zbw.eu/beta/stw-ws/suggest?query=finanzkr …liefert alle Terme, die mit “finanzkr” beginnen http://zbw.eu/beta/stw-ws/stw-ws-wrapper.php?service=labels& concept=http://zbw.eu/stw/descriptor/19664-4&lang=en …liefert alle englischen Synonyme zu “Finanzkrise: Seite 11
  • 12. Anwendungsfall_1: Verschlagwortung mit Normdaten • DER Anwendungsfall für Bibliothekarinnen und Bibliothekare • Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?) • Vorgang: Eingabe von beschreibenden Metadaten, die häufig aus einem kontrollierten Vokabular stammen • Crosskonkordanzen herstellen zwischen verschiedenen kontrollierten Vokabularen • Bestandteil von Open Access relevanten Vorgängen wie das „self-publishing“, das „self-archiving“ oder das „social tagging“ • Zielstellung: Den Vorgang der Verschlagwortung mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so dass man einerseits zu „besseren“ im Sinne von normierten Metadaten kommt, die andererseits aber auch Flexibilität im Rahmen eines KOS erlauben („Lokalisierung“): • Alternative Schreibweisen bei Namen • Synonyme sowie Ober-/Unterbegriffe bei Schlagworten Seite 12
  • 15. Anwendungsfall_2: Suche • Der häufigste Anwendungsfall in Bibliotheksanwendungen • Nutzergruppen: Bibliothekarinnen und Bibliothekare + WissenschaftlerInnen + BibliotheksnutzerInnen • Vorgang: Zumeist einfache Volltextsuche über Metadatenfelder (Titel/Abstract) und/oder Volltexte (soweit letztere verfügbar sind und im Suchmaschinenindex liegen) • Zielstellung: Den Vorgang der Suche mit Hilfe von kontrollierten Vokabularen und Webservices unterstützen, so so dass man zu besseren Suchergebnissen gelangt (Erhöhung von Recall + Precision) Seite 15
  • 16. Anwendungsfall_2: Suche Erweiterte Suche unter http://econstor.eu nach „Finanzkrise“ Seite 16
  • 19. “Leichtgewichtige” Integration in bestehende Systeme Seite 19
  • 20. “Leichtgewichtige” Integration in bestehende Systeme Vorteile • „Leichtgewichtige“ Erweiterungen bestehender (Alt-)Systeme • Strategie des „minimalen Eingriffs“ • Keine Änderungen am Systemkern, minimale Änderungen am Datenmodell nötig (Erweiterung um eine Spalte für den Authority-Key) • Typen von (Web-)Bibliotheksanwendungen, die sich auf diese Weise zwanglos erweitern ließen: • Repositorien (zumeist OSS, Plugin-Architektur) • Kataloge (zumeist proprietäre SW und monolithisch) • Portale (zumeist OSS, heterogene Inhalte hinsichtlich Art und Herkunft) -> WebService zur Verbesserung des Retrievals und zur Erzeugung von Mash- Ups • …sowie alle offenen Systeme mit kollaborativ-verteilter Verschlagwortung (z.B. Academic Linkshare) Seite 20
  • 21. Zusammenfassung und Fazit • Bibliotheksanwendungen erzeugen und verwalten jeweils eigene idiosynkratische Datenbestände. • Dies erschwert die Pflege, den Austausch, die Aggregation und die Homogenisierung der (Meta-)Daten für erweiterte Dienste. • Vorgelagerte Webservices als Teil einer übergreifenden Normdaten- Infrastruktur können frühzeitig zur Homogenisierung der Metadaten beitragen (bei gleichzeitiger Lokalisierung). • Wenn diese Webservices verbreitet entstehen und genutzt werden, besteht die Chance zu einer weitergehenden Vernetzung lokal gepflegter Metadaten bei gleichzeitiger Verbesserung der datenbasierten Services. • Die Möglichkeit zur „leichtgewichtigen Integration“ ist ein Angebot an Betreiber von Bibliotheksanwendungen, diese Webservices mit möglichst minimalem Aufwand in ihre Anwendungen zu integrieren. Seite 21
  • 22. Vielen Dank! Dr. Timo Borst Deutsche Zentralbibliothek für Wirtschaftswissenschaften / Leibniz-Informationszentrum Wirtschaft (ZBW) t.borst@zbw.eu Seite 22
  • 23. Anwendungsfall_3: Erfassung von Autoren •Der Normalfall in Katalogen - in anderen Erfassungssystemen bisher der Ausnahmefall •Nutzergruppen: BibliothekarInnen + WissenschaftlerInnen (?) + BibliotheksnutzerInnen (?) •Vorgang: Eingabe von AutorInnen-Namen •Zielstellung: Den Vorgang der Autorenerfassung mit Hilfe von Normdaten zu verbessern, die durch Webservices bereit gestellt werden Seite 23
  • 24. Anwendungsfall_3: Erfassung von Autoren •Erfassungsmaske unter http://87.106.250.18/beta/econstor/ Seite 24
  • 25. Bisherige Lösungsansätze zur Aggregierung & Homogenisierung •Metadatensuche durch Aggregatoren • Parallele Abfrage entfernt-verteilter Systeme • Rückgabe und Aufbereitung des Suchergebnisses als zusammengesetzte Trefferliste •Harvesting • Regelmäßiges Einsammeln von entfernt-verteilten Metadaten • Homogenisierung ex ante oder ex post •Föderierte Suche •… Seite 25
  • 26. •[1] http://wiki.dspace.org/index.php/Authority_Control_of_Metadata_Values Literatur •[2] http://minds.wisconsin.edu/handle/1793/31735 •[3] http://dsug09.ub.gu.se/index.php/dsug/dsug09/paper/view/22/3 •[4] http://subjectobject.net/2006/11/09/the-dspace-digital-repository-a-project-analysis/ •[5] http://code.google.com/p/dspace-agrisap/wiki/ThesaurusAddOn •[6] http://edoc.hu-berlin.de/conferences/dc-2008/subirats-imma-199/PDF/subirats.pdf •[7] http://www.jisc.ac.uk/media/documents/programmes/sharedservices/na mes-phase-one-final-report,.pdf •[8] http://idea.library.drexel.edu/bitstream/1860/3173/1/20070051011.pdf •[9] http://ptsefton.com/blog/2006/06/06/the_affiliation_issue_in _institutional_repository_software/ •[10] http://library.ust.hk/info/nac/nac-technical.html •[11] http://www.seco.tkk.fi/publications/2009/kurki-hyvonen-onki-people-2009.pdf •[12] http://journals.sfu.ca/archivar/index.php/archivaria/article/download/11883/12836 •[13] http://www.dini.de/fileadmin/workshops/oa-netzwerk- juni2009/vernetzungstage_2009_malitz.pdf Seite 26