SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Downloaden Sie, um offline zu lesen
FHO Fachhochschule Ostschweiz
Herausforderungen im Management von Metadaten
Prof. Dr. Ingo Barkow
28. März 2019
Hochschule für Technik und Wirtschaft
HTW Chur
• Schweizerisches Institut für
Informationswissenschaft
• Forschungsschwerpunkt 1 –
Informationsorganisation
• Forschungsfeld Datenmanagement
Obligatorische Bündner Tourismus Folie – HTW Chur
Definition Metadaten
Arten von Metadaten
• Metadaten sind domänenspezifisch
• Metadaten bewegen sich auf verschiedenen Ebenen
• Technische Metadaten (z.B. Data Dictionary, Masterdatenbank)
• Objektbezogene Metadaten (z.B. Filetypen)
• Inhaltliche Metadaten (z.B. Variablenbeschreibungen, Annotationen)
• Prozessorientierte Metadaten (z.B. Logfiles, Dokumentation Erhebungsprozesse)
• Analysebezogen Metadaten (z.B. Analyseskripte)
• Publikationsbezogene Metadaten (z.B. Kataloge)
• Verständnis von Daten ohne Metadaten oftmals nicht möglich
• Grundlage von Datenhaltung und Archivierung
Warum Metadaten Management?
Beispiel für einen
papierbasierten Schülertest
(Kelly, 1916)
• Test verfügbar
• Instruktionen verfügbar
• Ergebnisse der Schüler als
Tabelle verfügbar
Warum Metadaten Management?
Beispiel für einen computerbasierten
Test
Microsoft Networking Exam 070-058
(1999)
- Betriebssystem nicht mehr
verfügbar (Windows für
Workgroups v3.11)
- Proprietäre Software (Polaris)
nicht mehr verfügbar
- Datenträger (QIC80 Streamer)
nicht lesbar
- Proprietäres Format für
Ergebnisdateien nicht lesbar
Metadatenmanagement
• In jedem Prozess einer Studie fallen Metadaten und Daten an (z.B. Studiendesign, Entwicklung der
Instrumente, Übersetzung, Datenerhebung, Datenanalyse)
• Für die Prozesse sind bei grösseren Projekten unterschiedliche Organisationen zuständig
• Dazu werden mitunter unterschiedliche Tools eingesetzt, die nicht zueinander kompatibel sind
• Dies führte zur Entwicklung von Lifecycle Modellen (z.B. Generic Statistical Business Process Model,
Generic Longitudinal Business Process Model), um diese Prozesse besser greifen zu können
• Die Lifecycle Modelle werden idealerweise dann in Metadatenstandards aufgegriffen
• Metadatenstandards werden dann entsprechend in Toolchains umgesetzt um die Metadaten und
Daten zwischen Tools weiterleiten zu können
• Ohne die Tradition der Metadaten und Daten sind am Ende der Kette oftmals nicht ausreichend
Inhalte vorhanden, um ein Repository betreiben zu können
• Die Metadaten werden dann von dem Archivpersonal rekonstruiert in Form von “Datenforensik”
• Idealfall – Metadaten als Beiprodukt des Survey Prozesses bzw. der Toolverwendung
Metadatenstandard für die Sozialwissenschaften – DDI Lifecycle
• Data Documentation Initiative (DDI) ist der führende quantitative Metadatenstandard für
sozialwissenschaftliche Studien
• Dokumentiert wird nicht die Filestruktur von Ergebnisdateien sondern im Falle von DDI v3.3
z.B. der Inhalt des komplettes Studienverlauf vom Design bis zur Archivierung
• Momentan pflegt die DDI Alliance drei verschiedene Ausprägungen des Standards
− DDI Codebook (aktuelle Version: 2.5) als XML Schema
− DDI Lifecycle (aktuelle Version: 3.3) als XML Schema
− DDI “Next Generation” (kommende 4.0 Version) als RDF/JSON LD
• Die meisten Organisationen verwenden inzwischen DDI Lifecycle v3.2 da mit dieser Version der
komplette Lifecycle abgebildet warden kann
DDI Lifecycle 3.3 Modell
Metadatengetriebenes Survey Management
Software: IAB Metadata Portal (TBA21)
Metadata Standard: DDI Lifecycle 3.2
Metadatengetriebener Datenerhebungsprozess (Mobil)
Software: Rogatus Survey / Aitema Mobile Client (TBA21)
Metadata Standard: DDI Lifecycle 3.2
Metadatengetriebener Publikationsprozess
Software: Invenio 0.99 (CERN)
Metadata Standards: MARC21 / DataCite
Metadatengetriebene Sekundäranalysen aus dem Repository
Software: FORSbase (FORS)
Metadata Standard: DDI Lifecycle 3.2
Problemstellungen
• Toolchains in den meisten Domänen nicht vollständig ausgeprägt
• Metadatenstandards bei Wissenschaftler*innen nicht besonders beliebt
• Oftmals Verwendung proprietärer Formate und Standards
• Umsetzung der Metadatenstandards in Tools oftmals noch nicht gegeben
• Umsetzung von Toolchains in grossen Infrastrukturprojekten welche über die Konzeptionsphase oder
erste einfache Tools nicht hinauskommen (z.B. Data Without Boundaries / EU Ebene)
Empfehlungen
• Verwendung von Tools mit Unterstützung von Metadatenstandards und offenen Schnittstellen
• Infrastrukturprojekte mit pragmatischer Umsetzung von Tools
• Umsetzung von durchgehenden Metadatenstandards innerhalb von Tools
• Einbettung der einzelnen Tools in Datenmanagementsysteme
• Verwendung archivfähiger Formate
• Etwas mehr Fokus auf Umsetzung in der IT als auf wissenschaftliche Konzepte
• Verwendung von semantischen Konzepten und Linked Open Data
• Verwendung von offenen Standards, offenen Publikationsformaten und Open Source
Haben Sie noch irgendwelche Fragen?
Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Ingo Barkow
Schweizerisches Institut für Informationswissenschaft (SII)
HTW Chur
Pulvermühlestrasse 57
CH-7000 Chur
Mailto: ingo.barkow@htwchur.ch
FHO Fachhochschule Ostschweiz

Weitere ähnliche Inhalte

Ähnlich wie Herausforderungen im Datenmanagement von Metadaten

KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickKI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
 
Learning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer TestsLearning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer Testsi_dahn
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
 
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...svlaemi
 
Metadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
Metadatenmanagement: die ETH-Bibliothek beschreitet neue WegeMetadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
Metadatenmanagement: die ETH-Bibliothek beschreitet neue WegeETH-Bibliothek
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platformredsys
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in MetadatenverwaltungOpen Data Support
 
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...Peter Schrey
 
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Thomas Koch
 
Horizon Report 2015 Library Edition
Horizon Report 2015 Library EditionHorizon Report 2015 Library Edition
Horizon Report 2015 Library EditionRudolf Mumenthaler
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesOPITZ CONSULTING Deutschland
 
Herausforderungen für (Schweizer) Bibliotheken
Herausforderungen für (Schweizer) BibliothekenHerausforderungen für (Schweizer) Bibliotheken
Herausforderungen für (Schweizer) BibliothekenRudolf Mumenthaler
 
Datenanalyse in der Praxis
Datenanalyse in der PraxisDatenanalyse in der Praxis
Datenanalyse in der PraxisYvette Teiken
 
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCommunardo GmbH
 

Ähnlich wie Herausforderungen im Datenmanagement von Metadaten (20)

KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickKI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
 
Von der Sammlung gedruckter Statistiken zum Datenrepository
Von der Sammlung gedruckter Statistiken zum DatenrepositoryVon der Sammlung gedruckter Statistiken zum Datenrepository
Von der Sammlung gedruckter Statistiken zum Datenrepository
 
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!Forschungsdaten – Nach der Publikation ist vor der Archivierung!
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
 
Learning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer TestsLearning Analytics mit Daten mathematischer Tests
Learning Analytics mit Daten mathematischer Tests
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Standards für Lehr- und Lerntechnologien - Metadaten, Inhaltsformate und Besc...
Standards für Lehr- und Lerntechnologien - Metadaten, Inhaltsformate und Besc...Standards für Lehr- und Lerntechnologien - Metadaten, Inhaltsformate und Besc...
Standards für Lehr- und Lerntechnologien - Metadaten, Inhaltsformate und Besc...
 
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
Wirtschaftswissenschaftliche Forschung replizierbarer machen. Das Projekt EDa...
 
Forschungsdaten fachspezifisch archivieren und bereitstellen
Forschungsdaten fachspezifisch archivieren und bereitstellenForschungsdaten fachspezifisch archivieren und bereitstellen
Forschungsdaten fachspezifisch archivieren und bereitstellen
 
Metadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
Metadatenmanagement: die ETH-Bibliothek beschreitet neue WegeMetadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
Metadatenmanagement: die ETH-Bibliothek beschreitet neue Wege
 
DSpace as publication platform
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in Metadatenverwaltung
 
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...
Microservice-Architektur-Prozess für Software-Plattformen und Microservice-Ec...
 
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
Wissenserschließung und –Modellierung: Ontologie vs. Volltextsuche am Beispie...
 
Entscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic WebEntscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic Web
 
Horizon Report 2015 Library Edition
Horizon Report 2015 Library EditionHorizon Report 2015 Library Edition
Horizon Report 2015 Library Edition
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
Herausforderungen für (Schweizer) Bibliotheken
Herausforderungen für (Schweizer) BibliothekenHerausforderungen für (Schweizer) Bibliotheken
Herausforderungen für (Schweizer) Bibliotheken
 
Datenanalyse in der Praxis
Datenanalyse in der PraxisDatenanalyse in der Praxis
Datenanalyse in der Praxis
 
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AGCCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
CCD 2012: Wissensmanagement @MPS - Sören Krasel, Daimler AG
 
Das IT-Instrumentarium für das kommunale Bildungsmonitoring – Erfahrungen, An...
Das IT-Instrumentarium für das kommunale Bildungsmonitoring – Erfahrungen, An...Das IT-Instrumentarium für das kommunale Bildungsmonitoring – Erfahrungen, An...
Das IT-Instrumentarium für das kommunale Bildungsmonitoring – Erfahrungen, An...
 

Mehr von ETH-Bibliothek

17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...ETH-Bibliothek
 
OriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainOriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainETH-Bibliothek
 
Tracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDsTracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDsETH-Bibliothek
 
Persistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCSPersistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCSETH-Bibliothek
 
Building Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDsBuilding Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDsETH-Bibliothek
 
DataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying KnowledgeDataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying KnowledgeETH-Bibliothek
 
Bilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und TricksBilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und TricksETH-Bibliothek
 
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...ETH-Bibliothek
 
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...ETH-Bibliothek
 
Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?ETH-Bibliothek
 
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....ETH-Bibliothek
 
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen GlobusCitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen GlobusETH-Bibliothek
 
FORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-BibliothekFORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-BibliothekETH-Bibliothek
 
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...ETH-Bibliothek
 
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek „Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek ETH-Bibliothek
 
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...ETH-Bibliothek
 
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...ETH-Bibliothek
 
Texte visualisieren und lesen
Texte visualisieren und lesenTexte visualisieren und lesen
Texte visualisieren und lesenETH-Bibliothek
 
Netzwerk Metadatenmanagement
Netzwerk MetadatenmanagementNetzwerk Metadatenmanagement
Netzwerk MetadatenmanagementETH-Bibliothek
 
Intellectual Property is Common Property
Intellectual Property is Common PropertyIntellectual Property is Common Property
Intellectual Property is Common PropertyETH-Bibliothek
 

Mehr von ETH-Bibliothek (20)

17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
17:15 Kolloquium – Donnerstag, 27. Februar 2020 – Das Büro darf nicht nur Mit...
 
OriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin BlockchainOriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
OriginStamp: Trusted Time Stamping via the Bitcoin Blockchain
 
Tracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDsTracking Citations to Research Software via PIDs
Tracking Citations to Research Software via PIDs
 
Persistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCSPersistent Identifiers for Scientific Data at CSCS
Persistent Identifiers for Scientific Data at CSCS
 
Building Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDsBuilding Open Research Infrastructure with PIDs
Building Open Research Infrastructure with PIDs
 
DataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying KnowledgeDataCite and its Members: Connecting Research and Identifying Knowledge
DataCite and its Members: Connecting Research and Identifying Knowledge
 
Bilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und TricksBilder online recherchieren – Tipps und Tricks
Bilder online recherchieren – Tipps und Tricks
 
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
Transkribus. Eine Forschungsplattform für die automatisierte Digitalisierung,...
 
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
Gamification und Game Design: Theorie und Praxis jenseits der Heilsversprechu...
 
Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?Data Management in Research –WhyandHow?
Data Management in Research –WhyandHow?
 
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
Openness, exchange, FAIR DATA – oh brave new world that has such vision! (Dr....
 
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen GlobusCitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
CitizenScience - Freiwillige lokalisieren Bilder im virtuellen Globus
 
FORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-BibliothekFORUM - Das Bottom-up Gremium der ETH-Bibliothek
FORUM - Das Bottom-up Gremium der ETH-Bibliothek
 
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
Digitaler Zugang zu Lesespuren - Das Projekt „Thomas Mann Nachlassbibliothek“...
 
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek „Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
„Ex meis libris“ - Die Provenienzdatenbank der ETH-Bibliothek
 
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
Wenn Algorithmen Zeitschriften lesen - Vom Mehrwert automatisierter Textanrei...
 
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
Die Research Collection der ETH Zürich - Ein Repositorium für Publikationen u...
 
Texte visualisieren und lesen
Texte visualisieren und lesenTexte visualisieren und lesen
Texte visualisieren und lesen
 
Netzwerk Metadatenmanagement
Netzwerk MetadatenmanagementNetzwerk Metadatenmanagement
Netzwerk Metadatenmanagement
 
Intellectual Property is Common Property
Intellectual Property is Common PropertyIntellectual Property is Common Property
Intellectual Property is Common Property
 

Herausforderungen im Datenmanagement von Metadaten

  • 1. FHO Fachhochschule Ostschweiz Herausforderungen im Management von Metadaten Prof. Dr. Ingo Barkow 28. März 2019
  • 2. Hochschule für Technik und Wirtschaft HTW Chur • Schweizerisches Institut für Informationswissenschaft • Forschungsschwerpunkt 1 – Informationsorganisation • Forschungsfeld Datenmanagement Obligatorische Bündner Tourismus Folie – HTW Chur
  • 3.
  • 5. Arten von Metadaten • Metadaten sind domänenspezifisch • Metadaten bewegen sich auf verschiedenen Ebenen • Technische Metadaten (z.B. Data Dictionary, Masterdatenbank) • Objektbezogene Metadaten (z.B. Filetypen) • Inhaltliche Metadaten (z.B. Variablenbeschreibungen, Annotationen) • Prozessorientierte Metadaten (z.B. Logfiles, Dokumentation Erhebungsprozesse) • Analysebezogen Metadaten (z.B. Analyseskripte) • Publikationsbezogene Metadaten (z.B. Kataloge) • Verständnis von Daten ohne Metadaten oftmals nicht möglich • Grundlage von Datenhaltung und Archivierung
  • 6. Warum Metadaten Management? Beispiel für einen papierbasierten Schülertest (Kelly, 1916) • Test verfügbar • Instruktionen verfügbar • Ergebnisse der Schüler als Tabelle verfügbar
  • 7. Warum Metadaten Management? Beispiel für einen computerbasierten Test Microsoft Networking Exam 070-058 (1999) - Betriebssystem nicht mehr verfügbar (Windows für Workgroups v3.11) - Proprietäre Software (Polaris) nicht mehr verfügbar - Datenträger (QIC80 Streamer) nicht lesbar - Proprietäres Format für Ergebnisdateien nicht lesbar
  • 8. Metadatenmanagement • In jedem Prozess einer Studie fallen Metadaten und Daten an (z.B. Studiendesign, Entwicklung der Instrumente, Übersetzung, Datenerhebung, Datenanalyse) • Für die Prozesse sind bei grösseren Projekten unterschiedliche Organisationen zuständig • Dazu werden mitunter unterschiedliche Tools eingesetzt, die nicht zueinander kompatibel sind • Dies führte zur Entwicklung von Lifecycle Modellen (z.B. Generic Statistical Business Process Model, Generic Longitudinal Business Process Model), um diese Prozesse besser greifen zu können • Die Lifecycle Modelle werden idealerweise dann in Metadatenstandards aufgegriffen • Metadatenstandards werden dann entsprechend in Toolchains umgesetzt um die Metadaten und Daten zwischen Tools weiterleiten zu können • Ohne die Tradition der Metadaten und Daten sind am Ende der Kette oftmals nicht ausreichend Inhalte vorhanden, um ein Repository betreiben zu können • Die Metadaten werden dann von dem Archivpersonal rekonstruiert in Form von “Datenforensik” • Idealfall – Metadaten als Beiprodukt des Survey Prozesses bzw. der Toolverwendung
  • 9.
  • 10.
  • 11. Metadatenstandard für die Sozialwissenschaften – DDI Lifecycle • Data Documentation Initiative (DDI) ist der führende quantitative Metadatenstandard für sozialwissenschaftliche Studien • Dokumentiert wird nicht die Filestruktur von Ergebnisdateien sondern im Falle von DDI v3.3 z.B. der Inhalt des komplettes Studienverlauf vom Design bis zur Archivierung • Momentan pflegt die DDI Alliance drei verschiedene Ausprägungen des Standards − DDI Codebook (aktuelle Version: 2.5) als XML Schema − DDI Lifecycle (aktuelle Version: 3.3) als XML Schema − DDI “Next Generation” (kommende 4.0 Version) als RDF/JSON LD • Die meisten Organisationen verwenden inzwischen DDI Lifecycle v3.2 da mit dieser Version der komplette Lifecycle abgebildet warden kann
  • 13. Metadatengetriebenes Survey Management Software: IAB Metadata Portal (TBA21) Metadata Standard: DDI Lifecycle 3.2
  • 14. Metadatengetriebener Datenerhebungsprozess (Mobil) Software: Rogatus Survey / Aitema Mobile Client (TBA21) Metadata Standard: DDI Lifecycle 3.2
  • 15. Metadatengetriebener Publikationsprozess Software: Invenio 0.99 (CERN) Metadata Standards: MARC21 / DataCite
  • 16. Metadatengetriebene Sekundäranalysen aus dem Repository Software: FORSbase (FORS) Metadata Standard: DDI Lifecycle 3.2
  • 17. Problemstellungen • Toolchains in den meisten Domänen nicht vollständig ausgeprägt • Metadatenstandards bei Wissenschaftler*innen nicht besonders beliebt • Oftmals Verwendung proprietärer Formate und Standards • Umsetzung der Metadatenstandards in Tools oftmals noch nicht gegeben • Umsetzung von Toolchains in grossen Infrastrukturprojekten welche über die Konzeptionsphase oder erste einfache Tools nicht hinauskommen (z.B. Data Without Boundaries / EU Ebene)
  • 18. Empfehlungen • Verwendung von Tools mit Unterstützung von Metadatenstandards und offenen Schnittstellen • Infrastrukturprojekte mit pragmatischer Umsetzung von Tools • Umsetzung von durchgehenden Metadatenstandards innerhalb von Tools • Einbettung der einzelnen Tools in Datenmanagementsysteme • Verwendung archivfähiger Formate • Etwas mehr Fokus auf Umsetzung in der IT als auf wissenschaftliche Konzepte • Verwendung von semantischen Konzepten und Linked Open Data • Verwendung von offenen Standards, offenen Publikationsformaten und Open Source
  • 19. Haben Sie noch irgendwelche Fragen?
  • 20. Vielen Dank für Ihre Aufmerksamkeit Prof. Dr. Ingo Barkow Schweizerisches Institut für Informationswissenschaft (SII) HTW Chur Pulvermühlestrasse 57 CH-7000 Chur Mailto: ingo.barkow@htwchur.ch FHO Fachhochschule Ostschweiz