SlideShare ist ein Scribd-Unternehmen logo
1 von 7
Downloaden Sie, um offline zu lesen
30. Juni 2017
Sisyphus und die Metadaten
Wie könnten Erfassung und Pflege von Metadaten
einfach und effizient gestaltet werden?
4. Online-Workshop Open (Government) Data
Moderation: Dominic Petrak, Sebastian Goerke
30. Juni 2017 2
Agenda
1. Wie erfasst man Metadaten heute?
2. Was macht es oft so schwierig?
3. Wie könnte das einfacher gehen?
30. Juni 2017 3
Wie erfasst man Metadaten heute?
Metadatenerfassung
heute
Über klassische
Softwarelösungen
diverser Anbieter
(z.B. Geo-Bereich)
Häufig nicht
standard-
konform
Hoher
Anpassungs-
aufwand
Nur für größere
Institutionen
machbar
Alternative:
Gemeinsame
Infrastruktur
Standardi-
sierung
Generische Open
Data-Portale
Aufwändige
Pflege
Erfassung
manuell über
Web-Form
Automatisches
Sammeln
Massen-
verarbeitung
Daten müssen
maschinen-
lesbar vorliegen
Aus externen
Katalogen
Verlinkung /
Kontextbildung
Kritisch
30. Juni 2017 4
Was macht es oft so schwierig?
• Umfangreiche Beschreibungsvokabularien
• Sehr langer Lebenszyklus
• Verschiedene Metadaten-Schemata
• Frage nach passender Lizenz
• Metadaten-Pflege (Koordination und Umsetzung)
• Schwankende Datenqualität
30. Juni 2017 5
Wie könnte das einfacher gehen?
• Automatisierung
• Automatisierte Ableitung von Metadateninhalten gem. vorgegebener
Regelwerke und Werkzeuge (ETL Mechanismen)
• Einsatz von Deep Learning Mechanismen
Mittels Deep Learning
Mechanismen werden
Metadaten zu Datensätzen
erhoben
Ableitung verschiedener
Metadatenformate mittels
Deep Learning Mechanik
Überprüfung der Ergebnisse
anhand vorhandener
Metadaten zu Datensätzen
(insbesondere im
Geodatenbereich
umfangreiche
Datengrundlage)
Diskussion
6
Vielen Dank.

Weitere ähnliche Inhalte

Ähnlich wie Sisyphus und die Metadaten

Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenKatrin Weller
 
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage...
Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage...Forschungsgruppe Kooperationssysteme
 
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Axel Bruns
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenDirk Lewandowski
 
Information Broker 2.0 - Recherche im Sozialen Web
Information Broker 2.0 - Recherche im Sozialen WebInformation Broker 2.0 - Recherche im Sozialen Web
Information Broker 2.0 - Recherche im Sozialen WebUniversity St. Gallen
 
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...Christian Kummer
 
Archäologische Dateninfrastrukturen
Archäologische DateninfrastrukturenArchäologische Dateninfrastrukturen
Archäologische DateninfrastrukturenKai-Christian Bruhn
 
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDirk Lewandowski
 
Wenn Maschinen Menschen bewerten: To-dos für Teilhabe
Wenn Maschinen Menschen bewerten: To-dos für TeilhabeWenn Maschinen Menschen bewerten: To-dos für Teilhabe
Wenn Maschinen Menschen bewerten: To-dos für TeilhabeKonrad Lischka
 
Open Data Privacy
Open Data PrivacyOpen Data Privacy
Open Data Privacytknobloch
 
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”Dr. Mathias Riechert
 
Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013Prof. Dr. Alexander Maedche
 
Die Macht der Daten - CeBIT 2017
Die Macht der Daten - CeBIT 2017Die Macht der Daten - CeBIT 2017
Die Macht der Daten - CeBIT 2017Detlev Sandel
 
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...dieleutefürkommunikation AG
 
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...acosta-consult
 
Höher, schneller, weiter? Datenmanagement mit Augenmaß!
Höher, schneller, weiter? Datenmanagement mit Augenmaß!Höher, schneller, weiter? Datenmanagement mit Augenmaß!
Höher, schneller, weiter? Datenmanagement mit Augenmaß!CESSDA Training
 
Open (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOpen (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOliver Bildesheim
 

Ähnlich wie Sisyphus und die Metadaten (20)

Quantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media DatenQuantität vor Qualität? Big Data im Kontext von Social Media Daten
Quantität vor Qualität? Big Data im Kontext von Social Media Daten
 
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage...
Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...Vortrag "Enterprise 2.0 – Gegenwart und ZukunftVorschlag einer Forschungsage...
Vortrag "Enterprise 2.0 – Gegenwart und Zukunft Vorschlag einer Forschungsage...
 
Big Data und Business Intelligence
Big Data und Business IntelligenceBig Data und Business Intelligence
Big Data und Business Intelligence
 
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
Neue Öffentlichkeiten auf Social-Media-Plattformen: Zur Nutzung von ‚Big Data...
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
 
Information Broker 2.0 - Recherche im Sozialen Web
Information Broker 2.0 - Recherche im Sozialen WebInformation Broker 2.0 - Recherche im Sozialen Web
Information Broker 2.0 - Recherche im Sozialen Web
 
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
Gestaltungsmaßnahmen zur Förderung kollaborativer Wiki-Arbeit in der Hochschu...
 
Archäologische Dateninfrastrukturen
Archäologische DateninfrastrukturenArchäologische Dateninfrastrukturen
Archäologische Dateninfrastrukturen
 
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
 
Wenn Maschinen Menschen bewerten: To-dos für Teilhabe
Wenn Maschinen Menschen bewerten: To-dos für TeilhabeWenn Maschinen Menschen bewerten: To-dos für Teilhabe
Wenn Maschinen Menschen bewerten: To-dos für Teilhabe
 
Web-Index-Workshop 2014
Web-Index-Workshop 2014Web-Index-Workshop 2014
Web-Index-Workshop 2014
 
Entscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic WebEntscheidungsunterstützung im Semantic Web
Entscheidungsunterstützung im Semantic Web
 
Open Data Privacy
Open Data PrivacyOpen Data Privacy
Open Data Privacy
 
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
Zielsetzung, Entwicklung und Herausforderungen des “Kerndatensatz Forschung”
 
Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013
 
Die Macht der Daten - CeBIT 2017
Die Macht der Daten - CeBIT 2017Die Macht der Daten - CeBIT 2017
Die Macht der Daten - CeBIT 2017
 
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
B2B Marketing Whitepaper - Informationsverhalten von Entscheidungsträgern 201...
 
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
LSWT2011: CONTENTUS: Technologien und Konzepte für multimediale Bibliotheken ...
 
Höher, schneller, weiter? Datenmanagement mit Augenmaß!
Höher, schneller, weiter? Datenmanagement mit Augenmaß!Höher, schneller, weiter? Datenmanagement mit Augenmaß!
Höher, schneller, weiter? Datenmanagement mit Augenmaß!
 
Open (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOpen (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - Nutzen
 

Sisyphus und die Metadaten

  • 1. 30. Juni 2017 Sisyphus und die Metadaten Wie könnten Erfassung und Pflege von Metadaten einfach und effizient gestaltet werden? 4. Online-Workshop Open (Government) Data Moderation: Dominic Petrak, Sebastian Goerke
  • 2. 30. Juni 2017 2 Agenda 1. Wie erfasst man Metadaten heute? 2. Was macht es oft so schwierig? 3. Wie könnte das einfacher gehen?
  • 3. 30. Juni 2017 3 Wie erfasst man Metadaten heute? Metadatenerfassung heute Über klassische Softwarelösungen diverser Anbieter (z.B. Geo-Bereich) Häufig nicht standard- konform Hoher Anpassungs- aufwand Nur für größere Institutionen machbar Alternative: Gemeinsame Infrastruktur Standardi- sierung Generische Open Data-Portale Aufwändige Pflege Erfassung manuell über Web-Form Automatisches Sammeln Massen- verarbeitung Daten müssen maschinen- lesbar vorliegen Aus externen Katalogen Verlinkung / Kontextbildung Kritisch
  • 4. 30. Juni 2017 4 Was macht es oft so schwierig? • Umfangreiche Beschreibungsvokabularien • Sehr langer Lebenszyklus • Verschiedene Metadaten-Schemata • Frage nach passender Lizenz • Metadaten-Pflege (Koordination und Umsetzung) • Schwankende Datenqualität
  • 5. 30. Juni 2017 5 Wie könnte das einfacher gehen? • Automatisierung • Automatisierte Ableitung von Metadateninhalten gem. vorgegebener Regelwerke und Werkzeuge (ETL Mechanismen) • Einsatz von Deep Learning Mechanismen Mittels Deep Learning Mechanismen werden Metadaten zu Datensätzen erhoben Ableitung verschiedener Metadatenformate mittels Deep Learning Mechanik Überprüfung der Ergebnisse anhand vorhandener Metadaten zu Datensätzen (insbesondere im Geodatenbereich umfangreiche Datengrundlage)