SlideShare ist ein Scribd-Unternehmen logo
1 von 27
ODAaaS – Open Data Analytics as a Service 
Dr. Stephan Gauch, Dr. Klaus-Peter Eckert, Dr. Matthias Flügge 
Fraunhofer Institut FOKUS, Berlin 
6. ISPRAT Wissenschaftstag | Donau-Universität Krems | 26. September 2014
Motvation zur Studie 
§ Zur Verfügung stehende Datenmenge wächst beständig an und neue Werkzeuge der 
Datenanalyse für „Nichtstatistiker“ gewinnen an Bedeutung (Big Data). 
§ Zunehmend werden Werkzeuge „as a Service“ als Clouddienst bereitgestellt. 
§ Daten der öffentlichen Verwaltung werden zunehmend als Open (Government) Data 
bereitgestellt. 
– Nutzen wie Transparenz und Möglichkeit der Partizipation sind nur ein Teilbereich 
möglichen Nutzens für Wirtschaft und Gesellschaft 
– Open Government Data muss nicht zwangsläufig die einzige Quelle der 
Wertschöpfung durch Datenanalyse sein. 
§ Ziel der Studie ist die Frage nach Potentialen und Hemmnissen im Dreiklang „Datenanalyse“, 
„Clouddienste“ und „Open Data“. 
– Orientierung an Stand der Technik und für Datenanalyse typische Prozessschritte 
2
Prozessschritte bei ODAaaS 
Trennung unterschiedlicher Aspekte bei der Bereitstellung und Analyse offener Daten 
• Retrieve - Abruf von Daten 
• Revise - Ausgestaltung und Bereinigung von Daten 
• Integrate - Daten miteinander in Beziehung setzen 
• Analyze - Daten analysieren 
3
Typische Prozessschritte und Anforderungen an ODAaaS 
Retrieve 
Revise 
Integrate 
Analyse 
Technische 
Anforderungen 
Organisatorische 
Anforderungen 
Wirtscha9liche 
Anforderungen 
4 
Daten 
Metadaten
Datenermittlung (Retrieve) 
§ Unterstützung von Schnittstellen und Adressierbarkeit von Zugriffspunkten für Daten 
§ Aktualität und Verfügbarkeit von Daten 
§ Umfang der (Open Data) Datenkataloge 
§ Zugriff auf offene und veredelte Daten mittels Cloud-Diensten 
5 
Umfangreiche 
Daten 
können 
in 
der 
Cloud 
gespeichert 
sein
Datenbereinigung (Revise) 
§ Inhaltliche Einordnung von Daten auf Basis von Metadaten 
– Metadaten zu Datenquellen; Inhaltliche, räumliche, zeitliche Kontextualisierung, 
Lizenz 
§ Datenqualität 
– Korrektheit, Vollständigkeit, Granularität, Wohlgeformtheit 
§ Datenprovenienz 
– Unterschiedliche Herkunft 
6 
Umfangreiche 
Daten 
enthalten 
o9 
viel 
Datenmüll 
und 
unvollständige 
Metadaten
Datenzusammenführung (Integrate) 
§ Zentrale und dezentrale Integration von Daten 
– ETL, Data Federation 
– Integration von Daten „on the fly“ vs. Erstellung neuer Datenquellen 
§ Integration als Dienst 
– Veredelungsdienste, Ontologiedienste, Matching von Daten auf Basis von 
Metadaten 
7 
Daten 
aus 
verschiedenen 
Quellen 
müssen 
syntakEsch, 
semanEsch 
und 
physikalisch 
zusammengeführt 
werden
Datenanalyse (Analyze) 
§ Generische vs. spezifische Analysewerkzeuge 
– Generische Werkzeuge: Auf kompletten Datenbestand bezogene einfache 
Analyse- und Visualisierungsoptionen (z.B. Balkendiagramme) 
– Spezifische Werkzeuge: Klar an bestimmten Verwendungszweck gekoppelte 
Werkzeuge und Lösungen (z.B. Apps) 
§ Nutzerspezifische Ausgestaltung von Analysemethoden 
§ Datenmarktplätze 
§ Speicherung von Ergebnisdaten 
§ Zusammenarbeit und 
Community-Ansätze 
8 
Datenanalyse 
als 
Cloud-­‐Dienst 
oder 
Bereitstellung 
analysierter 
Daten 
in 
der 
Cloud 
oder 
Einbeziehung 
nutzerspezifischer 
AnalysefunkEonen
Experteninterviews 
9 
Feedback der ISPRAT-Partner 
• Grad der Unterstützung der Prozessschritte 
• Anforderungen an offene Daten 
• Herausforderungen 
• Potentiale
Experteninterviews: Technische Anforderungen 
§ Für die Mehrzahl von Lösungen der Interviewpartner stellen die technischen 
Anforderungen kein Problem dar. 
§ Allgemein verfügen alle Interviewpartner über entsprechende Lösungen, um 
Datenanalyse in der Cloud als SaaS auszuführen. 
§ Standardisierte Schnittstellen und Konzepte für die Kommunikation von Diensten 
untereinander und deren Organisation liegen ebenfalls bei einigen Anbietern vor und 
stellen z.T. einen wesentlichen Anteil ihrer Geschäftsmodelle dar. 
§ Alle kommerziellen Datenanalyselösungen verfügen über umfangreiche 
Funktionalitäten zur Integration und Nutzung heterogener und verteilter 
Daten 
10
Experteninterviews: Verfügbarkeit und Aktualität von Daten 
§ Sicherstellung der Datenverfügbarkeit ein wesentlicher Faktor für Markterfolg 
von ODAaaS Konzepten. 
§ Aktualität von Daten ist ebenfalls wesentlicher Erfolgsfaktor. 
§ Herausforderung: Unklarheit, wie die Zuständigkeit von Akteure zur Sicherstellung 
der Aktualität und Qualität organisiert werden können. 
§ Herausforderung: Koordinationsproblem zwischen Datenbereitstellern, Open Data 
Plattformen und Dienstleistern (z.B. Datenveredelung). 
11
Experteninterviews: Datenqualität 
§ Datenqualität muss so früh wie möglich im Verwertungsprozess realisiert werden. 
§ Daten sollten bis zur Veröffentlichung innerhalb der Organisation verbleiben und 
auch nur dort behandelt werden. 
§ Herausforderung „Werkzeuge“: Professionelle Instrumente der Datenbereitstellung 
werden in der öffentlichen Verwaltung noch nicht flächendeckend eingesetzt. 
§ Herausforderung „Prozesse“: Herausforderungen vor allem auf organisatorischer 
und prozessspezifischer Ebene. 
§ Herausforderung „Dynamik von Daten: Zyklus der Datenerhebung und zeitlich 
konsistente Zusammenführbarkeit mit anderen Daten muss durch Metadaten 
gewährleistet werden. 
12
Experteninterviews: Potentiale von Big Data und Sensordaten 
§ Sehr hohe Wertschöpfungspotentiale durch Big Open Data 
§ Hohe Wertschöpfung vor allem bei Daten mit besonders großem Umfang (big), hoher 
Dynamik (timely) oder durch Verschränkung mit anderen Daten (linked) 
§ Vorteil von Big Open Data durch ein Mindestmaß an Sicherheits-oder 
Datenhoheitsbedenken 
§ Anteil solcher Daten in Open Data-Plattformen noch relativ gering 
§ Positive Zukunftserwartung vor allem bei Daten des Nahverkehrs und des 
Katastrophenschutzes... 
§ ... tendenziell jedoch skeptisch was Offenlegungsneigung angeht. 
13
Experteninterviews: Einfache vs. komplexe ODAaaS Konzepte 
§ Domänenspezifische Anwendungen mit klar abgegrenzten Nutzungskontexten 
stehen im Vordergrund. 
§ Markt für Datenanalyse offener Daten ist nur schwer zu erschließen und eher an 
spezifischen Fragestellungen orientierte Lösungen sinnvoll. 
§ Generische Konzepte scheitern oft an Commitment auf Seiten der Datenbereitsteller. 
§ „One size fits all“-Konzepte erweisen sich momentan in der Praxis als schwierig. 
§ Ein Teil der Interviewpartner sieht langfristig hohes Potential für offene 
schnittstellenbasierte Infrastrukturen. Offene Daten sind dabei jedoch nur 
Teilmenge einer größeren Dateninfrastruktur. 
14
Experteninterviews: Anforderungen an ODAaaS 
§ Barrieren für ODAaaS-Konzepte sind nur selten technischer Natur . 
§ Hemmnisse in erster Linie durch die zu geringe Verfügbarkeit offener Daten und 
die im internationalen Vergleich bisher in Deutschland noch wenig wahrgenommenen 
wirtschaftlichen Verwertungspotentiale. 
§ Hemmnisse für generische Konzepte liegen vor allem in Umsetzungskosten und 
verhaltenem Investitionswillen. Ursache ist, dass der Nutzen nachgelagerter 
Analyseoptionen zum Teil nicht erkannt wird. 
§ Notwendige Voraussetzung für alle Konzepte ODAaaS ist die konsequente Nutzung 
offener Schnittstellen und offener Datenformate. 
15
Umsetzung von (O)DaaS in der Cloud 
Vergleich von Implementierungsoptionen 
• Analytics as a Service 
• Information as a Service 
• Data as a Service 
16
NIST Cloud-Referenzarchitektur 
Die 
Blaupause 
für 
Cloud-­‐Architekturen 
17
(O)DAaaS in der Cloud-Referenzarchitektur 
ODAaaS-­‐Ausprägungen 
in 
den 
NIST-­‐Service-­‐Layern 
18
Implementierungsoptionen für ODAaaS 
19 
AnalyEcs-­‐Dienste 
für 
Endnutzer 
AuQereitung 
von 
(Meta-­‐) 
Daten; 
AnalyEcs-­‐PlaVorm 
Bereitstellung 
von 
Rohdaten 
und 
veredelten 
Daten 
Data 
AnalyEcs 
aaS 
– 
SaaS 
Auswerten 
integrierter, 
auQereiteter 
Daten 
Verständliche 
Darstellung 
der 
Analyseergebnisse 
InformaEon 
aaS 
– 
PaaS 
Filtern, 
AnnoEeren, 
Transformieren, 
Zusammenführen 
von 
Daten 
Bereitstellung 
einer 
IntegraEonsplaVorm 
für 
Analyseverfahren 
Storage 
aaS 
– 
IaaS 
Speichern 
und 
Anbieten 
von 
Rohdaten 
Speichern 
und 
Anbieten 
von 
integrierten, 
veredelten 
Daten 
1 
2 
3
ODAaaS Option 1 – Analytics as a Service 
§ Werkzeug in einer Cloud-Infrastruktur betrieben und Nutzern als mandantenfähiger 
Cloud-Dienst angeboten. 
§ Daten können entweder in der gleichen Cloud-Infrastruktur über Storage as a 
Service gespeichert, extern gespeichert oder extern als Data as a Service-Dienst 
angeboten werden. 
§ Der AaaS-Anbieter stellt dem Kunden seine Dienstleistung entsprechend seinem 
Geschäftsmodell und den Lizenzbedingungen für die Nutzung der offenen Daten zur 
Verfügung. 
20
ODAaaS Option 2 – Information as a Service 
§ Werkzeug wird in einer Cloud-Infrastruktur auf einer Information-/ und 
Integrations-plattform als Cloud-Dienst angeboten. 
§ Anbieter und Nutzer sind Kunden eines Platform as a Service-Dienstes. Dabei 
werden sowohl veredelte Daten als auch eine Laufzeitplattform für individuelle 
Analyseverfahren als Cloud-Dienste angeboten. 
§ Für den Information as a Service-Anbieter ergeben sich dabei interessante 
Geschäftsmodelle, die von den Lizenzbedingungen der Daten unabhängig sind. 
21
ODAaaS Option 3 – Data as a Service 
§ Werkzeug wird ohne Cloud-Infrastruktur entweder als extern gehosteter Dienst 
mandantenfähig betrieben oder ist lokal in der IT-Umgebung des Nutzers installiert. 
§ Das Werkzeug greift auf in der Cloud gespeicherte und angebotene Daten zu 
bzw. legt veredelte Daten in der Cloud ab. 
§ Diese Option ist beim Zugriff auf große Datenmengen bzw. bei der Bereitstellung 
veredelter Daten von Interesse. Sie erlaubt interessante Geschäftsmodell für die 
Bereitstellern von Daten. 
22
Handlungsempfehlungen 
Ableitung von Handlungsempfehlungen für die betrachteten Stakeholder 
• Bereitstellung offener bzw. veredelter Daten 
• Analyse offener Daten in der Verwaltung 
• Anbieter von AaaS-Werkzeugen 
23
Handlungsempfehlungen: „Bereitstellung offener Daten“ 
§ Etablierung einer Qualitätskultur für offene Daten 
§ Verbesserung der Qualität der beschreibenden Metadaten 
§ Unterstützung der öffentlichen Verwaltung durch Open Data Publisher Werkzeuge 
§ Abbau von Medienbrüchen in der öffentlichen Verwaltung 
§ Open Data Beauftragte in der öffentlichen Verwaltung etablieren 
§ Veröffentlichung von Echtzeitdaten und Sensordaten als Open Data ausbauen 
§ Einbeziehung privater und offener Daten jenseits von Open Government Data 
24
Handlungsempfehlungen: „Analyse offener Daten“ 
§ ODAaaS als Entscheidungshilfe für die öffentliche Verwaltung aufbauen 
§ Verbesserte Bürgerinformationssysteme durch Datenanalyse 
§ Demonstratoren für innovative, analysebasierte Apps bereitstellen 
§ Best Practice Beispiele der amtlichen Statistik aufgreifen 
25
Handlungsempfehlungen: „Anbieter von AaaS-Werkzeugen“ 
§ Ausbau der Bereitstellung offener Importschnittstellen 
§ Bereitstellung von Funktionen zur Bereinigung und Integration von Daten 
§ Bereitstellung von AaaS-Diensten 
§ Dynamische Integration spezifischer Analyseverfahren 
§ Unterstützung föderierter ODAaaS-Lösungen (ODAaaS-Marktplatz) 
26
27 
Dr. 
Stephan 
Gauch, 
Dr. 
Klaus-­‐Peter 
Eckert, 
Dr. 
Maahias 
Flügge 
E-­‐Mail: 
{(stephan.gauch|klaus-­‐peter.eckert| 
maahias.fluegge)@fokus.fraunhofer.de} 
Fraunhofer 
FOKUS 
Kaiserin-­‐Augusta-­‐Allee 
31 
10589 
Berlin, 
Deutschland 
www.fokus.fraunhofer.de

Weitere ähnliche Inhalte

Andere mochten auch (15)

Universidad tecnológica equinoccial.... diapositivas
Universidad tecnológica equinoccial.... diapositivasUniversidad tecnológica equinoccial.... diapositivas
Universidad tecnológica equinoccial.... diapositivas
 
janik david resume 2
janik david resume 2janik david resume 2
janik david resume 2
 
Presentación1
Presentación1Presentación1
Presentación1
 
"Ideen zur Nachhaltigkeit und Energieeffizienz": Viola Maurer, HP Austria
"Ideen zur Nachhaltigkeit und Energieeffizienz": Viola Maurer, HP Austria"Ideen zur Nachhaltigkeit und Energieeffizienz": Viola Maurer, HP Austria
"Ideen zur Nachhaltigkeit und Energieeffizienz": Viola Maurer, HP Austria
 
Lore Pecha Kucha
Lore Pecha KuchaLore Pecha Kucha
Lore Pecha Kucha
 
Welche Daten wollen wir von der Verwaltung?
Welche Daten wollen wir von der Verwaltung?Welche Daten wollen wir von der Verwaltung?
Welche Daten wollen wir von der Verwaltung?
 
Sportkongress tvm change_management_okt15
Sportkongress tvm change_management_okt15Sportkongress tvm change_management_okt15
Sportkongress tvm change_management_okt15
 
Conjuntos
ConjuntosConjuntos
Conjuntos
 
tatiana te aconseja 1
tatiana te aconseja 1tatiana te aconseja 1
tatiana te aconseja 1
 
Maquetacion revista
Maquetacion revistaMaquetacion revista
Maquetacion revista
 
Wildbachbetreuung
Wildbachbetreuung Wildbachbetreuung
Wildbachbetreuung
 
Desarrollo sustentable
Desarrollo sustentableDesarrollo sustentable
Desarrollo sustentable
 
Duale Zustellung
Duale ZustellungDuale Zustellung
Duale Zustellung
 
Historia igl 1 1
Historia igl 1 1Historia igl 1 1
Historia igl 1 1
 
Elektronische Zustellung
Elektronische ZustellungElektronische Zustellung
Elektronische Zustellung
 

Ähnlich wie ODAaaS – Open Data Analytics as a Service

TFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTourismFastForward
 
Einführung in offene Daten Qualität
Einführung in offene Daten QualitätEinführung in offene Daten Qualität
Einführung in offene Daten QualitätOpen Data Support
 
Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationThomas Kurz
 
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...FIWARE
 
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdf
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdfMichael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdf
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdfFIWARE
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Felix Lohmeier
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in MetadatenverwaltungOpen Data Support
 
Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Harald Erb
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data GovernanceCapgemini
 
Datenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenDatenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenJohann Höchtl
 
Open (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOpen (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOliver Bildesheim
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannDataValueTalk
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data KonnektivitätTrivadis
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAPmurat9393
 
OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management SolutionTorsten Glunde
 
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...Semantic Web Company
 
Data Quadrant - Daten Management Methode
Data Quadrant - Daten Management MethodeData Quadrant - Daten Management Methode
Data Quadrant - Daten Management MethodeTorsten Glunde
 

Ähnlich wie ODAaaS – Open Data Analytics as a Service (20)

TFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data NexusTFF2023 - Navigating Tourism Data Nexus
TFF2023 - Navigating Tourism Data Nexus
 
Einführung in offene Daten Qualität
Einführung in offene Daten QualitätEinführung in offene Daten Qualität
Einführung in offene Daten Qualität
 
Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
 
Big Data und Business Intelligence
Big Data und Business IntelligenceBig Data und Business Intelligence
Big Data und Business Intelligence
 
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...
Prof. Dr. Michael Prange - Skalierbare Datenplattform für intelligente Infras...
 
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdf
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdfMichael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdf
Michael Pfefferle (Bitkom) Datenplattform für intelligente Infrastrukturen.pdf
 
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in Metadatenverwaltung
 
Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
 
Big Data Governance
Big Data GovernanceBig Data Governance
Big Data Governance
 
Datenqualität auf Offenen Datenportalen
Datenqualität auf Offenen DatenportalenDatenqualität auf Offenen Datenportalen
Datenqualität auf Offenen Datenportalen
 
Open (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - NutzenOpen (Government) Data | Chancen - Risiken - Nutzen
Open (Government) Data | Chancen - Risiken - Nutzen
 
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen KannBARC Was Datenmanagement Messbar Dazu Beitragen Kann
BARC Was Datenmanagement Messbar Dazu Beitragen Kann
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data Konnektivität
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAP
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 
OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management Solution
 
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
OGD2011: Tassilo Pellegrini - Linked Government Data als nachhaltige Maßnahme...
 
Data Quadrant - Daten Management Methode
Data Quadrant - Daten Management MethodeData Quadrant - Daten Management Methode
Data Quadrant - Daten Management Methode
 

Mehr von Danube University Krems, Centre for E-Governance

Mehr von Danube University Krems, Centre for E-Governance (20)

Smart Cities workshop at CeDEM17
Smart Cities workshop at CeDEM17Smart Cities workshop at CeDEM17
Smart Cities workshop at CeDEM17
 
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
#CeDEM17 - Towards an Open Data based ICT Reference Architecture for Smart Ci...
 
#CeDEM17 - Financial Payments and Smart Cities
#CeDEM17 - Financial Payments and Smart Cities #CeDEM17 - Financial Payments and Smart Cities
#CeDEM17 - Financial Payments and Smart Cities
 
#CeDEM2017 Smart Cities of Self-Determined Data Subjects
#CeDEM2017 Smart Cities of Self-Determined Data Subjects#CeDEM2017 Smart Cities of Self-Determined Data Subjects
#CeDEM2017 Smart Cities of Self-Determined Data Subjects
 
Open Data as Enabler of Public Service Co-creation: Exploring the Drivers and...
Open Data as Enabler of Public Service Co-creation:Exploring the Drivers and...Open Data as Enabler of Public Service Co-creation:Exploring the Drivers and...
Open Data as Enabler of Public Service Co-creation: Exploring the Drivers and...
 
DatalEt-Ecosystem Provider - The DEEP project
DatalEt-Ecosystem Provider - The DEEP projectDatalEt-Ecosystem Provider - The DEEP project
DatalEt-Ecosystem Provider - The DEEP project
 
Towards Open Justice: ICT acceptance in the Greek justice system
Towards Open Justice: ICT acceptance in the Greek justice systemTowards Open Justice: ICT acceptance in the Greek justice system
Towards Open Justice: ICT acceptance in the Greek justice system
 
[X]CHANGING PERSPECTIVES
[X]CHANGING PERSPECTIVES[X]CHANGING PERSPECTIVES
[X]CHANGING PERSPECTIVES
 
Using fuzzy cognitive maps as decision support tool for smart cities goraczek
Using fuzzy cognitive maps as decision support tool for smart cities  goraczekUsing fuzzy cognitive maps as decision support tool for smart cities  goraczek
Using fuzzy cognitive maps as decision support tool for smart cities goraczek
 
Understanding of smartphone divide dal yong
Understanding of smartphone divide  dal yongUnderstanding of smartphone divide  dal yong
Understanding of smartphone divide dal yong
 
The motivations behind open access publishing judith schossboeck
The motivations behind open access publishing  judith schossboeckThe motivations behind open access publishing  judith schossboeck
The motivations behind open access publishing judith schossboeck
 
Social media as hobed of racism and hate speech kobayashi, kaigo, kwak
Social media as hobed of racism and hate speech kobayashi, kaigo, kwakSocial media as hobed of racism and hate speech kobayashi, kaigo, kwak
Social media as hobed of racism and hate speech kobayashi, kaigo, kwak
 
Social media and citizen engagement in asia skoric
Social media and citizen engagement in asia  skoricSocial media and citizen engagement in asia  skoric
Social media and citizen engagement in asia skoric
 
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulosRealizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
Realizin modeling and evaluation city's enerfy efficiency leonidas anthopoulos
 
Post 2015 paris c limate conference politics on the internet manuela hartwig
Post 2015 paris c limate conference politics on the internet  manuela hartwigPost 2015 paris c limate conference politics on the internet  manuela hartwig
Post 2015 paris c limate conference politics on the internet manuela hartwig
 
Open government and national sovereignty ivo babaja
Open government and national sovereignty  ivo babajaOpen government and national sovereignty  ivo babaja
Open government and national sovereignty ivo babaja
 
Health r isk communication in the digital era myojung chung
Health r isk communication in the digital era myojung chungHealth r isk communication in the digital era myojung chung
Health r isk communication in the digital era myojung chung
 
An analysis of japanese local government facebook profiles muneo kaigo
An analysis of japanese local government facebook profiles muneo kaigoAn analysis of japanese local government facebook profiles muneo kaigo
An analysis of japanese local government facebook profiles muneo kaigo
 
GovCamp 2016 - Co-Creation
GovCamp 2016 - Co-CreationGovCamp 2016 - Co-Creation
GovCamp 2016 - Co-Creation
 
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
 

ODAaaS – Open Data Analytics as a Service

  • 1. ODAaaS – Open Data Analytics as a Service Dr. Stephan Gauch, Dr. Klaus-Peter Eckert, Dr. Matthias Flügge Fraunhofer Institut FOKUS, Berlin 6. ISPRAT Wissenschaftstag | Donau-Universität Krems | 26. September 2014
  • 2. Motvation zur Studie § Zur Verfügung stehende Datenmenge wächst beständig an und neue Werkzeuge der Datenanalyse für „Nichtstatistiker“ gewinnen an Bedeutung (Big Data). § Zunehmend werden Werkzeuge „as a Service“ als Clouddienst bereitgestellt. § Daten der öffentlichen Verwaltung werden zunehmend als Open (Government) Data bereitgestellt. – Nutzen wie Transparenz und Möglichkeit der Partizipation sind nur ein Teilbereich möglichen Nutzens für Wirtschaft und Gesellschaft – Open Government Data muss nicht zwangsläufig die einzige Quelle der Wertschöpfung durch Datenanalyse sein. § Ziel der Studie ist die Frage nach Potentialen und Hemmnissen im Dreiklang „Datenanalyse“, „Clouddienste“ und „Open Data“. – Orientierung an Stand der Technik und für Datenanalyse typische Prozessschritte 2
  • 3. Prozessschritte bei ODAaaS Trennung unterschiedlicher Aspekte bei der Bereitstellung und Analyse offener Daten • Retrieve - Abruf von Daten • Revise - Ausgestaltung und Bereinigung von Daten • Integrate - Daten miteinander in Beziehung setzen • Analyze - Daten analysieren 3
  • 4. Typische Prozessschritte und Anforderungen an ODAaaS Retrieve Revise Integrate Analyse Technische Anforderungen Organisatorische Anforderungen Wirtscha9liche Anforderungen 4 Daten Metadaten
  • 5. Datenermittlung (Retrieve) § Unterstützung von Schnittstellen und Adressierbarkeit von Zugriffspunkten für Daten § Aktualität und Verfügbarkeit von Daten § Umfang der (Open Data) Datenkataloge § Zugriff auf offene und veredelte Daten mittels Cloud-Diensten 5 Umfangreiche Daten können in der Cloud gespeichert sein
  • 6. Datenbereinigung (Revise) § Inhaltliche Einordnung von Daten auf Basis von Metadaten – Metadaten zu Datenquellen; Inhaltliche, räumliche, zeitliche Kontextualisierung, Lizenz § Datenqualität – Korrektheit, Vollständigkeit, Granularität, Wohlgeformtheit § Datenprovenienz – Unterschiedliche Herkunft 6 Umfangreiche Daten enthalten o9 viel Datenmüll und unvollständige Metadaten
  • 7. Datenzusammenführung (Integrate) § Zentrale und dezentrale Integration von Daten – ETL, Data Federation – Integration von Daten „on the fly“ vs. Erstellung neuer Datenquellen § Integration als Dienst – Veredelungsdienste, Ontologiedienste, Matching von Daten auf Basis von Metadaten 7 Daten aus verschiedenen Quellen müssen syntakEsch, semanEsch und physikalisch zusammengeführt werden
  • 8. Datenanalyse (Analyze) § Generische vs. spezifische Analysewerkzeuge – Generische Werkzeuge: Auf kompletten Datenbestand bezogene einfache Analyse- und Visualisierungsoptionen (z.B. Balkendiagramme) – Spezifische Werkzeuge: Klar an bestimmten Verwendungszweck gekoppelte Werkzeuge und Lösungen (z.B. Apps) § Nutzerspezifische Ausgestaltung von Analysemethoden § Datenmarktplätze § Speicherung von Ergebnisdaten § Zusammenarbeit und Community-Ansätze 8 Datenanalyse als Cloud-­‐Dienst oder Bereitstellung analysierter Daten in der Cloud oder Einbeziehung nutzerspezifischer AnalysefunkEonen
  • 9. Experteninterviews 9 Feedback der ISPRAT-Partner • Grad der Unterstützung der Prozessschritte • Anforderungen an offene Daten • Herausforderungen • Potentiale
  • 10. Experteninterviews: Technische Anforderungen § Für die Mehrzahl von Lösungen der Interviewpartner stellen die technischen Anforderungen kein Problem dar. § Allgemein verfügen alle Interviewpartner über entsprechende Lösungen, um Datenanalyse in der Cloud als SaaS auszuführen. § Standardisierte Schnittstellen und Konzepte für die Kommunikation von Diensten untereinander und deren Organisation liegen ebenfalls bei einigen Anbietern vor und stellen z.T. einen wesentlichen Anteil ihrer Geschäftsmodelle dar. § Alle kommerziellen Datenanalyselösungen verfügen über umfangreiche Funktionalitäten zur Integration und Nutzung heterogener und verteilter Daten 10
  • 11. Experteninterviews: Verfügbarkeit und Aktualität von Daten § Sicherstellung der Datenverfügbarkeit ein wesentlicher Faktor für Markterfolg von ODAaaS Konzepten. § Aktualität von Daten ist ebenfalls wesentlicher Erfolgsfaktor. § Herausforderung: Unklarheit, wie die Zuständigkeit von Akteure zur Sicherstellung der Aktualität und Qualität organisiert werden können. § Herausforderung: Koordinationsproblem zwischen Datenbereitstellern, Open Data Plattformen und Dienstleistern (z.B. Datenveredelung). 11
  • 12. Experteninterviews: Datenqualität § Datenqualität muss so früh wie möglich im Verwertungsprozess realisiert werden. § Daten sollten bis zur Veröffentlichung innerhalb der Organisation verbleiben und auch nur dort behandelt werden. § Herausforderung „Werkzeuge“: Professionelle Instrumente der Datenbereitstellung werden in der öffentlichen Verwaltung noch nicht flächendeckend eingesetzt. § Herausforderung „Prozesse“: Herausforderungen vor allem auf organisatorischer und prozessspezifischer Ebene. § Herausforderung „Dynamik von Daten: Zyklus der Datenerhebung und zeitlich konsistente Zusammenführbarkeit mit anderen Daten muss durch Metadaten gewährleistet werden. 12
  • 13. Experteninterviews: Potentiale von Big Data und Sensordaten § Sehr hohe Wertschöpfungspotentiale durch Big Open Data § Hohe Wertschöpfung vor allem bei Daten mit besonders großem Umfang (big), hoher Dynamik (timely) oder durch Verschränkung mit anderen Daten (linked) § Vorteil von Big Open Data durch ein Mindestmaß an Sicherheits-oder Datenhoheitsbedenken § Anteil solcher Daten in Open Data-Plattformen noch relativ gering § Positive Zukunftserwartung vor allem bei Daten des Nahverkehrs und des Katastrophenschutzes... § ... tendenziell jedoch skeptisch was Offenlegungsneigung angeht. 13
  • 14. Experteninterviews: Einfache vs. komplexe ODAaaS Konzepte § Domänenspezifische Anwendungen mit klar abgegrenzten Nutzungskontexten stehen im Vordergrund. § Markt für Datenanalyse offener Daten ist nur schwer zu erschließen und eher an spezifischen Fragestellungen orientierte Lösungen sinnvoll. § Generische Konzepte scheitern oft an Commitment auf Seiten der Datenbereitsteller. § „One size fits all“-Konzepte erweisen sich momentan in der Praxis als schwierig. § Ein Teil der Interviewpartner sieht langfristig hohes Potential für offene schnittstellenbasierte Infrastrukturen. Offene Daten sind dabei jedoch nur Teilmenge einer größeren Dateninfrastruktur. 14
  • 15. Experteninterviews: Anforderungen an ODAaaS § Barrieren für ODAaaS-Konzepte sind nur selten technischer Natur . § Hemmnisse in erster Linie durch die zu geringe Verfügbarkeit offener Daten und die im internationalen Vergleich bisher in Deutschland noch wenig wahrgenommenen wirtschaftlichen Verwertungspotentiale. § Hemmnisse für generische Konzepte liegen vor allem in Umsetzungskosten und verhaltenem Investitionswillen. Ursache ist, dass der Nutzen nachgelagerter Analyseoptionen zum Teil nicht erkannt wird. § Notwendige Voraussetzung für alle Konzepte ODAaaS ist die konsequente Nutzung offener Schnittstellen und offener Datenformate. 15
  • 16. Umsetzung von (O)DaaS in der Cloud Vergleich von Implementierungsoptionen • Analytics as a Service • Information as a Service • Data as a Service 16
  • 17. NIST Cloud-Referenzarchitektur Die Blaupause für Cloud-­‐Architekturen 17
  • 18. (O)DAaaS in der Cloud-Referenzarchitektur ODAaaS-­‐Ausprägungen in den NIST-­‐Service-­‐Layern 18
  • 19. Implementierungsoptionen für ODAaaS 19 AnalyEcs-­‐Dienste für Endnutzer AuQereitung von (Meta-­‐) Daten; AnalyEcs-­‐PlaVorm Bereitstellung von Rohdaten und veredelten Daten Data AnalyEcs aaS – SaaS Auswerten integrierter, auQereiteter Daten Verständliche Darstellung der Analyseergebnisse InformaEon aaS – PaaS Filtern, AnnoEeren, Transformieren, Zusammenführen von Daten Bereitstellung einer IntegraEonsplaVorm für Analyseverfahren Storage aaS – IaaS Speichern und Anbieten von Rohdaten Speichern und Anbieten von integrierten, veredelten Daten 1 2 3
  • 20. ODAaaS Option 1 – Analytics as a Service § Werkzeug in einer Cloud-Infrastruktur betrieben und Nutzern als mandantenfähiger Cloud-Dienst angeboten. § Daten können entweder in der gleichen Cloud-Infrastruktur über Storage as a Service gespeichert, extern gespeichert oder extern als Data as a Service-Dienst angeboten werden. § Der AaaS-Anbieter stellt dem Kunden seine Dienstleistung entsprechend seinem Geschäftsmodell und den Lizenzbedingungen für die Nutzung der offenen Daten zur Verfügung. 20
  • 21. ODAaaS Option 2 – Information as a Service § Werkzeug wird in einer Cloud-Infrastruktur auf einer Information-/ und Integrations-plattform als Cloud-Dienst angeboten. § Anbieter und Nutzer sind Kunden eines Platform as a Service-Dienstes. Dabei werden sowohl veredelte Daten als auch eine Laufzeitplattform für individuelle Analyseverfahren als Cloud-Dienste angeboten. § Für den Information as a Service-Anbieter ergeben sich dabei interessante Geschäftsmodelle, die von den Lizenzbedingungen der Daten unabhängig sind. 21
  • 22. ODAaaS Option 3 – Data as a Service § Werkzeug wird ohne Cloud-Infrastruktur entweder als extern gehosteter Dienst mandantenfähig betrieben oder ist lokal in der IT-Umgebung des Nutzers installiert. § Das Werkzeug greift auf in der Cloud gespeicherte und angebotene Daten zu bzw. legt veredelte Daten in der Cloud ab. § Diese Option ist beim Zugriff auf große Datenmengen bzw. bei der Bereitstellung veredelter Daten von Interesse. Sie erlaubt interessante Geschäftsmodell für die Bereitstellern von Daten. 22
  • 23. Handlungsempfehlungen Ableitung von Handlungsempfehlungen für die betrachteten Stakeholder • Bereitstellung offener bzw. veredelter Daten • Analyse offener Daten in der Verwaltung • Anbieter von AaaS-Werkzeugen 23
  • 24. Handlungsempfehlungen: „Bereitstellung offener Daten“ § Etablierung einer Qualitätskultur für offene Daten § Verbesserung der Qualität der beschreibenden Metadaten § Unterstützung der öffentlichen Verwaltung durch Open Data Publisher Werkzeuge § Abbau von Medienbrüchen in der öffentlichen Verwaltung § Open Data Beauftragte in der öffentlichen Verwaltung etablieren § Veröffentlichung von Echtzeitdaten und Sensordaten als Open Data ausbauen § Einbeziehung privater und offener Daten jenseits von Open Government Data 24
  • 25. Handlungsempfehlungen: „Analyse offener Daten“ § ODAaaS als Entscheidungshilfe für die öffentliche Verwaltung aufbauen § Verbesserte Bürgerinformationssysteme durch Datenanalyse § Demonstratoren für innovative, analysebasierte Apps bereitstellen § Best Practice Beispiele der amtlichen Statistik aufgreifen 25
  • 26. Handlungsempfehlungen: „Anbieter von AaaS-Werkzeugen“ § Ausbau der Bereitstellung offener Importschnittstellen § Bereitstellung von Funktionen zur Bereinigung und Integration von Daten § Bereitstellung von AaaS-Diensten § Dynamische Integration spezifischer Analyseverfahren § Unterstützung föderierter ODAaaS-Lösungen (ODAaaS-Marktplatz) 26
  • 27. 27 Dr. Stephan Gauch, Dr. Klaus-­‐Peter Eckert, Dr. Maahias Flügge E-­‐Mail: {(stephan.gauch|klaus-­‐peter.eckert| maahias.fluegge)@fokus.fraunhofer.de} Fraunhofer FOKUS Kaiserin-­‐Augusta-­‐Allee 31 10589 Berlin, Deutschland www.fokus.fraunhofer.de