ODAaaS – Open Data Analytics as a Service 
Dr. Stephan Gauch, Dr. Klaus-Peter Eckert, Dr. Matthias Flügge 
Fraunhofer Inst...
Motvation zur Studie 
§ Zur Verfügung stehende Datenmenge wächst beständig an und neue Werkzeuge der 
Datenanalyse für „N...
Prozessschritte bei ODAaaS 
Trennung unterschiedlicher Aspekte bei der Bereitstellung und Analyse offener Daten 
• Retriev...
Typische Prozessschritte und Anforderungen an ODAaaS 
Retrieve 
Revise 
Integrate 
Analyse 
Technische 
Anforderungen 
Org...
Datenermittlung (Retrieve) 
§ Unterstützung von Schnittstellen und Adressierbarkeit von Zugriffspunkten für Daten 
§ Akt...
Datenbereinigung (Revise) 
§ Inhaltliche Einordnung von Daten auf Basis von Metadaten 
– Metadaten zu Datenquellen; Inhal...
Datenzusammenführung (Integrate) 
§ Zentrale und dezentrale Integration von Daten 
– ETL, Data Federation 
– Integration ...
Datenanalyse (Analyze) 
§ Generische vs. spezifische Analysewerkzeuge 
– Generische Werkzeuge: Auf kompletten Datenbestan...
Experteninterviews 
9 
Feedback der ISPRAT-Partner 
• Grad der Unterstützung der Prozessschritte 
• Anforderungen an offen...
Experteninterviews: Technische Anforderungen 
§ Für die Mehrzahl von Lösungen der Interviewpartner stellen die technische...
Experteninterviews: Verfügbarkeit und Aktualität von Daten 
§ Sicherstellung der Datenverfügbarkeit ein wesentlicher Fakt...
Experteninterviews: Datenqualität 
§ Datenqualität muss so früh wie möglich im Verwertungsprozess realisiert werden. 
§ ...
Experteninterviews: Potentiale von Big Data und Sensordaten 
§ Sehr hohe Wertschöpfungspotentiale durch Big Open Data 
§...
Experteninterviews: Einfache vs. komplexe ODAaaS Konzepte 
§ Domänenspezifische Anwendungen mit klar abgegrenzten Nutzung...
Experteninterviews: Anforderungen an ODAaaS 
§ Barrieren für ODAaaS-Konzepte sind nur selten technischer Natur . 
§ Hemm...
Umsetzung von (O)DaaS in der Cloud 
Vergleich von Implementierungsoptionen 
• Analytics as a Service 
• Information as a S...
NIST Cloud-Referenzarchitektur 
Die 
Blaupause 
für 
Cloud-­‐Architekturen 
17
(O)DAaaS in der Cloud-Referenzarchitektur 
ODAaaS-­‐Ausprägungen 
in 
den 
NIST-­‐Service-­‐Layern 
18
Implementierungsoptionen für ODAaaS 
19 
AnalyEcs-­‐Dienste 
für 
Endnutzer 
AuQereitung 
von 
(Meta-­‐) 
Daten; 
AnalyEcs...
ODAaaS Option 1 – Analytics as a Service 
§ Werkzeug in einer Cloud-Infrastruktur betrieben und Nutzern als mandantenfähi...
ODAaaS Option 2 – Information as a Service 
§ Werkzeug wird in einer Cloud-Infrastruktur auf einer Information-/ und 
Int...
ODAaaS Option 3 – Data as a Service 
§ Werkzeug wird ohne Cloud-Infrastruktur entweder als extern gehosteter Dienst 
mand...
Handlungsempfehlungen 
Ableitung von Handlungsempfehlungen für die betrachteten Stakeholder 
• Bereitstellung offener bzw....
Handlungsempfehlungen: „Bereitstellung offener Daten“ 
§ Etablierung einer Qualitätskultur für offene Daten 
§ Verbesser...
Handlungsempfehlungen: „Analyse offener Daten“ 
§ ODAaaS als Entscheidungshilfe für die öffentliche Verwaltung aufbauen 
...
Handlungsempfehlungen: „Anbieter von AaaS-Werkzeugen“ 
§ Ausbau der Bereitstellung offener Importschnittstellen 
§ Berei...
27 
Dr. 
Stephan 
Gauch, 
Dr. 
Klaus-­‐Peter 
Eckert, 
Dr. 
Maahias 
Flügge 
E-­‐Mail: 
{(stephan.gauch|klaus-­‐peter.ecke...
Nächste SlideShare
Wird geladen in …5
×

ODAaaS – Open Data Analytics as a Service

784 Aufrufe

Veröffentlicht am

Präsentation im Rahmen des 6. ISPRAT Wissenschaftstages 2014 an der Donau-Universität Krems

Veröffentlicht in: Bildung
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
784
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
427
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

ODAaaS – Open Data Analytics as a Service

  1. 1. ODAaaS – Open Data Analytics as a Service Dr. Stephan Gauch, Dr. Klaus-Peter Eckert, Dr. Matthias Flügge Fraunhofer Institut FOKUS, Berlin 6. ISPRAT Wissenschaftstag | Donau-Universität Krems | 26. September 2014
  2. 2. Motvation zur Studie § Zur Verfügung stehende Datenmenge wächst beständig an und neue Werkzeuge der Datenanalyse für „Nichtstatistiker“ gewinnen an Bedeutung (Big Data). § Zunehmend werden Werkzeuge „as a Service“ als Clouddienst bereitgestellt. § Daten der öffentlichen Verwaltung werden zunehmend als Open (Government) Data bereitgestellt. – Nutzen wie Transparenz und Möglichkeit der Partizipation sind nur ein Teilbereich möglichen Nutzens für Wirtschaft und Gesellschaft – Open Government Data muss nicht zwangsläufig die einzige Quelle der Wertschöpfung durch Datenanalyse sein. § Ziel der Studie ist die Frage nach Potentialen und Hemmnissen im Dreiklang „Datenanalyse“, „Clouddienste“ und „Open Data“. – Orientierung an Stand der Technik und für Datenanalyse typische Prozessschritte 2
  3. 3. Prozessschritte bei ODAaaS Trennung unterschiedlicher Aspekte bei der Bereitstellung und Analyse offener Daten • Retrieve - Abruf von Daten • Revise - Ausgestaltung und Bereinigung von Daten • Integrate - Daten miteinander in Beziehung setzen • Analyze - Daten analysieren 3
  4. 4. Typische Prozessschritte und Anforderungen an ODAaaS Retrieve Revise Integrate Analyse Technische Anforderungen Organisatorische Anforderungen Wirtscha9liche Anforderungen 4 Daten Metadaten
  5. 5. Datenermittlung (Retrieve) § Unterstützung von Schnittstellen und Adressierbarkeit von Zugriffspunkten für Daten § Aktualität und Verfügbarkeit von Daten § Umfang der (Open Data) Datenkataloge § Zugriff auf offene und veredelte Daten mittels Cloud-Diensten 5 Umfangreiche Daten können in der Cloud gespeichert sein
  6. 6. Datenbereinigung (Revise) § Inhaltliche Einordnung von Daten auf Basis von Metadaten – Metadaten zu Datenquellen; Inhaltliche, räumliche, zeitliche Kontextualisierung, Lizenz § Datenqualität – Korrektheit, Vollständigkeit, Granularität, Wohlgeformtheit § Datenprovenienz – Unterschiedliche Herkunft 6 Umfangreiche Daten enthalten o9 viel Datenmüll und unvollständige Metadaten
  7. 7. Datenzusammenführung (Integrate) § Zentrale und dezentrale Integration von Daten – ETL, Data Federation – Integration von Daten „on the fly“ vs. Erstellung neuer Datenquellen § Integration als Dienst – Veredelungsdienste, Ontologiedienste, Matching von Daten auf Basis von Metadaten 7 Daten aus verschiedenen Quellen müssen syntakEsch, semanEsch und physikalisch zusammengeführt werden
  8. 8. Datenanalyse (Analyze) § Generische vs. spezifische Analysewerkzeuge – Generische Werkzeuge: Auf kompletten Datenbestand bezogene einfache Analyse- und Visualisierungsoptionen (z.B. Balkendiagramme) – Spezifische Werkzeuge: Klar an bestimmten Verwendungszweck gekoppelte Werkzeuge und Lösungen (z.B. Apps) § Nutzerspezifische Ausgestaltung von Analysemethoden § Datenmarktplätze § Speicherung von Ergebnisdaten § Zusammenarbeit und Community-Ansätze 8 Datenanalyse als Cloud-­‐Dienst oder Bereitstellung analysierter Daten in der Cloud oder Einbeziehung nutzerspezifischer AnalysefunkEonen
  9. 9. Experteninterviews 9 Feedback der ISPRAT-Partner • Grad der Unterstützung der Prozessschritte • Anforderungen an offene Daten • Herausforderungen • Potentiale
  10. 10. Experteninterviews: Technische Anforderungen § Für die Mehrzahl von Lösungen der Interviewpartner stellen die technischen Anforderungen kein Problem dar. § Allgemein verfügen alle Interviewpartner über entsprechende Lösungen, um Datenanalyse in der Cloud als SaaS auszuführen. § Standardisierte Schnittstellen und Konzepte für die Kommunikation von Diensten untereinander und deren Organisation liegen ebenfalls bei einigen Anbietern vor und stellen z.T. einen wesentlichen Anteil ihrer Geschäftsmodelle dar. § Alle kommerziellen Datenanalyselösungen verfügen über umfangreiche Funktionalitäten zur Integration und Nutzung heterogener und verteilter Daten 10
  11. 11. Experteninterviews: Verfügbarkeit und Aktualität von Daten § Sicherstellung der Datenverfügbarkeit ein wesentlicher Faktor für Markterfolg von ODAaaS Konzepten. § Aktualität von Daten ist ebenfalls wesentlicher Erfolgsfaktor. § Herausforderung: Unklarheit, wie die Zuständigkeit von Akteure zur Sicherstellung der Aktualität und Qualität organisiert werden können. § Herausforderung: Koordinationsproblem zwischen Datenbereitstellern, Open Data Plattformen und Dienstleistern (z.B. Datenveredelung). 11
  12. 12. Experteninterviews: Datenqualität § Datenqualität muss so früh wie möglich im Verwertungsprozess realisiert werden. § Daten sollten bis zur Veröffentlichung innerhalb der Organisation verbleiben und auch nur dort behandelt werden. § Herausforderung „Werkzeuge“: Professionelle Instrumente der Datenbereitstellung werden in der öffentlichen Verwaltung noch nicht flächendeckend eingesetzt. § Herausforderung „Prozesse“: Herausforderungen vor allem auf organisatorischer und prozessspezifischer Ebene. § Herausforderung „Dynamik von Daten: Zyklus der Datenerhebung und zeitlich konsistente Zusammenführbarkeit mit anderen Daten muss durch Metadaten gewährleistet werden. 12
  13. 13. Experteninterviews: Potentiale von Big Data und Sensordaten § Sehr hohe Wertschöpfungspotentiale durch Big Open Data § Hohe Wertschöpfung vor allem bei Daten mit besonders großem Umfang (big), hoher Dynamik (timely) oder durch Verschränkung mit anderen Daten (linked) § Vorteil von Big Open Data durch ein Mindestmaß an Sicherheits-oder Datenhoheitsbedenken § Anteil solcher Daten in Open Data-Plattformen noch relativ gering § Positive Zukunftserwartung vor allem bei Daten des Nahverkehrs und des Katastrophenschutzes... § ... tendenziell jedoch skeptisch was Offenlegungsneigung angeht. 13
  14. 14. Experteninterviews: Einfache vs. komplexe ODAaaS Konzepte § Domänenspezifische Anwendungen mit klar abgegrenzten Nutzungskontexten stehen im Vordergrund. § Markt für Datenanalyse offener Daten ist nur schwer zu erschließen und eher an spezifischen Fragestellungen orientierte Lösungen sinnvoll. § Generische Konzepte scheitern oft an Commitment auf Seiten der Datenbereitsteller. § „One size fits all“-Konzepte erweisen sich momentan in der Praxis als schwierig. § Ein Teil der Interviewpartner sieht langfristig hohes Potential für offene schnittstellenbasierte Infrastrukturen. Offene Daten sind dabei jedoch nur Teilmenge einer größeren Dateninfrastruktur. 14
  15. 15. Experteninterviews: Anforderungen an ODAaaS § Barrieren für ODAaaS-Konzepte sind nur selten technischer Natur . § Hemmnisse in erster Linie durch die zu geringe Verfügbarkeit offener Daten und die im internationalen Vergleich bisher in Deutschland noch wenig wahrgenommenen wirtschaftlichen Verwertungspotentiale. § Hemmnisse für generische Konzepte liegen vor allem in Umsetzungskosten und verhaltenem Investitionswillen. Ursache ist, dass der Nutzen nachgelagerter Analyseoptionen zum Teil nicht erkannt wird. § Notwendige Voraussetzung für alle Konzepte ODAaaS ist die konsequente Nutzung offener Schnittstellen und offener Datenformate. 15
  16. 16. Umsetzung von (O)DaaS in der Cloud Vergleich von Implementierungsoptionen • Analytics as a Service • Information as a Service • Data as a Service 16
  17. 17. NIST Cloud-Referenzarchitektur Die Blaupause für Cloud-­‐Architekturen 17
  18. 18. (O)DAaaS in der Cloud-Referenzarchitektur ODAaaS-­‐Ausprägungen in den NIST-­‐Service-­‐Layern 18
  19. 19. Implementierungsoptionen für ODAaaS 19 AnalyEcs-­‐Dienste für Endnutzer AuQereitung von (Meta-­‐) Daten; AnalyEcs-­‐PlaVorm Bereitstellung von Rohdaten und veredelten Daten Data AnalyEcs aaS – SaaS Auswerten integrierter, auQereiteter Daten Verständliche Darstellung der Analyseergebnisse InformaEon aaS – PaaS Filtern, AnnoEeren, Transformieren, Zusammenführen von Daten Bereitstellung einer IntegraEonsplaVorm für Analyseverfahren Storage aaS – IaaS Speichern und Anbieten von Rohdaten Speichern und Anbieten von integrierten, veredelten Daten 1 2 3
  20. 20. ODAaaS Option 1 – Analytics as a Service § Werkzeug in einer Cloud-Infrastruktur betrieben und Nutzern als mandantenfähiger Cloud-Dienst angeboten. § Daten können entweder in der gleichen Cloud-Infrastruktur über Storage as a Service gespeichert, extern gespeichert oder extern als Data as a Service-Dienst angeboten werden. § Der AaaS-Anbieter stellt dem Kunden seine Dienstleistung entsprechend seinem Geschäftsmodell und den Lizenzbedingungen für die Nutzung der offenen Daten zur Verfügung. 20
  21. 21. ODAaaS Option 2 – Information as a Service § Werkzeug wird in einer Cloud-Infrastruktur auf einer Information-/ und Integrations-plattform als Cloud-Dienst angeboten. § Anbieter und Nutzer sind Kunden eines Platform as a Service-Dienstes. Dabei werden sowohl veredelte Daten als auch eine Laufzeitplattform für individuelle Analyseverfahren als Cloud-Dienste angeboten. § Für den Information as a Service-Anbieter ergeben sich dabei interessante Geschäftsmodelle, die von den Lizenzbedingungen der Daten unabhängig sind. 21
  22. 22. ODAaaS Option 3 – Data as a Service § Werkzeug wird ohne Cloud-Infrastruktur entweder als extern gehosteter Dienst mandantenfähig betrieben oder ist lokal in der IT-Umgebung des Nutzers installiert. § Das Werkzeug greift auf in der Cloud gespeicherte und angebotene Daten zu bzw. legt veredelte Daten in der Cloud ab. § Diese Option ist beim Zugriff auf große Datenmengen bzw. bei der Bereitstellung veredelter Daten von Interesse. Sie erlaubt interessante Geschäftsmodell für die Bereitstellern von Daten. 22
  23. 23. Handlungsempfehlungen Ableitung von Handlungsempfehlungen für die betrachteten Stakeholder • Bereitstellung offener bzw. veredelter Daten • Analyse offener Daten in der Verwaltung • Anbieter von AaaS-Werkzeugen 23
  24. 24. Handlungsempfehlungen: „Bereitstellung offener Daten“ § Etablierung einer Qualitätskultur für offene Daten § Verbesserung der Qualität der beschreibenden Metadaten § Unterstützung der öffentlichen Verwaltung durch Open Data Publisher Werkzeuge § Abbau von Medienbrüchen in der öffentlichen Verwaltung § Open Data Beauftragte in der öffentlichen Verwaltung etablieren § Veröffentlichung von Echtzeitdaten und Sensordaten als Open Data ausbauen § Einbeziehung privater und offener Daten jenseits von Open Government Data 24
  25. 25. Handlungsempfehlungen: „Analyse offener Daten“ § ODAaaS als Entscheidungshilfe für die öffentliche Verwaltung aufbauen § Verbesserte Bürgerinformationssysteme durch Datenanalyse § Demonstratoren für innovative, analysebasierte Apps bereitstellen § Best Practice Beispiele der amtlichen Statistik aufgreifen 25
  26. 26. Handlungsempfehlungen: „Anbieter von AaaS-Werkzeugen“ § Ausbau der Bereitstellung offener Importschnittstellen § Bereitstellung von Funktionen zur Bereinigung und Integration von Daten § Bereitstellung von AaaS-Diensten § Dynamische Integration spezifischer Analyseverfahren § Unterstützung föderierter ODAaaS-Lösungen (ODAaaS-Marktplatz) 26
  27. 27. 27 Dr. Stephan Gauch, Dr. Klaus-­‐Peter Eckert, Dr. Maahias Flügge E-­‐Mail: {(stephan.gauch|klaus-­‐peter.eckert| maahias.fluegge)@fokus.fraunhofer.de} Fraunhofer FOKUS Kaiserin-­‐Augusta-­‐Allee 31 10589 Berlin, Deutschland www.fokus.fraunhofer.de

×