Datenschutzbeauftragte werden in Zukunft eine wichtige Rolle im Unternehmen s...
ODAaaS – Open Data Analytics as a Service
1. ODAaaS – Open Data Analytics as a Service
Dr. Stephan Gauch, Dr. Klaus-Peter Eckert, Dr. Matthias Flügge
Fraunhofer Institut FOKUS, Berlin
6. ISPRAT Wissenschaftstag | Donau-Universität Krems | 26. September 2014
2. Motvation zur Studie
§ Zur Verfügung stehende Datenmenge wächst beständig an und neue Werkzeuge der
Datenanalyse für „Nichtstatistiker“ gewinnen an Bedeutung (Big Data).
§ Zunehmend werden Werkzeuge „as a Service“ als Clouddienst bereitgestellt.
§ Daten der öffentlichen Verwaltung werden zunehmend als Open (Government) Data
bereitgestellt.
– Nutzen wie Transparenz und Möglichkeit der Partizipation sind nur ein Teilbereich
möglichen Nutzens für Wirtschaft und Gesellschaft
– Open Government Data muss nicht zwangsläufig die einzige Quelle der
Wertschöpfung durch Datenanalyse sein.
§ Ziel der Studie ist die Frage nach Potentialen und Hemmnissen im Dreiklang „Datenanalyse“,
„Clouddienste“ und „Open Data“.
– Orientierung an Stand der Technik und für Datenanalyse typische Prozessschritte
2
3. Prozessschritte bei ODAaaS
Trennung unterschiedlicher Aspekte bei der Bereitstellung und Analyse offener Daten
• Retrieve - Abruf von Daten
• Revise - Ausgestaltung und Bereinigung von Daten
• Integrate - Daten miteinander in Beziehung setzen
• Analyze - Daten analysieren
3
4. Typische Prozessschritte und Anforderungen an ODAaaS
Retrieve
Revise
Integrate
Analyse
Technische
Anforderungen
Organisatorische
Anforderungen
Wirtscha9liche
Anforderungen
4
Daten
Metadaten
5. Datenermittlung (Retrieve)
§ Unterstützung von Schnittstellen und Adressierbarkeit von Zugriffspunkten für Daten
§ Aktualität und Verfügbarkeit von Daten
§ Umfang der (Open Data) Datenkataloge
§ Zugriff auf offene und veredelte Daten mittels Cloud-Diensten
5
Umfangreiche
Daten
können
in
der
Cloud
gespeichert
sein
6. Datenbereinigung (Revise)
§ Inhaltliche Einordnung von Daten auf Basis von Metadaten
– Metadaten zu Datenquellen; Inhaltliche, räumliche, zeitliche Kontextualisierung,
Lizenz
§ Datenqualität
– Korrektheit, Vollständigkeit, Granularität, Wohlgeformtheit
§ Datenprovenienz
– Unterschiedliche Herkunft
6
Umfangreiche
Daten
enthalten
o9
viel
Datenmüll
und
unvollständige
Metadaten
7. Datenzusammenführung (Integrate)
§ Zentrale und dezentrale Integration von Daten
– ETL, Data Federation
– Integration von Daten „on the fly“ vs. Erstellung neuer Datenquellen
§ Integration als Dienst
– Veredelungsdienste, Ontologiedienste, Matching von Daten auf Basis von
Metadaten
7
Daten
aus
verschiedenen
Quellen
müssen
syntakEsch,
semanEsch
und
physikalisch
zusammengeführt
werden
8. Datenanalyse (Analyze)
§ Generische vs. spezifische Analysewerkzeuge
– Generische Werkzeuge: Auf kompletten Datenbestand bezogene einfache
Analyse- und Visualisierungsoptionen (z.B. Balkendiagramme)
– Spezifische Werkzeuge: Klar an bestimmten Verwendungszweck gekoppelte
Werkzeuge und Lösungen (z.B. Apps)
§ Nutzerspezifische Ausgestaltung von Analysemethoden
§ Datenmarktplätze
§ Speicherung von Ergebnisdaten
§ Zusammenarbeit und
Community-Ansätze
8
Datenanalyse
als
Cloud-‐Dienst
oder
Bereitstellung
analysierter
Daten
in
der
Cloud
oder
Einbeziehung
nutzerspezifischer
AnalysefunkEonen
9. Experteninterviews
9
Feedback der ISPRAT-Partner
• Grad der Unterstützung der Prozessschritte
• Anforderungen an offene Daten
• Herausforderungen
• Potentiale
10. Experteninterviews: Technische Anforderungen
§ Für die Mehrzahl von Lösungen der Interviewpartner stellen die technischen
Anforderungen kein Problem dar.
§ Allgemein verfügen alle Interviewpartner über entsprechende Lösungen, um
Datenanalyse in der Cloud als SaaS auszuführen.
§ Standardisierte Schnittstellen und Konzepte für die Kommunikation von Diensten
untereinander und deren Organisation liegen ebenfalls bei einigen Anbietern vor und
stellen z.T. einen wesentlichen Anteil ihrer Geschäftsmodelle dar.
§ Alle kommerziellen Datenanalyselösungen verfügen über umfangreiche
Funktionalitäten zur Integration und Nutzung heterogener und verteilter
Daten
10
11. Experteninterviews: Verfügbarkeit und Aktualität von Daten
§ Sicherstellung der Datenverfügbarkeit ein wesentlicher Faktor für Markterfolg
von ODAaaS Konzepten.
§ Aktualität von Daten ist ebenfalls wesentlicher Erfolgsfaktor.
§ Herausforderung: Unklarheit, wie die Zuständigkeit von Akteure zur Sicherstellung
der Aktualität und Qualität organisiert werden können.
§ Herausforderung: Koordinationsproblem zwischen Datenbereitstellern, Open Data
Plattformen und Dienstleistern (z.B. Datenveredelung).
11
12. Experteninterviews: Datenqualität
§ Datenqualität muss so früh wie möglich im Verwertungsprozess realisiert werden.
§ Daten sollten bis zur Veröffentlichung innerhalb der Organisation verbleiben und
auch nur dort behandelt werden.
§ Herausforderung „Werkzeuge“: Professionelle Instrumente der Datenbereitstellung
werden in der öffentlichen Verwaltung noch nicht flächendeckend eingesetzt.
§ Herausforderung „Prozesse“: Herausforderungen vor allem auf organisatorischer
und prozessspezifischer Ebene.
§ Herausforderung „Dynamik von Daten: Zyklus der Datenerhebung und zeitlich
konsistente Zusammenführbarkeit mit anderen Daten muss durch Metadaten
gewährleistet werden.
12
13. Experteninterviews: Potentiale von Big Data und Sensordaten
§ Sehr hohe Wertschöpfungspotentiale durch Big Open Data
§ Hohe Wertschöpfung vor allem bei Daten mit besonders großem Umfang (big), hoher
Dynamik (timely) oder durch Verschränkung mit anderen Daten (linked)
§ Vorteil von Big Open Data durch ein Mindestmaß an Sicherheits-oder
Datenhoheitsbedenken
§ Anteil solcher Daten in Open Data-Plattformen noch relativ gering
§ Positive Zukunftserwartung vor allem bei Daten des Nahverkehrs und des
Katastrophenschutzes...
§ ... tendenziell jedoch skeptisch was Offenlegungsneigung angeht.
13
14. Experteninterviews: Einfache vs. komplexe ODAaaS Konzepte
§ Domänenspezifische Anwendungen mit klar abgegrenzten Nutzungskontexten
stehen im Vordergrund.
§ Markt für Datenanalyse offener Daten ist nur schwer zu erschließen und eher an
spezifischen Fragestellungen orientierte Lösungen sinnvoll.
§ Generische Konzepte scheitern oft an Commitment auf Seiten der Datenbereitsteller.
§ „One size fits all“-Konzepte erweisen sich momentan in der Praxis als schwierig.
§ Ein Teil der Interviewpartner sieht langfristig hohes Potential für offene
schnittstellenbasierte Infrastrukturen. Offene Daten sind dabei jedoch nur
Teilmenge einer größeren Dateninfrastruktur.
14
15. Experteninterviews: Anforderungen an ODAaaS
§ Barrieren für ODAaaS-Konzepte sind nur selten technischer Natur .
§ Hemmnisse in erster Linie durch die zu geringe Verfügbarkeit offener Daten und
die im internationalen Vergleich bisher in Deutschland noch wenig wahrgenommenen
wirtschaftlichen Verwertungspotentiale.
§ Hemmnisse für generische Konzepte liegen vor allem in Umsetzungskosten und
verhaltenem Investitionswillen. Ursache ist, dass der Nutzen nachgelagerter
Analyseoptionen zum Teil nicht erkannt wird.
§ Notwendige Voraussetzung für alle Konzepte ODAaaS ist die konsequente Nutzung
offener Schnittstellen und offener Datenformate.
15
16. Umsetzung von (O)DaaS in der Cloud
Vergleich von Implementierungsoptionen
• Analytics as a Service
• Information as a Service
• Data as a Service
16
18. (O)DAaaS in der Cloud-Referenzarchitektur
ODAaaS-‐Ausprägungen
in
den
NIST-‐Service-‐Layern
18
19. Implementierungsoptionen für ODAaaS
19
AnalyEcs-‐Dienste
für
Endnutzer
AuQereitung
von
(Meta-‐)
Daten;
AnalyEcs-‐PlaVorm
Bereitstellung
von
Rohdaten
und
veredelten
Daten
Data
AnalyEcs
aaS
–
SaaS
Auswerten
integrierter,
auQereiteter
Daten
Verständliche
Darstellung
der
Analyseergebnisse
InformaEon
aaS
–
PaaS
Filtern,
AnnoEeren,
Transformieren,
Zusammenführen
von
Daten
Bereitstellung
einer
IntegraEonsplaVorm
für
Analyseverfahren
Storage
aaS
–
IaaS
Speichern
und
Anbieten
von
Rohdaten
Speichern
und
Anbieten
von
integrierten,
veredelten
Daten
1
2
3
20. ODAaaS Option 1 – Analytics as a Service
§ Werkzeug in einer Cloud-Infrastruktur betrieben und Nutzern als mandantenfähiger
Cloud-Dienst angeboten.
§ Daten können entweder in der gleichen Cloud-Infrastruktur über Storage as a
Service gespeichert, extern gespeichert oder extern als Data as a Service-Dienst
angeboten werden.
§ Der AaaS-Anbieter stellt dem Kunden seine Dienstleistung entsprechend seinem
Geschäftsmodell und den Lizenzbedingungen für die Nutzung der offenen Daten zur
Verfügung.
20
21. ODAaaS Option 2 – Information as a Service
§ Werkzeug wird in einer Cloud-Infrastruktur auf einer Information-/ und
Integrations-plattform als Cloud-Dienst angeboten.
§ Anbieter und Nutzer sind Kunden eines Platform as a Service-Dienstes. Dabei
werden sowohl veredelte Daten als auch eine Laufzeitplattform für individuelle
Analyseverfahren als Cloud-Dienste angeboten.
§ Für den Information as a Service-Anbieter ergeben sich dabei interessante
Geschäftsmodelle, die von den Lizenzbedingungen der Daten unabhängig sind.
21
22. ODAaaS Option 3 – Data as a Service
§ Werkzeug wird ohne Cloud-Infrastruktur entweder als extern gehosteter Dienst
mandantenfähig betrieben oder ist lokal in der IT-Umgebung des Nutzers installiert.
§ Das Werkzeug greift auf in der Cloud gespeicherte und angebotene Daten zu
bzw. legt veredelte Daten in der Cloud ab.
§ Diese Option ist beim Zugriff auf große Datenmengen bzw. bei der Bereitstellung
veredelter Daten von Interesse. Sie erlaubt interessante Geschäftsmodell für die
Bereitstellern von Daten.
22
23. Handlungsempfehlungen
Ableitung von Handlungsempfehlungen für die betrachteten Stakeholder
• Bereitstellung offener bzw. veredelter Daten
• Analyse offener Daten in der Verwaltung
• Anbieter von AaaS-Werkzeugen
23
24. Handlungsempfehlungen: „Bereitstellung offener Daten“
§ Etablierung einer Qualitätskultur für offene Daten
§ Verbesserung der Qualität der beschreibenden Metadaten
§ Unterstützung der öffentlichen Verwaltung durch Open Data Publisher Werkzeuge
§ Abbau von Medienbrüchen in der öffentlichen Verwaltung
§ Open Data Beauftragte in der öffentlichen Verwaltung etablieren
§ Veröffentlichung von Echtzeitdaten und Sensordaten als Open Data ausbauen
§ Einbeziehung privater und offener Daten jenseits von Open Government Data
24
25. Handlungsempfehlungen: „Analyse offener Daten“
§ ODAaaS als Entscheidungshilfe für die öffentliche Verwaltung aufbauen
§ Verbesserte Bürgerinformationssysteme durch Datenanalyse
§ Demonstratoren für innovative, analysebasierte Apps bereitstellen
§ Best Practice Beispiele der amtlichen Statistik aufgreifen
25
26. Handlungsempfehlungen: „Anbieter von AaaS-Werkzeugen“
§ Ausbau der Bereitstellung offener Importschnittstellen
§ Bereitstellung von Funktionen zur Bereinigung und Integration von Daten
§ Bereitstellung von AaaS-Diensten
§ Dynamische Integration spezifischer Analyseverfahren
§ Unterstützung föderierter ODAaaS-Lösungen (ODAaaS-Marktplatz)
26
27. 27
Dr.
Stephan
Gauch,
Dr.
Klaus-‐Peter
Eckert,
Dr.
Maahias
Flügge
E-‐Mail:
{(stephan.gauch|klaus-‐peter.eckert|
maahias.fluegge)@fokus.fraunhofer.de}
Fraunhofer
FOKUS
Kaiserin-‐Augusta-‐Allee
31
10589
Berlin,
Deutschland
www.fokus.fraunhofer.de