SlideShare ist ein Scribd-Unternehmen logo
1 von 13
5/6/13 Stefan Schiller
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
Inhalte
1) Was ist “Big Data”?
2) Wo kommen die Daten her?
3) Wer verfügt über “Big Data”?
4) Wie können die Daten ausgewertet werden?
5) Wofür werden Social Media Daten genutzt?
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
(1) Was ist “Big Data”?
● Immer mehr Daten:
– Jeden Tag: 2.5 Trillionen (10^18) Bytes [1]
25.0000000000.0000000 Byte
2.500.000 Terabyte
– 1-TB Festplatte: 8 x 5 x 1 cm
– DHL-Paket: 60 x 30 x 15 cm
=> 630 Festplatten pro Paket
Foto: conskeptical
DHL
30
15 60
cm
06. Mai 2013 Stefan Schiller Seminar Online Reputation
3969 Pakete! Jeden Tag!
5/6/13 Stefan Schiller
Drei Dimensionen
Volume
Velocity
Variety
Unterschiedlichste
Datentypen Datenumfang
Geschwindigkeit
06. Mai 2013 Stefan Schiller Seminar Online Reputation
[2]
5/6/13 Stefan Schiller
(2) Wo kommen die Daten her?
● Bewusst
– Erzeugte Dokumente und Dateien
– Digitale Fotos und Videos
– Posts auf Social Media Webseiten
● Unbewusst
– Suchmaschinen
– Aufgezeichnete Transaktionen
– Logging: Webseiten-Statistiken
Foto: s2art
Foto: bandarji
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
(3) Wer verfügt über “Big Data”?
→ Beispiele
● Large Hardon Collider
– Teilchenbeschleuniger im CERN bei Genf
– 150 Mill. Sensoren → 40 Mill. Daten pro Sekunde
– Datenvolumen 500 Exabyte pro Tag
→ 500.000.000 Terabyte
– Filterung: 99,999% der Daten
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
(3) Wer verfügt über “Big Data”?
→ Beispiele
● Wissenschaft und Forschung
● Staatliche Datenbanken
– CIA, NASA, ...
● Privatsektor
– Amazon
● Linux-basierende Datenbanken
● 59 Mill. aktive Kunden → 42 Terabyte Daten [3]
– Google
– YouTube
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
(4) Wie können die Daten
ausgewertet werden?
● Problem: Extraktion relevanter Informationen
aus riesiger Datenmenge
● “Den Wald vor lauter Bäumen nicht sehen”
● → Daten müssen aufbereitet werden
– Verschiedene Techniken:
● Mustererkennung
● Kluster-Analyse
● Assoziationsanalyse
● ...
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
Assoziationsanalyse
● Wie stark stehen verschiedene Gegenstände
in Beziehung zueinander?
● Anwendung: Crossmarketing
● → Warenkorbanalyse
● Vorhandene Daten werden gezielt für
Werbung genutzt
● “Kunden, die diesen Artikel gekauft haben,
kauften auch ...”
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
2
5
= 40%
0,4
0,6
= 67%
0,4
0,6 * 0,4
= 167%
0
5
= 0%
0,0
0,6
= 0%
0,0
0,6 * 0,2
= 0%
1
5
= 20%
0,2
0,6
= 33%
0,2
0,6 * 0,4
= 83%
3
5
= 60%
0,6
0,6
= 100%
0,6
0,6 * 0,8
= 125%
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
(5) Wofür werden Social Media
Daten genutzt?
● Große Menge an öffentlichen Daten
● Bislang nicht da gewesene Analysen möglich
● Wozu können die Daten genutzt werden?
– Finanzsektor: Bloomberg und WiseWindow nutzen
Daten für gezieltes Investment (+30% Gewinn)
– Naturkatastrophen: Erdbeben in Virginia – Twitter
– Marketing: Nestle ersetzt Umfragen durch Analyse
– Kriminalität: Wichtige Ermittlungsinformationen
06. Mai 2013 Stefan Schiller Seminar Online Reputation
5/6/13 Stefan Schiller
06. Mai 2013 Stefan Schiller Seminar Online Reputation
Fragen und DiskussionFragen und Diskussion
5/6/13 Stefan Schiller
Bilder und Quellen
● Bilder
– http://www.flickr.com/photos/conskeptical/1569962306/
– http://www.flickr.com/photos/s2art/126605647/lightbox/
– http://www.flickr.com/photos/s_w_ellis/3877534599/
– http://www.flickr.com/photos/judy-van-der-
velden/6700513557/sizes/o/in/photostream/
● Quellen
– [1]: http://www.cisco.com/en/US/solutions/collateral/ns341/ns525/
ns537/ns705/ns1175/Cloud_Index_White_Paper.html
– [2]: http://www-01.ibm.com/software/data/bigdata/
– [3]: http://www.comparebusinessproducts.com/fyi/10-largest-
databases-in-the-world
06. Mai 2013 Stefan Schiller Seminar Online Reputation

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (12)

22. Jahrestagung: Die MainDays finden vom 23./24.11.21 in Berlin statt
22. Jahrestagung: Die MainDays finden vom 23./24.11.21 in Berlin statt22. Jahrestagung: Die MainDays finden vom 23./24.11.21 in Berlin statt
22. Jahrestagung: Die MainDays finden vom 23./24.11.21 in Berlin statt
 
Was ist Information Governance?
Was ist Information Governance?Was ist Information Governance?
Was ist Information Governance?
 
Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013Data-Driven Systems - Overview Presentation at InES Symposium 2013
Data-Driven Systems - Overview Presentation at InES Symposium 2013
 
Social Data Strategy: Mehr Wert aus Daten von Facebook & Co. erzeugen
Social Data Strategy: Mehr Wert aus Daten von Facebook & Co. erzeugenSocial Data Strategy: Mehr Wert aus Daten von Facebook & Co. erzeugen
Social Data Strategy: Mehr Wert aus Daten von Facebook & Co. erzeugen
 
Agile Datenanalsyse - der schnelle Weg zum Mehrwert
Agile Datenanalsyse - der schnelle Weg zum MehrwertAgile Datenanalsyse - der schnelle Weg zum Mehrwert
Agile Datenanalsyse - der schnelle Weg zum Mehrwert
 
Mit Design Thinking zum datengetriebenen Marketing
Mit Design Thinking zum datengetriebenen MarketingMit Design Thinking zum datengetriebenen Marketing
Mit Design Thinking zum datengetriebenen Marketing
 
Vorstellung von Datentreiber
Vorstellung von DatentreiberVorstellung von Datentreiber
Vorstellung von Datentreiber
 
Datenstrategie-Seminar
Datenstrategie-SeminarDatenstrategie-Seminar
Datenstrategie-Seminar
 
Business mit Daten? Deutschland auf dem Weg in die smarte Datenwirtschaft
Business mit Daten? Deutschland auf dem Weg in die smarte DatenwirtschaftBusiness mit Daten? Deutschland auf dem Weg in die smarte Datenwirtschaft
Business mit Daten? Deutschland auf dem Weg in die smarte Datenwirtschaft
 
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.atGoogle Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
Google Analytics Konferenz 2015_Building a data strategy_Georg Koch_herold.at
 
DSGVO-Compliance schneller erreichen – mit Talend und Cloudera
DSGVO-Compliance schneller erreichen – mit Talend und ClouderaDSGVO-Compliance schneller erreichen – mit Talend und Cloudera
DSGVO-Compliance schneller erreichen – mit Talend und Cloudera
 
Big Data/Industrie 4.0
Big Data/Industrie 4.0Big Data/Industrie 4.0
Big Data/Industrie 4.0
 

Andere mochten auch

Operaciones con fracciones
Operaciones  con fraccionesOperaciones  con fracciones
Operaciones con fracciones
sthefano015
 

Andere mochten auch (20)

Governing Big Data : Principles and practices
Governing Big Data : Principles and practicesGoverning Big Data : Principles and practices
Governing Big Data : Principles and practices
 
Preparing Data for Sharing: The FAIR Principles
Preparing Data for Sharing: The FAIR PrinciplesPreparing Data for Sharing: The FAIR Principles
Preparing Data for Sharing: The FAIR Principles
 
FAIR data overview
FAIR data overviewFAIR data overview
FAIR data overview
 
Intro to network Science
Intro to network ScienceIntro to network Science
Intro to network Science
 
A Pragmatic Approach to Identity and Access Management
A Pragmatic Approach to Identity and Access ManagementA Pragmatic Approach to Identity and Access Management
A Pragmatic Approach to Identity and Access Management
 
Key Principles Of Data Mining
Key Principles Of Data MiningKey Principles Of Data Mining
Key Principles Of Data Mining
 
Analytics et Big Data, une histoire de cubes...
Analytics et Big Data, une histoire de cubes...Analytics et Big Data, une histoire de cubes...
Analytics et Big Data, une histoire de cubes...
 
Network Science: Theory, Modeling and Applications
Network Science: Theory, Modeling and ApplicationsNetwork Science: Theory, Modeling and Applications
Network Science: Theory, Modeling and Applications
 
Big Data
Big DataBig Data
Big Data
 
50 data principles for loosely coupled identity management v1 0
50 data principles for loosely coupled identity management v1 050 data principles for loosely coupled identity management v1 0
50 data principles for loosely coupled identity management v1 0
 
Big data-analytics-ebook
Big data-analytics-ebookBig data-analytics-ebook
Big data-analytics-ebook
 
Analysis of Major Trends in Big Data Analytics
Analysis of Major Trends in Big Data AnalyticsAnalysis of Major Trends in Big Data Analytics
Analysis of Major Trends in Big Data Analytics
 
UTE “FORTALECER LAS CAPACIDADES Y POTENCIALIDADES DE LA CIUDADANÍA”
UTE “FORTALECER LAS CAPACIDADES Y POTENCIALIDADES DE LA CIUDADANÍA”UTE “FORTALECER LAS CAPACIDADES Y POTENCIALIDADES DE LA CIUDADANÍA”
UTE “FORTALECER LAS CAPACIDADES Y POTENCIALIDADES DE LA CIUDADANÍA”
 
Animación
Animación Animación
Animación
 
Cómo funciona el mundo
Cómo funciona el mundoCómo funciona el mundo
Cómo funciona el mundo
 
Impress 4
Impress 4Impress 4
Impress 4
 
Power point las dificultades del primer año de universidad
Power point las dificultades del primer año de universidadPower point las dificultades del primer año de universidad
Power point las dificultades del primer año de universidad
 
Operaciones con fracciones
Operaciones  con fraccionesOperaciones  con fracciones
Operaciones con fracciones
 
Autores
AutoresAutores
Autores
 
Mi cuento
Mi cuentoMi cuento
Mi cuento
 

Ähnlich wie Big Data

Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?
Data Market Austria
 
Big Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A RelationsBig Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A Relations
Georg Blum
 

Ähnlich wie Big Data (20)

Simsa provider day_datenpolitik_20160608
Simsa provider day_datenpolitik_20160608Simsa provider day_datenpolitik_20160608
Simsa provider day_datenpolitik_20160608
 
Datensicherheit, tracking & sicheres surfen
Datensicherheit, tracking & sicheres surfenDatensicherheit, tracking & sicheres surfen
Datensicherheit, tracking & sicheres surfen
 
2017-05-04 Data Pioneers NetzPAT
2017-05-04 Data Pioneers NetzPAT2017-05-04 Data Pioneers NetzPAT
2017-05-04 Data Pioneers NetzPAT
 
Linked Data nach dem Hype
Linked Data nach dem HypeLinked Data nach dem Hype
Linked Data nach dem Hype
 
Si präsidentenkonferenz vorstellung_opendata.ch_20141203
Si präsidentenkonferenz vorstellung_opendata.ch_20141203Si präsidentenkonferenz vorstellung_opendata.ch_20141203
Si präsidentenkonferenz vorstellung_opendata.ch_20141203
 
Data Science & Big Data, made in Switzerland
Data Science & Big Data, made in SwitzerlandData Science & Big Data, made in Switzerland
Data Science & Big Data, made in Switzerland
 
Socialmedia für die Recherche 2018
Socialmedia für die Recherche 2018Socialmedia für die Recherche 2018
Socialmedia für die Recherche 2018
 
Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?
 
Big Data zwischen Technik und Organisationskultur
Big Data zwischen Technik und OrganisationskulturBig Data zwischen Technik und Organisationskultur
Big Data zwischen Technik und Organisationskultur
 
DE - Module 3 - Improving your business model using external data
DE - Module 3 - Improving your business model using external dataDE - Module 3 - Improving your business model using external data
DE - Module 3 - Improving your business model using external data
 
2017 06-13 odp meet up dma
2017 06-13 odp meet up dma2017 06-13 odp meet up dma
2017 06-13 odp meet up dma
 
Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
 
Retrospektiven - Fehler nicht zweimal machen
Retrospektiven - Fehler nicht zweimal machenRetrospektiven - Fehler nicht zweimal machen
Retrospektiven - Fehler nicht zweimal machen
 
Datenstrategie in der Praxis
Datenstrategie in der PraxisDatenstrategie in der Praxis
Datenstrategie in der Praxis
 
Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"
 
Big Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A RelationsBig Data_und auf was es wirklich ankommt. 1A Relations
Big Data_und auf was es wirklich ankommt. 1A Relations
 
5. Nationale Smart City-Tagung: Open Data und Open Government
5. Nationale Smart City-Tagung: Open Data und Open Government5. Nationale Smart City-Tagung: Open Data und Open Government
5. Nationale Smart City-Tagung: Open Data und Open Government
 
Reportings & Insights mit Google Data Studio | Google Analytics Konferenz 2019
Reportings & Insights mit Google Data Studio | Google Analytics Konferenz 2019Reportings & Insights mit Google Data Studio | Google Analytics Konferenz 2019
Reportings & Insights mit Google Data Studio | Google Analytics Konferenz 2019
 
Workshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: ForschungsdatenmanagementWorkshop für die LUH: Forschungsdatenmanagement
Workshop für die LUH: Forschungsdatenmanagement
 
Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012Grüne ag netzpolitik_20131012
Grüne ag netzpolitik_20131012
 

Big Data

  • 1. 5/6/13 Stefan Schiller 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 2. 5/6/13 Stefan Schiller Inhalte 1) Was ist “Big Data”? 2) Wo kommen die Daten her? 3) Wer verfügt über “Big Data”? 4) Wie können die Daten ausgewertet werden? 5) Wofür werden Social Media Daten genutzt? 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 3. 5/6/13 Stefan Schiller (1) Was ist “Big Data”? ● Immer mehr Daten: – Jeden Tag: 2.5 Trillionen (10^18) Bytes [1] 25.0000000000.0000000 Byte 2.500.000 Terabyte – 1-TB Festplatte: 8 x 5 x 1 cm – DHL-Paket: 60 x 30 x 15 cm => 630 Festplatten pro Paket Foto: conskeptical DHL 30 15 60 cm 06. Mai 2013 Stefan Schiller Seminar Online Reputation 3969 Pakete! Jeden Tag!
  • 4. 5/6/13 Stefan Schiller Drei Dimensionen Volume Velocity Variety Unterschiedlichste Datentypen Datenumfang Geschwindigkeit 06. Mai 2013 Stefan Schiller Seminar Online Reputation [2]
  • 5. 5/6/13 Stefan Schiller (2) Wo kommen die Daten her? ● Bewusst – Erzeugte Dokumente und Dateien – Digitale Fotos und Videos – Posts auf Social Media Webseiten ● Unbewusst – Suchmaschinen – Aufgezeichnete Transaktionen – Logging: Webseiten-Statistiken Foto: s2art Foto: bandarji 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 6. 5/6/13 Stefan Schiller (3) Wer verfügt über “Big Data”? → Beispiele ● Large Hardon Collider – Teilchenbeschleuniger im CERN bei Genf – 150 Mill. Sensoren → 40 Mill. Daten pro Sekunde – Datenvolumen 500 Exabyte pro Tag → 500.000.000 Terabyte – Filterung: 99,999% der Daten 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 7. 5/6/13 Stefan Schiller (3) Wer verfügt über “Big Data”? → Beispiele ● Wissenschaft und Forschung ● Staatliche Datenbanken – CIA, NASA, ... ● Privatsektor – Amazon ● Linux-basierende Datenbanken ● 59 Mill. aktive Kunden → 42 Terabyte Daten [3] – Google – YouTube 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 8. 5/6/13 Stefan Schiller (4) Wie können die Daten ausgewertet werden? ● Problem: Extraktion relevanter Informationen aus riesiger Datenmenge ● “Den Wald vor lauter Bäumen nicht sehen” ● → Daten müssen aufbereitet werden – Verschiedene Techniken: ● Mustererkennung ● Kluster-Analyse ● Assoziationsanalyse ● ... 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 9. 5/6/13 Stefan Schiller Assoziationsanalyse ● Wie stark stehen verschiedene Gegenstände in Beziehung zueinander? ● Anwendung: Crossmarketing ● → Warenkorbanalyse ● Vorhandene Daten werden gezielt für Werbung genutzt ● “Kunden, die diesen Artikel gekauft haben, kauften auch ...” 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 10. 5/6/13 Stefan Schiller 2 5 = 40% 0,4 0,6 = 67% 0,4 0,6 * 0,4 = 167% 0 5 = 0% 0,0 0,6 = 0% 0,0 0,6 * 0,2 = 0% 1 5 = 20% 0,2 0,6 = 33% 0,2 0,6 * 0,4 = 83% 3 5 = 60% 0,6 0,6 = 100% 0,6 0,6 * 0,8 = 125% 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 11. 5/6/13 Stefan Schiller (5) Wofür werden Social Media Daten genutzt? ● Große Menge an öffentlichen Daten ● Bislang nicht da gewesene Analysen möglich ● Wozu können die Daten genutzt werden? – Finanzsektor: Bloomberg und WiseWindow nutzen Daten für gezieltes Investment (+30% Gewinn) – Naturkatastrophen: Erdbeben in Virginia – Twitter – Marketing: Nestle ersetzt Umfragen durch Analyse – Kriminalität: Wichtige Ermittlungsinformationen 06. Mai 2013 Stefan Schiller Seminar Online Reputation
  • 12. 5/6/13 Stefan Schiller 06. Mai 2013 Stefan Schiller Seminar Online Reputation Fragen und DiskussionFragen und Diskussion
  • 13. 5/6/13 Stefan Schiller Bilder und Quellen ● Bilder – http://www.flickr.com/photos/conskeptical/1569962306/ – http://www.flickr.com/photos/s2art/126605647/lightbox/ – http://www.flickr.com/photos/s_w_ellis/3877534599/ – http://www.flickr.com/photos/judy-van-der- velden/6700513557/sizes/o/in/photostream/ ● Quellen – [1]: http://www.cisco.com/en/US/solutions/collateral/ns341/ns525/ ns537/ns705/ns1175/Cloud_Index_White_Paper.html – [2]: http://www-01.ibm.com/software/data/bigdata/ – [3]: http://www.comparebusinessproducts.com/fyi/10-largest- databases-in-the-world 06. Mai 2013 Stefan Schiller Seminar Online Reputation