Big Data, Big Brother
Chancen und Risiken massenhafter elektronischer Datenverarbeitung!
!
Jakob Steinschaden, Wien, 29. April 2014

Am Puls, Albert Schweitzer Haus
Wo ich publiziere:
Was ist Big Data eigentlich??
„Big data is like teenage sex: 

Everyone talks about it, 

nobody really knows how to do it, 

everyone thinks everyone else is doing it, 

so everyone claims they are doing it.“
- Dan Ariely, Duke University, 

6. Jänner 2013
Die nächsten 20 Minuten:
• Definition und Erklärungsversuch
• Big Data der IT-Riesen
• Big Data für österreichische KMU
• Big Data in der Politik
• Big Data bei der NSA
Datensammeln ist nichts Neues:!
„Es geschah […] in jenen Tagen, dass
eine Verordnung vom Kaiser Augustus
ausging, den ganzen Erdkreis
einzuschreiben. Und alle gingen hin, um
sich einschreiben zu lassen, ein jeder in
seine Stadt. Es ging aber auch Josef
von Galiläa, aus der Stadt Nazareth,
hinauf nach Judäa, in Davids Stadt, die
Bethlehem heißt, weil er aus dem Haus
und Geschlecht Davids war, um sich
einschreiben zu lassen mit Maria, seiner
Verlobten, die schwanger war.“

- Lukas 2,1-5, Neues Testament
„Volkszählung zu Bethlehem“, © Pieter Bruegel der Ältere, 1566
= Daten bedeuteten bereits vor 2000 Jahren Macht und Geld
Neue Qualität:
Social Mobile Local
Datensammeln heute
• Datenmengen: Jeden Tag 

werden 2,5 Quintillionen 

(10 hoch 18) Bytes produziert
(IBM)
• Datenfirmen: Google,
Facebook, Amazon etc. machen
Milliardenumsätze mit Big Data
(v.a. Real Time Advertising)
• Datenwissenschaftler: Bis
2015 werden 4,4 Mio. Forscher
gebraucht, um diese
Datenmengen zu analysieren
(Gartner)
Quellen: saferinternet.at, Universität Mainz, McAfee © Facebook, Google
The 4 Big V`s of Big Data:
•Volume: Die meisten US-Firmen haben bereits mehr als 100

Petabytes an Daten gespeichert

•Velocity: Daten werden heute in ungeheurer Geschwindigkeit

produziert. NYSE: 1 Terabyte Daten / Trading Session

•Variety: Von Facebook-Likes über Herzschlagfrequenz,
Aktienkurs, Webvideos, Location-Data bis zu Gesichts-Tags

•Veracity/Validity/Volatility: Schlechte Datenqualität kostet
Weltwirtschaft IBM zufolge pro Jahr 3,1 Bio. Dollar/Jahr
Quelle: IBM, http://www.ibmbigdatahub.com/infographic/four-vs-big-data
Was kann Big Data?
• „Big Data bringt eine neue
Qualität der Beobachtung“
• „Unser Leben ist bereits in
vielen Bereichen durch Big
Data bestimmt“
• „Big Data liefert bessere
Entscheidungsgrundlagen“
• „Wir beginnen in einer Welt zu
leben, in der Minority Report
Realität wird“
© Viktor Mayer-Schönberger
Beispiel 1: Google Flu Trends
http://www.google.org/flutrends/
• 45 Suchbegriffe
werden getrackt
• täglich aktuelle
Werte für 29
Länder weltweit
• Kritik: Grippefälle
wurden
überschätzt
Beispiel 2: Amazon Fire TV
• Fire TV ist eine Set-Top-Box,
die TV-Streaming via Internet
auf den Flat-TV bringt
• zusätzlich zu Daten über
Verkäufe und Umsatz hat
Amazon Nutzermeinungen zu
Produkten
• gestaltet seine eigenen
Produkte auf Basis dieser
Daten und bietet sie billiger 

an als die Konkurrenz
© Amazon
Beispiel 3: Facebook
• positive und negative
Worte in Statusmeldungen
von Mitgliedern werden
aggregiert und
ausgewertet
• Sentimentanalyse von
Statusmeldungen auch
während US-Vorwahlen der
Republikaner 2012
• Big-Data-Analysen werden
nicht mehr öffentlich
kommuniziert
Facebook Gross National Happiness Index
Measure GOP Candidate Buzz for Politico
Beispiel 3: Runtastic
• Das österreichische Start-up
kann 70 Mio. App-Downloads
vorweisen, 27 Mio. davon in
der kostenpflichtigen Variante
• Apps erfassen Alter, Größe,
Gewicht, Speed, Route und
den „Power Song“ des Users
• Runtastic brachte kürzlich
gemeinsam mit Universal
„Runtastic Music Running 

Vol. 1“
© Runtastic
Beispiel 4: mySugr
• Die Smartphone-App für
Diabetiker hilft, die eigenen
Blutzuckerwerte zu
dokumentieren
• Daten können anonymisiert
Wissenschaftlern zugänglich
gemacht werden
• Partnerschaften mit
Pharmafirmen, die Interesse
an den Nutzerdaten haben
© mySugr
Beispiel 5: Obama
• Datenwissenschaftler waren
wichtiger Bestandteil des
Wahlkampfteams
• Nicht nur, mit wem (Alter,
Geschlecht, Einkommen,
Wahlbezirk etc.) man
kommuniziert, sondern wie
• z.B. Single-Haushalte wurden
per Telefon adressiert, bei
Familien funktionierte das
nicht so gut (Zeitfaktor)
Beispiel 6: Mahü
• Auch rund um die
Volksbefragung zur Zukunft
der Mariahilferstraße wehte ein
Hauch von Obama durch
Neubau
• Agentur mindworker
analysierte für die Grünen
Daten von 25.000
Wahlberechtigten
• Mailings wurden auf Basis
dieser Daten hinsichtlich Alter,
Geschlecht und Nationalität
personalisiert
Big Brother NSA
• 5 Milliarden Daten über
Handy-Standortdaten pro Tag
• 200 Millionen SMS pro Tag
• Kapazitäten, um eine Milliarde
Telefongespräche pro Tag zu
speichern
• Datencenter in Utah soll
Yottabytes oder zumindest
hunderte Petabytes Daten
speichern können
Der „Chilling Effect“
• 86 Prozent der US-Nutzer
haben schon ersucht, ihre
Spuren im Web zu verwischen
• 22 Interessensverbände
berichten, dass Konsumenten
heikle Telefonate vermeiden
• Jeder sechste US-
Schriftsteller des PEN-
Verbands vermeidet, über
heikle Themen zu sprechen
oder zu schreiben
© Jakob Steinschaden
Big Brother entkommen?
• Janet Vertesi, Soziologin an der
Princeton University, machte den
Versuch während ihrer
Schwangerschaft
• entfreundete Onkel, weil er via
Facebook-Direktnachricht zur
Schwangerschaft gratulierte
• surfte mit per TOR-
Anonymisierung auf Baby-
Webseiten
• kaufte auf Amazon nur mit im
Voraus bezahlten Gutscheinen mit
Extra-Account
© janet.vertesi.com
Fazit:
• Big Data prägt schon viel länger unseren Alltag, als
das Hype-Wort die Runde machte
• Big Data wird durch Sensorisierung noch viel mehr an
Bedeutung gewinnen
• Es entstehen neue Berufe: Datenwissenschaftler, 

Datenjournalisten sind künftig sehr gefragt
• Big Data hilft nicht nur Forschung, Marketing und
Konsumenten, sondern auch den Überwachern, was
wiederum soziale Folgen hat
Danke für die
Aufmerksamkeit!
Kontakt:!
jakob.steinschaden@gmx.at
@jakkse
!
Folien ab morgen unter www.jakkse.com

Big Data, Big Brother

  • 1.
    Big Data, BigBrother Chancen und Risiken massenhafter elektronischer Datenverarbeitung! ! Jakob Steinschaden, Wien, 29. April 2014
 Am Puls, Albert Schweitzer Haus
  • 2.
  • 3.
    Was ist BigData eigentlich??
  • 4.
    „Big data islike teenage sex: 
 Everyone talks about it, 
 nobody really knows how to do it, 
 everyone thinks everyone else is doing it, 
 so everyone claims they are doing it.“ - Dan Ariely, Duke University, 
 6. Jänner 2013
  • 5.
    Die nächsten 20Minuten: • Definition und Erklärungsversuch • Big Data der IT-Riesen • Big Data für österreichische KMU • Big Data in der Politik • Big Data bei der NSA
  • 6.
    Datensammeln ist nichtsNeues:! „Es geschah […] in jenen Tagen, dass eine Verordnung vom Kaiser Augustus ausging, den ganzen Erdkreis einzuschreiben. Und alle gingen hin, um sich einschreiben zu lassen, ein jeder in seine Stadt. Es ging aber auch Josef von Galiläa, aus der Stadt Nazareth, hinauf nach Judäa, in Davids Stadt, die Bethlehem heißt, weil er aus dem Haus und Geschlecht Davids war, um sich einschreiben zu lassen mit Maria, seiner Verlobten, die schwanger war.“
 - Lukas 2,1-5, Neues Testament „Volkszählung zu Bethlehem“, © Pieter Bruegel der Ältere, 1566 = Daten bedeuteten bereits vor 2000 Jahren Macht und Geld
  • 7.
  • 8.
    Datensammeln heute • Datenmengen:Jeden Tag 
 werden 2,5 Quintillionen 
 (10 hoch 18) Bytes produziert (IBM) • Datenfirmen: Google, Facebook, Amazon etc. machen Milliardenumsätze mit Big Data (v.a. Real Time Advertising) • Datenwissenschaftler: Bis 2015 werden 4,4 Mio. Forscher gebraucht, um diese Datenmengen zu analysieren (Gartner) Quellen: saferinternet.at, Universität Mainz, McAfee © Facebook, Google
  • 9.
    The 4 BigV`s of Big Data: •Volume: Die meisten US-Firmen haben bereits mehr als 100
 Petabytes an Daten gespeichert
 •Velocity: Daten werden heute in ungeheurer Geschwindigkeit
 produziert. NYSE: 1 Terabyte Daten / Trading Session
 •Variety: Von Facebook-Likes über Herzschlagfrequenz, Aktienkurs, Webvideos, Location-Data bis zu Gesichts-Tags
 •Veracity/Validity/Volatility: Schlechte Datenqualität kostet Weltwirtschaft IBM zufolge pro Jahr 3,1 Bio. Dollar/Jahr Quelle: IBM, http://www.ibmbigdatahub.com/infographic/four-vs-big-data
  • 10.
    Was kann BigData? • „Big Data bringt eine neue Qualität der Beobachtung“ • „Unser Leben ist bereits in vielen Bereichen durch Big Data bestimmt“ • „Big Data liefert bessere Entscheidungsgrundlagen“ • „Wir beginnen in einer Welt zu leben, in der Minority Report Realität wird“ © Viktor Mayer-Schönberger
  • 11.
    Beispiel 1: GoogleFlu Trends http://www.google.org/flutrends/ • 45 Suchbegriffe werden getrackt • täglich aktuelle Werte für 29 Länder weltweit • Kritik: Grippefälle wurden überschätzt
  • 12.
    Beispiel 2: AmazonFire TV • Fire TV ist eine Set-Top-Box, die TV-Streaming via Internet auf den Flat-TV bringt • zusätzlich zu Daten über Verkäufe und Umsatz hat Amazon Nutzermeinungen zu Produkten • gestaltet seine eigenen Produkte auf Basis dieser Daten und bietet sie billiger 
 an als die Konkurrenz © Amazon
  • 13.
    Beispiel 3: Facebook •positive und negative Worte in Statusmeldungen von Mitgliedern werden aggregiert und ausgewertet • Sentimentanalyse von Statusmeldungen auch während US-Vorwahlen der Republikaner 2012 • Big-Data-Analysen werden nicht mehr öffentlich kommuniziert Facebook Gross National Happiness Index Measure GOP Candidate Buzz for Politico
  • 14.
    Beispiel 3: Runtastic •Das österreichische Start-up kann 70 Mio. App-Downloads vorweisen, 27 Mio. davon in der kostenpflichtigen Variante • Apps erfassen Alter, Größe, Gewicht, Speed, Route und den „Power Song“ des Users • Runtastic brachte kürzlich gemeinsam mit Universal „Runtastic Music Running 
 Vol. 1“ © Runtastic
  • 15.
    Beispiel 4: mySugr •Die Smartphone-App für Diabetiker hilft, die eigenen Blutzuckerwerte zu dokumentieren • Daten können anonymisiert Wissenschaftlern zugänglich gemacht werden • Partnerschaften mit Pharmafirmen, die Interesse an den Nutzerdaten haben © mySugr
  • 16.
    Beispiel 5: Obama •Datenwissenschaftler waren wichtiger Bestandteil des Wahlkampfteams • Nicht nur, mit wem (Alter, Geschlecht, Einkommen, Wahlbezirk etc.) man kommuniziert, sondern wie • z.B. Single-Haushalte wurden per Telefon adressiert, bei Familien funktionierte das nicht so gut (Zeitfaktor)
  • 17.
    Beispiel 6: Mahü •Auch rund um die Volksbefragung zur Zukunft der Mariahilferstraße wehte ein Hauch von Obama durch Neubau • Agentur mindworker analysierte für die Grünen Daten von 25.000 Wahlberechtigten • Mailings wurden auf Basis dieser Daten hinsichtlich Alter, Geschlecht und Nationalität personalisiert
  • 18.
    Big Brother NSA •5 Milliarden Daten über Handy-Standortdaten pro Tag • 200 Millionen SMS pro Tag • Kapazitäten, um eine Milliarde Telefongespräche pro Tag zu speichern • Datencenter in Utah soll Yottabytes oder zumindest hunderte Petabytes Daten speichern können
  • 19.
    Der „Chilling Effect“ •86 Prozent der US-Nutzer haben schon ersucht, ihre Spuren im Web zu verwischen • 22 Interessensverbände berichten, dass Konsumenten heikle Telefonate vermeiden • Jeder sechste US- Schriftsteller des PEN- Verbands vermeidet, über heikle Themen zu sprechen oder zu schreiben © Jakob Steinschaden
  • 20.
    Big Brother entkommen? •Janet Vertesi, Soziologin an der Princeton University, machte den Versuch während ihrer Schwangerschaft • entfreundete Onkel, weil er via Facebook-Direktnachricht zur Schwangerschaft gratulierte • surfte mit per TOR- Anonymisierung auf Baby- Webseiten • kaufte auf Amazon nur mit im Voraus bezahlten Gutscheinen mit Extra-Account © janet.vertesi.com
  • 21.
    Fazit: • Big Dataprägt schon viel länger unseren Alltag, als das Hype-Wort die Runde machte • Big Data wird durch Sensorisierung noch viel mehr an Bedeutung gewinnen • Es entstehen neue Berufe: Datenwissenschaftler, 
 Datenjournalisten sind künftig sehr gefragt • Big Data hilft nicht nur Forschung, Marketing und Konsumenten, sondern auch den Überwachern, was wiederum soziale Folgen hat
  • 22.
  • 23.