Big Data

728 Aufrufe

Veröffentlicht am

  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Big Data

  1. 1. 5/6/13 Stefan Schiller06. Mai 2013 Stefan Schiller Seminar Online Reputation
  2. 2. 5/6/13 Stefan SchillerInhalte1) Was ist “Big Data”?2) Wo kommen die Daten her?3) Wer verfügt über “Big Data”?4) Wie können die Daten ausgewertet werden?5) Wofür werden Social Media Daten genutzt?06. Mai 2013 Stefan Schiller Seminar Online Reputation
  3. 3. 5/6/13 Stefan Schiller(1) Was ist “Big Data”?● Immer mehr Daten:– Jeden Tag: 2.5 Trillionen (10^18) Bytes [1]25.0000000000.0000000 Byte2.500.000 Terabyte– 1-TB Festplatte: 8 x 5 x 1 cm– DHL-Paket: 60 x 30 x 15 cm=> 630 Festplatten pro PaketFoto: conskepticalDHL3015 60cm06. Mai 2013 Stefan Schiller Seminar Online Reputation3969 Pakete! Jeden Tag!
  4. 4. 5/6/13 Stefan SchillerDrei DimensionenVolumeVelocityVarietyUnterschiedlichsteDatentypen DatenumfangGeschwindigkeit06. Mai 2013 Stefan Schiller Seminar Online Reputation[2]
  5. 5. 5/6/13 Stefan Schiller(2) Wo kommen die Daten her?● Bewusst– Erzeugte Dokumente und Dateien– Digitale Fotos und Videos– Posts auf Social Media Webseiten● Unbewusst– Suchmaschinen– Aufgezeichnete Transaktionen– Logging: Webseiten-StatistikenFoto: s2artFoto: bandarji06. Mai 2013 Stefan Schiller Seminar Online Reputation
  6. 6. 5/6/13 Stefan Schiller(3) Wer verfügt über “Big Data”?→ Beispiele● Large Hardon Collider– Teilchenbeschleuniger im CERN bei Genf– 150 Mill. Sensoren → 40 Mill. Daten pro Sekunde– Datenvolumen 500 Exabyte pro Tag→ 500.000.000 Terabyte– Filterung: 99,999% der Daten06. Mai 2013 Stefan Schiller Seminar Online Reputation
  7. 7. 5/6/13 Stefan Schiller(3) Wer verfügt über “Big Data”?→ Beispiele● Wissenschaft und Forschung● Staatliche Datenbanken– CIA, NASA, ...● Privatsektor– Amazon● Linux-basierende Datenbanken● 59 Mill. aktive Kunden → 42 Terabyte Daten [3]– Google– YouTube06. Mai 2013 Stefan Schiller Seminar Online Reputation
  8. 8. 5/6/13 Stefan Schiller(4) Wie können die Datenausgewertet werden?● Problem: Extraktion relevanter Informationenaus riesiger Datenmenge● “Den Wald vor lauter Bäumen nicht sehen”● → Daten müssen aufbereitet werden– Verschiedene Techniken:● Mustererkennung● Kluster-Analyse● Assoziationsanalyse● ...06. Mai 2013 Stefan Schiller Seminar Online Reputation
  9. 9. 5/6/13 Stefan SchillerAssoziationsanalyse● Wie stark stehen verschiedene Gegenständein Beziehung zueinander?● Anwendung: Crossmarketing● → Warenkorbanalyse● Vorhandene Daten werden gezielt fürWerbung genutzt● “Kunden, die diesen Artikel gekauft haben,kauften auch ...”06. Mai 2013 Stefan Schiller Seminar Online Reputation
  10. 10. 5/6/13 Stefan Schiller25= 40%0,40,6= 67%0,40,6 * 0,4= 167%05= 0%0,00,6= 0%0,00,6 * 0,2= 0%15= 20%0,20,6= 33%0,20,6 * 0,4= 83%35= 60%0,60,6= 100%0,60,6 * 0,8= 125%06. Mai 2013 Stefan Schiller Seminar Online Reputation
  11. 11. 5/6/13 Stefan Schiller(5) Wofür werden Social MediaDaten genutzt?● Große Menge an öffentlichen Daten● Bislang nicht da gewesene Analysen möglich● Wozu können die Daten genutzt werden?– Finanzsektor: Bloomberg und WiseWindow nutzenDaten für gezieltes Investment (+30% Gewinn)– Naturkatastrophen: Erdbeben in Virginia – Twitter– Marketing: Nestle ersetzt Umfragen durch Analyse– Kriminalität: Wichtige Ermittlungsinformationen06. Mai 2013 Stefan Schiller Seminar Online Reputation
  12. 12. 5/6/13 Stefan Schiller06. Mai 2013 Stefan Schiller Seminar Online ReputationFragen und DiskussionFragen und Diskussion
  13. 13. 5/6/13 Stefan SchillerBilder und Quellen● Bilder– http://www.flickr.com/photos/conskeptical/1569962306/– http://www.flickr.com/photos/s2art/126605647/lightbox/– http://www.flickr.com/photos/s_w_ellis/3877534599/– http://www.flickr.com/photos/judy-van-der-velden/6700513557/sizes/o/in/photostream/● Quellen– [1]: http://www.cisco.com/en/US/solutions/collateral/ns341/ns525/ns537/ns705/ns1175/Cloud_Index_White_Paper.html– [2]: http://www-01.ibm.com/software/data/bigdata/– [3]: http://www.comparebusinessproducts.com/fyi/10-largest-databases-in-the-world06. Mai 2013 Stefan Schiller Seminar Online Reputation

×