13. Metrik Anzahl
Rechen-Stunden 109927 Stunden
Rechen-Tage 4580 Tage
Using CycleCloud & Amazon Cloud
The impossible 12,55 Jahre
Rechen-Jahre run finished in...
Anzahl Liganden Ca. 21 Millionen Liganden
14. Metrik Anzahl
Rechen-Stunden 109927 Stunden
Rechen-Tage 4580 Tage
Using CycleCloud & Amazon Cloud
The impossible 12,55 Jahre
Rechen-Jahre run finished in...
Anzahl Liganden Ca. 21 Millionen Liganden
Mit CycleCloud & Amazon Cloud
Der unmögliche Rechenlauf dauerte...
28. n e Wer ist Ihr Kunde wirklich?
nd
Ku
Was mögen Kunden wirklich?
Was geschieht sozial mit Ihren
Produkten?
Wie verwenden Ihre Kunden Ihre
Produkte tatsächlich?
31. Erkenntnis 1: Lassen Sie Ihr Amazon Konto zu
Hause nicht eingeloggt
Erkenntnis 2: Verwenden Sie Ihre vorhandenen
Daten für proaktive Prozesse
32. Big Data mit AWS
Storage Big Data Compute
Herausforderungen fangen bei relativ kleinen Datenmengen an
100 GB 1,000 PB
33. Big Data mit AWS
Storage Big Data Compute
Wenn Datenmengen und Datenanalysen so weit skalieren müssen, dass
Sie innovativ sein müssen mit Sammlung, Speicherung, Organisation,
Analyse und Weitergabe der Daten
34. Storage Big Data Compute
Daten haben Schwerkraft
App Daten App
http://blog.mccrory.me/2010/12/07/data-gravity-in-the-clouds/
35. Storage Big Data Compute
…und in großen Mengen Trägheit…
App App
Latenz Durch
satz
Daten
http://blog.mccrory.me/2010/12/07/data-gravity-in-the-clouds/
36. Storage Big Data Compute
…was es einfacher macht, die Anwendungen zu verschieben als die Daten
A Daten
App
pp
http://blog.mccrory.me/2010/12/07/data-gravity-in-the-clouds/
38. Storage Big Data Compute
Warum jetzt?
Datensammlung und
HPC Computing -auswertung
Große Algorithmen & Modelle Bioanalyse, Bergbau, Ingenieurwesen
Websites Sensordaten
Blogs/Reviews/Emails/Bilder Wetter, Wasser, Smart Grids
Soziale Graphen Bilder/Videos
Facebook, Linked In, Kontakte Verkehr, Überwachungskameras
Application Server Logs Twitter
Websites, Spiele... 50m Tweets/Tag, 1400% Wachstum
pro Jahr
39. Storage Big Data Compute
Warum jetzt?
Datensammlung und
HPC Computing -auswertung
Große Algorithmen & Modelle Bioanalyse, Bergbau, Ingenieurwesen
Mobil verbundene Welt
Websites
Blogs/Reviews/Emails/Bilder
Sensordaten
Wetter, Wasser, Smart Grids
Soziale Graphen
(Daten einfacher zu sammeln, Bilder/Videos
Facebook, Linked In, Kontakte Verkehr, Überwachungskameras
mehr Menschen generieren Daten)
Application Server Logs Twitter
Websites, Spiele... 50m Tweets/Tag, 1400% Wachstum
pro Jahr
40. Storage Big Data Compute
Warum jetzt?
Datensammlung und
HPC Computing -auswertung
Große Algorithmen & Modelle Bioanalyse, Bergbau, Ingenieurwesen
Websites Sensordaten
Mehr Aspekte der Daten
Blogs/Reviews/Emails/Bilder
Soziale Graphen
Wetter, Wasser, Smart Grids
Bilder/Videos
(Vielfalt, Tiefe,
Facebook, Linked In, Kontakte Ort, Häufigkeit)
Verkehr, Überwachungskameras
Application Server Logs Twitter
Websites, Spiele... 50m Tweets/Tag, 1400% Wachstum
pro Jahr
41. Storage Big Data Compute
Warum jetzt?
Datensammlung und
HPC Computing -auswertung
Große Algorithmen & Modelle Bioanalyse, Bergbau, Ingenieurwesen
Websites Sensordaten
Reichhaltigkeit erhalten
Blogs/Reviews/Emails/Bilder
Soziale Graphen
Wetter, Wasser, Smart Grids
Bilder/Videos
Facebook,muss nicht mitteln,
(man Linked In, Kontakte aggregieren oder löschen)
Verkehr, Überwachungskameras
Application Server Logs Twitter
Websites, Spiele... 50m Tweets/Tag, 1400% Wachstum
pro Jahr
52. Viele Aktivitäten von
Hans Meier
Sehr großes
Klick-Log
(TeraByte) Splitte das
Log in viele
kleine Teile
53. Verarbeitung in
einem EMR Cluster
Viele Aktivitäten von
Hans Meier
Sehr großes
Klick-Log
(TeraByte) Splitte das
Log in viele
kleine Teile
54. Verarbeitung in
einem EMR Cluster
Viele Aktivitäten von
Hans Meier
Sehr großes
Klick-Log
(TeraByte) Splitte das Aggregiere
Log in viele die
kleine Teile Ergebnisse
von allen
Knoten
55. Verarbeitung in
einem EMR Cluster
Viele Aktivitäten von
Hans Meier
Sehr großes Was
Klick-Log Hans
(TeraByte) Splitte das
Log in viele
Aggregiere
die Meier
kleine Teile Ergebnisse
von allen
Knoten
getan
hat
56. Sehr großes Was
Klick-Log Hans
(TeraByte) Erkenntnisse in einem Bruchteil der Zeit
Meier
getan
hat
57. 1 Instanz für 100 Stunden
=
100 Instanzen für 1 Stunde
61. Features, die Amazon Elastic
MapReduce nutzen:
Diese Geschäfte könnten dich auch interessieren...
Beitrags-Highlights
Automatische Ergänzung bei der Eingabe
Rechtschreib-Vorschläge
Top Suchen
Werbung
200 Elastic MapReduce Jobs pro Tag
verarbeiten 3TB Daten
62.
63.
64.
65.
66. Alles, was eine beschränkte
Ressource war
ist jetzt eine programmierbare
Ressource