Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Building a Distributed Data Pipeline

524 Aufrufe

Veröffentlicht am

Spark, Akka, MLlib, Kafka, Spray
Presentation & demo for http://www.daysofcode.nl/ @daysofcode

Veröffentlicht in: Software
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Building a Distributed Data Pipeline

  1. 1. BUILDING A DISTRIBUTED MACHINE LEARNING AT SCALE
  2. 2. BACKGROUND DATA ▸Data is everywhere ▸Data, unapplied, is useless ▸How can we turn high volume & velocity data into value?
  3. 3. BACKGROUND PIPELINE ▸Process the data continuously ▸Apply several processing steps COLLECT MODEL DEPLOY INTEGRA TE
  4. 4. SOLUTION ANALYSE THE STOCK MARKET YAHOO.C OM YAHOO.C OM (PREFETCHED) COLLECTO R MESSAGE BROKER STREAMIN G STORAGE MODEL MACHINE LEARNING MLlibWEBSERVI CE USER / CLIENTS
  5. 5. DEMO DEMO (FINGERS CROSSED)
  6. 6. DONE QUESTIONS? ▸?

×