Suche senden
Hochladen
800万人の"食べたい"をHadoopで分散処理
•
Als KEY, PDF herunterladen
•
5 gefällt mir
•
1,520 views
Tatsuya Sasaki
Folgen
Melden
Teilen
Melden
Teilen
1 von 26
Jetzt herunterladen
Empfohlen
Hadoopを業務で使ってみました
Hadoopを業務で使ってみました
Tatsuya Sasaki
マーケティングのためのHadoop利用
マーケティングのためのHadoop利用
Tatsuya Sasaki
Big Data in the Microsoft Platform
Big Data in the Microsoft Platform
Jesus Rodriguez
COOKPADでのHadoop利用
COOKPADでのHadoop利用
Tatsuya Sasaki
961万人の食卓を支えるデータ解析
961万人の食卓を支えるデータ解析
Tatsuya Sasaki
Hadoop and Hive Development at Facebook
Hadoop and Hive Development at Facebook
elliando dias
Константин Макарычев (Sofware Engineer): ИСПОЛЬЗОВАНИЕ SPARK ДЛЯ МАШИННОГО ОБ...
Константин Макарычев (Sofware Engineer): ИСПОЛЬЗОВАНИЕ SPARK ДЛЯ МАШИННОГО ОБ...
Provectus
Hadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきました
moai kids
Empfohlen
Hadoopを業務で使ってみました
Hadoopを業務で使ってみました
Tatsuya Sasaki
マーケティングのためのHadoop利用
マーケティングのためのHadoop利用
Tatsuya Sasaki
Big Data in the Microsoft Platform
Big Data in the Microsoft Platform
Jesus Rodriguez
COOKPADでのHadoop利用
COOKPADでのHadoop利用
Tatsuya Sasaki
961万人の食卓を支えるデータ解析
961万人の食卓を支えるデータ解析
Tatsuya Sasaki
Hadoop and Hive Development at Facebook
Hadoop and Hive Development at Facebook
elliando dias
Константин Макарычев (Sofware Engineer): ИСПОЛЬЗОВАНИЕ SPARK ДЛЯ МАШИННОГО ОБ...
Константин Макарычев (Sofware Engineer): ИСПОЛЬЗОВАНИЕ SPARK ДЛЯ МАШИННОГО ОБ...
Provectus
Hadoop Conference Japan 2011 Fallに行ってきました
Hadoop Conference Japan 2011 Fallに行ってきました
moai kids
Hive vs Pig for HadoopSourceCodeReading
Hive vs Pig for HadoopSourceCodeReading
Mitsuharu Hamba
Building Location Aware Apps - Get Started with PostGIS, PART II
Building Location Aware Apps - Get Started with PostGIS, PART II
lasmasi
Streaming API, Spark and Ruby
Streaming API, Spark and Ruby
Manohar Amrutkar
Hive at Last.fm
Hive at Last.fm
Skills Matter
サンプルから見るMap reduceコード
サンプルから見るMap reduceコード
Shinpei Ohtani
Introduction to pig & pig latin
Introduction to pig & pig latin
knowbigdata
Hadoop 101 for bioinformaticians
Hadoop 101 for bioinformaticians
attilacsordas
Hadoopを業務で使ってみた
Hadoopを業務で使ってみた
Tatsuya Sasaki
Big Data Hadoop Training in Pune-Course Content Advanto Software
Big Data Hadoop Training in Pune-Course Content Advanto Software
Advanto Software
Hive integration: HBase and Rcfile__HadoopSummit2010
Hive integration: HBase and Rcfile__HadoopSummit2010
Yahoo Developer Network
Hw09 Hadoop Development At Facebook Hive And Hdfs
Hw09 Hadoop Development At Facebook Hive And Hdfs
Cloudera, Inc.
Apache spark session
Apache spark session
knowbigdata
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
GeeksLab Odessa
Apache Pig
Apache Pig
Shashidhar Basavaraju
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
Takahiro Kamatani
Pig and Pig Latin - Module 5
Pig and Pig Latin - Module 5
Rohit Agrawal
Big Data @ Orange - Dev Day 2013 - part 2
Big Data @ Orange - Dev Day 2013 - part 2
ovarene
Pig, Making Hadoop Easy
Pig, Making Hadoop Easy
Nick Dimiduk
Cassandra + Hadoop @ApacheCon
Cassandra + Hadoop @ApacheCon
Jeremy Hanna
Hadoop導入事例 in クックパッド
Hadoop導入事例 in クックパッド
Tatsuya Sasaki
Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤
Toshihiro Suzuki
OCF.tw's talk about "Introduction to spark"
OCF.tw's talk about "Introduction to spark"
Giivee The
Weitere ähnliche Inhalte
Was ist angesagt?
Hive vs Pig for HadoopSourceCodeReading
Hive vs Pig for HadoopSourceCodeReading
Mitsuharu Hamba
Building Location Aware Apps - Get Started with PostGIS, PART II
Building Location Aware Apps - Get Started with PostGIS, PART II
lasmasi
Streaming API, Spark and Ruby
Streaming API, Spark and Ruby
Manohar Amrutkar
Hive at Last.fm
Hive at Last.fm
Skills Matter
サンプルから見るMap reduceコード
サンプルから見るMap reduceコード
Shinpei Ohtani
Introduction to pig & pig latin
Introduction to pig & pig latin
knowbigdata
Hadoop 101 for bioinformaticians
Hadoop 101 for bioinformaticians
attilacsordas
Hadoopを業務で使ってみた
Hadoopを業務で使ってみた
Tatsuya Sasaki
Big Data Hadoop Training in Pune-Course Content Advanto Software
Big Data Hadoop Training in Pune-Course Content Advanto Software
Advanto Software
Hive integration: HBase and Rcfile__HadoopSummit2010
Hive integration: HBase and Rcfile__HadoopSummit2010
Yahoo Developer Network
Hw09 Hadoop Development At Facebook Hive And Hdfs
Hw09 Hadoop Development At Facebook Hive And Hdfs
Cloudera, Inc.
Apache spark session
Apache spark session
knowbigdata
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
GeeksLab Odessa
Apache Pig
Apache Pig
Shashidhar Basavaraju
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
Takahiro Kamatani
Pig and Pig Latin - Module 5
Pig and Pig Latin - Module 5
Rohit Agrawal
Big Data @ Orange - Dev Day 2013 - part 2
Big Data @ Orange - Dev Day 2013 - part 2
ovarene
Pig, Making Hadoop Easy
Pig, Making Hadoop Easy
Nick Dimiduk
Cassandra + Hadoop @ApacheCon
Cassandra + Hadoop @ApacheCon
Jeremy Hanna
Was ist angesagt?
(19)
Hive vs Pig for HadoopSourceCodeReading
Hive vs Pig for HadoopSourceCodeReading
Building Location Aware Apps - Get Started with PostGIS, PART II
Building Location Aware Apps - Get Started with PostGIS, PART II
Streaming API, Spark and Ruby
Streaming API, Spark and Ruby
Hive at Last.fm
Hive at Last.fm
サンプルから見るMap reduceコード
サンプルから見るMap reduceコード
Introduction to pig & pig latin
Introduction to pig & pig latin
Hadoop 101 for bioinformaticians
Hadoop 101 for bioinformaticians
Hadoopを業務で使ってみた
Hadoopを業務で使ってみた
Big Data Hadoop Training in Pune-Course Content Advanto Software
Big Data Hadoop Training in Pune-Course Content Advanto Software
Hive integration: HBase and Rcfile__HadoopSummit2010
Hive integration: HBase and Rcfile__HadoopSummit2010
Hw09 Hadoop Development At Facebook Hive And Hdfs
Hw09 Hadoop Development At Facebook Hive And Hdfs
Apache spark session
Apache spark session
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
Java/Scala Lab 2016. Александр Конопко: Машинное обучение в Spark.
Apache Pig
Apache Pig
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
ソーシャルアプリでの Amazon Elastic MapReduce 活用事例
Pig and Pig Latin - Module 5
Pig and Pig Latin - Module 5
Big Data @ Orange - Dev Day 2013 - part 2
Big Data @ Orange - Dev Day 2013 - part 2
Pig, Making Hadoop Easy
Pig, Making Hadoop Easy
Cassandra + Hadoop @ApacheCon
Cassandra + Hadoop @ApacheCon
Ähnlich wie 800万人の"食べたい"をHadoopで分散処理
Hadoop導入事例 in クックパッド
Hadoop導入事例 in クックパッド
Tatsuya Sasaki
Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤
Toshihiro Suzuki
OCF.tw's talk about "Introduction to spark"
OCF.tw's talk about "Introduction to spark"
Giivee The
データ解析技術入門(Hadoop編)
データ解析技術入門(Hadoop編)
Takumi Asai
Tachyon and Apache Spark
Tachyon and Apache Spark
rhatr
hadoop事例紹介
hadoop事例紹介
OSSラボ株式会社
Osd ctw spark
Osd ctw spark
Wisely chen
Hadoop london
Hadoop london
Yahoo Developer Network
Elephant in the cloud
Elephant in the cloud
rhatr
Hadoop Overview & Architecture
Hadoop Overview & Architecture
EMC
The Fundamentals Guide to HDP and HDInsight
The Fundamentals Guide to HDP and HDInsight
Gert Drapers
20091027genentech
20091027genentech
Jeff Hammerbacher
Hadoop入門とクラウド利用
Hadoop入門とクラウド利用
Naoki Yanai
20091203gemini
20091203gemini
Jeff Hammerbacher
20091030nasajpl
20091030nasajpl
Jeff Hammerbacher
anohana
anohana
ybenjo
You know, for search. Querying 24 Billion Documents in 900ms
You know, for search. Querying 24 Billion Documents in 900ms
Jodok Batlogg
Hadoop and Hive Development at Facebook
Hadoop and Hive Development at Facebook
S S
Apache Spark: killer or savior of Apache Hadoop?
Apache Spark: killer or savior of Apache Hadoop?
rhatr
Hadoop Conference Japan 2011 Fall
Hadoop Conference Japan 2011 Fall
Ryu Kobayashi
Ähnlich wie 800万人の"食べたい"をHadoopで分散処理
(20)
Hadoop導入事例 in クックパッド
Hadoop導入事例 in クックパッド
Amebaサービスのログ解析基盤
Amebaサービスのログ解析基盤
OCF.tw's talk about "Introduction to spark"
OCF.tw's talk about "Introduction to spark"
データ解析技術入門(Hadoop編)
データ解析技術入門(Hadoop編)
Tachyon and Apache Spark
Tachyon and Apache Spark
hadoop事例紹介
hadoop事例紹介
Osd ctw spark
Osd ctw spark
Hadoop london
Hadoop london
Elephant in the cloud
Elephant in the cloud
Hadoop Overview & Architecture
Hadoop Overview & Architecture
The Fundamentals Guide to HDP and HDInsight
The Fundamentals Guide to HDP and HDInsight
20091027genentech
20091027genentech
Hadoop入門とクラウド利用
Hadoop入門とクラウド利用
20091203gemini
20091203gemini
20091030nasajpl
20091030nasajpl
anohana
anohana
You know, for search. Querying 24 Billion Documents in 900ms
You know, for search. Querying 24 Billion Documents in 900ms
Hadoop and Hive Development at Facebook
Hadoop and Hive Development at Facebook
Apache Spark: killer or savior of Apache Hadoop?
Apache Spark: killer or savior of Apache Hadoop?
Hadoop Conference Japan 2011 Fall
Hadoop Conference Japan 2011 Fall
Mehr von Tatsuya Sasaki
からあげエンジニアについて
からあげエンジニアについて
Tatsuya Sasaki
クックパッドでのemr利用事例
クックパッドでのemr利用事例
Tatsuya Sasaki
からあげとビーチと私
からあげとビーチと私
Tatsuya Sasaki
メタプログラミングでDSLを書こう
メタプログラミングでDSLを書こう
Tatsuya Sasaki
NoSQLデータベースが登場した背景と特徴
NoSQLデータベースが登場した背景と特徴
Tatsuya Sasaki
Hadoopをemr経由で利用する方法
Hadoopをemr経由で利用する方法
Tatsuya Sasaki
YUI
YUI
Tatsuya Sasaki
Mehr von Tatsuya Sasaki
(7)
からあげエンジニアについて
からあげエンジニアについて
クックパッドでのemr利用事例
クックパッドでのemr利用事例
からあげとビーチと私
からあげとビーチと私
メタプログラミングでDSLを書こう
メタプログラミングでDSLを書こう
NoSQLデータベースが登場した背景と特徴
NoSQLデータベースが登場した背景と特徴
Hadoopをemr経由で利用する方法
Hadoopをemr経由で利用する方法
YUI
YUI
800万人の"食べたい"をHadoopで分散処理
1.
800
” ” Hadoop
2.
• id:sasata299 (
) • Ruby Perl • • http://blog.livedoor.jp/sasata299/
3.
1. Hadoop 2. Hadoop 3. 4. 5.
4.
Hadoop
5.
816 30
3 1
6.
(
)
7.
(
)
8.
• • GROUP BY
( ( Д`) • 7000 ( )
9.
!!
10.
Hadoop
11.
Hadoop
12.
• Google
MapReduce • • • HDFS
13.
(
) ( ) Mapper Reducer ( ) ( )
14.
15.
‣ Hadoop Streaming ‣
Ruby ‣ EC2 Hadoop ( 50 ) ‣ HDFS S3 (s3fs)
16.
17.
(
) ( ) Mapper ( ) ( )
18.
HDFS Mapper, Reducer
19.
Hadoop
cat `hadoop dfs -cat s3://xxx/user/root/in/hoge` ※
20.
require ‘csv’ path =
‘s3://xxx/user/root/in/user_info’ # user_info = `hadoop dfs -cat #{path}` ARGF.each_line do |line| # line.chomp! csv = CSV.parse(line) # user_info end
21.
22.
7000
( )→
23.
7000
( )→ 30
24.
Hadoop
!!
25.
• Mapper, Reducer
HDFS (Hadoop cat) • • DB
Jetzt herunterladen