SlideShare ist ein Scribd-Unternehmen logo
1 von 28
Downloaden Sie, um offline zu lesen
AWSとRUBYで作る	

ビッグデータ解析の裏側
@srockstyle / Shohei Kobayashi	

!
Twitter : https://twitter.com/srockstyle	

Facebook : https://www.facebook.com/srockstyle	

Github : https://github.com/srockstyle
15 MINITE
収まるように
頑張ります
WHO ARE YOU?
「あんた誰や!?」
Shohei Kobayashi
Mind Palette.co.ltd.
Backend ServerSide Engineer
仕事はAWS,Ruby漬け
家ではPHP,Swift漬け
TODAY’S THEME
スマホアプリの	

データ解析インフラについて
SNAPEEEって?
• 写真共有アプリから新しいメディアへ
と進化しているF1層の女性向けスマホ
アプリ。	

• iOS版とAndroid版があるよ。	

• この世に生を受けて四年目。	

• 「カワイイを世界に届ける」がテーマ!
日本からアジアへ アジアから世界へ
世界進出のために蓄積されるビッグデータ解析は不可欠
JAPAN
TAIWAN
CHINA
HONGKONG
SINGAPOLE
TAILAND
….AND MORE!
SNAPEEEのデータ解析基盤
データ解析周りの用語
• データウェアハウス:集めたデータを
入れておくところ	

• データマート:解析結果をいれておく
ところ	

• MapReduce:たくさんのコンピュータで
巨大なデータを解析するプログラミン
グモデル。
見ての通りAWSばっかりだよ!	

AWS万歳!ヽ(‘ ∇‘ )ノ	

AWS万歳!ヽ(‘ ∇‘ )ノ	

AWS万歳!ヽ(‘ ∇‘ )ノ
解析基盤でAWSを選んだ理由
• 解析結果の格納・検索はRedshiftが超速い	

• Hadoopクラスタとジョブの追加・構築・増
減がAPI経由で楽に可能	

• API経由でログの送信・解析・収納まで可能
それでこうなった
AWSまみれ
AWS様々
司令塔サーバの話
○こいつ
RUBY ON RAILS
AND	

AWS-SDK FOR RUBY
なんでRUBYを選んだか?
• 書いてて楽しいから	

• Java、PHPもみんな書けたけど、JavaとPHPは書いてて数ヶ月
で飽きたから(弊社エンジニア陣の主観	

• Rails使っての開発効率の高さ!	

• 全社でJavaからRubyへの移行を進めており、サーバ構築に
Chefの導入もあって言語の統一化を進めていきたかったから
ちょっと待った!
○あれっ……
Q:HADOOPってJAVAじゃね?
MAP REDUCEって	

JAVA以外使えないんじゃ……
そんなあなたに!
HADOOP-STREAMING
がオススメ!
AWSで
HADOOP-STREAMING!
• AWS-SDKからJob-Flowスクリプト流し込めばHadoop-
Streamingでデータ解析が可能。	

• S3上にログの設置→Job実行までをRails内のバッチ処
理で自動化。	

• 標準入力/標準出力でHadoopとやりとりすればよい
のでMapper&Reducerも全部Rubyスクリプト。
流れ
JOB FLOW設定
集計後データは……
• S3の結果ファイルをRedShiftへ投入	

• ダウンロードしたファイルをRで解析	

• RedShift上のデータを別バッチで再利用&フ
ロントエンドでRailsのActive Recordで呼び出
してグラフ化!
おまけ
弊社ではエンジニア募集中だよ!
Ruby、Rails、AWS、iOS、Android、グロースハック
そんなのに興味あるひとはぜひお声かけください	

!
Twitterで@srockstyleまで!
RAILS GIRLも大歓迎!
F1層の女性向けアプリなので
女子のハートがわかるRails Girlも大募集です!
!
!
Twitterで@srockstyleまで!
ご清聴ありがとうございました!
「“カワイイ”を世界に」

Weitere ähnliche Inhalte

Andere mochten auch

20140621 CreatorsMeetUp17
20140621 CreatorsMeetUp1720140621 CreatorsMeetUp17
20140621 CreatorsMeetUp17Seigo Tanaka
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-Yuki Shimizu
 
わかると楽しいInfrastructure as code
わかると楽しいInfrastructure as codeわかると楽しいInfrastructure as code
わかると楽しいInfrastructure as codeShohei Kobayashi
 
Rubyによるデータ解析
Rubyによるデータ解析Rubyによるデータ解析
Rubyによるデータ解析Shugo Maeda
 
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識Katsuhiro Morishita
 
インフラ・サーバ技術の Days of Future Past
インフラ・サーバ技術の Days of Future Pastインフラ・サーバ技術の Days of Future Past
インフラ・サーバ技術の Days of Future PastShohei Kobayashi
 
Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料Shohei Kobayashi
 
落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のことKyoko Kojima
 
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法Kyoko Kojima
 
Classboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methodsClassboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methodsShugo Maeda
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するSatoshi Ishikawa
 
人狼知能プログラミング演習資料2015
人狼知能プログラミング演習資料2015人狼知能プログラミング演習資料2015
人狼知能プログラミング演習資料2015Kosuke Shinoda
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSSNYSOL
 
Rubyで始めるWebスクレイピング
Rubyで始めるWebスクレイピングRubyで始めるWebスクレイピング
Rubyで始めるWebスクレイピングTakuro Sasaki
 
Rubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawlerRubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawlerTakuro Sasaki
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向Takatsugu Kobayashi
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessRie Yamanaka
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Preferred Networks
 

Andere mochten auch (20)

20140621 CreatorsMeetUp17
20140621 CreatorsMeetUp1720140621 CreatorsMeetUp17
20140621 CreatorsMeetUp17
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-
 
わかると楽しいInfrastructure as code
わかると楽しいInfrastructure as codeわかると楽しいInfrastructure as code
わかると楽しいInfrastructure as code
 
Rubyによるデータ解析
Rubyによるデータ解析Rubyによるデータ解析
Rubyによるデータ解析
 
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
 
インフラ・サーバ技術の Days of Future Past
インフラ・サーバ技術の Days of Future Pastインフラ・サーバ技術の Days of Future Past
インフラ・サーバ技術の Days of Future Past
 
Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料Ruby on vim yokohama.vim発表資料
Ruby on vim yokohama.vim発表資料
 
落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと落ち込んだ気分を盛り上げるための10のこと
落ち込んだ気分を盛り上げるための10のこと
 
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
設立1ヶ月の会社に入社して考えたこと 苦手タスクを最速でこなす方法
 
Classboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methodsClassboxes, nested methods, and real private methods
Classboxes, nested methods, and real private methods
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
 
人狼知能プログラミング演習資料2015
人狼知能プログラミング演習資料2015人狼知能プログラミング演習資料2015
人狼知能プログラミング演習資料2015
 
はじめてのDNS
はじめてのDNSはじめてのDNS
はじめてのDNS
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
 
Rubyで始めるWebスクレイピング
Rubyで始めるWebスクレイピングRubyで始めるWebスクレイピング
Rubyで始めるWebスクレイピング
 
Rubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawlerRubyで作るクローラー Ruby crawler
Rubyで作るクローラー Ruby crawler
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向
 
統計Python2
統計Python2統計Python2
統計Python2
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 

Ähnlich wie Awsとrubyで作るビッグデータ解析の裏側

SwiftによるiOS開発再入門
SwiftによるiOS開発再入門SwiftによるiOS開発再入門
SwiftによるiOS開発再入門Tomoki Hasegawa
 
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTVOYAGE GROUP
 
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめVOYAGE GROUP
 
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版Tomoki Hasegawa
 
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のことv6app
 
iOS グラフィックス Tips
iOS グラフィックス TipsiOS グラフィックス Tips
iOS グラフィックス TipsKaname Noto
 
はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版Tomoki Hasegawa
 
20120316 designerworkshoppublished
20120316 designerworkshoppublished20120316 designerworkshoppublished
20120316 designerworkshoppublishedYoichiro Sakurai
 
サイボウズのオープンソースへの取り組み - OSC 2018 Osaka
サイボウズのオープンソースへの取り組み - OSC 2018 Osakaサイボウズのオープンソースへの取り組み - OSC 2018 Osaka
サイボウズのオープンソースへの取り組み - OSC 2018 OsakaYuki Okada
 
Swiftビギナーズ勉強会 第1回 @Co-Edo
Swiftビギナーズ勉強会 第1回 @Co-EdoSwiftビギナーズ勉強会 第1回 @Co-Edo
Swiftビギナーズ勉強会 第1回 @Co-EdoMegumi Otani(Czenhe)
 
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分について
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分についてiOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分について
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分についてFumiya Sakai
 
明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrowKaname Noto
 
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」Shigeyuki Kameda
 
アプリ開発の境界問題を支えるツール
アプリ開発の境界問題を支えるツールアプリ開発の境界問題を支えるツール
アプリ開発の境界問題を支えるツールKeishi Hosoba
 
20120413 nestakabaneworkshop
20120413 nestakabaneworkshop20120413 nestakabaneworkshop
20120413 nestakabaneworkshopYoichiro Sakurai
 
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略Fumiya Sakai
 
【Ltech#5】機械学習を用いた間取り画像の自動解析
【Ltech#5】機械学習を用いた間取り画像の自動解析【Ltech#5】機械学習を用いた間取り画像の自動解析
【Ltech#5】機械学習を用いた間取り画像の自動解析LIFULL Co., Ltd.
 
Ruby会議08 倉貫発表資料
Ruby会議08 倉貫発表資料Ruby会議08 倉貫発表資料
Ruby会議08 倉貫発表資料Yoshihito Kuranuki
 

Ähnlich wie Awsとrubyで作るビッグデータ解析の裏側 (20)

SwiftによるiOS開発再入門
SwiftによるiOS開発再入門SwiftによるiOS開発再入門
SwiftによるiOS開発再入門
 
iphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLTiphone5 発表イベント 最速まとめLT
iphone5 発表イベント 最速まとめLT
 
iphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめiphone5 発表イベント 速報まとめ
iphone5 発表イベント 速報まとめ
 
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版
オプショナル型。〜なんとなく付ける ! ? 撲滅〜 改訂版
 
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
20150312 html5とか勉強会-lt-開発者に知ってほしいi pv6のこと
 
iOS グラフィックス Tips
iOS グラフィックス TipsiOS グラフィックス Tips
iOS グラフィックス Tips
 
はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版はじめてのiOSアプリ開発 Swift対応版
はじめてのiOSアプリ開発 Swift対応版
 
20180914 FiFiC
20180914 FiFiC20180914 FiFiC
20180914 FiFiC
 
20120316 designerworkshoppublished
20120316 designerworkshoppublished20120316 designerworkshoppublished
20120316 designerworkshoppublished
 
サイボウズのオープンソースへの取り組み - OSC 2018 Osaka
サイボウズのオープンソースへの取り組み - OSC 2018 Osakaサイボウズのオープンソースへの取り組み - OSC 2018 Osaka
サイボウズのオープンソースへの取り組み - OSC 2018 Osaka
 
Swiftビギナーズ勉強会 第1回 @Co-Edo
Swiftビギナーズ勉強会 第1回 @Co-EdoSwiftビギナーズ勉強会 第1回 @Co-Edo
Swiftビギナーズ勉強会 第1回 @Co-Edo
 
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分について
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分についてiOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分について
iOSアプリ開発で意識すると役立ちそうな「つなぎ目」の部分について
 
明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow明日のためのBaaS - BaaS for tomorrow
明日のためのBaaS - BaaS for tomorrow
 
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 第5回 Machine Learning 15minutes! 「オフラインデータがAI発展の鍵になる」
 
IkaLog_FPGAStartup1
IkaLog_FPGAStartup1IkaLog_FPGAStartup1
IkaLog_FPGAStartup1
 
アプリ開発の境界問題を支えるツール
アプリ開発の境界問題を支えるツールアプリ開発の境界問題を支えるツール
アプリ開発の境界問題を支えるツール
 
20120413 nestakabaneworkshop
20120413 nestakabaneworkshop20120413 nestakabaneworkshop
20120413 nestakabaneworkshop
 
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略
デザイナー→Webエンジニア→iOSエンジニアと渡り歩いた僕なりのSwiftとの向き合い方と生かす戦略
 
【Ltech#5】機械学習を用いた間取り画像の自動解析
【Ltech#5】機械学習を用いた間取り画像の自動解析【Ltech#5】機械学習を用いた間取り画像の自動解析
【Ltech#5】機械学習を用いた間取り画像の自動解析
 
Ruby会議08 倉貫発表資料
Ruby会議08 倉貫発表資料Ruby会議08 倉貫発表資料
Ruby会議08 倉貫発表資料
 

Awsとrubyで作るビッグデータ解析の裏側