Hadoop Conference Japan 2009 #2

楽天の Hadoop 利用事例～技術研究所でも～楽天株式会社　楽天技術研究所　西岡悠平｜ 2009 年 11 月 13 日

楽天技術研究所について　 ,[object Object],[object Object],[object Object],[object Object],研究テーマ More Than Web - 来るべき豊かなリアリティを - コンセプト楽天タワー楽天技術研究所 Rakuten Institute of Technology

自己紹介 ,[object Object],[object Object],[object Object],[object Object]

目次１ Hadoop で集合知プログラミング２ POJO Hadoop ３ fairy by 楽天技術研究所

集合知プログラミング (1)‏ ,[object Object],[object Object],[object Object],[object Object],集合知プログラミングとは？楽天でも売っているらしい

集合知プログラミング (2)‏ ,[object Object],[object Object],[object Object],具体的な手法は？ Hadoop で動くの？？ k-means ( クラスタリング ) について見ていきましょう

k-means 赤クラスタと青クラスタの中心をランダムに

k-means クラスタへ割り当て ( 距離計算 )‏

k-means クラスタへ割り当て

k-means クラスタへ割り当て [2 回目 ] ( 距離計算 )‏

k-means クラスタへ割り当て [2 回目 ]

k-means 中心の移動 [2 回目 ]

楽天の商品を k-means で ,[object Object],[object Object],課題アルゴリズムを工夫それでも一週間ぐらいかかりそう・・・ Hadoop は？？ ( 当時は ver.0.16.x)‏

k-means は Hadoop 上で動くの？　 (1)‏ ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],http://lucene.apache.org/mahout/

k-means は Hadoop 上で動くのか？ (2)‏ 開始収束？開始 (Map 処理 )‏ クラスタへ割り当て (Reduce 処理 )‏ 中心を移動それぞれの点で中心との距離を計算 ⇒ 完全に並列クラスタに属する点を集めて中心の再計算 ⇒ 集約が必要

楽天の商品を k-means ( Hadoop バージョン )‏ ,[object Object],[object Object],どうなった？

Hadoop で Java プログラミング面倒では？？ ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

そこで、 ,[object Object],[object Object],[object Object],[object Object],POJO Hadoop というフレームワークを開発コンセプト EJB Plain Old Java Object （ POJO)

POJO Hadoop の機能 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

WordCount のサンプル ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

楽天では独自に分散フレームワーク開発 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],先月オープンソース化

まとめ ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop Conference Japan 2009 #2

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (19)

Andere mochten auch

Andere mochten auch (20)

Ähnlich wie Hadoop Conference Japan 2009 #2

Ähnlich wie Hadoop Conference Japan 2009 #2 (20)

Mehr von Rakuten Group, Inc.

Mehr von Rakuten Group, Inc. (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (10)

Hadoop Conference Japan 2009 #2