Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

楽天におけるHadoop活用と、Big Dataのビジョン

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Hier ansehen

1 von 32 Anzeige

Weitere Verwandte Inhalte

Andere mochten auch (15)

Weitere von Rakuten Group, Inc. (20)

Anzeige

Aktuellste (20)

楽天におけるHadoop活用と、Big Dataのビジョン

  1. 1. 楽天における 楽天におけるHadoop活用と、 における 活用と 活用 BigDataのビジョン の 楽 天 株 式 会 社 森 正 弥 1
  2. 2. Introduction • 森 正弥 (もり まさや) まさや) • 楽天株式会社 執行役員 • 楽天技術研究所 所長 • 職掌 – 開発部署のマネジメント Masaya Mori – 研究開発の推進・統括 Twitter: @emasha 2
  3. 3. Rakuten Group 3
  4. 4. 1年間で1兆円以上 年間で 兆円以上 年間 4
  5. 5. サービス別会員数*1 5
  6. 6. 楽天経済圏 楽天スーパーポイント 楽天スーパーポイント 共通ID 共通ID ラクーポン 共通決済 6
  7. 7. グループビジネスの拡大と国際展開 1997年 1997年 1998年 1998年 1999年 1999年 2000年 2000年 2001年 2001年 2002年 2002年 2003 2003年 2004 2004年 2005 2005年 2006 2006年 2007 2007年 2008 2008年 2009 2009年 2010年 2010年 2011年 2011年 11 7
  8. 8. 国際展開 ■楽天グループの国際展開 楽天グループの グループ 8
  9. 9. For BigData: Hadoop 9
  10. 10. BigDataへの取組み ■楽天にあるBig Data 楽天にあるBig にある • 70,000,000+ 会員 • 85,000,000+ 商品情報 • 80,000,000+ 購買情報 • 68,000,000+ レビュー、口コミ レビュー、 • 3,000,000+ 1ヶ月あたりの宿泊情報 ヶ あたりの宿泊情報 • 30,000+ 市場出店店舗 • 60,000+ 登録ホテル 登録ホテル • 銀行、クレジットカード情報 銀行、クレジットカード情報 情報…. • 1日あたり数百ギガバイト以上のTransaction 日あたり数百ギガバイト以上 数百ギガバイト以上の DataやAccess Log • etc etc etc 上記は国内のみのデータ量 上記は国内のみのデータ量! のみのデータ 10
  11. 11. Total size M on th -Y Ju ear – 2年で2倍 De n- 9 c 7 Ju - 97 De n- 9 c 8 Ju - 98 n De - 99 c Ju - 99 n Ja - 00 n Ju -0 0 n De - 01 c – 会員は1ヶ月で20万増える Ju - 01 De n- 0 c 2 データは指数関数的に増加 Ju - 02 De n- 0 c 3 レコード10億ごえDBなんてのも Ju - 03 De n- 0 c 4 Ju - 04 n De - 05 c Ju - 05 n De - 06 c Ju - 06 n De - 07 c Ju - 07 De n- 0 c 8 Big Data Problem in Rakuten Ju - 08 De n- 0 c 9 Ju - 09 2 years n De - 1 c- 0 10 x2 は一苦労 分析・利活用 11
  12. 12. Hadoop 活用 ■楽天でのHadoop導入状況 楽天でのHadoop導入状況 でのHadoop • 商品ランキング • MD情報,注文情報分析 (楽天市場) (楽天市場) • ジャンルランキング • お勧め検索機能強化 (楽天市場) (楽天市場) • ログ分析 for • 次世代サーチ (楽天市場) • レコメンドエンジン パーソナライズ • ログデータ格納と分析 (楽天市場) • レコメンドエンジン (楽天市場) (楽天トラベル) 12
  13. 13. レコメンドでの活用 レコメンドでの活用 での 2009年以来、全商品レコメンドにてHadoop活用 70台規模のクラスタで、商品間の類似度計算や購買データをかけ あわせた計算を実施 MyRakuten IchibaTOP - Recommend all item - Browsing-History × Recommend all item 購買データ・数億件 十数億GB 13
  14. 14. ログ分析プラットフォーム: ログ分析プラットフォーム Mebius 分析プラットフォーム 様々なサービスのアクセスログ・検索ログを統合的に解析するプラットフォーム ユーザーの傾向分析をしたり、レコメンド・サービス改善に活用 user Services Rakuten Service Services Mebius Load, Transform, Classify tables Log Analysis Platform Various API Web UI Data Cooperate Ad Hoc Query Staff Rakuten APPs 14
  15. 15. 楽天プロダクトランキング 楽天プロダクトランキング ■処理内容 ・ランキングデータ集計 サーチエンジン 購買履歴 製品マスタDB 製品マスタDB マスタ ・製品ページ用データ生成 ■データ量 データ量 製品名 製品コード 検索ワード 価格 売上件数 売上高 ・1日/1億レコード ・1日/300GB レビュー 商品件数 売上率 購買時間帯 スペック 発売日 ■M/R 処理時間 ・1時間半 ■ノード数 ノード数 ・70台 15
  16. 16. 検索での関連語提示や辞書構築での活用 検索での関連語提示や辞書構築での活用 での関連語提示 での クラスターから検索解析用のHiveにつなげ 関連語の提示や辞書構築等での活用 月 250GBのデータを解析 suggest batch server Suggest Index sync analyzed update search index data Shared Hadoop Cluster NGS Hive dictionary batch 検索エンジン Server NGS common Dictionary platform for hive Index update search index 16
  17. 17. 楽天トラベルでの活用 楽天トラベルでの活用 トラベルでの Access Logs 1 Hiveでデータのサマリー AccessLogを 2 を作成しDWHへ Hadoopクラスターへ 取り込む Rakuten Hadoop Cluster DWH ・・・・・ ・・・・・ ビジネス施策やランキング、 レコメンドへの応用 17
  18. 18. Hadoop 活用 ■楽天でのHadoop導入状況 楽天でのHadoop導入状況 でのHadoop • 商品ランキング • MD情報,注文情報分析 (楽天市場) (楽天市場) • ジャンルランキング • お勧め検索機能強化 (楽天市場) (楽天市場) • ログ分析 for • 次世代サーチ (楽天市場) • レコメンドエンジン パーソナライズ • ログデータ格納と分析 (楽天市場) • レコメンドエンジン (楽天市場) (楽天トラベル) 18
  19. 19. For BigData: Rakuten Super DB 19
  20. 20. 全体像 会員属性 集約 加工・集計・分析 デモグラフィック 購入履歴 基本属性) (基本属性) ジオグラフィック アンケート Rakuten (地理情報) 地理情報) Super DB ビヘイビア カード情報 行動) (行動) スーパーポイント サイコグラフィック データ提供 データ提供 心理的属性) (心理的属性) アプリケーション 楽天クーポン ・パーソナライズ ・リコメンデーション ログイン ・行動ターゲティング広告 DB ファイル 外部データ ・営業支援 (Mosaic 等) ・・・・ 利用 20
  21. 21. レコメンデーション技術の レコメンデーション技術の自社開発 技術 大量なデータをいかすレコメンドの自社開発 自社レコメンデーション エンジン開発 楽天 スーパーDB + レコメンデーション/パーソナライゼーションされたコンテンツ レコメンデーション/パーソナライゼーションされたコンテンツ された の提供により、購買転換率UP 提供により 購買転換率UP により、 21
  22. 22. 【レコメンド・エンジン】 レコメンド・エンジン】 22
  23. 23. 【レコメンド・エンジン】 楽天グループへ横展開 レコメンド・エンジン】 楽天グループ グループへ 楽天市場 楽天レンタル 楽天レンタル 楽天ブックス 楽天ブックス 楽天ダウンロード 楽天ダウンロード 23
  24. 24. レコメンデーションプラットフォーム TOHO サービス特性毎にレコメンドロジックをカスタマイズ可能な サービス特性毎にレコメンドロジックをカスタマイズ可能な、 特性毎 可能 TOHO 楽天経済圏の 楽天経済圏のレコメンデーションプラットフォーム スーパーDB スーパー レコメンデーション 各サービスでの サービスでの プラットフォーム レコメンド展開 レコメンド展開 商品・サービスDB 商品・サービスDB 顧客属性DB 顧客属性DB 【各種レコメンドロジック】 各種レコメンドロジック】 レコメンドロジック 協調フィルタリング 購買履歴DB 購買履歴DB リターゲティング バスケット 閲覧履歴DB 閲覧履歴DB グループ相関 コンテンツベース 各サービス サービス独自DB サービス独自DB 独自 24
  25. 25. メール配信の最適化 ■メール配信エンジンシステム連携 メール配信エンジンシステム連携 配信エンジンシステム SPDBの集約/分析データをメール配信システムに自動連携 効果: メール配信システムからSPDBの属性をセグメント指定をすることで、 精度の高いパーソナライズの実現→効果的なメールプロモーションが可能となる。 セグメント指定、配信管理 セグメント指定、 指定 特定ジャンル購買者・見込者へのアプローチ 特定ジャンル購買者・見込者へのアプローチ ジャンル購買者 への 特定クラスタ会員へのアプローチ 特定クラスタ会員へのアプローチ クラスタ会員への Rakuten Super DB 特定サービス利用者へのアプローチ 特定サービス利用者へのアプローチ サービス利用者への 25
  26. 26. スーパーDBの利用方法・効果 ■パーソナライズ(バナー) パーソナライズ(バナー) 顧客をセグメント化し、適切なバナーを出し分け ク 0.7%リ GORAリテンション 効果例: 0.6% ッ コントロールグループ ク ゴルフ予約サービスGORAの既存顧客の 率 0.5% リテンションを目的とし、GORAを過去数ヶ 0.4% 月以内に利用したことがあるが、直近利 0.3% 用のないユーザにバナーを露出したところ、 大幅アップ 大幅アップ 0.2% クリック率 数倍の効果! クリック率で数倍の効果! 0.1% 0.0% 08/08/08 08/08/11 08/08/12 08/08/13 08/08/14 08/08/17 08/08/18 08/08/19 08/08/20 08/08/09 08/08/10 08/08/15 08/08/16 26
  27. 27. スーパーDBの利用方法・効果 ■BIツールの提供と利用促進 BIツールの提供と ツール SPDBの集約/分析データをBIツールで利用可能とすることで分析者を拡大 →BICCへの取り組みへ 27
  28. 28. スーパーDBの利用方法・効果 ■クロスユースの進展 クロスユースの スーパーDBを利用したパーソナライゼーション等によりクロスユースが増加 p %U 7 .8 28
  29. 29. For the future 29
  30. 30. SuperDB ☓ Hadoop Infrastructure ■SPDBとの連携について SPDBとの連携について との連携 Rakuten Super DB Member Purchase Card Point Service 30
  31. 31. データの研究目的での提供 ■アカデミックへの貢献 アカデミックへの貢献 への 楽天の様々なデータを大学、公的研究機関に公開 楽天技術研究所-楽天データ公開 http://rit.rakuten.co.jp/rdr/index.html •楽天市場の全商品データ(約5000万商品)、レビューデータ(約1660万レビュー) •楽天トラベルの施設データ(11,468施設)、レビューデータ(35万レビュー、34万評価) •楽天GORAの施設データ(1,669施設)、レビューデータ(32万レビュー) <商品データ> <レビュー> 2011年追加! <宿泊評価> <ゴルフ場データ> 31
  32. 32. Thank You! If you like big data: www.rakuten.co.jp/recruit for job info! 32

×