Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

楽天のECにおけるAI技術の活用

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Wird geladen in …3
×

Hier ansehen

1 von 49 Anzeige

楽天のECにおけるAI技術の活用

Herunterladen, um offline zu lesen

□Author
Masaya Mori, Global Head of Rakuten Institute of Technology, Executive Officer, Rakuten Inc.
森正弥 楽天株式会社 執行役員 兼 楽天技術研究所代表
□Description
そもそもなぜ人工知能(AI)をビジネスで活用する必要があるのかの視点に基づいて、AI活用戦略について述べた講演の資料です。

□Author
Masaya Mori, Global Head of Rakuten Institute of Technology, Executive Officer, Rakuten Inc.
森正弥 楽天株式会社 執行役員 兼 楽天技術研究所代表
□Description
そもそもなぜ人工知能(AI)をビジネスで活用する必要があるのかの視点に基づいて、AI活用戦略について述べた講演の資料です。

Anzeige
Anzeige

Weitere Verwandte Inhalte

Diashows für Sie (20)

Ähnlich wie 楽天のECにおけるAI技術の活用 (20)

Anzeige

Weitere von Rakuten Group, Inc. (20)

Aktuellste (20)

Anzeige

楽天のECにおけるAI技術の活用

  1. 1. 森 正弥 楽天株式会社 執行役員 楽天技術研究所 代表 http://rit.rakuten.co.jp/ 「人工知能ビジネス活用研究会 第三期」 楽天のECにおけるAI技術の活用
  2. 2. New Blockchain Capability Bringing Blockchain computational power to AI  Digital Assets & Value Transfer  Smart Contracts  Autonomous Operations  P2P Sharing Economy  Identity & Reputation Systems  Supply Chain Optimization
  3. 3. まずはお約束 • 人工知能(AI)とは – 人間の脳が行う知的な作業をコンピュータで模倣したソフト ウェアやシステムのこと – 具体的には,環境や物体の認識,人間の使う自然言語の 理解や論理的な推論,経験からの学習を行うコンピュータ プログラムのこと – AIを実現する為の技術は細分化 • 自然言語処理,画像処理,音声認識,機械学習,ロボティクス等 – ビッグデータの潮流の中,取得可能なデータ量や活用機 会が増え,データを有効に活用する為のAI技術も注目
  4. 4. 次に。そして、楽天も。 • ビッグデータとは (ビジネスのコンテキストで) – 各種事業や身の回りの様々な技術のコンピュータ化,コンテンツのデ ジタル化に伴い増大しているデータの活用 – 構造化データ + 非構造・非定型データの流入 – リアルタイム性が高いデータ,ログ,クエリ,センサやモバイル機器 が生成するデータ,そして音声や動画のマルチメディアデータをも含む • Ex. M2M, IoT, Industrial 4.0 – 近年,大量データ活用事例が共有 – 楽天も
  5. 5. • 楽天株式会社 執行役員 • 楽天技術研究所 代表 – 2005年設立 – 世界5拠点 100名以上 – 20国籍、博士・IPA未踏出身者 • AI,IoTに加えBlockchainも •The article for the journal of JSAI vol.30 Intro: 森 正弥 http://rit.rakuten.co.jp/
  6. 6. 楽天技術研究所: Rakuten Institute of Technology • 世界5拠点。100名以上。事業とは独立した戦略的R&D組織。 • 研究者の問題意識・関心・やりたいに基づいた研究の推進。 • Bring new wind from Academia to Rakuten. Tokyo NY Singapore Paris Boston http://rit.rakuten.co.jp/
  7. 7. 楽天技術研究所: Rakuten Institute of Technology • 世界5拠点。100名以上。事業とは独立した戦略的R&D組織。 • 研究者の問題意識・関心・やりたいに基づいた研究の推進。 • Bring new wind from Academia to Rakuten. Tokyo NY Singapore Paris Boston http://rit.rakuten.co.jp/ 全領域 AI マーケティング 機械翻訳 AI プロダクトサイエンス AI プロダクトサイエンス AI / DeepLearning AR/VR
  8. 8. 株式会社自律制御システム研究所(ACSL) とドローンを開発 • 「そら楽」の第一弾として、ゴルフ場コース内でのゴル フ用品や軽食、飲み物デリバリー • 着陸に楽天技術研究所の画像認識技術を活用 https://www.youtube.com/watch?v=mc5r7DVEgZc
  9. 9. Deep Learning を活用した判定、診断 Automatic category suggestion. • 楽天グループ 仏 プライスミニスターのC2C アプリ QuickSell に、画像認識機能を搭載 https://www.youtube.com/watch?v=dFTTNWlzBSc
  10. 10. Rakuma: Deep Learning を活用した「もしコレ!」機能をリリース Providing category candidate from uploaded photo by AI. This AI was trained with existing item & genre data by deep learning technology. Rakuma Magazinen http://bit.ly/2c0X5DI ラクマの使いかた YouTube https://youtu.be/1oCgrvOoB20
  11. 11. Accelerate Global R&D on AI • シンガポール科学技術庁とのAI人材育成プログラム • スタンフォード大とのAI・自然言語の共同研究 • 筑波大、MIT ともそれぞれ AI関連の研究 • なぜ、そこまでやるのか? → 人工知能を活用しなければ難しい局面に来ている
  12. 12. 「専門家が負けていく」という問題 • AI の性能・精度が高くなっている • 人類(消費者)が「個別化」している • ロングテールの発展 • 新しい「情報の非対称性」の登場 → 人工知能を活用なしには、もはや(企業は)生きていけない
  13. 13. 「専門家が負けていく」
  14. 14. 「専門家が負けていく」という問題 • AI の性能・精度が高くなっている • 人類(消費者)が「個別化」している • ロングテールの発展 • 新しい「情報の非対称性」の登場 → 人工知能を活用なしには、もはや(企業は)生きていけない
  15. 15. 雑談: 競馬ハッカソン Venue: Crimson House Date: Nov 22nd, 23rd 2015 Contestant: 50 people Referee: famous Keiba commentators Mr. Suda Mr. Nakaya
  16. 16. A variety of applications Team: 9 Teams Some teams used AI (Machine Learning)
  17. 17. At the racecourse “Ohi Keibajo” or 大井競馬場 One team amazingly predicted; No.1 in the 1st race, No.2 in the 2nd race (so close), No.1 in the 3rd race They used Random Forest. (one of Machine Learning / AI) It showed strong potential.
  18. 18. 専門家を凌駕する様々な事例 メルクの化合物活性化予測コンペティション(2012) Enlitic: 肺がん検出 検出の精度は、放射線医師が1人だけで肺がんを検出する 精度を5割以上も上回ったとする Atomwise: 新薬発見 スパコンとAI により、千万近くの化合物・分子構造を数日で 分析。症状と治療薬のペアを発見 治療薬の仮説を作り、新薬発見に IBM Watson Jeopardyでの勝利 Legal Service への進出。治療法の発見
  19. 19. 「専門家が負けていく」という問題 • AI の性能・精度が高くなっている • 人類(消費者)が「個別化」している • ロングテールの発展 • 新しい「情報の非対称性」の登場 → 人工知能を活用なしには、もはや(企業は)生きていけない
  20. 20. ロングテール • ロングテール現象はインターネットの様々に見られる • もはやどの商品が売れるかというのは誰にもわからなくなった • 人手で分析するのには限界がある。
  21. 21. 実は、我々はロングテールに進化している • Conclave (コンクラーベ) より – 2005年と2013年 – http://goo.gl/0swzs2 – ( http://www.washingtonpost.com/blogs/innovations/post/about-those-2005-and-2013-photos-of-the-crowds-in-st-peters- square/2013/03/14/aaf1067a-8cf9-11e2-9f54-f3fdd70acad2_blog.html) ネット上のデータ分布は 全てロングテール化 それと大きく関わる
  22. 22. CASBS (www.casbs.org) • Conference of Advanced Study in Behavioral Science • CASBS スタンフォード大学での行動科学 の会合 • 従来のリーダー分析、組織分析が機能しな い現代。 • 社会科学、人文科学、自然科学の各領域を 統合し、新しい社会分析・価値創出の地平 を目指す。 • 2012年、彼らが重要な関心を払ったの は、「ウォールストリートを占拠せよ」 という現象であった Source: Wikipedia
  23. 23. 【日本の小売の特徴】 顧客も商品もロングテール じゃばら • 販売者もロングテール、購入者もロングテール • 1億9千万の商材。常識ではかれないものが売れる。 • このような背景で、各種AI技術活用が進みつつある 日本は ロングテール じゃばらドリンク
  24. 24. 「専門家が負けていく」という問題 • AI の性能・精度が高くなっている • 人類(消費者)が「個別化」している • ロングテールの発展 • 新しい「情報の非対称性」の登場 → 人工知能を活用なしには、もはや(企業は)生きていけない
  25. 25. 新しい形で登場してきた「情報の非対称性」 • アダム・スミスの「神の見えざる手」 • 近代経済学による「情報の非対称性」 – 中古車市場での指摘、レモンの原理 • インターネットによる逆転 → 人工知能を活用なしには、もはや(企業は)生きていけない
  26. 26. スタートとしての 商品とユーザーの理解
  27. 27. 自然言語処理(NLP) for EC • 商品検索  DBにある商品の構造データに加え、商 品に付随する非定形の商品説明文等も 対象にすることで精度向上  だが楽天市場では4万に上る各種店舗 が作成.ロングテール現象がここにも見 られ,商品の種類や店舗の方針や売り 方で記述内容の形式や質は異なる  商品解説文は,その商品の説明がある と通常考えるが,実データを見ると →  適切な検索の実現には,クエリ拡張,商 品名・属性の抽出,名寄せ,ノイズの除 去等,NLPの技術が要所で重要 • 機械翻訳  国際化、Cross Boarder Trading の人気
  28. 28. うっとろりんとする 白瀧上善如水純米吟醸 メイベリンニューヨークアイシャドウ うっとろりん | と | する 白瀧 | 上善如水 | 純米 | 吟醸 RakutenMA (AFTER) Search Tagger Noise Dtct. Normalization ... メイベリン | ニューヨーク | アイシャドウ MeCab + IPADic (BEFORE) メイベリンニューヨークアイシャドウ 白 瀧 上 善 如水 純 米 吟醸 うっ とろ りん と する (New Word) (Compound Noun) (Unknown Noun) RakutenMA – RIT オリジナル形態素解析エンジン •JavaScript だけで(サーバ接続なしに)動く、学習器付きの形態素解析器。 •点推定を使った単語分割(能動学習)。 •形態素解析部分は文字単位の系列ラベリングモデルを用いる。 •学習の部分はSCWで、線形高速オンライン学習を行う。 • “Soft-segmentation” and “Pointwise segmentation” • OSS: Runs on JVM, compatible with Solr, Lucene
  29. 29. 商品の多様化に対応すべくカタログデータの作成、ノイズの発見 •属性値抽出を系列ラベリング問題として捉え、CRF(条件付確率場)で解く •ブートストラップ法(半教師:少量教師+大量教師なし)での生成 スペイン産地 アイレン60%・ マカベオ40% ブドウ 品種 辛口味わい 白ワイン色 ×ハウス ×ワイン ×タカムラ ○マルコス・エグーレン ×【楽天市場】 1.タイトル中にあ る商品関連用語 の抽出 2.ページ中に ある属性・属性 値の抽出 3.クラスタリング 4.カタログとの紐つけ CatID: 2034500167 商品情報 5.属性名の 同義性の発見 6.ノイズページ の発見産地、生産地、原 産地、地方、地区 ぶどう品種、ブドウ 品種、葡萄品種、 品種、セパージュ
  30. 30. Deploy it to other markets Item pages in Rakuten are created by merchants They Contain lots of unstructured text Hard to see a wine’s attributes Easy to see a wine’s attributes For better service, we need structured data.
  31. 31. 商品のクラスタリング •サーチ、レコメンデーション、パーソナライズの基礎となる。 •K-Means、pLSI 、LDA 等 各種手法が幅広く使われる •嗜好の似たユーザーかどうかの分析でLSH (Locally Sensitive Hash)。 Collaborative Filtering Basket Analysis Text Matching Clustering Cluster Coefficient
  32. 32. 商品に対する評価「レビュー」の解析 (評判解析) 質の高いレビュー (ポジティブ) 質の高いレビュー (ネガティブ) 質 (+) 態度 (+) 態度 (-) 質 (-) •多くは自然言語処理の文書 分類タスクとみなせる •LSIやLDAの活用の場 •シノニム辞書作成やオノマト ペを考慮したクラスタリング を通して、異表記の問題を 解決しながら、多様な評価 視点の重要度を識別し、重 要度にもとづいてランキング
  33. 33. •LDAによる人手を介しないユーザーの嗜好の発見 •Bandit Algorithm のUCBアルゴリズムによる損失量上限の範囲内で最適化 多様化したユーザーのクラスタリング&最適化
  34. 34. 通常のAd配信との違い 通常のターゲティング配信 本ソリューション バナーC バナーB バナーA バナーC バナーB バナーA CBA 25%70% 5 % 5 % 15 %80% 50%25%25% 「誰」に「何」を見せるとのが ベストか判らないのに組合せ を固定してしまう まずは全ての 可能性を試す CTRが最大化されるよう バナー配信比率を クラスタ毎に 自動調整する 可能性を全て試しつつ、パフォーマンスを最大化する (参考)Bandit Algorithm ソリューション
  35. 35. 予測・個別化のプラットフォームへ
  36. 36. 需要予測: 個別化された需要すらも予測 •膨大なデータから季節性・イベント等を加味した、商品販売量の予測 •教師あり学習(非線形回帰) •全体の販売量を被説明変数 •週、月、キャンペーン、月末、連休、温度、等を説明変数に → 在庫・価格の最適化。大幅なコスト削減を実現 コンピューターは量をこなせる ロングテールをこなせる 人はトレンドを作り出す 最新のものに反応できる •更に、パーソナライズとの統合も
  37. 37. スマートクーポン •LDA (購買行動によるクラスタリング)、Bandit Algorithm、需要予測 •&地道な統計モデリングをも組み合わせた、仮想的な価格の個別化の実現 クーポン戦略: 価格の個別化の実現
  38. 38. Economist Prediction of stock market of economics index of demands of products …. Impact on Finance & Management FinTech シフト Provide prediction For Merchants Rakuten’s BigData (ICHIBA’s data) ファイナンスや経営の施策へ ビジネスパートナーへの支援に ミクロからマクロまで あらゆる予測を 楽天データを活用し、金融商品の予測・取引、FX自動取引を実施 金融商品取引では、様々なモデルを試したが、ランダムフォレストを用 いたモデルが一番いい成果を
  39. 39. 各種商品の売れ行きから:景気動向の予測 • Training data : Dec., 2009 – Dec. 2012 • Test data : Jan., 2013 – Apr., 2013 94 96 98 100 102 104 106 108 110 CI(景気動向指数) Month Prediction of CI Actual Predict(Training fit) Predict(Test fit) We already tried to use ICHIBA’s data for prediction of CI (Composite Index or 景気動向指数). Lasso 回帰を活用 実際に様々なものが予測可能に 耐久財・消費財、大衆商品・嗜好品 日用品・高級品
  40. 40. 隠れたニーズをつかみ、 新しいトレンドをつかむ
  41. 41. ロングテール(2億商材)に対応し、ニーズを自動発見 1st,Jan. 31st,Dec. “ランドセル”には、もう一つのハイシーズンがあること をアルゴリズムが自動発見 Prepare for their grand child. Present it at New Year’s 隠れたニーズを 「自動的」に発見
  42. 42. 隠れたニーズを掴む Keyword:父の日 Keyword: ステテコ イベントキーワードの時系列データから 隠れた相関を発見する.
  43. 43. これら全てを統合していく、VA
  44. 44. バーチャルアシスタント for EC • バーチャルアシスタント – 個々のAI技術の活用ではなく,まさに人の知能を模すことを目指す, 人工知能としてのアプリの実現も,ECでの利用例は想定し易い.例え ば,自然言語を用いた対話を通しユーザが求めている情報を提供した り,適切なサービスを紹介したりするアプリ. – Siri やしゃべってコンシェル,Amazon Echo等の例があり,期待あり – ECでの適用例としては,顧客が買いたい商品の名前やジャンルが判 らない,或いはそもそもどう検索したらいいか判らない為に,欲しい商 品情報に辿り着けないような際に,自然言語での対話を通して適切な 商品へと導く機能が期待される[Mikael 06]. → 嗜好・ニーズ・新しいトレンドも理解し、真に「個別化」 されたユーザーへ対処する
  45. 45. 新しい関係へ
  46. 46. AI技術と人間の関係 言語翻訳の機微は、人の力 大量のシーン解析は、機械の力 コンピューターは量をこなせる ロングテールをこなせる 人はトレンドを作り出す 最新のものに反応できる
  47. 47. 新しい関係へ 人の知と機械の力を統合する 新しい関係へ •AI の高度化により、様々な職能がAI に置き換わることで、雇用は 収奪されていくのではないか。 •人は創造性を持っている。機械はロングテールとビッグデータを処 理できる力を持っている。
  48. 48. BehaviorInsight DataAnalystClub 【おまけ】 AI 活用の体制 推進に、横断的なチームは必要 マーケター DBA ビッグデータ エンジニア 楽天技術研究所 •ID, Mail, Checkout •会員データマーケティング、統計分析 •スーパーDB、商用技術、構造化データ •サーチ、レコメンド、ランキング、広告 •Hadoop, Cassandra, Spark, Redis. •OSS、非構造化データ •データマイニング、NLP、機械学習 •分散処理基盤、O2O、Next Reality •独自技術、理論的側面を支える Webデザイナー •Webデザイン、ディレクション •Webアーキテクト、UI/UX 設計 •Adobe、SiteCatalyst、数値解析

×