SlideShare ist ein Scribd-Unternehmen logo
1 von 14
Downloaden Sie, um offline zu lesen
0
ユーザ分析における特徴量の作り方
How to provide feature quantities
第37回 TokyoWebmining
アジェンダ
- 1 -
1. 自己紹介
2. 議論したいこと
自己紹介の前に…
- 2 -
本日の発表は、全て発表者の私見であり、所属する団体等とは一切関係ありません。
自己紹介
- 3 -
Twitter :obnym
本名 :尾花山 和哉 (四股名ではない)
略歴 :”尾花山和哉”もしくは”kazuya obanayama”でググった感じです。
最近は共通ポイントデータを相手にPPDMとかやってます。
ちょっと宣伝ですが、最近、購買情報や個人情報を直接取得せずに、
レコメンドやクラスタリングを行う技術を開発しました。(特許申請中)
この領域に興味のある方、情報交換しましょう!
分析屋の日常
顧客だったり、企業だったりしますが、大抵『何か』の分析を依頼されます。
- 4 -
××の分析ヨロシクー
データはいっぱいあるから、
イイ感じの奴お願いねー
上司の声
分析屋の日常
割と良く分からない依頼でも、空気を読んでイイ感じに目標設定して頑張ります。
- 5 -
・・・はーい。
(この前言ってた奴かな…)
分析屋の日常
目標に併せてデータ準備に勤しみます。
- 6 -
さて、データの準備しないと…
購買情報 閲覧情報
分析屋の日常
- 7 -
そんな時…困ることありませんか?
分析屋の日常
対象の特徴を表現するデータが割りと無尽蔵に作れてしまう
- 8 -
あ、アレ…キリが無い…
(;´Д`)
購買情報 閲覧情報
・売上総額
・来店回数
・商品別購買金額
・商品別購買回数
・商品別購買金額構成比
・曜日別…
・累計訪問回数
・訪問時間
・ページ別滞在時間
・ページ別訪問回数構成比
・時間帯別閲覧数
・時間帯別…
分析屋の苦悩
- 9 -
しかも…
分析屋の苦悩
頑張って作ってると処理が遅くなってきて、加速度的に作業がしんどくなる。
- 10 -
特徴量って言っても
同じような物が沢山出てくるし、
処理も遅くなって来る…orz
分析屋の苦悩
更に難しいこと言い始める人もいたりして…
- 11 -
特徴量って言っても
同じような物が沢山出てくるし、
処理も遅くなって来る…orz
タジュウキョウセンセイ
にも注意しろよー!
専門家な感じの声
本日のアンカンファレンス内容
- 12 -
そんな時、皆さん如何されてますか?
本日のアンカンファレンス内容
- 13 -
ぜひ、皆さんで議論しましょう!
• 特徴量の作り方 比率? 絶対値? ヒューリスティクス?
• 特徴量の捨て方/まとめ方 変数選択法? 主成分?

Weitere ähnliche Inhalte

Was ist angesagt?

状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
horihorio
 

Was ist angesagt? (20)

ChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AIChatGPT 人間のフィードバックから強化学習した対話AI
ChatGPT 人間のフィードバックから強化学習した対話AI
 
BERTology のススメ
BERTology のススメBERTology のススメ
BERTology のススメ
 
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
 
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
 
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
 
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
多腕バンディット問題: 定式化と応用 (第13回ステアラボ人工知能セミナー)
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
 
Data-Centric AIの紹介
Data-Centric AIの紹介Data-Centric AIの紹介
Data-Centric AIの紹介
 
BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装
 
研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有研究室における研究・実装ノウハウの共有
研究室における研究・実装ノウハウの共有
 
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
事業の進展とデータマネジメント体制の進歩(+プレトタイプの話)
 
ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づける
 
たのしいプレゼン〜卒論・修論発表の構成を組み立てるコツ〜
たのしいプレゼン〜卒論・修論発表の構成を組み立てるコツ〜たのしいプレゼン〜卒論・修論発表の構成を組み立てるコツ〜
たのしいプレゼン〜卒論・修論発表の構成を組み立てるコツ〜
 
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
 
MICの解説
MICの解説MICの解説
MICの解説
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
 
CatBoost on GPU のひみつ
CatBoost on GPU のひみつCatBoost on GPU のひみつ
CatBoost on GPU のひみつ
 
XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性XAI (説明可能なAI) の必要性
XAI (説明可能なAI) の必要性
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 

Andere mochten auch

Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
 
法人顧客データあれこれ
法人顧客データあれこれ法人顧客データあれこれ
法人顧客データあれこれ
Izumi Akiyama
 
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
Yuki Koyama
 
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
Yuki Koyama
 
Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)
Yuki Koyama
 
勉強会資料 トピック紹介「音楽と機械学習」
勉強会資料 トピック紹介「音楽と機械学習」勉強会資料 トピック紹介「音楽と機械学習」
勉強会資料 トピック紹介「音楽と機械学習」
Itaru Otomaru
 

Andere mochten auch (20)

37th webmining
37th webmining37th webmining
37th webmining
 
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
 
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
 
法人顧客データあれこれ
法人顧客データあれこれ法人顧客データあれこれ
法人顧客データあれこれ
 
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
 
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
 
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
 
Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)
 
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
 
Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}
 
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
 
近年の音楽市場の変化〜同人音楽の登場〜
近年の音楽市場の変化〜同人音楽の登場〜近年の音楽市場の変化〜同人音楽の登場〜
近年の音楽市場の変化〜同人音楽の登場〜
 
勉強会資料 トピック紹介「音楽と機械学習」
勉強会資料 トピック紹介「音楽と機械学習」勉強会資料 トピック紹介「音楽と機械学習」
勉強会資料 トピック紹介「音楽と機械学習」
 
綺麗なデザインの盛り付け方 -超小ネタ編-
綺麗なデザインの盛り付け方 -超小ネタ編-綺麗なデザインの盛り付け方 -超小ネタ編-
綺麗なデザインの盛り付け方 -超小ネタ編-
 
PRML第6章「カーネル法」
PRML第6章「カーネル法」PRML第6章「カーネル法」
PRML第6章「カーネル法」
 
初めての機械学習
初めての機械学習初めての機械学習
初めての機械学習
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築
 
パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)
 
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
 
情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライド情報推薦システム入門:講義スライド
情報推薦システム入門:講義スライド
 

Ähnlich wie ユーザー分析における特徴量の作り方

SIにおけるプロジェクトとプロマネ
SIにおけるプロジェクトとプロマネSIにおけるプロジェクトとプロマネ
SIにおけるプロジェクトとプロマネ
Takesato Nigorikawa
 
ネットで個人はどこまで追われているか
ネットで個人はどこまで追われているかネットで個人はどこまで追われているか
ネットで個人はどこまで追われているか
Yoichi Tomi
 

Ähnlich wie ユーザー分析における特徴量の作り方 (20)

ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知ディープラーニングによる時系列データの異常検知
ディープラーニングによる時系列データの異常検知
 
Oss magic2
Oss magic2Oss magic2
Oss magic2
 
tokyo_webmining_no51
tokyo_webmining_no51tokyo_webmining_no51
tokyo_webmining_no51
 
リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用リアルタイムトレンド抽出飛び込み用
リアルタイムトレンド抽出飛び込み用
 
SIにおけるプロジェクトとプロマネ
SIにおけるプロジェクトとプロマネSIにおけるプロジェクトとプロマネ
SIにおけるプロジェクトとプロマネ
 
Saya Projectの感情スコア推定モデル
Saya Projectの感情スコア推定モデルSaya Projectの感情スコア推定モデル
Saya Projectの感情スコア推定モデル
 
Oss magic
Oss magicOss magic
Oss magic
 
非エンジニアに人工知能に 興味を持ってもらう話
非エンジニアに人工知能に興味を持ってもらう話非エンジニアに人工知能に興味を持ってもらう話
非エンジニアに人工知能に 興味を持ってもらう話
 
Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析Pythonで簡単ネットワーク分析
Pythonで簡単ネットワーク分析
 
ネットで個人はどこまで追われているか
ネットで個人はどこまで追われているかネットで個人はどこまで追われているか
ネットで個人はどこまで追われているか
 
Thinking datascientist itself
Thinking datascientist itselfThinking datascientist itself
Thinking datascientist itself
 
セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44セグメンテーションの考え方・使い方 - TokyoR #44
セグメンテーションの考え方・使い方 - TokyoR #44
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
ゲーム事業×データ分析 ドリコムにおける組織と仕事の組み立て方
 
データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)データ視点のit資産価値評価の検討(経営情報学会2014)
データ視点のit資産価値評価の検討(経営情報学会2014)
 
Lightning Networkのユースケースを考える
Lightning Networkのユースケースを考えるLightning Networkのユースケースを考える
Lightning Networkのユースケースを考える
 
パブリックチェーンとプライベートチェーン
パブリックチェーンとプライベートチェーンパブリックチェーンとプライベートチェーン
パブリックチェーンとプライベートチェーン
 
Shinyを自由に使ってみる​
Shinyを自由に使ってみる​Shinyを自由に使ってみる​
Shinyを自由に使ってみる​
 
第1回SIA研究会(例会)プレゼン資料
第1回SIA研究会(例会)プレゼン資料第1回SIA研究会(例会)プレゼン資料
第1回SIA研究会(例会)プレゼン資料
 
アクセスデータ収集と解析
アクセスデータ収集と解析アクセスデータ収集と解析
アクセスデータ収集と解析
 

ユーザー分析における特徴量の作り方