Suche senden
Hochladen
Rで売上予測のデモ(回帰分析)
•
5 gefällt mir
•
8,115 views
裕
裕美 成田
Folgen
2015/12/22 第八回雑談会で発表した内容です。
Weniger lesen
Mehr lesen
Daten & Analysen
Melden
Teilen
Melden
Teilen
1 von 18
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価
Shintaro Fukushima
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219
Shuhei Ichikawa
回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)
Jaehyun Song
分布から見た線形モデル・GLM・GLMM
分布から見た線形モデル・GLM・GLMM
. .
心理学研究におけるQualtricsの活用
心理学研究におけるQualtricsの活用
igarashilab
SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデル
Masaru Tokuoka
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
StanとRでベイズ統計モデリング 1,2章
StanとRでベイズ統計モデリング 1,2章
Miki Katsuragi
Empfohlen
機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価
Shintaro Fukushima
GLMM in interventional study at Require 23, 20151219
GLMM in interventional study at Require 23, 20151219
Shuhei Ichikawa
回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)
Jaehyun Song
分布から見た線形モデル・GLM・GLMM
分布から見た線形モデル・GLM・GLMM
. .
心理学研究におけるQualtricsの活用
心理学研究におけるQualtricsの活用
igarashilab
SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデル
Masaru Tokuoka
Rで潜在ランク分析
Rで潜在ランク分析
Hiroshi Shimizu
StanとRでベイズ統計モデリング 1,2章
StanとRでベイズ統計モデリング 1,2章
Miki Katsuragi
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
Takashi J OZAKI
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
Cfa 20190620
Cfa 20190620
Kei Nakagawa
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
社会心理学とGlmm
社会心理学とGlmm
Hiroshi Shimizu
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
Masaki Tsuda
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
osamu morimoto
ファクター投資と機械学習
ファクター投資と機械学習
Kei Nakagawa
Tokyo r53
Tokyo r53
Hiroshi Shimizu
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
Masaru Tokuoka
20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)
Masakazu Shinoda
重回帰分析で交互作用効果
重回帰分析で交互作用効果
Makoto Hirakawa
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
Hiroshi Shimizu
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
Hiroshi Shimizu
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
Yoichi Motomura
第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)
Masaru Tokuoka
rstanで簡単にGLMMができるglmmstan()を作ってみた
rstanで簡単にGLMMができるglmmstan()を作ってみた
Hiroshi Shimizu
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
Hiroshi Shimizu
SEM分析の理論
SEM分析の理論
Daisuke Sashida
20190512 subscription meetup kamata
20190512 subscription meetup kamata
真太郎 鎌田
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
Courslide
Weitere ähnliche Inhalte
Was ist angesagt?
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
Takashi J OZAKI
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
Cfa 20190620
Cfa 20190620
Kei Nakagawa
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
社会心理学とGlmm
社会心理学とGlmm
Hiroshi Shimizu
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
Masaki Tsuda
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
osamu morimoto
ファクター投資と機械学習
ファクター投資と機械学習
Kei Nakagawa
Tokyo r53
Tokyo r53
Hiroshi Shimizu
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
Masaru Tokuoka
20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)
Masakazu Shinoda
重回帰分析で交互作用効果
重回帰分析で交互作用効果
Makoto Hirakawa
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
Hiroshi Shimizu
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
Hiroshi Shimizu
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
Yoichi Motomura
第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)
Masaru Tokuoka
rstanで簡単にGLMMができるglmmstan()を作ってみた
rstanで簡単にGLMMができるglmmstan()を作ってみた
Hiroshi Shimizu
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
Hiroshi Shimizu
SEM分析の理論
SEM分析の理論
Daisuke Sashida
Was ist angesagt?
(20)
Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
順序データでもベイズモデリング
順序データでもベイズモデリング
Cfa 20190620
Cfa 20190620
Rで架空データの発生
Rで架空データの発生
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
社会心理学とGlmm
社会心理学とGlmm
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
ファクター投資と機械学習
ファクター投資と機械学習
Tokyo r53
Tokyo r53
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)
重回帰分析で交互作用効果
重回帰分析で交互作用効果
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
StanとRでベイズ統計モデリング読書会 導入編(1章~3章)
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
ベイジアンネット技術とサービス工学におけるビッグデータ活用技術
第1回DARM勉強会のANOVA補足(repeated measures designs)
第1回DARM勉強会のANOVA補足(repeated measures designs)
rstanで簡単にGLMMができるglmmstan()を作ってみた
rstanで簡単にGLMMができるglmmstan()を作ってみた
心理学者のためのGlmm・階層ベイズ
心理学者のためのGlmm・階層ベイズ
SEM分析の理論
SEM分析の理論
Ähnlich wie Rで売上予測のデモ(回帰分析)
20190512 subscription meetup kamata
20190512 subscription meetup kamata
真太郎 鎌田
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
Courslide
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
Yuya Matsumura
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
E2D3.org
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
predictori
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
Ryota Inaba
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
Tdc 20181121
Tdc 20181121
Masabumi Furuhata
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
junji kumooka
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
陽一 滝川
データサイエンティストの今
データサイエンティストの今
Suzuki Shinji
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
Shinichi Nakagawa
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
takashi sasaki
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
The Japan DataScientist Society
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
SPIRAL Inc.
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
schoowebcampus
120801発会式概要
120801発会式概要
Michiharu Kitano
Ähnlich wie Rで売上予測のデモ(回帰分析)
(18)
20190512 subscription meetup kamata
20190512 subscription meetup kamata
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
Tdc 20181121
Tdc 20181121
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
データサイエンティストの今
データサイエンティストの今
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
120801発会式概要
120801発会式概要
Rで売上予測のデモ(回帰分析)
1.
Rで売上予測のデモ 第⼋回 雑談会 2015/12/22 成⽥裕美
2.
2 あんただれ︖ • いわゆる統計&分析屋 – 専⾨統計調査⼠ –
SAS認定プロフェッショナル ビジネスアナリスト – R, SAS, SPSSなんでもやります • ⼈事・組織系コンサルファーム出⾝ • 三沢市出⾝&在住/2016年1⽉ 開業予定 ‒ ⼦連れ出戻りUターンです♡ 成⽥ 裕美(なりた ひろみ)
3.
3 データ分析の⽬的 • データを要約する(記述統計、可視化) • 仮説を検証する(統計的仮説検定) •
仮説を創造する(データマイニング) • 未来を予測する(回帰分析、機械学習) ↑今回はコレ
4.
4 売上予測の重要性 • 売れ残る ⇒
ロスの発⽣ • 売れすぎる ⇒ 機会の損失 過去の実績から未来の売上を予測 経営資源の最適化 根拠(データ)に基づく販売戦略 売れ残っても 売れすぎても 致命傷
5.
5 統計解析⽤⾔語 R • なんてったってタダ♡ •
世界3⼤統計ソフトウェアの1つ (R, SAS, SPSS) • オープンソースなので⽇々進化する Rってスゴイんだぜ︕︕︕ 昔は⼤⾦払わないと出来なかった分析がタダで出来ます
6.
6 Rのデモ ごぼうビールの消費量を予測する 月 平均気温 消費量
百ℓ 1 5.7 2.41 2 6.4 3.91 3 7.9 4.32 4 13.9 5.55 5 19.7 5.63 6 21.6 6.23 7 27.9 8.34 8 29.1 8.39 9 28.1 7.33 12 8.9 4.77 11 13.2 4.95 10 18.5 5.51
7.
7 散布図&相関係数 相関係数 =0.95 気温が上がるほど 消費量も増える 気温と消費量の 間には強い正の 相関がある
8.
8 これが回帰分析 すべてのデータからの距離が 最も短くなる予測式を求める
9.
9 消費量 = 0.19(百ℓ)×
気温(℃) + 2.4 気温が1℃上昇すると、平均消費量が19ℓ増える 回帰分析の結果(1)
10.
10 回帰分析の結果(2) 切⽚と気温が消費量を予測する上で意味が あるのかを、検定という⼿法で検証 2つとも最⾼ランクの★3つなので、予測の上で ほぼほぼ有効だということがいえる。
11.
11 回帰分析の結果(3) 決定係数R²は予測式の当てはまりの良さを 表す。(0に近いほど当てはまりが悪く、 1に近いほど当てはまりが良い) 今回0.9なので、だいぶ当てはまりが良い、 つまり精度の⾼い予測式だといえる。
12.
12 信頼区間と予測区間 ⾚︓信頼区間 予測式の信頼幅 を表します 緑︓予測区間 予測値の取りう る幅を表します データを取り直して同じ分析を 繰り返したとしたら、100回の うち95回はこの範囲内に予測 式・予測値が収まると考えられ ますよ、という意味 ⿊︓予測式
13.
13 でもね。。。 • たった1つの変数から精度の⾼い予測式が 出来ることは、⾮常にまれ • 実際は、消費量に影響する様々な変数を複 数使って予測するケースがほとんど(重回 帰分析)
14.
14 最⼤電⼒ (千kw) = 16770.6 +(181.1 × 最⾼気温)+(125.0 × 最低気温) - 123.7
(晴) + 101.1 (⾬) + 6384.6 (⽉) 6269.2 (⽕) 6276.4 (⽔) 6156.9 (⽊) 5942.3 (⾦) 2427.8 (⼟) - 1674.7(⽇祝)- 5614.5 (年末年始) 重回帰分析ってこんな感じ〜
15.
15 重回帰分析の注意点 • 予測するための変数をたくさん投⼊すれば するほど、理論上は予測精度が⾼くなる • でも変数が増えすぎると、予測式が安定し なくなってヘンテコな係数が出たりする (多重共線性に気をつけろ︕) •
いかに少数精鋭の変数を選び出してシンプ ルで美しいモデルを作れるか、ここはまさ にアナリストの腕の⾒せどころ
16.
16 重回帰分析の発展形 • 今回お話したのは、⼀番単純な線形モデル • 曲線関係を表したり、もっと複雑な関係 (交互作⽤とか)をモデルに組み込んだり、 ⼈⼯知能の⼿法を取り⼊れたりして、デー タ分析の世界はどんどん進化 •
でも基本的な原理や考え⽅は共通している
17.
17 参考︓デモに使⽤したRのコード #---ごぼうビールの売上データ ⽉ <- c(1:12) 気温
<- c(5.7,6.4,7.9,13.9,19.7,21.6,27.9,29.1,28.1,18.5,13.2,8.9) 消費量 <- c(2.41,3.91,4.32,5.55,5.63,6.23,8.34,8.39,7.33,5.51,4.95,4.77) beer <- data.frame(⽉,気温,消費量); beer #---これを散布図にしてみると p1 <- ggplot (beer, aes(x = 気温, y = 消費量)) p1 + geom_point(size = 5)+ labs(title = "気温とごぼうビール消費量の散布図") #---相関係数を算出する round(cor(beer$消費量 , beer$気温),2) #---回帰分析を実⾏してみよう beer.lm <- lm (消費量 ~ 気温, data = beer);summary(beer.lm) #---実測値と予測値を⽐べてみる 実測値 <- beer[,3] ; 予測値 <- round(predict(beer.lm),2);(data.frame(実測値, 予測値)) #---予測値を計算しよう new <- data.frame (気温 = 20) #来⽉の平均気温が20度という予報が出たと仮定 predict(beer.lm, newdata = data.frame(気温 = 20)) #---信頼区間と予測区間 #(conf <- predict(beer.lm, new_dat, interval="confidence")) #信頼区間 #(pred <- predict(beer.lm, new_dat, interval="prediction")) #予測区間 #---信頼区間と予測区間のグラフ new1 <- data.frame("気温"=seq(5,30,0.2)) conf <- predict(beer.lm, new1, interval="confidence") pred <- predict(beer.lm, new1, interval="prediction") matplot(new1$気温, cbind(conf), lty=c(1,2,2), col=c(1,2,2), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量") par(new=T) matplot(new1$気温, cbind(pred), lty=c(1,2,2), col=c(1,3,3), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量")
18.
18 Fin ご清聴ありがとうございました。 (*´ω`)
Jetzt herunterladen