SlideShare ist ein Scribd-Unternehmen logo
1 von 8
時系列の相関係数の
解釈は注意を要する
ランダムウォーク同士の相関係数は
±0.72の外側に15%が分布することなど
2014年4月20日 下野寿之
初めに:ブラウン運動とランダムウォーク
• ブラウン運動は花粉中の微粒子の “生きている”
運動として、1828年に植物学者のブラウンが発見、
これを1905年にアインシュタインが熱運動に由来さ
せる理論を発表
ブラウン運動は、x座標とy座標をそれぞれ
ランダムウォークとすることで作ることが
出来る。
“ランダムウォークと時刻の相関係数” の
分布についてのヒストグラム
• ±0.87の外側に20%が分布し、 ±0.94の外側に5%が分布する。
±0.66の外側に50%が分布する。±0.89の外側に15%が分布し、±0.93が最頻値である。
• 経済指標などの値の変動のグラフと共に、年や月との相関係数の高さを示すグラフがよく
存在するが、大きな誤解を与えてしまう。相関係数が単に大きいことだけでは、ランダ
ムウォークと弁別は困難。
“独立なランダムウォーク同士の相関係数” の
分布についてのヒストグラム
• ±0.67の外側に20%が分布し、±0.83の外側に5%が分布する。
±0.41の外側に50%が分布し、±0.72の外側に15%が分布する。
• 2個の時系列のグラフの 同じ時刻ごとの値のペアについて 相関係数が高くても、
単にそれだけでは 将来の動き方が連動するとは、とても言いがたい。
(参考) 分位点プロット
― ヒストグラムでは分位を読み取ることは難しいので、分位点プロット化した。
0.00
0.25
0.50
0.75
1.00
0% 25% 50% 75% 100%
ランダムウォークに関係する相関係数の絶対値の分位点プロット
ランダムウォーク同士の相関係数の絶対値 ランダムウォークと等差数列の相関係数の絶対値
参考: 数の精度についての簡単な考察
信頼性の高い数値を求めるには、 KとLの値をいろいろ変化させて試す必要あり。
> K=1e5;L=31;
replicate(3,median(replicate(K,abs(cor(cumsum(rnorm(L)),cumsum(rnorm(L))))))) ;
[1] 0.4160581 0.4175198 0.4163474
> K=1e5;L=1e3;
replicate(3,median(replicate(K,abs(cor(cumsum(rnorm(L)),cumsum(rnorm(L))))))) ;
[1] 0.4123227 0.4133370 0.4154217
> K=1e5;L=1e2;
replicate(3,median(replicate(K,abs(cor(cumsum(rnorm(L)),cumsum(rnorm(L))))))) ;
[1] 0.4160729 0.4155231 0.4121305
> K=1e6;L=1e2;
replicate(3,median(replicate(K,abs(cor(cumsum(rnorm(L)),cumsum(rnorm(L))))))) ;
[1] 0.4149759 0.4145197 0.4131180
まとめ :
• 連続に変化するような時系列データについて、単に回帰を取るだけ
では、ほとんど意味が無い。(相関係数0.95程度以上の場合は除
く。)
• 複数の連続に変化するような時系列データの、各時刻の値につい
て、相関係数が高いことを根拠にそれらの時系列データの間に相関
関係があるとは言えない。(相関係数0.83程度以上の場合は除く。)
さらに考察として加えたいこと
 ヒストグラムの形は、数式で表すことはできないか?
 2個のヒストグラムに何か関係は無いか?
 今回のランダムウォークはガウス乱数を1000個用いて累
和をとることで生成したが、精度として十分であるか?
 時系列データのトレンドを把握するには、計算上は差分
を取ると良いと言えそうだが、では、どういう差分を取
るのが適切であるか。
 この話題は時系列関係なので、参考文献は多数あるはず
(単位根検定などの話も重要。)

Weitere ähnliche Inhalte

Was ist angesagt?

比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率
hoxo_m
 

Was ist angesagt? (20)

遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
遺伝的アルゴリズム(Genetic Algorithm)を始めよう!遺伝的アルゴリズム(Genetic Algorithm)を始めよう!
遺伝的アルゴリズム (Genetic Algorithm)を始めよう!
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
テンソル代数
テンソル代数テンソル代数
テンソル代数
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
【解説】 一般逆行列
【解説】 一般逆行列【解説】 一般逆行列
【解説】 一般逆行列
 
Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1Probabilistic Graphical Models 輪読会 #1
Probabilistic Graphical Models 輪読会 #1
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
5分でわかるベイズ確率
5分でわかるベイズ確率5分でわかるベイズ確率
5分でわかるベイズ確率
 
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
ベルヌーイ分布における超パラメータ推定のための経験ベイズ法
 
ブラックボックス最適化とその応用
ブラックボックス最適化とその応用ブラックボックス最適化とその応用
ブラックボックス最適化とその応用
 
機械学習 入門
機械学習 入門機械学習 入門
機械学習 入門
 
直交領域探索
直交領域探索直交領域探索
直交領域探索
 
研究発表を準備する(2022年版)
研究発表を準備する(2022年版)研究発表を準備する(2022年版)
研究発表を準備する(2022年版)
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習[DL輪読会]Deep Learning 第15章 表現学習
[DL輪読会]Deep Learning 第15章 表現学習
 
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
 

Andere mochten auch

2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/102012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
Tatsuo Shibata
 
統計勉強会Vol1
統計勉強会Vol1統計勉強会Vol1
統計勉強会Vol1
Yuto Suzuki
 
図解入門最新マーケティング・リサーチがよーくわかる本(2)
図解入門最新マーケティング・リサーチがよーくわかる本(2)図解入門最新マーケティング・リサーチがよーくわかる本(2)
図解入門最新マーケティング・リサーチがよーくわかる本(2)
MROC Japan
 
データ解析・統計講座②
データ解析・統計講座②データ解析・統計講座②
データ解析・統計講座②
uenotsutomu
 
100人のための統計解析 和食レストラン編
100人のための統計解析   和食レストラン編100人のための統計解析   和食レストラン編
100人のための統計解析 和食レストラン編
. .
 

Andere mochten auch (20)

Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」Rによるデータサイエンス:12章「時系列」
Rによるデータサイエンス:12章「時系列」
 
Ellipsoidal Representations about correlations (2011-11, Tsukuba, Kakenhi-Sym...
Ellipsoidal Representations about correlations (2011-11, Tsukuba, Kakenhi-Sym...Ellipsoidal Representations about correlations (2011-11, Tsukuba, Kakenhi-Sym...
Ellipsoidal Representations about correlations (2011-11, Tsukuba, Kakenhi-Sym...
 
How Random Points distributes on a plane? (To see the variety of the shape)
How Random Points distributes on a plane?  (To see the variety of the shape)How Random Points distributes on a plane?  (To see the variety of the shape)
How Random Points distributes on a plane? (To see the variety of the shape)
 
Correlations about random_walks
Correlations about random_walksCorrelations about random_walks
Correlations about random_walks
 
便利な数を100億個の乱数から算出
便利な数を100億個の乱数から算出便利な数を100億個の乱数から算出
便利な数を100億個の乱数から算出
 
A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)A Hacking Toolset for Big Tabular Files (3)
A Hacking Toolset for Big Tabular Files (3)
 
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
Why 40? なぜ40個のサンプルで調査をするのか ― 数値例からの考察
 
2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/102012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
2012 第1回数理生物学サマーレクチャーコース@RIKEN CDB 2012/7/10
 
Rで学ぶミニミニビッグデータ分析入門-第2回
Rで学ぶミニミニビッグデータ分析入門-第2回 Rで学ぶミニミニビッグデータ分析入門-第2回
Rで学ぶミニミニビッグデータ分析入門-第2回
 
統計勉強会Vol1
統計勉強会Vol1統計勉強会Vol1
統計勉強会Vol1
 
図解入門最新マーケティング・リサーチがよーくわかる本(2)
図解入門最新マーケティング・リサーチがよーくわかる本(2)図解入門最新マーケティング・リサーチがよーくわかる本(2)
図解入門最新マーケティング・リサーチがよーくわかる本(2)
 
Bra kobe.r12
Bra kobe.r12Bra kobe.r12
Bra kobe.r12
 
データ解析
データ解析データ解析
データ解析
 
相関係数は傾きに影響される
相関係数は傾きに影響される相関係数は傾きに影響される
相関係数は傾きに影響される
 
データ解析・統計講座②
データ解析・統計講座②データ解析・統計講座②
データ解析・統計講座②
 
Rで学ぶミニミニビッグデータ分析入門-第3回
Rで学ぶミニミニビッグデータ分析入門-第3回Rで学ぶミニミニビッグデータ分析入門-第3回
Rで学ぶミニミニビッグデータ分析入門-第3回
 
統計学超入門 アップロード用
統計学超入門 アップロード用統計学超入門 アップロード用
統計学超入門 アップロード用
 
100人のための統計解析 和食レストラン編
100人のための統計解析   和食レストラン編100人のための統計解析   和食レストラン編
100人のための統計解析 和食レストラン編
 
Rで学ぶミニミニビッグデータ分析入門-第1回
Rで学ぶミニミニビッグデータ分析入門-第1回Rで学ぶミニミニビッグデータ分析入門-第1回
Rで学ぶミニミニビッグデータ分析入門-第1回
 
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用ビジネスリテラシーとしての統計 ビッグデータと統計の活用
ビジネスリテラシーとしての統計 ビッグデータと統計の活用
 

Mehr von Toshiyuki Shimono

新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで
Toshiyuki Shimono
 

Mehr von Toshiyuki Shimono (20)

国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)国際産業数理・応用数理会議のポスター(作成中)
国際産業数理・応用数理会議のポスター(作成中)
 
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
インターネット等からデータを自動収集するソフトウェアに必要な補助機能とその実装
 
extracting only a necessary file from a zip file
extracting only a necessary file from a zip fileextracting only a necessary file from a zip file
extracting only a necessary file from a zip file
 
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
A Hacking Toolset for Big Tabular Files -- JAPAN.PM 2021
 
新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで新型コロナの感染者数 全国の状況 2021年2月上旬まで
新型コロナの感染者数 全国の状況 2021年2月上旬まで
 
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 Multiplicative Decompositions of Stochastic Distributions and Their Applicat... Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
Multiplicative Decompositions of Stochastic Distributions and Their Applicat...
 
Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...Theory to consider an inaccurate testing and how to determine the prior proba...
Theory to consider an inaccurate testing and how to determine the prior proba...
 
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...Interpreting Multiple Regressionvia an Ellipse Inscribed in a Square Extensi...
Interpreting Multiple Regression via an Ellipse Inscribed in a Square Extensi...
 
Sqlgen190412.pdf
Sqlgen190412.pdfSqlgen190412.pdf
Sqlgen190412.pdf
 
BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)BigQueryを使ってみた(2018年2月)
BigQueryを使ってみた(2018年2月)
 
Seminar0917
Seminar0917Seminar0917
Seminar0917
 
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
既存分析ソフトへ
データを投入する前に
簡便な分析するためのソフトの作り方の提案
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
To Make Graphs Such as Scatter Plots Numerically Readable (PacificVis 2018, K...
 
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
Make Accumulated Data in Companies Eloquent by SQL Statement Constructors (PDF)
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
 
新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど新入社員の頃に教えて欲しかったようなことなど
新入社員の頃に教えて欲しかったようなことなど
 
ページャ lessを使いこなす
ページャ lessを使いこなすページャ lessを使いこなす
ページャ lessを使いこなす
 
Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理Guiを使わないテキストデータ処理
Guiを使わないテキストデータ処理
 
データ全貌把握の方法170324
データ全貌把握の方法170324データ全貌把握の方法170324
データ全貌把握の方法170324
 

時系列の相関係数の解釈は注意を要する(ランダムウォーク同士の相関係数は±0.72の外側に15%も分布することなど)