SlideShare a Scribd company logo
1 of 50
Download to read offline
より好ましい統計手法1
 —Resampling Methods—
例えばこんなデータ




            3
データはきったない



        4
とりあえず平均




          5
なんか違うけど...	
  まあいいか。




  「t	
  検定・分散分析は	
  n	
  が大きければ,
   前提が満たされなくても頑健性(robustness)を持つ。」   6
Q-­‐Q	
  Plot




                7
外れ値を含む場合の対処方法
        橋本(2011)

• 一定基準以上(平均値±2/3SDなど)の
 値を取り除く。

• データを変換(対数変換・逆変換)する。
• 何もしない。
外れ値は外していいの?

• 明らかに反応がおかしい場合 Yes
• 特殊な集団を対象とした実験の場合 No
• 実験デザインを考えて,サンプルサイズ
 が小さくなる場合 No
Resampling
手元の観測データ(標本)を使って,
再度サンプリング(再抽出)を行い,
新しい標本を複数作り,その統計量を
推定する方法。
Resamplingのイメージ
                              3   7      8            5
                          4
    1                                                     9
                  2
        3               5     6   3      1            2
              6
7                                     M	
  =	
  4.9
         9            8


                              9個の抽出を

        M	
  =	
  5.0         	
  	
  1,000回程度繰り返す
... N
はじめのデータに適用
Resampling
         大きく2つに分類



• Bootstrapping (Jackknife)
• Permutation (Randomization)
 tests
Bootstrapping



http://blog.templatemonster.com/2012/10/04/bootstrap-templates-launch/



     h"p://images.yourdic3onary.com/jackknife




                               Jackknife
                                                                         http://www.lhup.edu/~dsimanek/museum/themes/NewtonsThird.htm
4
    1                         3    7   8   5
                2
        3           5                            9
            6                 6    3   1   2
7
        9           8

                            同じものを再度抽出
                            (リサンプリング)することを
                            許すのが Bootstrapping
                            許さないのがJackknife
Resampling
         大きく2つに分類



• Bootstrapping (Jackknife)
• Permutation (Randomization)
 Tests
並べ替え検定
Permutation/Randomization Tests
                                  R. Fisher




• 母集団の分布(正規分布など)の仮定なし。
• 小さいサンプルで外れ値が含まれている
 ときには,パラメトリック検定よりも有効。

• 常に正しい p 値を得ることができる。
• 推測統計よりも,考え方がシンプル。
ノンパラでいいのでは?

• 分布の仮定が必要ないということと,
 外れ値が含まれている場合に有効とい
 う点ではノンパラと同じ。

• しかし,ノンパラもパラメトリック検
 定と同様に,特定の確率分布を基に
 p 値の推定を行う。
                      21
ノンパラでいいのでは?

• パラメトリック検定やノンパラメトリ
 ック検定で推定しようとしている・近
 似(approximation)を行っている p の
 正しい値
 = Permutation (Randomization) testsで
  得られる p 値
                                        22
Howell	
  (2002)
“I	
  believe	
  that	
  in	
  a	
  short	
  Dme	
  they	
  
  will	
  overtake	
  what	
  are	
  now	
  the	
  
  more	
  common	
  nonparametric	
  
  tests,	
  and	
  may	
  eventually	
  
  overtake	
  the	
  tradiDonal	
  
  parametric	
  tests”	
  (p.	
  692).
                                                           23
“The	
  day	
  .	
  .	
  .	
  has	
  come.”
                           R版ではノンパラなし




                                              24
以心伝心




       25
並べ替え検定の例
Permutation/Randomization Tests
Permutation/Randomization Tests
Permutation/Randomization Tests
n	
  =	
  12	
  で	
  2	
  群に	
  6	
  個のデータ
      すべての組み合わせ	
  
            12!/6!/6!	
  =	
  924

差が30以上の組み合わせは54組
   54	
  /	
  924	
  =	
  0.058	
  (これが	
  p	
  値)
p	
  値の比較
母集団への一般化
      どちらも同じものだが呼び名が違う



• 並べ替え検定(Permutation Test)
 → 推定の対象は母集団(研究向き)


• 確率化検定(Randomization Test)
 → 手元のサンプルのみ(実践向き)
                              31
どうやって
やればいいですか?




            32
より好ましい統計手法2
  —Effect Sizes—
差が大きいのはどちら?
差が大きいのはどちら?
効果量


	
  統計的検定の問題
-­‐	
  サンプルサイズが影響。
-­‐	
  有意差あり・なしのみの判断。
-­‐	
  p	
  値は実質的な差を示さない。
効果量


	
  効果量(effect	
  size)
-­‐	
  サンプルサイズに影響されない。
-­‐	
  効果の大小を示す。
-­‐	
  実質的な差を確認できる。
効果量 d = 0.2 / r = 0.1



効果量 d = 0.2 / r = 0.1
<さらに発展編>

統計的有意差検定さようなら?

             39
一般化線形モデル
 GLM	
  (Generalized	
  Linear	
  Model)

検定
  帰無仮説検定である要因の影響を調べる。

 まったく別のものではなく発展させたもの


モデル選択
  データを最もよく説明しているモデルを選ぶ。

                                           40
“A picture is worth a thousand p values.”
                                (Loftus, 1993)




より好ましい図示方法
  —Visualization—
分布を見せる




         42
「隠れる」「隠される」情報がない

100


 90
           ***
                      CALL


 80
                             ***

 70


 60


 50


 40


 30


 20


 10


  0
      10         20     40




                 OK                Better
個別のデータも見せる
                0.700




                0.600




                0.500




                0.400
Oxy-Hb(mM-mm)




                0.300




                0.200




                0.100




                0.000
                         Normal   Scanning
                                             44

                -0.100
個別のデータも見せる




             45
論旨に合った図示方法
前田啓朗 (2008). WBTを援用した授業で成功した学習者・
 成功しなかった学習者. ARELE, 19, 253–262.
再現性は科学の基本

• データの二次利用を推奨すべき。
 例えば,使用したデータを(個人情報に
 気をつけて)オンラインなどで公開。

• ソフトウェアのスクリプトも公開
 すれば,誰でも再現ができる。
再現性は科学の基本




     http://www.apa.org/pubs/journals/arc/
まとめ
•	
  “Resampling”	
  -­‐-­‐-­‐	
  強力なツール
•「効果量」-­‐-­‐-­‐	
  実質的な意味
•「p	
  値」よりも「図」で語る
•	
  	
  再現性を重視する風土を!
推薦書籍(入門編)




www.mizumot.com/lablog

More Related Content

Viewers also liked

Rを使ったコンピュータ適応型テスト構築の試み
Rを使ったコンピュータ適応型テスト構築の試みRを使ったコンピュータ適応型テスト構築の試み
Rを使ったコンピュータ適応型テスト構築の試みMizumoto Atsushi
 
LET2015 National Conference Seminar
LET2015 National Conference SeminarLET2015 National Conference Seminar
LET2015 National Conference SeminarMizumoto Atsushi
 
JSSS2014 Symposium (Atsushi Mizumoto)
JSSS2014 Symposium (Atsushi Mizumoto)JSSS2014 Symposium (Atsushi Mizumoto)
JSSS2014 Symposium (Atsushi Mizumoto)Mizumoto Atsushi
 
2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライド2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライドMizumoto Atsushi
 
2013全国英語教育学会WS公開用スライド
2013全国英語教育学会WS公開用スライド2013全国英語教育学会WS公開用スライド
2013全国英語教育学会WS公開用スライドMizumoto Atsushi
 
量的データの分析・報告で気をつけたいこと
量的データの分析・報告で気をつけたいこと量的データの分析・報告で気をつけたいこと
量的データの分析・報告で気をつけたいことMizumoto Atsushi
 
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパスコーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパスyasuimao
 
SappoRo.R #3 LT: Shiny by RStudio
SappoRo.R #3 LT: Shiny by RStudioSappoRo.R #3 LT: Shiny by RStudio
SappoRo.R #3 LT: Shiny by RStudioMizumoto Atsushi
 
2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)Mizumoto Atsushi
 

Viewers also liked (10)

Rを使ったコンピュータ適応型テスト構築の試み
Rを使ったコンピュータ適応型テスト構築の試みRを使ったコンピュータ適応型テスト構築の試み
Rを使ったコンピュータ適応型テスト構築の試み
 
LET2015 National Conference Seminar
LET2015 National Conference SeminarLET2015 National Conference Seminar
LET2015 National Conference Seminar
 
JSSS2014 Symposium (Atsushi Mizumoto)
JSSS2014 Symposium (Atsushi Mizumoto)JSSS2014 Symposium (Atsushi Mizumoto)
JSSS2014 Symposium (Atsushi Mizumoto)
 
2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライド2015-1003 英語コーパス学会ワークショップ使用スライド
2015-1003 英語コーパス学会ワークショップ使用スライド
 
2013 11 jacet-kansai-ws
2013 11 jacet-kansai-ws2013 11 jacet-kansai-ws
2013 11 jacet-kansai-ws
 
2013全国英語教育学会WS公開用スライド
2013全国英語教育学会WS公開用スライド2013全国英語教育学会WS公開用スライド
2013全国英語教育学会WS公開用スライド
 
量的データの分析・報告で気をつけたいこと
量的データの分析・報告で気をつけたいこと量的データの分析・報告で気をつけたいこと
量的データの分析・報告で気をつけたいこと
 
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパスコーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
 
SappoRo.R #3 LT: Shiny by RStudio
SappoRo.R #3 LT: Shiny by RStudioSappoRo.R #3 LT: Shiny by RStudio
SappoRo.R #3 LT: Shiny by RStudio
 
2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)2012-1110「マルチレベルモデルのはなし」(censored)
2012-1110「マルチレベルモデルのはなし」(censored)
 

Similar to Let中部2012シンポスライド

岩波データサイエンス_Vol.5_勉強会資料01
岩波データサイエンス_Vol.5_勉強会資料01岩波データサイエンス_Vol.5_勉強会資料01
岩波データサイエンス_Vol.5_勉強会資料01goony0101
 
Rm20140507 4key
Rm20140507 4keyRm20140507 4key
Rm20140507 4keyyouwatari
 
Introduction to statistics
Introduction to statisticsIntroduction to statistics
Introduction to statisticsKohta Ishikawa
 
Survival analysis0702 2
Survival analysis0702 2Survival analysis0702 2
Survival analysis0702 2Nobuaki Oshiro
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなしToru Imai
 
tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.osamu morimoto
 
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient DescentRyutaro Yamauchi
 
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores,  Clusters and Cloudsの解説LCCC2010:Learning on Cores,  Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説Preferred Networks
 
統計学基礎
統計学基礎統計学基礎
統計学基礎Yuka Ezura
 
第五回統計学勉強会@東大駒場
第五回統計学勉強会@東大駒場第五回統計学勉強会@東大駒場
第五回統計学勉強会@東大駒場Daisuke Yoneoka
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Shohei Kumagai
 
プログラミングコンテストでの乱択アルゴリズム
プログラミングコンテストでの乱択アルゴリズムプログラミングコンテストでの乱択アルゴリズム
プログラミングコンテストでの乱択アルゴリズムTakuya Akiba
 
Rm20140702 11key
Rm20140702 11keyRm20140702 11key
Rm20140702 11keyyouwatari
 
Rm20150520 6key
Rm20150520 6keyRm20150520 6key
Rm20150520 6keyyouwatari
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するかSAKAUE, Tatsuya
 
みどりぼん読書会 第4章
みどりぼん読書会 第4章みどりぼん読書会 第4章
みどりぼん読書会 第4章Masanori Takano
 
Datamining 4th adaboost
Datamining 4th adaboostDatamining 4th adaboost
Datamining 4th adaboostsesejun
 
Deep learningbook chap7
Deep learningbook chap7Deep learningbook chap7
Deep learningbook chap7Shinsaku Kono
 
Rm20130626 10key
Rm20130626 10keyRm20130626 10key
Rm20130626 10keyyouwatari
 

Similar to Let中部2012シンポスライド (20)

岩波データサイエンス_Vol.5_勉強会資料01
岩波データサイエンス_Vol.5_勉強会資料01岩波データサイエンス_Vol.5_勉強会資料01
岩波データサイエンス_Vol.5_勉強会資料01
 
Rm20140507 4key
Rm20140507 4keyRm20140507 4key
Rm20140507 4key
 
Introduction to statistics
Introduction to statisticsIntroduction to statistics
Introduction to statistics
 
Survival analysis0702 2
Survival analysis0702 2Survival analysis0702 2
Survival analysis0702 2
 
幾何を使った統計のはなし
幾何を使った統計のはなし幾何を使った統計のはなし
幾何を使った統計のはなし
 
tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.tokyo webmining3 2010.04.17.
tokyo webmining3 2010.04.17.
 
Survival analysis0702
Survival analysis0702Survival analysis0702
Survival analysis0702
 
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
[論文解説]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
 
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
LCCC2010:Learning on Cores,  Clusters and Cloudsの解説LCCC2010:Learning on Cores,  Clusters and Cloudsの解説
LCCC2010:Learning on Cores, Clusters and Cloudsの解説
 
統計学基礎
統計学基礎統計学基礎
統計学基礎
 
第五回統計学勉強会@東大駒場
第五回統計学勉強会@東大駒場第五回統計学勉強会@東大駒場
第五回統計学勉強会@東大駒場
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用
 
プログラミングコンテストでの乱択アルゴリズム
プログラミングコンテストでの乱択アルゴリズムプログラミングコンテストでの乱択アルゴリズム
プログラミングコンテストでの乱択アルゴリズム
 
Rm20140702 11key
Rm20140702 11keyRm20140702 11key
Rm20140702 11key
 
Rm20150520 6key
Rm20150520 6keyRm20150520 6key
Rm20150520 6key
 
反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
みどりぼん読書会 第4章
みどりぼん読書会 第4章みどりぼん読書会 第4章
みどりぼん読書会 第4章
 
Datamining 4th adaboost
Datamining 4th adaboostDatamining 4th adaboost
Datamining 4th adaboost
 
Deep learningbook chap7
Deep learningbook chap7Deep learningbook chap7
Deep learningbook chap7
 
Rm20130626 10key
Rm20130626 10keyRm20130626 10key
Rm20130626 10key
 

Let中部2012シンポスライド