Weitere ähnliche Inhalte Ähnlich wie 外国語教育研究におけるRを用いた統計処理入門 (20) Mehr von Yusaku Kawaguchi (17) 外国語教育研究におけるRを用いた統計処理入門3. 自己紹介
• 川口 勇作 (KAWAGUCHI Yusaku)
–所属: 愛知学院大学 教養部
• 教養科目の英語授業などを担当しています
–専門: 外国語教育学
• コンピュータを用いた英語教育・学習
–Nagoya.R 主催
–R歴:約7年
5. この講習で扱うもの・扱わないもの
○ 扱うもの
• 最低限のRの仕様・操作
• 記述統計量の算出方法
• よく用いられる各種検定・分析の
実行方法と算出方法、結果の見方
– t 検定
– 分散分析
– 効果量の算出
– 相関分析
– 回帰分析
❌ 扱わないもの
• 細かいRの仕様・操作
• よく用いられる各種検定・分析の
詳細な説明
• 高度な統計分析
– ベイズ統計、一般化線形混合効果モ
デル、構造方程式モデリング、項目
反応理論、などなど
• 文字列処理・コーパス分析
• データハンドリング・管理
14. R version 3.0.1 (2013-05-16) -- "Good Sport"
Copyright (C) 2013 The R Foundation for Statistical Computing
Platform: i386-w64-mingw32/i386 (32-bit)
R は、自由なソフトウェアであり、「完全に無保証」です。
一定の条件に従えば、自由にこれを再配布することができます。
配布条件の詳細に関しては、'license()' あるいは 'licence()' と入力してください。
R は多くの貢献者による共同プロジェクトです。
詳しくは 'contributors()' と入力してください。
また、R や R のパッケージを出版物で引用する際の形式については
'citation()' と入力してください。
'demo()' と入力すればデモをみることができます。
'help()' とすればオンラインヘルプが出ます。
'help.start()' で HTML ブラウザによるヘルプがみられます。
'q()' と入力すれば R を終了します。
>|
← ここから入力
入力している部分は赤く表示されます
20. 変数に データを 代入する
• 変数の名前を書き、- と > で矢印を作る
• 右辺には、変数に入れたいデータを記入する
> # hakoという名の変数に 5 という数字を代入する
> hako <- 5
> # hakoという名の変数の中身を確認
> hako
[1] 5
22. 変数に データを 代入する
1. 変数の名前を ”hako” とする
2. c関数で、値を1つにまとめる
– このまとまりをベクトルと呼ぶ
3. まとめた値を ”hako” という変数に代入する
<- は矢印を表現
4. 代入したら中身を確認する
> hako <- c(1, 2, 3, 4, 5)
> hako
27. 平方根を一気に
> hako <- c(1, 2, 3, 4, 5)
> sqrt(hako)
[1] 1.000000 1.414214 1.732051 2.000000
[5] 2.236068
38. イメージ
[,1] [,2] [,3] [,4] [,5]
[1,]
[2,]
[3,]
[4,]
[5,]
70. やってみよう
• 事前テストと事後テストの間の効果量を算出する
• t 検定の場合は、Cohen’s d と呼ばれる効果量を
用いる
–effsizeパッケージのcohen.d関数でd が算出できる
> install.packages(“effsize”)
> library(effsize)
> cohen.d(dat$pre, dat$post)
71. 結果の見方
• t 値、自由度(df )、p 値を読み取る
• t 値の小数第3位以降は不要なので四捨五入
• p 値は紙面の許す限り、少数第2, 3位までの
正確な値を報告(APA, 2010)
• .001を下回る場合はp < .001でよい
• 効果量も後ろに付記する
本文中での報告例
t (62) = -5.29, p < .001, d = 0.91
75. やってみよう
• anovakun関数を使う
– 引数1:データ
– 引数2:要因計画
• “sA”:被験者内計画(今回はこれ)
• “As”:被験者間計画
– 引数3:要因の水準数
• 今回は事前・事後・遅延の3水準
– holmオプションをTにし、多重比較の方法をHolm法に
– etaオプションをTにし、効果量(イータ二乗)を算出
> anovakun(oneway, “sA”, 3, holm = T, eta = T)
77. 結果の見方
• F 値、自由度(df )、p 値を読み取る
• 自由度は、要因のもの(A)と誤差(s x A)
のものをピックアップする
• F 値の小数第3位以降は不要なので四捨五入
• 多重比較の結果を確認し、報告(t 検定と同様)
本文中での報告例
F (2, 98) = 43.64, p < .001, η2 = 0.39
81. やってみよう
• anovakun関数を使う
– 引数1:データ
– 引数2:要因計画
• “sAB”:被験者内計画
• “AsB”:被験者内・被験者間混合計画(今回はこれ)
• “ABs”:被験者間計画
– 引数3, 4:1つ目・2つ目の要因の水準数
• 今回は協同学習G・個別学習Gの2水準と事前・事後の2水準
– holmオプションをTにし、多重比較の方法をHolm法に
– petaオプション(etaではない)をTにし、効果量(偏イータ二乗)を算出
> anovakun(twoway, “AsB”, 2, 2, holm = T, peta = T)
88. 300 400 500 600 700 800 900 1000
150200250300350
toeic$score
toeic$words
96. 結果の見方
• 導かれる回帰式:
TOEIC得点の予測値 = 89.43 + 2.29 × 読
解テストの得点 + 3.14 × 聴解テストの得点 +
1.51 × 語彙テストの得点
• 偏回帰係数が有意だったのは聴解テストのみ
→TOEIC得点を最も予測するものは聴解テスト
• 決定係数 0.34、自由度調整済み決定係数0.31
TOEIC得点の分散の約30%が説明されている