Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.
エクセルでRライクな図⽰

散布図・箱ひげ図・ヒストグラム
概要
• Rがいいとかエクセルがいいとか
• 両⽅でやってみよう
– 散布図
– 箱ひげ図
– ヒストグラム

• まとめ
草薙邦広

Nagoya R #11 LT, 2013/12/7
kusanagi@nagoya-u.jp
Rがいいとかエクセルがいいとか
• Rでしかできないことって?
• エクセルでしかできないことって?
• 仕様の違い
• デフォルトの違い

– デフォルトに拘泥して⽐較するのは…?
1
0.9
0.8
0.7
0.6
0.5

系列1

0.4
0.3
0.2
0.1
0
0

0.2

0.4

0.6

0.8

1

1.2

18
16
14
12
10
8
6
4
2
0

系列1
両⽅でやってみよう
• 散布図

– plot関数を使おう!
– plot(rnorm(30), rnorm(30))

• ベクトルか,または⼆つ指定する
• 主なオプション
– xlim=c( , ), ylim=c( , )
– col=...
両⽅でやってみよう
• 散布図

– plot関数を使おう!

– plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”,
xlim=c(-2,2), ylim=c(-2.2))
– ...
両⽅でやってみよう
• 散布図

– エクセルでやろうず!
– ・・・。
1.00

Y

0.75

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
2
1
-2

-1

0

1

2
0.75

X
Y

Y

0
-1
-2

1.00

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
2
1
-2

-1

0

1

2
0.75

X
Y

Y

0
-1
-2

1.00

0.50

0.25

0.00
0.00

0.25

0.50
X

0.75

1.00
両⽅でやってみよう
• 散布図

– エクセルだって⾒分けがつかないようなのは
作れる
– ちょっと設定が多くてめんどい
– ただGUIで細かく決められる
両⽅でやってみよう
• ただエクセルは…
– pairs(dat)
両⽅でやってみよう
• 箱ひげ図

– boxplot()
– 主なオプション

• horizontal = T

– boxplot(dat, ylab=“Score”, col=“lightgray”)
両⽅でやってみよう
• 箱ひげ図

– エクセルでやろうず!
– 実は⼯夫次第で作れる!
140

120

100

Score

80

60

40

20

0
data 1

data 2
D
C
B
A

140

120

0.2

0.4

0.6

0.8

1.0
100

Score

80
Score

0.0

60

40

20

0
data 1

data 2
D
C
B
A

140

120

0.2

0.4

0.6

0.8

1.0
100

Score

80
Score

0.0

60

40

20

0
data 1

data 2
両⽅でやってみよう
• 散布図

– エクセルだって箱ひげ図⾃体は作れる
…ただ⼿間を考えると…
両⽅でやってみよう
• ただエクセルはこのようなデータのばら
つきの可視化はできない
両⽅でやってみよう
• ヒストグラム

– Rでやってみようず!
• hist(dat)
• 主なオプション
–
–
–
–

xlab =“”
main =“”
col =“”
breaks=10
» デフォルトはスタージェスの公式によるもの...
両⽅でやってみよう
• ヒストグラム

– Rでやってみようず!

• hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)
両⽅でやってみよう
• ヒストグラム

– これは⾯倒だ!!

• スタージェスの公式から最適な階級数を求める
• 「分析ツール」→ヒストグラムで度数分布を計算
する
• 棒グラフにする
• ⾊々と調整
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
25

Frequency

20

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
15

-2

-1

0

1

2

3

25

Score

20

Frequency

Frequency

10
5
0
-3

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
15

-2

-1

0

1

2

3

25

Score

20

Frequency

Frequency

10
5
0
-3

15

10

5

0
‐3

‐2

‐1

0
Score

1

2

3
両⽅でやってみよう
• ヒストグラム

– やはり⾒分けがつかないようなものはできる
– ただ本当に⼿間が…
まとめ
• エクセルだって頑張ればよいとされるような作図がで
きる
– 実際に折れ線グラフならエクセルの⽅が楽…?
– ただ確かにRでなければできないことはある

• 無批判にRのしかもただのデフォルトをよいとするの
ではなくて,どのような点が...
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
草薙 Nagoyar11 エクセルでrライクな図示
Nächste SlideShare
Wird geladen in …5
×

草薙 Nagoyar11 エクセルでrライクな図示

1.841 Aufrufe

Veröffentlicht am

草薙邦広「エクセルでRライクな図示」NagoyaR #11 2013/12/7

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

草薙 Nagoyar11 エクセルでrライクな図示

  1. 1. エクセルでRライクな図⽰ 散布図・箱ひげ図・ヒストグラム
  2. 2. 概要 • Rがいいとかエクセルがいいとか • 両⽅でやってみよう – 散布図 – 箱ひげ図 – ヒストグラム • まとめ
  3. 3. 草薙邦広 Nagoya R #11 LT, 2013/12/7 kusanagi@nagoya-u.jp
  4. 4. Rがいいとかエクセルがいいとか • Rでしかできないことって? • エクセルでしかできないことって? • 仕様の違い • デフォルトの違い – デフォルトに拘泥して⽐較するのは…?
  5. 5. 1 0.9 0.8 0.7 0.6 0.5 系列1 0.4 0.3 0.2 0.1 0 0 0.2 0.4 0.6 0.8 1 1.2 18 16 14 12 10 8 6 4 2 0 系列1
  6. 6. 両⽅でやってみよう • 散布図 – plot関数を使おう! – plot(rnorm(30), rnorm(30)) • ベクトルか,または⼆つ指定する • 主なオプション – xlim=c( , ), ylim=c( , ) – col=“red” – xlab = “”, ylab=“”, main = “”
  7. 7. 両⽅でやってみよう • 散布図 – plot関数を使おう! – plot(rnorm(30), rnorm(30), xlab=“X”, ylab=“Y”, col=“red”, xlim=c(-2,2), ylim=c(-2.2)) – abline(0,1)
  8. 8. 両⽅でやってみよう • 散布図 – エクセルでやろうず! – ・・・。
  9. 9. 1.00 Y 0.75 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  10. 10. 2 1 -2 -1 0 1 2 0.75 X Y Y 0 -1 -2 1.00 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  11. 11. 2 1 -2 -1 0 1 2 0.75 X Y Y 0 -1 -2 1.00 0.50 0.25 0.00 0.00 0.25 0.50 X 0.75 1.00
  12. 12. 両⽅でやってみよう • 散布図 – エクセルだって⾒分けがつかないようなのは 作れる – ちょっと設定が多くてめんどい – ただGUIで細かく決められる
  13. 13. 両⽅でやってみよう • ただエクセルは… – pairs(dat)
  14. 14. 両⽅でやってみよう • 箱ひげ図 – boxplot() – 主なオプション • horizontal = T – boxplot(dat, ylab=“Score”, col=“lightgray”)
  15. 15. 両⽅でやってみよう • 箱ひげ図 – エクセルでやろうず! – 実は⼯夫次第で作れる!
  16. 16. 140 120 100 Score 80 60 40 20 0 data 1 data 2
  17. 17. D C B A 140 120 0.2 0.4 0.6 0.8 1.0 100 Score 80 Score 0.0 60 40 20 0 data 1 data 2
  18. 18. D C B A 140 120 0.2 0.4 0.6 0.8 1.0 100 Score 80 Score 0.0 60 40 20 0 data 1 data 2
  19. 19. 両⽅でやってみよう • 散布図 – エクセルだって箱ひげ図⾃体は作れる …ただ⼿間を考えると…
  20. 20. 両⽅でやってみよう • ただエクセルはこのようなデータのばら つきの可視化はできない
  21. 21. 両⽅でやってみよう • ヒストグラム – Rでやってみようず! • hist(dat) • 主なオプション – – – – xlab =“” main =“” col =“” breaks=10 » デフォルトはスタージェスの公式によるもの » あまりいじらなくてもよい
  22. 22. 両⽅でやってみよう • ヒストグラム – Rでやってみようず! • hist(rnorm(100), xlab=“Score”, main=“”, col=“red”)
  23. 23. 両⽅でやってみよう • ヒストグラム – これは⾯倒だ!! • スタージェスの公式から最適な階級数を求める • 「分析ツール」→ヒストグラムで度数分布を計算 する • 棒グラフにする • ⾊々と調整
  24. 24. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  25. 25. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  26. 26. 25 Frequency 20 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  27. 27. 15 -2 -1 0 1 2 3 25 Score 20 Frequency Frequency 10 5 0 -3 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  28. 28. 15 -2 -1 0 1 2 3 25 Score 20 Frequency Frequency 10 5 0 -3 15 10 5 0 ‐3 ‐2 ‐1 0 Score 1 2 3
  29. 29. 両⽅でやってみよう • ヒストグラム – やはり⾒分けがつかないようなものはできる – ただ本当に⼿間が…
  30. 30. まとめ • エクセルだって頑張ればよいとされるような作図がで きる – 実際に折れ線グラフならエクセルの⽅が楽…? – ただ確かにRでなければできないことはある • 無批判にRのしかもただのデフォルトをよいとするの ではなくて,どのような点がよい可視化か⾒極める • ⽬的とするのは優れたデータの可視化であって,Rを 使うことではない • ただ,殆どの場合Rの⽅が楽である • ⼤抵の場合「エクセルのお化粧は⼤変」

×