SlideShare ist ein Scribd-Unternehmen logo
1 von 17
Downloaden Sie, um offline zu lesen
표본들의 분포
용어
• 모수(Parameter)
– 모집단의 특성을 나타내는 수량화된 값
– 일반적으로 모수는 정해져 있지만 잘 알지 못한다.

• 통계량(Statistic)
– 표본으로부터 계산되는 표본의 특성값
– 관측가능한 확률변수들의 실수값 함수로 통계량은 확
률변수

• 표본분포(Sampling Distribution)
– 한 모집단에서 같은 크기로 뽑을 수 있는 모든 표본에
서 통계량을 계산할 때 이 통계량이 이루는 확률분포
한림대학교 이윤환(http://fb.com/yoonani72)
평균의 표본분포
• 다음 4장의 카드에서 두 장을 랜덤하게 뽑아 평
균을 구해봅시다.

1

2

3

한림대학교 이윤환(http://fb.com/yoonani72)

4
평균의 표본분포
𝒙

𝒙𝒑(𝒙)

𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1

1
4

1
4

1
4

2

1
4

2
4

4
4

3

1
4

3
4

9
4

4

1
4

4
4

16
4

𝑝 𝑥 =1

합
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

10
𝑥𝑝 𝑥 =
4

𝑥2
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p161
한림대학교 이윤환(http://fb.com/yoonani72)

30
𝑝 𝑥 =
4
평균의 표본분포
• 표본추출 방법 : 비복원 추출(without replace)

1

2

3

1

3

4

4

한림대학교 이윤환(http://fb.com/yoonani72)

2

4
평균의 표본분포
• 랜덤표본과 그 평균 – 비복원 추출
가능한 표본

평균표본 𝒙

{1, 2}

1.5

{1, 3}

2.0

{1, 4}

2.5

{2, 3}

2.5

{2, 4}

3.0

{3, 4}

3.5

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p162

한림대학교 이윤환(http://fb.com/yoonani72)
평균의 표본분포
• 평균의 표본분포
𝒙

𝒑(𝒙)

𝒙 𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1.5

1/6

1.5 / 6

2.25 / 6

2.0

1/6

2/6

4/6

2.5

2/6

5/6

12.5 / 6

3

1/6

3/6

9/6

3.5

1/6

3.5 / 6

12.25 / 6

𝑝 𝒙 =1

합
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

𝒙𝑝 𝒙 =
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

15
6

𝒙2 𝑝 𝒙 =
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p162
한림대학교 이윤환(http://fb.com/yoonani72)

40
6
평균의 표본분포
• 표본추출 방법 : 복원 추출(with replace)

1

2

3

4

2

1

2

3

4

2

한림대학교 이윤환(http://fb.com/yoonani72)
평균의 표본분포
• 랜덤표본과 그 평균 – 복원 추출
표본

𝒙

표본

𝒙

표본

𝒙

표본

𝒙

{1, 1}

1.0

{2, 1}

1.5

{3, 1}

2.0

{4, 1}

2.5

{1, 2}

1.5

{2, 2}

2.0

{3, 2}

2.5

{4, 2}

3.0

{1, 3}

2.0

{2, 3}

2.5

{3, 3}

3.0

{4, 3}

3.5

{1, 4}

2.5

{2, 4}

3.0

{4, 4}

3.5

{4, 4}

4.0

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p163

한림대학교 이윤환(http://fb.com/yoonani72)
평균의 표본분포
• 평균의 표본분포
𝒙

𝒑(𝒙)

𝒙 𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1.0

1 / 16

1 / 16

1 / 16

1.5

2 / 16

3 / 16

4.5 / 16

2.0

3 / 16

6 / 16

12 / 16

2.5

4 / 16

10 / 16

25 / 16

3.0

3 / 16

9 / 16

27 / 16

3.5

2 / 16

7 / 16

24.5 / 16

4.0

1 / 16

4 / 16

16 / 16

𝑝 𝒙 =1

합
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

40
𝒙𝑝 𝒙 =
16

𝒙2
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p163
한림대학교 이윤환(http://fb.com/yoonani72)

110
𝑝 𝒙 =
16
표본평균의 기대값과 분산
• 우리가 알고자 하는 대상 : 모집단의 특성
• 표본평균의 기대값
– 슬라이드 #4에 있는 {1, 2, 3, 4} 의 평균 𝜇 = 2.5
– 표본평균 𝑋 의 분포는 확률변수
– 기대값 : 확률변수의 평균
• 표본평균들의 평균을 표본평균의 기대값
• 기호 : 𝐸(𝑋)

– 앞선 복원추출과 비복원추출 모두의 기대값은 2.5

• 𝐸 𝑋 = 𝜇
한림대학교 이윤환(http://fb.com/yoonani72)
표본평균의 기대값과 분산
• 표본평균의 분산
– 분산의 간편계산식 : V𝑎𝑟 𝑋 = 𝐸 𝑋 2 − 𝐸(𝑋)2
– 비복원 추출에서의 분산
• V𝑎𝑟 𝑋 =

𝒙2

𝑝 𝒙 − 𝐸 𝑋

2

=

40
16

2

=

110
16

−

5 2
2

=

5
12

– 복원 추출에서의 분산
• V𝑎𝑟 𝑋 =

𝒙2 𝑝 𝒙 − 𝐸 𝑋

5
2

− ( )2 =

5
8

한림대학교 이윤환(http://fb.com/yoonani72)
표본평균의 기대값과 분산
• 표본평균의 분산과 모집단의 분산과의 관계
– 모분산이 𝜎 2 이고, 크기가 𝑁인 모집단에서 크기 𝑛인 랜
덤표본을 뽑을 때 표본평균 𝑋에 대하여
• 비복원 추출 : 𝑉𝑎𝑟 𝑋 =

• 복원 추출 : 𝑉𝑎𝑟 𝑋 =

𝑁−𝑛
𝑁−1

∙

𝜎2
𝑛

𝜎2
𝑛

한림대학교 이윤환(http://fb.com/yoonani72)
표본분포의 모양
• 모집단이 정규분포일 경우
모집단의 분포가
정규분포 𝑁 𝜇, 𝜎 2 일때,
표본평균 𝑋는
정규분포 𝑁 𝜇,
를 따른다

한림대학교 이윤환(http://fb.com/yoonani72)

𝜎2
𝑛
표본분포의 모양
• 모집단이 정규분포가 아닐 경우

평균이 𝜇 이고 분산이 𝜎 2 인
무한모집단에서 크기가 𝑛인
랜덤표본을 뽑았을 때
𝑛이 충분히 크면
모집단의 분포 모양에 관계없이
표본평균 𝑋는
근사적으로 정규분포 𝑁 𝜇,
를 따른다

한림대학교 이윤환(http://fb.com/yoonani72)

𝜎2
𝑛
표본비율의 분포
• 관심이 가는 사건의 비율(propotion)
– 성공율, 불량률, 지지율, 사망률 등
– 확률변수 𝑋 =

1,
0,

관심사건의 성공
관심사건의 실패

– 이 때의 확률변수는 각각 베르누이

– 𝑝=

성공의 횟수
𝑛

=

𝑋1 +𝑋2 +𝑋3 +⋯+𝑋 𝑛
𝑛

– 𝑝은 모집단의 성공의 비율 𝑝의 추정량으로
• X는 성공의 횟수, n은 표본의 개수

– 𝑝 역시 확률변수로 기대값과 분산을 갖는다.
한림대학교 이윤환(http://fb.com/yoonani72)

𝑋
𝑛

로 계산
모비율의 분포
• 𝑝의 기대값과 분산
– 𝐸 𝑝 = 𝑝
– Var 𝑝 =

𝑝(1−𝑝)
𝑛

• 중심극한정리 적용
– 𝑝 은 표본평균의 개념과 동일
– n이 충분히 클 경우 다음이 성립 by C. L. T
𝒑~𝑵(𝒑,

𝒑 𝟏− 𝒑
)
𝒏

한림대학교 이윤환(http://fb.com/yoonani72)

Weitere ähnliche Inhalte

Was ist angesagt?

Rによる分類木 入門
Rによる分類木 入門Rによる分類木 入門
Rによる分類木 入門Hiro47
 
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미 제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미 BOAZ Bigdata
 
Kato Mivule: An Overview of Adaptive Boosting – AdaBoost
Kato Mivule: An Overview of  Adaptive Boosting – AdaBoostKato Mivule: An Overview of  Adaptive Boosting – AdaBoost
Kato Mivule: An Overview of Adaptive Boosting – AdaBoostKato Mivule
 
Object detection and Instance Segmentation
Object detection and Instance SegmentationObject detection and Instance Segmentation
Object detection and Instance SegmentationHichem Felouat
 
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2hirokazutanaka
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析Kunihiro Hisatsune
 
Lect5 principal component analysis
Lect5 principal component analysisLect5 principal component analysis
Lect5 principal component analysishktripathy
 
Osaka.Stan #3 Chapter 5-2
Osaka.Stan #3 Chapter 5-2Osaka.Stan #3 Chapter 5-2
Osaka.Stan #3 Chapter 5-2Takayuki Goto
 
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix Decomposition
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix DecompositionBeyond Low Rank + Sparse: Multi-scale Low Rank Matrix Decomposition
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix DecompositionFrank Ong
 
はじパタ11章 後半
はじパタ11章 後半はじパタ11章 後半
はじパタ11章 後半Atsushi Hayakawa
 
2019 cvpr paper_overview
2019 cvpr paper_overview2019 cvpr paper_overview
2019 cvpr paper_overviewLEE HOSEONG
 
Evaluation of multilabel multi class classification
Evaluation of multilabel multi class classificationEvaluation of multilabel multi class classification
Evaluation of multilabel multi class classificationSridhar Nomula
 
Intro to Classification: Logistic Regression & SVM
Intro to Classification: Logistic Regression & SVMIntro to Classification: Logistic Regression & SVM
Intro to Classification: Logistic Regression & SVMNYC Predictive Analytics
 
You Only Look Once: Unified, Real-Time Object Detection
You Only Look Once: Unified, Real-Time Object DetectionYou Only Look Once: Unified, Real-Time Object Detection
You Only Look Once: Unified, Real-Time Object DetectionDADAJONJURAKUZIEV
 
Unsupervised Cross-Domain Image Generation
Unsupervised Cross-Domain Image GenerationUnsupervised Cross-Domain Image Generation
Unsupervised Cross-Domain Image GenerationJunho Cho
 
Association rule mining and Apriori algorithm
Association rule mining and Apriori algorithmAssociation rule mining and Apriori algorithm
Association rule mining and Apriori algorithmhina firdaus
 
Probabilistic programming
Probabilistic programmingProbabilistic programming
Probabilistic programmingEli Gottlieb
 

Was ist angesagt? (20)

淺談品質指標及決策實驗室分析方法介紹
淺談品質指標及決策實驗室分析方法介紹淺談品質指標及決策實驗室分析方法介紹
淺談品質指標及決策實驗室分析方法介紹
 
Rによる分類木 入門
Rによる分類木 入門Rによる分類木 入門
Rによる分類木 入門
 
Sequential Pattern Mining and GSP
Sequential Pattern Mining and GSPSequential Pattern Mining and GSP
Sequential Pattern Mining and GSP
 
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미 제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미
제10회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 외국인 관광객을 위한 식당 메뉴판 인식 도우미
 
Kato Mivule: An Overview of Adaptive Boosting – AdaBoost
Kato Mivule: An Overview of  Adaptive Boosting – AdaBoostKato Mivule: An Overview of  Adaptive Boosting – AdaBoost
Kato Mivule: An Overview of Adaptive Boosting – AdaBoost
 
Object detection and Instance Segmentation
Object detection and Instance SegmentationObject detection and Instance Segmentation
Object detection and Instance Segmentation
 
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
東京都市大学 データ解析入門 7 回帰分析とモデル選択 2
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
 
Lect5 principal component analysis
Lect5 principal component analysisLect5 principal component analysis
Lect5 principal component analysis
 
Osaka.Stan #3 Chapter 5-2
Osaka.Stan #3 Chapter 5-2Osaka.Stan #3 Chapter 5-2
Osaka.Stan #3 Chapter 5-2
 
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix Decomposition
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix DecompositionBeyond Low Rank + Sparse: Multi-scale Low Rank Matrix Decomposition
Beyond Low Rank + Sparse: Multi-scale Low Rank Matrix Decomposition
 
はじパタ11章 後半
はじパタ11章 後半はじパタ11章 後半
はじパタ11章 後半
 
2019 cvpr paper_overview
2019 cvpr paper_overview2019 cvpr paper_overview
2019 cvpr paper_overview
 
Evaluation of multilabel multi class classification
Evaluation of multilabel multi class classificationEvaluation of multilabel multi class classification
Evaluation of multilabel multi class classification
 
Intro to Classification: Logistic Regression & SVM
Intro to Classification: Logistic Regression & SVMIntro to Classification: Logistic Regression & SVM
Intro to Classification: Logistic Regression & SVM
 
You Only Look Once: Unified, Real-Time Object Detection
You Only Look Once: Unified, Real-Time Object DetectionYou Only Look Once: Unified, Real-Time Object Detection
You Only Look Once: Unified, Real-Time Object Detection
 
Unsupervised Cross-Domain Image Generation
Unsupervised Cross-Domain Image GenerationUnsupervised Cross-Domain Image Generation
Unsupervised Cross-Domain Image Generation
 
Association rule mining and Apriori algorithm
Association rule mining and Apriori algorithmAssociation rule mining and Apriori algorithm
Association rule mining and Apriori algorithm
 
Decision tree
Decision treeDecision tree
Decision tree
 
Probabilistic programming
Probabilistic programmingProbabilistic programming
Probabilistic programming
 

Andere mochten auch

10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율Yoonwhan Lee
 
09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정Yoonwhan Lee
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문Yoonwhan Lee
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도Yoonwhan Lee
 
02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기Yoonwhan Lee
 
13.상관과 회귀
13.상관과 회귀13.상관과 회귀
13.상관과 회귀Yoonwhan Lee
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R BasicsYoonwhan Lee
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교Yoonwhan Lee
 
R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기Yoonwhan Lee
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 RYoonwhan Lee
 
04.r 기초 유의성 검증
04.r 기초   유의성 검증04.r 기초   유의성 검증
04.r 기초 유의성 검증Yoonwhan Lee
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석Yoonwhan Lee
 
12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교Yoonwhan Lee
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기Yoonwhan Lee
 
01.r 기초 확률분포
01.r 기초   확률분포01.r 기초   확률분포
01.r 기초 확률분포Yoonwhan Lee
 

Andere mochten auch (20)

10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율
 
09.통계적가설검정
09.통계적가설검정09.통계적가설검정
09.통계적가설검정
 
08.추정
08.추정08.추정
08.추정
 
00.통계학입문
00.통계학입문00.통계학입문
00.통계학입문
 
06.확률분포
06.확률분포06.확률분포
06.확률분포
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도
 
02.자료다루기
02.자료다루기02.자료다루기
02.자료다루기
 
13.상관과 회귀
13.상관과 회귀13.상관과 회귀
13.상관과 회귀
 
05.확률
05.확률05.확률
05.확률
 
R 기초 : R Basics
R 기초 : R BasicsR 기초 : R Basics
R 기초 : R Basics
 
11.두표본의 평균비교
11.두표본의 평균비교11.두표본의 평균비교
11.두표본의 평균비교
 
R 기초 Part. 01
R 기초 Part. 01R 기초 Part. 01
R 기초 Part. 01
 
R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기R과 기초통계 : 01.자료다루기
R과 기초통계 : 01.자료다루기
 
통계자료 분석을 위한 R
통계자료 분석을 위한 R통계자료 분석을 위한 R
통계자료 분석을 위한 R
 
01.r 기초
01.r 기초01.r 기초
01.r 기초
 
04.r 기초 유의성 검증
04.r 기초   유의성 검증04.r 기초   유의성 검증
04.r 기초 유의성 검증
 
14.범주형자료분석
14.범주형자료분석14.범주형자료분석
14.범주형자료분석
 
12.세표본 이상의 평균비교
12.세표본 이상의 평균비교12.세표본 이상의 평균비교
12.세표본 이상의 평균비교
 
R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기R과 기초통계 : 02.기술통계-자료나타내기
R과 기초통계 : 02.기술통계-자료나타내기
 
01.r 기초 확률분포
01.r 기초   확률분포01.r 기초   확률분포
01.r 기초 확률분포
 

Mehr von Yoonwhan Lee

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1Yoonwhan Lee
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇYoonwhan Lee
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기Yoonwhan Lee
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정Yoonwhan Lee
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치Yoonwhan Lee
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지Yoonwhan Lee
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포Yoonwhan Lee
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열Yoonwhan Lee
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용Yoonwhan Lee
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수Yoonwhan Lee
 
기초 확률 관련
기초 확률 관련기초 확률 관련
기초 확률 관련Yoonwhan Lee
 

Mehr von Yoonwhan Lee (15)

Smart work 자료 1
Smart work 자료 1Smart work 자료 1
Smart work 자료 1
 
통계자료분석을 ㅇ
통계자료분석을 ㅇ통계자료분석을 ㅇ
통계자료분석을 ㅇ
 
PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기PHP를 이용한 간단한 방명록 만들기
PHP를 이용한 간단한 방명록 만들기
 
Class10
Class10Class10
Class10
 
MySQL과 PHP
MySQL과 PHPMySQL과 PHP
MySQL과 PHP
 
MySQL 기초
MySQL 기초MySQL 기초
MySQL 기초
 
추정
추정추정
추정
 
쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정쿠키를 통해 구현해보는 간단한 로그인 과정
쿠키를 통해 구현해보는 간단한 로그인 과정
 
에버노트와 드롭박스 설치
에버노트와 드롭박스 설치에버노트와 드롭박스 설치
에버노트와 드롭박스 설치
 
PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지PHP에서 객체와 데이터 연결 유지
PHP에서 객체와 데이터 연결 유지
 
표본들의 분포
표본들의 분포표본들의 분포
표본들의 분포
 
HTML Form과 배열
HTML Form과 배열HTML Form과 배열
HTML Form과 배열
 
Android 기초 앱 사용
Android 기초 앱 사용Android 기초 앱 사용
Android 기초 앱 사용
 
확률변수와 분포함수
확률변수와 분포함수확률변수와 분포함수
확률변수와 분포함수
 
기초 확률 관련
기초 확률 관련기초 확률 관련
기초 확률 관련
 

07.표본분포

  • 2. 용어 • 모수(Parameter) – 모집단의 특성을 나타내는 수량화된 값 – 일반적으로 모수는 정해져 있지만 잘 알지 못한다. • 통계량(Statistic) – 표본으로부터 계산되는 표본의 특성값 – 관측가능한 확률변수들의 실수값 함수로 통계량은 확 률변수 • 표본분포(Sampling Distribution) – 한 모집단에서 같은 크기로 뽑을 수 있는 모든 표본에 서 통계량을 계산할 때 이 통계량이 이루는 확률분포 한림대학교 이윤환(http://fb.com/yoonani72)
  • 3. 평균의 표본분포 • 다음 4장의 카드에서 두 장을 랜덤하게 뽑아 평 균을 구해봅시다. 1 2 3 한림대학교 이윤환(http://fb.com/yoonani72) 4
  • 4. 평균의 표본분포 𝒙 𝒙𝒑(𝒙) 𝒑(𝒙) 𝒙 𝟐 𝒑(𝒙) 1 1 4 1 4 1 4 2 1 4 2 4 4 4 3 1 4 3 4 9 4 4 1 4 4 4 16 4 𝑝 𝑥 =1 합 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 10 𝑥𝑝 𝑥 = 4 𝑥2 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p161 한림대학교 이윤환(http://fb.com/yoonani72) 30 𝑝 𝑥 = 4
  • 5. 평균의 표본분포 • 표본추출 방법 : 비복원 추출(without replace) 1 2 3 1 3 4 4 한림대학교 이윤환(http://fb.com/yoonani72) 2 4
  • 6. 평균의 표본분포 • 랜덤표본과 그 평균 – 비복원 추출 가능한 표본 평균표본 𝒙 {1, 2} 1.5 {1, 3} 2.0 {1, 4} 2.5 {2, 3} 2.5 {2, 4} 3.0 {3, 4} 3.5 통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p162 한림대학교 이윤환(http://fb.com/yoonani72)
  • 7. 평균의 표본분포 • 평균의 표본분포 𝒙 𝒑(𝒙) 𝒙 𝒑(𝒙) 𝒙 𝟐 𝒑(𝒙) 1.5 1/6 1.5 / 6 2.25 / 6 2.0 1/6 2/6 4/6 2.5 2/6 5/6 12.5 / 6 3 1/6 3/6 9/6 3.5 1/6 3.5 / 6 12.25 / 6 𝑝 𝒙 =1 합 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 𝒙𝑝 𝒙 = 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 15 6 𝒙2 𝑝 𝒙 = 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p162 한림대학교 이윤환(http://fb.com/yoonani72) 40 6
  • 8. 평균의 표본분포 • 표본추출 방법 : 복원 추출(with replace) 1 2 3 4 2 1 2 3 4 2 한림대학교 이윤환(http://fb.com/yoonani72)
  • 9. 평균의 표본분포 • 랜덤표본과 그 평균 – 복원 추출 표본 𝒙 표본 𝒙 표본 𝒙 표본 𝒙 {1, 1} 1.0 {2, 1} 1.5 {3, 1} 2.0 {4, 1} 2.5 {1, 2} 1.5 {2, 2} 2.0 {3, 2} 2.5 {4, 2} 3.0 {1, 3} 2.0 {2, 3} 2.5 {3, 3} 3.0 {4, 3} 3.5 {1, 4} 2.5 {2, 4} 3.0 {4, 4} 3.5 {4, 4} 4.0 통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p163 한림대학교 이윤환(http://fb.com/yoonani72)
  • 10. 평균의 표본분포 • 평균의 표본분포 𝒙 𝒑(𝒙) 𝒙 𝒑(𝒙) 𝒙 𝟐 𝒑(𝒙) 1.0 1 / 16 1 / 16 1 / 16 1.5 2 / 16 3 / 16 4.5 / 16 2.0 3 / 16 6 / 16 12 / 16 2.5 4 / 16 10 / 16 25 / 16 3.0 3 / 16 9 / 16 27 / 16 3.5 2 / 16 7 / 16 24.5 / 16 4.0 1 / 16 4 / 16 16 / 16 𝑝 𝒙 =1 합 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 40 𝒙𝑝 𝒙 = 16 𝒙2 𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥 통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p163 한림대학교 이윤환(http://fb.com/yoonani72) 110 𝑝 𝒙 = 16
  • 11. 표본평균의 기대값과 분산 • 우리가 알고자 하는 대상 : 모집단의 특성 • 표본평균의 기대값 – 슬라이드 #4에 있는 {1, 2, 3, 4} 의 평균 𝜇 = 2.5 – 표본평균 𝑋 의 분포는 확률변수 – 기대값 : 확률변수의 평균 • 표본평균들의 평균을 표본평균의 기대값 • 기호 : 𝐸(𝑋) – 앞선 복원추출과 비복원추출 모두의 기대값은 2.5 • 𝐸 𝑋 = 𝜇 한림대학교 이윤환(http://fb.com/yoonani72)
  • 12. 표본평균의 기대값과 분산 • 표본평균의 분산 – 분산의 간편계산식 : V𝑎𝑟 𝑋 = 𝐸 𝑋 2 − 𝐸(𝑋)2 – 비복원 추출에서의 분산 • V𝑎𝑟 𝑋 = 𝒙2 𝑝 𝒙 − 𝐸 𝑋 2 = 40 16 2 = 110 16 − 5 2 2 = 5 12 – 복원 추출에서의 분산 • V𝑎𝑟 𝑋 = 𝒙2 𝑝 𝒙 − 𝐸 𝑋 5 2 − ( )2 = 5 8 한림대학교 이윤환(http://fb.com/yoonani72)
  • 13. 표본평균의 기대값과 분산 • 표본평균의 분산과 모집단의 분산과의 관계 – 모분산이 𝜎 2 이고, 크기가 𝑁인 모집단에서 크기 𝑛인 랜 덤표본을 뽑을 때 표본평균 𝑋에 대하여 • 비복원 추출 : 𝑉𝑎𝑟 𝑋 = • 복원 추출 : 𝑉𝑎𝑟 𝑋 = 𝑁−𝑛 𝑁−1 ∙ 𝜎2 𝑛 𝜎2 𝑛 한림대학교 이윤환(http://fb.com/yoonani72)
  • 14. 표본분포의 모양 • 모집단이 정규분포일 경우 모집단의 분포가 정규분포 𝑁 𝜇, 𝜎 2 일때, 표본평균 𝑋는 정규분포 𝑁 𝜇, 를 따른다 한림대학교 이윤환(http://fb.com/yoonani72) 𝜎2 𝑛
  • 15. 표본분포의 모양 • 모집단이 정규분포가 아닐 경우 평균이 𝜇 이고 분산이 𝜎 2 인 무한모집단에서 크기가 𝑛인 랜덤표본을 뽑았을 때 𝑛이 충분히 크면 모집단의 분포 모양에 관계없이 표본평균 𝑋는 근사적으로 정규분포 𝑁 𝜇, 를 따른다 한림대학교 이윤환(http://fb.com/yoonani72) 𝜎2 𝑛
  • 16. 표본비율의 분포 • 관심이 가는 사건의 비율(propotion) – 성공율, 불량률, 지지율, 사망률 등 – 확률변수 𝑋 = 1, 0, 관심사건의 성공 관심사건의 실패 – 이 때의 확률변수는 각각 베르누이 – 𝑝= 성공의 횟수 𝑛 = 𝑋1 +𝑋2 +𝑋3 +⋯+𝑋 𝑛 𝑛 – 𝑝은 모집단의 성공의 비율 𝑝의 추정량으로 • X는 성공의 횟수, n은 표본의 개수 – 𝑝 역시 확률변수로 기대값과 분산을 갖는다. 한림대학교 이윤환(http://fb.com/yoonani72) 𝑋 𝑛 로 계산
  • 17. 모비율의 분포 • 𝑝의 기대값과 분산 – 𝐸 𝑝 = 𝑝 – Var 𝑝 = 𝑝(1−𝑝) 𝑛 • 중심극한정리 적용 – 𝑝 은 표본평균의 개념과 동일 – n이 충분히 클 경우 다음이 성립 by C. L. T 𝒑~𝑵(𝒑, 𝒑 𝟏− 𝒑 ) 𝒏 한림대학교 이윤환(http://fb.com/yoonani72)