07.표본분포

용어
• 모수(Parameter)
– 모집단의 특성을 나타내는 수량화된 값
– 일반적으로 모수는 정해져 있지만 잘 알지 못한다.

• 통계량(Statistic)
– 표본으로부터 계산되는 표본의 특성값
– 관측가능한 확률변수들의 실수값 함수로 통계량은 확
률변수

• 표본분포(Sampling Distribution)
– 한 모집단에서 같은 크기로 뽑을 수 있는 모든 표본에
서 통계량을 계산할 때 이 통계량이 이루는 확률분포
한림대학교 이윤환(http://fb.com/yoonani72)

평균의 표본분포
• 다음 4장의 카드에서 두 장을 랜덤하게 뽑아 평
균을 구해봅시다.

1

2

3


4

𝒙

𝒙𝒑(𝒙)

𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1

1
4

1
4

1
4

2

1
4

2
4

4
4

3

1
4

3
4

9
4

4

1
4

4
4

16
4

𝑝 𝑥 =1

합
𝑓𝑜𝑟 𝑎𝑙𝑙 𝑥


10
𝑥𝑝 𝑥 =
4

𝑥2

통계학 개론, 제 4판, 김우철 외 9인 공저, 영지문화사, p161

30
𝑝 𝑥 =
4

• 표본추출 방법 : 비복원 추출(without replace)

1

2

3

1

3

4

4


2

4

• 랜덤표본과 그 평균 – 비복원 추출
가능한 표본

평균표본 𝒙

{1, 2}

1.5

{1, 3}

2.0

{1, 4}

2.5

{2, 3}

2.5

{2, 4}

3.0

{3, 4}

3.5



• 평균의 표본분포
𝒙

𝒑(𝒙)

𝒙 𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1.5

1/6

1.5 / 6

2.25 / 6

2.0

1/6

2/6

4/6

2.5

2/6

5/6

12.5 / 6

3

1/6

3/6

9/6

3.5

1/6

3.5 / 6

12.25 / 6

𝑝 𝒙 =1

합

𝒙𝑝 𝒙 =

15
6

𝒙2 𝑝 𝒙 =


40
6

• 표본추출 방법 : 복원 추출(with replace)

1

2

3

4

2

1

2

3

4

2


• 랜덤표본과 그 평균 – 복원 추출
표본

𝒙

표본

𝒙

표본

𝒙

표본

𝒙

{1, 1}

1.0

{2, 1}

1.5

{3, 1}

2.0

{4, 1}

2.5

{1, 2}

1.5

{2, 2}

2.0

{3, 2}

2.5

{4, 2}

3.0

{1, 3}

2.0

{2, 3}

2.5

{3, 3}

3.0

{4, 3}

3.5

{1, 4}

2.5

{2, 4}

3.0

{4, 4}

3.5

{4, 4}

4.0



• 평균의 표본분포
𝒙

𝒑(𝒙)

𝒙 𝒑(𝒙)

𝒙 𝟐 𝒑(𝒙)

1.0

1 / 16

1 / 16

1 / 16

1.5

2 / 16

3 / 16

4.5 / 16

2.0

3 / 16

6 / 16

12 / 16

2.5

4 / 16

10 / 16

25 / 16

3.0

3 / 16

9 / 16

27 / 16

3.5

2 / 16

7 / 16

24.5 / 16

4.0

1 / 16

4 / 16

16 / 16

𝑝 𝒙 =1

합


40
𝒙𝑝 𝒙 =
16

𝒙2


110
𝑝 𝒙 =
16

표본평균의 기대값과 분산
• 우리가 알고자 하는 대상 : 모집단의 특성
• 표본평균의 기대값
– 슬라이드 #4에 있는 {1, 2, 3, 4} 의 평균 𝜇 = 2.5
– 표본평균 𝑋 의 분포는 확률변수
– 기대값 : 확률변수의 평균
• 표본평균들의 평균을 표본평균의 기대값
• 기호 : 𝐸(𝑋)

– 앞선 복원추출과 비복원추출 모두의 기대값은 2.5

• 𝐸 𝑋 = 𝜇

• 표본평균의 분산
– 분산의 간편계산식 : V𝑎𝑟 𝑋 = 𝐸 𝑋 2 − 𝐸(𝑋)2
– 비복원 추출에서의 분산
• V𝑎𝑟 𝑋 =

𝒙2

𝑝 𝒙 − 𝐸 𝑋

2

=

40
16

2

=

110
16

−

5 2
2

=

5
12

– 복원 추출에서의 분산
• V𝑎𝑟 𝑋 =

𝒙2 𝑝 𝒙 − 𝐸 𝑋

5
2

− ( )2 =

5
8


• 표본평균의 분산과 모집단의 분산과의 관계
– 모분산이 𝜎 2 이고, 크기가 𝑁인 모집단에서 크기 𝑛인 랜
덤표본을 뽑을 때 표본평균 𝑋에 대하여
• 비복원 추출 : 𝑉𝑎𝑟 𝑋 =

• 복원 추출 : 𝑉𝑎𝑟 𝑋 =

𝑁−𝑛
𝑁−1

∙

𝜎2
𝑛

𝜎2
𝑛


표본분포의 모양
• 모집단이 정규분포일 경우
모집단의 분포가
정규분포 𝑁 𝜇, 𝜎 2 일때,
표본평균 𝑋는
정규분포 𝑁 𝜇,
를 따른다


𝜎2
𝑛

표본분포의 모양
• 모집단이 정규분포가 아닐 경우

평균이 𝜇 이고 분산이 𝜎 2 인
무한모집단에서 크기가 𝑛인
랜덤표본을 뽑았을 때
𝑛이 충분히 크면
모집단의 분포 모양에 관계없이
표본평균 𝑋는
근사적으로 정규분포 𝑁 𝜇,
를 따른다


𝜎2
𝑛

표본비율의 분포
• 관심이 가는 사건의 비율(propotion)
– 성공율, 불량률, 지지율, 사망률 등
– 확률변수 𝑋 =

1,
0,

관심사건의 성공
관심사건의 실패

– 이 때의 확률변수는 각각 베르누이

– 𝑝=

성공의 횟수
𝑛

=

𝑋1 +𝑋2 +𝑋3 +⋯+𝑋 𝑛
𝑛

– 𝑝은 모집단의 성공의 비율 𝑝의 추정량으로
• X는 성공의 횟수, n은 표본의 개수

– 𝑝 역시 확률변수로 기대값과 분산을 갖는다.

𝑋
𝑛

로 계산

모비율의 분포
• 𝑝의 기대값과 분산
– 𝐸 𝑝 = 𝑝
– Var 𝑝 =

𝑝(1−𝑝)
𝑛

• 중심극한정리 적용
– 𝑝 은 표본평균의 개념과 동일
– n이 충분히 클 경우 다음이 성립 by C. L. T
𝒑~𝑵(𝒑,

𝒑 𝟏− 𝒑
)
𝒏


07.표본분포

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Andere mochten auch

Andere mochten auch (20)

Mehr von Yoonwhan Lee

Mehr von Yoonwhan Lee (15)

07.표본분포