SlideShare ist ein Scribd-Unternehmen logo
1 von 46
엑셀을 활용한
통계분석 맛보기
청성초등학교
교사 김성훈
효과성 검증?!
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
3
통계분석
1. 모집단과 표본 I. 기초통계개념
모집단 표본
모수
(parameter)
통계량
(statistics)
표본추출
(sampling)
4
추론통계
I. 기초통계개념
5
분류 목적 및 이용분석 방법
기술통계
몇 개의 대표되는 숫자로 자료 전체를 요약하여 자료를 양적으로 축소하거
나, 정리된 표나 그래프를 통하여 자료의 특징을 파악하는 방법
=> 빈도분석, 기술통계분석 등 이용
추론통계
둘 혹은 셋 이상의 집단 간에 차이가 있는지, 변수 간에 상관 혹은 영향관
계가 있는지를 표본자료로 파악하여 모집단에 적용하는 분석방법.
이 결과의 적용에 오류가 있을 수 있으며, 이를 확률적으로 파악함.
=> 교차분석, t-test분석, 분산분석, 상관관계, 회귀분석 등 이용
2. 기술통계와 추론통계
3. 가설 I. 기초통계개념
1)개념
분류 내용
귀무 가설
“아무런차이가없다”또는“전혀효과가없다”는내용을의미하는주장
대체로연구에서는귀무가설을거부하기위해 설정
대립 가설
“차이가있다”혹은“효과가있다”는귀무가설의 반대개념
귀무가설이기각되고대립가설이받아들여지면 자료는
“통계적으로유의하다”고표현
예)아프리카원주민의한국정당선호비율은?
->아무것도모르기때문에3개정당이면33%,
33%,33%로나타날것이다(무작위결과)
예)영유아의경제력과행복과의관계
->영유아는경제(돈)에대한관념이형성되지않
았기때문에돈이많은것과행복은별개
귀무가설과 대립가설의 관계는 피고인의
무죄와 유죄와의 관계와 유사하다. 무죄
(귀무)라는 사실에 입각하여 증거가 많
아질수록 유죄(대립)로 간다.
6
3. 가설 I. 기초통계개념
차이의
가설
귀무가설: 소득수준에 따라서 선호하는 자동차 유형은 차이가 없다.
대립가설: 소득수준에 따라서 선호하는 자동차 유형은 차이가 있다.
상관
관계의
가설
영향
관계의
가설
귀무가설: 소득수준이 선호하는 자동차 유형에 영향을 미치지 않을 것이다.
대립가설: 소득수준이 선호하는 자동차 유형에 영향을 미칠 것이다.
귀무가설: 소득수준에 따라서 선호하는 자동차 유형은 관계가 없다.
대립가설: 소득수준에 따라서 선호하는 자동차 유형은 관계가 있다.
7
2)귀무가설과대립가설설정
3. 가설 I. 기초통계개념
가설
검정
표본으로부터 얻은 사실에 근거하여, 모집단에 대한 가설이 맞는지
틀리는지를 통계적으로 검정하는 방법
가설
기각
실제 표본의 관측치와 이론치와의 차이가 확률적인 오차의 범위를 넘
어 오류라고 판단되는 것
가설
채택
관측치와 이론치의 차이가 신뢰수준 범위내에 존재하는 것
8
3)가설의기각과채택
3. 가설 I. 기초통계개념
4)유의수준과임계치
유의수준
(significant level)
제 1종 오류를 범할 확률을 유의수준이라고 하여 α로 표시
보통 유의수준(α)은 0.10, 0.05, 0.01 등으로 정하는 경우가 많다.
임계치
(critical value)
주어진 유의수준에서 귀무가설의 채택과 기각에 관한 의사결정을 할 경우,
그 기준이 되는 점(기각치).
검정통계량
귀무가설(영가설:HO)채택
대립가설(연구가설:H1) 채택
신뢰수준 95%
귀무가설의
중심
유의수준(α )=0.05(5%) 임계치
α/2=0.025
α/2=0.025
9
전교 학생들의 평균 총점을 추정한 값은 300점이다. 그러나 다른 의견이
있어 표본 25명을 선발해 조사했더니 평균 총점이 310점이 나왔다. 이때
어느 의견이 더 타당한지 유의수준 5%에서 검정하시오.
(단 총점의 모표준편차는 30이다.)
3. 가설 I. 기초통계개념
5)가설검정의예
예) A반 100명의 평균은 75점(표준편차 10), B반 100명의 평균은 80점(표준편차 16) 이라고 할 때,
두 반의 평균차이가 유의한지 가설을 설정하고 검증하여라 (신뢰수준 95%)
• 귀무가설: 두 반의 평균은 다르지 않다. (두 반의 성적은 차이가 없다.)
• 대립가설: 두 반의 평균은 다르다. (두 반의 성적은 차이가 있다.)
검정통계량
t값= 1.03: 귀무가설 채택
t값= 2.35: 대립가설 채택
신뢰수준 95%
차이가
없다
유의수준
(α)=0.05(5%)
임계치
검정통계량의 의미 귀
무가설로부터 약 몇배
떨어져 있다
α/2=0.025
α/2=0.025
11
I. 기초통계개념
귀무가설/대립가설
의사결정대안 설정
유의수준(α) 선택 및 기각
영역 설정
표본통계량(검정통계량)
계산 도출
표본통계치를 이용한 가설
검정 및 최선의 대안 선택
H0:수업방식의 변화가 평균점수의 변화에 영향을 미치지 않을 것이다.
H1:수업방식의 변화가 평균점수의 변화에 영향을 미칠 것이다.
유의수준 0.05(신뢰수준 95)에서 가설채택 여부
대립가설 채택, 즉 수업방식이 시험성적에 긍정적 영향을 미침
최선 대안: 새로운 방식의 수업을 지속적으로 실시함
통계량 t-value=3.134, p=0.001
12
4. 가설검정의 순서
I. 기초통계개념
13
분석방법 독립-종속 귀무가설(H0)/대립가설(H1) 검정통계량 p
교차분석 범주-범주
H0: 독립변수에 따라 종속변수에는 차이가 없다.
H1: 독립변수에 따라 종속변수는 차이가 있다.
ᵡ2
P<0.05
→대립
독립표본
t-test 범주-연속
H0: 독립변수에 따라 종속변수에는 차이가 없다.
H1: 독립변수에 따라 종속변수는 차이가 있다. t-value
P<0.05
→대립
분산분석 범주-연속
H0: 독립변수에 따라 종속변수에는 차이가 없다.
H1: 독립변수에 따라 종속변수는 차이가 있다. F-value
P<0.05
→대립
상관관계
분석 연속-연속
H0: 독립변수와 종속변수는 상관관계가 없다.
H1: 독립변수와 종속변수는 상관관계가 있다. r(rho)
P<0.05
→대립
회귀분석 연속-연속
H0: 독립변수는 종속변수에 영향을 미치지 않는다.
H1: 독립변수는 종속변수에 영향을 미친다.
F-value
t-value
P<0.05
→대립
5. 분석방법과 통계량
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
14
SPSS 중급통계분석
1. 4가지 척도 Ⅱ. 척도와 분석방법
15
 척도/자료의 종류가 무엇인가에 따라 분석방법이 결정 됨.
 따라서 척도의 자료의 종류를 이해하는 것은 분석에 앞서 매우 중요함.
 척도란 사물이나 사람의 특성을 하나의 기준으로 숫자를 부여한 것.
종류 정의 (예) 구분 분석방법
명목척도
측정대상(응답자)을 단지 분류할 목
적으로 숫자를 부여한 척도 성별
범주형 자료 빈도분석
서열척도 측정대상(응답자)간에 순서/서열적
의미(높고 낮음)가 있는 척도
학력
등간척도
측정대상(응답자)간에 순서 뿐만 아
니라 숫자의 간격이 동일하여 양적
인 정도를 알 수 있는 척도
온도
연속형 자료 기술통계
비율척도
등간척도와 유사하나, 0의 의미가
‘실제로 없다’고 말할 수 있는 척도 소득
Ⅱ. 척도와 분석방법
척도와 분석간의 관계
독립변수
범주형 자료 연속형 자료
종속변수
범주형 자료 교차분석
로지스틱 회귀분석
프로빗 분석 판별
분석, 군집분석
연속형 자료
t-test
분석분석(ANOVA)
상관관계분석
회귀분석
경로분석
SEM분석
2. 척도와 척도의 분석방법
16
Ⅱ. 척도와 분석방법
17
2. 척도와 척도의 분석방법
1)교차분석
 독립변수와종속변수가모두범주형인경우두 변수간의관계를파악하는통계분석방법.
교차분석의 예
문1. 귀하의 성별은?
① 남성 ② 여성
문2. 귀하가 선호하는 패밀리레스토랑은?
① TGI ② 베니건스 ③ VIPS ④ 아웃백
구분 TGI 베니건스 VIPS 아웃백 전체
남 30 30 30 30 120명
여 25 25 30 50 130명
전체 55 55 60 80 250명
Ⅱ. 척도와 분석방법
18
2. 척도와 척도의 분석방법
t-test와 분산분석의 예
문1. 귀하의 성별은?
① 남성 ② 여성
문2. 귀하의 연령대는?
① 20대 이하 ② 30대 ③ 40대 이상
문3. 귀하께서는 TGI에 얼마나 만족하십니까?
① 매우 불만족 ② 불만족 ③ 보통 ④ 만족 ⑤ 매우 만족
2)t-test와분산분석
 독립변수가범주형이고,종속변수가연속형자료
 독립변수 범주가 2개 : t-test
 독립변수 범주가 3개 이상 : 분산분석
구분 N(명) 평균 표준편차
남 120 3.4 0.23
성별
여 130 3.2 0.3
20대이하 80 3.4 0.3
연령대 30대 90 3.2 0.27
40대이상 80 3.3 0.29
전체 250 3.3 0.31
Ⅱ. 척도와 분석방법
19
3)상관관계분석과회귀분석
2. 척도와 척도의 분석방법
 독립변수와 종속변수가 모두 연속형인 경우
두 변수간의 관계를 파악하는 통계분석방법.
 두 변인간 상관 정도를 파악하는 분석 :
상관관계분석
 독립변수가 종속변수에 미치는 영향 분석 :
회귀분석
 상관관계분석
 회귀분석
변수 TV광고
횟수
라디오
광고횟수
신문광고
횟수
온라인
광고횟수
매출액 0.343** 0.304** 0.294** 0.283**
변수
비표준화계수 표준화
계수
t p
b S.E. β
TV 0.232 0.085 0.343 2.729 0.000***
라디오 0.193 0.097 0.310 1.990 0.032*
신문 0.094 0.092 0.293 1.022 0.432
온라인 0.087 0.088 0.292 0.989 0.842
R²=0.325, F=76.422, p=0.000***
기간 TV 광고
횟수
라디오
광고횟수
신문광고
횟수
온라인
광고횟수
매출액
2009.1 4 12 23 23 12.5억
2009.2 5 13 24 32 12.9억
2009.3 4 15 25 46 12.6억
2009.4 5 13 30 45 13.5억
2009.5 6 12 34 57 14.5억
2009.6 6 17 15 65 16.5억
2009.7 5 18 32 43 15.4억
·
·
·
·
·
·
·
·
·
·
·
·
2011.12. 7 19 25 56 18.3억
Ⅱ. 척도와 분석방법2. 척도와 척도의 분석방법
4)로지스틱회귀분석/판별분석/군집분석 5)기타통계분석
 독립변수가 연속형이고, 종속변수가 범주형 자
료
 독립변수가 종속변수에 미치는 영향 분석
: 로지스틱 회귀분석
• 신체관련 변수(연령, 키, 몸무게, bmi 등), 건강행위 관련 변수
(흡연정도, 음주정도 등) 중 어떠한 변수가 암발생(정상/환자)
에 영향을 미치는가?
 종속변수 집단을 판별하는 주요한 변수 분석
: 판별분석
• 고객분류(VIP고객/우수고객/일반고객)을 분류하는 소비
행위변수(쇼핑횟수, 시간, 지출액 등)은 무엇인가?
 기준변수를 설정하여 유사한 특성을 보이는 소
비 집단(군집)을 파악하여 마케팅 조사에서는
특히 ‘시장세분화’에 많이 사용되는 분석
: 군집분석
• 고객소비특성에 따른 Heavy User, Middle User, Light User는?
• 제품관여도/라이프스타일에 따른 소비군집은?
 신뢰도 및 요인분석: 다항목으로 한 개념을
측정하고자 할 때, 척도의 타당도와 신뢰도를
측정하는 방법.
특히 요인분석은 군집분석과 결합하여 사용
(요인분석→군집화 기준변수 →군집분석)
• 고객만족도를 조사하기 위하여 5개 문항은 타당한가?
• 패션관심도, 외모관심도, 웰빙관심도 3개 요인으로 도출되어
군집분석
20
 컨조인트분석: 결합분석이라고도 하며, 대안의
컨셉/제품/카피 안에 대한 최적의 조합을 찾아
내고, 세분시장별 중요 요인을 파악하고, 시장
점유율을 예측하는 방법
• 가격(300/400원), 디자인(전문적/전통적), 기능(옵션/노옵션)의
최적의 조합 컨셉?
 대응분석과 다차원척도법: 지각도 작성(포지셔닝맵)
방법
• 경쟁사들과 자사에 대한 소비자의 지각형성도는? 자사의
경쟁업체는?
• 어떤 포지셔닝 전략이 현실적(단기적), 이상적(중장기적)인가?
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
21
SPSS 중급통계분석
Ⅲ.t-test
22
1. 개념과 통계량
9✓ 개념
➢ 기네스 맥주회사 과학자 고셋(Gosset)
이
1908년에 고안한 분석방법
➢ 두 표본 집단 간에 평균의 차이를 검
증하기 위해 사용
➢ 독립변수(2개 집단), 종속변수(연속형
자료)
➢ 일반적으로 t-test 분석이라 함은 독립표
본
t-test를 말함
✓ 통계량
➢ t-value : t-test분석의 검정통계량
• 집단 간에 평균차이가 얼마나 있는가를
계산한 결과
➢ 유의확률(p) : 검정통계량을 t분포상에
위치한 확률값
• t 값을 확률적 값으로 변환한 값
Ⅲ.t-test
23
2. t-test의 종류
일표본 t-test
 특정한 평균을 기준으로 해당 표본의 평균이 같은지를 검정
• 예1) 우리 학교 학생의 영어성적은 전국 영어평균과 다른가?
• 예2) 서울의 집값은 선진국에 비해 높은가?
독립표본 t-test
 두 개의 독립적인 표본 간에 하나의 종속변수의 평균이 동일한가를 검증
• 예1) 남녀직원들 간에 회사에 대한 만족 수준은 같은가? 다른가?
• 예2) 결혼한 사람과 결혼하지 않은 사람 중 누가 더 행복한가?
대응표본 t-test
 동일한 표본의 A시점의 점수화 B시점의 점수 변화 차이를 검증
• 예1) 영상학습법 적용 이후 학생들의 성적은 올랐는가?
• 예2) 결혼 전과 결혼 후 남성들의 인생관이 달라지는가?
Ⅲ.t-test3. 일표본 t-test
1) 사용목적
표본의 평균이 어떤 수와 같은가를 검증
하기 위해 사용
알려진 평균 VS 표본데이터의 평균 비교
2) 가설검정과 검정통계량
 귀무가설: 중간영어점수는 80점이다.
 대립가설: 중간영어점수는 80점과 차이
가 있다.
 검정통계량: t-value, 자유도(df), 이를
고려하여 -> 유의확률(p)의 계산구분 명수 평균 표준
편차
표준
오차
중간
영어점수
36 72.19 20.324 3.39
중간영어점수 : 80점
24
Ⅲ.t-test
25
4. 독립표본 t-test
1) 사용목적
 두 표본 집단 간에 평균의 차이를 검증하기
위해 사용
 독립변수(2개 집단), 종속변수(연속형 자료)
2) 가설검정과 검정통계량
 귀무가설: 통제집단과 실험집단의 중간영어
성취도점수는 차이가 없다.
 대립가설: 통제집단과 실험집단의 중간영어
성취도점수는 차이가 있다.
 검정통계량: t-value, 자유도: df,
이를 고려하여 -> 유의확률(p)의 계산구분 명수 평균
표준
편차
표준
오차
통제집단 20 71.40 20.41 4.56
실험집단 16 73.19 20.84 5.21
Ⅲ.t-test
26
5. 대응표본 t-test
1) 사용목적
 두 변수 간의 평균 차이를 분석
 사전점수-사후점수, 중간고사-기말고사,
만족도-중요도 등의 차이 분석
2) 가설검정과 검정통계량
 귀무가설 : 사전점수와 사후점수 간에는
차이가 없다.
 대립가설 : 사전점수와 사후점수 간에는
차이가 있다.
검정통계량 : t-value, 자유도 : df, 이를
고려하여 -> 유의확률(p)의 계산
구분 명수 평균 표준
편차
표준
오차
사전점수 100 78.4 10.3 1.03
사후점수 100 82.3 11.2 1.12
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
27
SPSS 중급통계분석
1. 분산분석의 개념
28
1) 개념과 통계량
개념
 세 집단 이상 간의 평균차이 분석
 독립변수(3집단 이상), 종속변수(연속형 변수)
2) 가설검정과 검정통계량
 귀무가설: 인문/이공계/상경계 학생들 간에는
월평균 용돈에 차이가 없다.
 대립가설: 인문/이공계/상경계 학생들 간에는
월평균 용돈에 차이가 있다.
 검정통계량: F-value, 자유도: df, 이를 고려하여
–> 유의확률(p)의 계산
구분 명수 평균 표준
편차
왜도 첨도 표준오차
인문계 100 34.3 8.42 1.23 0.54 0.842
사후점수 100 36.4 9.43 2.43 0.94 0.943
상경계 100 39.4 7.54 1.95 1.31 0.754
[집단 기술통계]
Ⅳ.분산분석(ANOVA)
2. 분산분석의 SPSS
 분석 -> 평균비교 -> 일원배치 분산분석으로
들어간다.
요인에 범주형 독립변수를, 종속변수에 연속형
종속변수를 각각 넣는다.
전시관만족도.sav
Ⅳ.분산분석(ANOVA)
29
2. 분산분석의 SPSS
 옵션에서 ‘기술통계량’ 을 클릭한다. 사후분석에서 Scheffe 또는 Duncan 방법을 체
크한다.
 (선택하지 않으면 각 집단별 평균 등이 나오지
않는다.)
Ⅳ.분산분석(ANOVA)
30
2. 분산분석의 SPSS
31
 사후검정을 왜 하는가?
분산분석의 귀무가설과 대립가설은 다음과 같다.
귀무가설: 집단 (A,B,C)간 평균 차이는 같다 (A=B=C)
대립가설: 집단 (A,B,C)간 평균 차이는 다르다
(A≠B 또는 B≠C 또는 C ≠A)
 즉, 대립가설은 단 2개의 집단간에만 차이가 나타나도 채택된다. 따라서 어떤 집단
간에 차이가 나타나는지는 평균만으로는 부족하다.
 Scheffe와 Duncan
 일반적으로 집단의 표본수를 통제하지 못하는 서베이에서는 Scheffe의 방법을 실험연구처럼 표본수를 동일하게
할 경우는 Duncan방법을 선호한다.
Ⅳ.분산분석(ANOVA)
Ⅳ.분산분석(ANOVA)3. 분산분석의 결과 정리와 해석
결과 해석
 관람객 집단 간에 전시환경만족도에 차이가 있는지를 파악하기 위해서 일원배치분산분석을 실시한 결과,
통계적으로 유의한 차이가 나타났다(p<0.05). Scheffe의 사후검증 결과, 선생님의 만족도가 5.92점으로 가
장 높은 반면, 학생 (초등학생, 중학생, 고등학생) 및 학부모의 만족도가 낮았다. 기타 집단은 그 중간 정도로
파악되었다.
32
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
33
SPSS 중급통계분석
1. 개념
1) 개념
 두 연속형 변수 간의 상관 정도를 파악
 상관계수 (-1~+1)를 통해 표준화된 상관관계를
도출
 주로 회귀분석을 하기 전에 독립↔종속 간의
상관이 있는지 탐색적 목적
2) 가설검정과 검정통계량
 귀무가설: 공부시간/ 지능지수와 성적 간에는
상관관계가 없다.
 대립가설: 공부시간/ 지능지수와 성적 간에는
상관관계가 있다.
 검정통계량: 상관계수(r), 자료수 (n)를 고려하여
-> 유의확률(p)의 계산
구분 공부시간 지능지수 성적
공부시간 1 .123 .435
지능지수 .123 1 .343
성적 .435 .343 1
상관계수 의미
0.2 이하 두 변수 간 상관이 거의 없음
0.2~0.4 약한 상관관계가 존재
0.4~0.6 강한 상관관계가 존재
0.6 이상 매우 밀접한 상관관계
Ⅴ.상관관계분석
[상관분석하는 이유]
(1) 회귀분석을 하기 위함
(2) 독립변수간 상관관계가 낮음을 확인(탐색적 성격)
독립
변수
종속
변수
독립변수들간의 상관관계는 낮을수록 좋음
-> 그렇지 않으면 다중공선성 문제 발생
-> 이 경우 독립변수 둘 중 하나를 빼야 함
(예: GDP, GNP -> 행복에 미치는 영향)
34
1. 개념
3) 상관관계 적용의 예
 예1) 회사의 광고지출비용과 매출과는 상관이
있는가?
 광고지출비용이 높은 월에 매출이 높고, 광고
지출비용이적 은 월에는 매출이 낮은 경향을 보
이는지,
 예2) 소득과 행복간에는 상관이 있는가?
 소득이 높은 사람은 행복점수가 높다고 응답하
고, 반대로 소득이 낮은 사람은 행복점수가 낮다
고 응답하는지
4) 상관계수와 산점도
Ⅴ.상관관계분석
35
2. 분산분석의 SPSS
 분석 -> 상관분석 -> 이변량상관관계로
들어간다.
 연속형 변수를 모두 이동시킨다.
 확인을 누르면 분석 결과가 나타난다.
상관및회귀.sav
Ⅴ.상관관계분석
36
Ⅴ.상관관계분석3. 상관관계분석의 결과 정리와 해석
결과 해석
 포도크기, 숙성기간과 포도판매가격 간의 상관관계를 파악하기 Pearson의 상관관계를 실시한 결과, 종속
변수인 판매가격은 포도크기 및 숙성기간과 모두 유의한 정(+)의 상관관계를 보이고 있다(p<0.05). 즉 포도
크기가 클수록, 숙성기간이 길수록 판매가격이 높아지는 경향이 존재하여, 포도크기와 숙성기간이 판매가
격에 미치는 영향관계가 성립될 수 있음을 의미한다.
반면, 독립변수인 포도크기와 숙성기간 간의 상관관계는 0.512로 유의하게 나타나고 있으나 일반적으로
독립변수 간에 지나친 상관으로 인해 나타날 다중공선성(collinearity)의 기준인 상관관계 0.8보다는 낮게
나타나고 있어, 이러한 문제는 제기되지 않는다고 판단된다.
37
Ⅴ.상관관계분석3. 상관관계분석의 결과 정리와 해석
결과 해석
Cf) 자료가 5, 7점 척도가 아닌 연속적으로 범위가 큰
경우에는 상관이 높아도 선형이 아닐 수 있음 ex) BMI
와 윗몸 일으키기
따라서 반드시 그래프를 확인해 봐야 함
⇒ SPSS 메뉴의 그래프 → 레거시 대화상자 →
산점도/점도표 → 단순 산점도 : X축 / Y축에
변수 설정
⇒ 그래프 더블클릭 → 요소 → 전체적합선 클릭
⇒ 그래프의 점 클릭 → R-click → 데이터 설명
보이기
⇒ 그래프의 직선 클릭 → 회귀선 적합 확인
38
6 희귀분석
5 상관관계분석
4 ANOVA
3 t-test
2 척도와 분석
1 기초통계개념
39
SPSS 중급통계분석
1. 개념
40
1) 개념과 목적
 연속형 원인변수가 연속형 결과변수에 영향을
미치는지를 파악하기 위함
 원인변수와 결과변수 간에 영향관계(인과관계)
가 성립되는지가 가장 중요
 ‘영향을 미치는가’ 와 ‘얼마나 영향을 미치는가’
를 파악하는 것이 핵심
2) 가설검정과 검정통계량
 귀무가설: 공부시간/ 지능지수는 성적에
영향을 미치지 않는다.
 대립가설: 공부시간/ 지능지수는 성적에
영향을 미친다.
 검정통계량: 모형 F검증/ 변수 t검증 ->
유의확률(p)의 계산
Ⅵ.회귀분석
1. 개념
41
공부시간/ 지능지수가 성적을 설명하는 정도(설
명력/결정계수): 71.2%
공부시간과 지능지수 중 성적에 유의한 영향을
미치는 변수: 공부시간
둘 중 더 큰 영향을 미치는 변수: 공부시
간(t=3.242) > 지능지수 (t=-0.351)
3) 단일회귀분석과 다중회귀분석
 단일회귀분석
: 원인변수 1개가 결과변수에 영향을 미치는가를
파악하는 분석.
 다중회귀분석
: 원인변수 2개 이상이 결과변수에 영향을 미치
는가를 파악하는 분석.
 다중회귀분석에서는 여러 원인변수에서 ‘어느
변수가 결과변수에 더 중요한(큰) 영향을 미치는
가’를 파악하는 것이 목적 (상대적인 영향력)
4) 결과예시
회귀분석 결과예시: ‘공부시간과 지능지수가 성적에 미치
는 영향’
Ⅵ.회귀분석
요인 비표준화
계수
표준오차 T-value p
공부시간 4.427 1.365 3.242 0.014
지능지수 -0.101 0.288 -0.351 0.736
𝑅2=0.712 F=8.636 P=0.012
비표준화계수: 독립변수단위가 1증가할 때 종속변수가
변하는 정도
1. 개념
42
 F-value와 p값
: 회귀모형이 적합한가(통계적으로 유의한 모형
인가)를 검증한 통계량.
 F값은 클수록, p값은 0.05보다 작으면 통계적
으로 유의한 모형.
5) 주요통계량(1)
 𝑅2( 설명력/ 결정계수)
: 독립변수가 종속변수를 설명하는 정도
 0~1 사이의 값을 가지며 1이면 100%의 설명
력을 의미함
Ⅵ.회귀분석
자유도 제곱합 제곱 평균 F 비 유의미한 F
회귀 3 81.282 27.094 40.161 0.000
잔차 396 267.158 0.675
계 399 348.400
회귀분석 통계량
다중상관계수 0.483
결정계수(𝑅2) 0.233
조정된 결정계수 0.227
표준오차 0.821
관측수 400
- 𝑅2은 ‘설명력’용어로 주로 사용, 가장 중요한 개념
- 𝑅2이 20~30%가 되어야 일반적, 거시경제/주식에
서는 5%도 안나옴
1. 개념
43
5) 주요통계량(2)
 t-value와 p값
: 각 원인변수가 결과변수에 영향을 미치는가를
검증한 통계량.
 t값은 클수록, p값은 0.05보다 작으면 통계적으
로 유의한 영향을 미침.
Ⅵ.회귀분석
계수 표준 오차 t 통계량 P-값
Y절편 2.450 0.266 9.196 0.000
제품만족도 0.246 0.058 4.240 0.000
직원만족도 0.125 0.059 2.114 0.035
이미지만족도 0.229 0.064 3.595 0.000
2. 회귀분석의 SPSS
 분석 → 회귀분석 → 선형으로 들어감
Ⅵ.회귀분석
 종속변수에 ‘판매가’ , 독립변수에 ‘숙성기간’을
각각 투입함,
44
3. 회귀분석의 결과 정리와 해석 Ⅵ.회귀분석
결과 해석
 모형요약 → 독립변수가 종속변수를 설명하는 정도(설명력/결정계수): 84.5%
 분산 분석 → ‘회귀계수가 0이다(독립변수 변화에 따라 종속변수의 변화경향이 존재하지 않는다)’는 귀무가설에 대
한 검증 결과. F=310.019, p=0.000으로서 대립가설 ‘회귀계수는 0이 아니다. 즉 기울기가 존재한다’가 채택.
 계수 → 독립변수인 숙성기간은 판매가에 유의한 정(+)의 영향을 미치는 것으로 나타남.
회귀식: y(판매가) = -2.891 + 2.492*X(숙성기간)
[비표준화계수]
- 상수: Y 절편
- B: 독립변수가 1증가할 때 종속변수의 변화정도, 즉,
회귀식의 기울기를 의미
- 표준오차: 다른 표본일 때의 오차
- 검정량(F):
𝑜 𝑜차이 관계의값
=
𝑜 𝑜차이 관계의값
𝑆
𝑁
=
표준오차
2.492
.142
= 310.019
45
- 회귀식: Y = 2.492X – 2.891
감사합니다.
46

Weitere ähnliche Inhalte

Was ist angesagt?

20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価SR WS
 
체계적 문헌고찰과 메타분석
체계적 문헌고찰과 메타분석체계적 문헌고찰과 메타분석
체계적 문헌고찰과 메타분석mothersafe
 
201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアスSR WS
 
Sampling Theory.pdf
Sampling Theory.pdfSampling Theory.pdf
Sampling Theory.pdfMaMaeManzo
 
Review & Hypothesis Testing
Review & Hypothesis TestingReview & Hypothesis Testing
Review & Hypothesis TestingSr Edith Bogue
 
患者報告式尺度の開発方法
患者報告式尺度の開発方法患者報告式尺度の開発方法
患者報告式尺度の開発方法Senshu University
 
Research method ch07 statistical methods 1
Research method ch07 statistical methods 1Research method ch07 statistical methods 1
Research method ch07 statistical methods 1naranbatn
 
STARD2015に学ぶ「診断精度の分析」の書き方
 STARD2015に学ぶ「診断精度の分析」の書き方 STARD2015に学ぶ「診断精度の分析」の書き方
STARD2015に学ぶ「診断精度の分析」の書き方Yoshitake Takebayashi
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋としてYoshitake Takebayashi
 
Practice test ch 8 hypothesis testing ch 9 two populations
Practice test ch 8 hypothesis testing ch 9 two populationsPractice test ch 8 hypothesis testing ch 9 two populations
Practice test ch 8 hypothesis testing ch 9 two populationsLong Beach City College
 
Chap08 fundamentals of hypothesis
Chap08 fundamentals of  hypothesisChap08 fundamentals of  hypothesis
Chap08 fundamentals of hypothesisUni Azza Aunillah
 
Statistics lecture 8 (chapter 7)
Statistics lecture 8 (chapter 7)Statistics lecture 8 (chapter 7)
Statistics lecture 8 (chapter 7)jillmitchell8778
 
心理学者のためのJASP入門(操作編)[説明文をよんでください]
心理学者のためのJASP入門(操作編)[説明文をよんでください]心理学者のためのJASP入門(操作編)[説明文をよんでください]
心理学者のためのJASP入門(操作編)[説明文をよんでください]daiki hojo
 

Was ist angesagt? (20)

20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
 
観察研究の必須事項
観察研究の必須事項観察研究の必須事項
観察研究の必須事項
 
체계적 문헌고찰과 메타분석
체계적 문헌고찰과 메타분석체계적 문헌고찰과 메타분석
체계적 문헌고찰과 메타분석
 
201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス201707srws第六回その2メタアナリシス・異質性・出版バイアス
201707srws第六回その2メタアナリシス・異質性・出版バイアス
 
Sampling Distribution
Sampling DistributionSampling Distribution
Sampling Distribution
 
観察研究の質の評価
観察研究の質の評価観察研究の質の評価
観察研究の質の評価
 
Sampling Theory.pdf
Sampling Theory.pdfSampling Theory.pdf
Sampling Theory.pdf
 
Review & Hypothesis Testing
Review & Hypothesis TestingReview & Hypothesis Testing
Review & Hypothesis Testing
 
Practice Test 2 Solutions
Practice Test 2  SolutionsPractice Test 2  Solutions
Practice Test 2 Solutions
 
Assessing Normality
Assessing NormalityAssessing Normality
Assessing Normality
 
患者報告式尺度の開発方法
患者報告式尺度の開発方法患者報告式尺度の開発方法
患者報告式尺度の開発方法
 
Research method ch07 statistical methods 1
Research method ch07 statistical methods 1Research method ch07 statistical methods 1
Research method ch07 statistical methods 1
 
STARD2015に学ぶ「診断精度の分析」の書き方
 STARD2015に学ぶ「診断精度の分析」の書き方 STARD2015に学ぶ「診断精度の分析」の書き方
STARD2015に学ぶ「診断精度の分析」の書き方
 
Two Means, Independent Samples
Two Means, Independent SamplesTwo Means, Independent Samples
Two Means, Independent Samples
 
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として
 
Chapter 15
Chapter 15 Chapter 15
Chapter 15
 
Practice test ch 8 hypothesis testing ch 9 two populations
Practice test ch 8 hypothesis testing ch 9 two populationsPractice test ch 8 hypothesis testing ch 9 two populations
Practice test ch 8 hypothesis testing ch 9 two populations
 
Chap08 fundamentals of hypothesis
Chap08 fundamentals of  hypothesisChap08 fundamentals of  hypothesis
Chap08 fundamentals of hypothesis
 
Statistics lecture 8 (chapter 7)
Statistics lecture 8 (chapter 7)Statistics lecture 8 (chapter 7)
Statistics lecture 8 (chapter 7)
 
心理学者のためのJASP入門(操作編)[説明文をよんでください]
心理学者のためのJASP入門(操作編)[説明文をよんでください]心理学者のためのJASP入門(操作編)[説明文をよんでください]
心理学者のためのJASP入門(操作編)[説明文をよんでください]
 

Andere mochten auch

교사연수02 무엇을어떻게
교사연수02 무엇을어떻게교사연수02 무엇을어떻게
교사연수02 무엇을어떻게성훈 김
 
BOMBERBOT Getting Started: Teacher's Guide
BOMBERBOT Getting Started: Teacher's GuideBOMBERBOT Getting Started: Teacher's Guide
BOMBERBOT Getting Started: Teacher's GuideSue Li
 
교사연수02 무엇을어떻게
교사연수02 무엇을어떻게교사연수02 무엇을어떻게
교사연수02 무엇을어떻게성훈 김
 
SW교육과 컴퓨팅 사고력 신장하기
SW교육과 컴퓨팅 사고력 신장하기SW교육과 컴퓨팅 사고력 신장하기
SW교육과 컴퓨팅 사고력 신장하기웅용 박
 
Sw학생교재소개(초)
Sw학생교재소개(초)Sw학생교재소개(초)
Sw학생교재소개(초)성훈 김
 
뮤지컬로 배우는 나라사랑 영웅
뮤지컬로 배우는 나라사랑 영웅뮤지컬로 배우는 나라사랑 영웅
뮤지컬로 배우는 나라사랑 영웅Lee Jae Hyun
 
Internet addiction of Indian youth
Internet addiction of Indian youthInternet addiction of Indian youth
Internet addiction of Indian youthRaj Menon
 
색채학 연구결과 보고서 1511120 도유진
색채학 연구결과 보고서 1511120 도유진색채학 연구결과 보고서 1511120 도유진
색채학 연구결과 보고서 1511120 도유진vivadick0425
 
창의적발상 과제 15116341 이현지
창의적발상 과제  15116341 이현지창의적발상 과제  15116341 이현지
창의적발상 과제 15116341 이현지현지 이
 
The Next Challenge of the Web is UsForwardsjs
The Next Challenge of the Web is UsForwardsjsThe Next Challenge of the Web is UsForwardsjs
The Next Challenge of the Web is UsForwardsjsChristian Heilmann
 
1515475 조은서 색채학 연구결과 보고서
1515475 조은서 색채학 연구결과 보고서1515475 조은서 색채학 연구결과 보고서
1515475 조은서 색채학 연구결과 보고서은서 조
 
색채학 기말 최종
색채학 기말 최종색채학 기말 최종
색채학 기말 최종혜수 조
 
1216 no show ppt최종
1216 no show ppt최종1216 no show ppt최종
1216 no show ppt최종youlim
 
1316046진세라
1316046진세라1316046진세라
1316046진세라세라 진
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체YoungSik Jeong
 
디미컨 어린이컴퓨터교육 방향.차별성
디미컨 어린이컴퓨터교육 방향.차별성디미컨 어린이컴퓨터교육 방향.차별성
디미컨 어린이컴퓨터교육 방향.차별성jiyein
 
Internet addiction
Internet addictionInternet addiction
Internet addictionmflo1919
 

Andere mochten auch (20)

Spc개요
Spc개요Spc개요
Spc개요
 
교사연수02 무엇을어떻게
교사연수02 무엇을어떻게교사연수02 무엇을어떻게
교사연수02 무엇을어떻게
 
BOMBERBOT Getting Started: Teacher's Guide
BOMBERBOT Getting Started: Teacher's GuideBOMBERBOT Getting Started: Teacher's Guide
BOMBERBOT Getting Started: Teacher's Guide
 
교사연수02 무엇을어떻게
교사연수02 무엇을어떻게교사연수02 무엇을어떻게
교사연수02 무엇을어떻게
 
SW교육과 컴퓨팅 사고력 신장하기
SW교육과 컴퓨팅 사고력 신장하기SW교육과 컴퓨팅 사고력 신장하기
SW교육과 컴퓨팅 사고력 신장하기
 
Sw학생교재소개(초)
Sw학생교재소개(초)Sw학생교재소개(초)
Sw학생교재소개(초)
 
뮤지컬로 배우는 나라사랑 영웅
뮤지컬로 배우는 나라사랑 영웅뮤지컬로 배우는 나라사랑 영웅
뮤지컬로 배우는 나라사랑 영웅
 
Internet addiction of Indian youth
Internet addiction of Indian youthInternet addiction of Indian youth
Internet addiction of Indian youth
 
색채학 연구결과 보고서 1511120 도유진
색채학 연구결과 보고서 1511120 도유진색채학 연구결과 보고서 1511120 도유진
색채학 연구결과 보고서 1511120 도유진
 
창의적발상 과제 15116341 이현지
창의적발상 과제  15116341 이현지창의적발상 과제  15116341 이현지
창의적발상 과제 15116341 이현지
 
The Next Challenge of the Web is UsForwardsjs
The Next Challenge of the Web is UsForwardsjsThe Next Challenge of the Web is UsForwardsjs
The Next Challenge of the Web is UsForwardsjs
 
Social media
Social mediaSocial media
Social media
 
1515475 조은서 색채학 연구결과 보고서
1515475 조은서 색채학 연구결과 보고서1515475 조은서 색채학 연구결과 보고서
1515475 조은서 색채학 연구결과 보고서
 
색채학 기말 최종
색채학 기말 최종색채학 기말 최종
색채학 기말 최종
 
1216 no show ppt최종
1216 no show ppt최종1216 no show ppt최종
1216 no show ppt최종
 
1316046진세라
1316046진세라1316046진세라
1316046진세라
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체
 
디미컨 어린이컴퓨터교육 방향.차별성
디미컨 어린이컴퓨터교육 방향.차별성디미컨 어린이컴퓨터교육 방향.차별성
디미컨 어린이컴퓨터교육 방향.차별성
 
Internet addiction
Internet addictionInternet addiction
Internet addiction
 
Internet Addiction
Internet AddictionInternet Addiction
Internet Addiction
 

Ähnlich wie 연구학교 데이터분석

Statistics for psychology, Inferential Statistics and Hypothesis Testing
Statistics for psychology, Inferential Statistics and Hypothesis TestingStatistics for psychology, Inferential Statistics and Hypothesis Testing
Statistics for psychology, Inferential Statistics and Hypothesis TestingMinyeong Seo
 
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석SuHyun Jeon
 
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdfJong-Ki Lee
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트JeongMin Kwon
 
04.r 기초 유의성 검증
04.r 기초   유의성 검증04.r 기초   유의성 검증
04.r 기초 유의성 검증Yoonwhan Lee
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문noerror
 
Effective active learning strategy for multi label learning
Effective active learning strategy for multi label learningEffective active learning strategy for multi label learning
Effective active learning strategy for multi label learningJinho Lee
 
Week5 data vis(2)
Week5 data vis(2)Week5 data vis(2)
Week5 data vis(2)Eun Yu
 
개념화 조작화 측정
개념화 조작화 측정개념화 조작화 측정
개념화 조작화 측정sundol75
 
통계적방법론발표Ppt Kmlikejy
통계적방법론발표Ppt Kmlikejy통계적방법론발표Ppt Kmlikejy
통계적방법론발표Ppt Kmlikejyhyun
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도Yoonwhan Lee
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링BOAZ Bigdata
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율Yoonwhan Lee
 
기술통계 - 자료의 중심과 퍼진정도
기술통계 - 자료의 중심과 퍼진정도기술통계 - 자료의 중심과 퍼진정도
기술통계 - 자료의 중심과 퍼진정도Yoonwhan Lee
 

Ähnlich wie 연구학교 데이터분석 (20)

Statistics for psychology, Inferential Statistics and Hypothesis Testing
Statistics for psychology, Inferential Statistics and Hypothesis TestingStatistics for psychology, Inferential Statistics and Hypothesis Testing
Statistics for psychology, Inferential Statistics and Hypothesis Testing
 
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
[Ankus Open Source Conference 2013] 빅데이터 분석을 위한 통계 이해와 해석
 
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
230601이종기-시장조사론특강교안-신뢰성과 타당성-요인분석-최종.pdf
 
08.추정
08.추정08.추정
08.추정
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트
 
04.r 기초 유의성 검증
04.r 기초   유의성 검증04.r 기초   유의성 검증
04.r 기초 유의성 검증
 
11_통계 자료분석 입문
11_통계 자료분석 입문11_통계 자료분석 입문
11_통계 자료분석 입문
 
G power v10_beta-01
G power v10_beta-01G power v10_beta-01
G power v10_beta-01
 
Effective active learning strategy for multi label learning
Effective active learning strategy for multi label learningEffective active learning strategy for multi label learning
Effective active learning strategy for multi label learning
 
20161222 기출문제해설강의
20161222 기출문제해설강의20161222 기출문제해설강의
20161222 기출문제해설강의
 
Week5 data vis(2)
Week5 data vis(2)Week5 data vis(2)
Week5 data vis(2)
 
개념화 조작화 측정
개념화 조작화 측정개념화 조작화 측정
개념화 조작화 측정
 
표집
표집표집
표집
 
통계적방법론발표Ppt Kmlikejy
통계적방법론발표Ppt Kmlikejy통계적방법론발표Ppt Kmlikejy
통계적방법론발표Ppt Kmlikejy
 
Decision tree
Decision treeDecision tree
Decision tree
 
03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도03.기술통계 자료의 중심과 퍼진정도
03.기술통계 자료의 중심과 퍼진정도
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [리뷰의 재발견 팀] : 이커머스 리뷰 유용성 파악 및 필터링
 
122
122122
122
 
10.단일표본 평균 모비율
10.단일표본 평균 모비율10.단일표본 평균 모비율
10.단일표본 평균 모비율
 
기술통계 - 자료의 중심과 퍼진정도
기술통계 - 자료의 중심과 퍼진정도기술통계 - 자료의 중심과 퍼진정도
기술통계 - 자료의 중심과 퍼진정도
 

Mehr von 성훈 김

영국BBC의 코딩교육
영국BBC의 코딩교육영국BBC의 코딩교육
영국BBC의 코딩교육성훈 김
 
햄스터 로봇 기초 설치
햄스터 로봇 기초 설치햄스터 로봇 기초 설치
햄스터 로봇 기초 설치성훈 김
 
한옥처마의 비밀 1차시 지도안
한옥처마의 비밀 1차시 지도안한옥처마의 비밀 1차시 지도안
한옥처마의 비밀 1차시 지도안성훈 김
 
한옥처마의 비밀 2차시 지도안
한옥처마의 비밀 2차시 지도안한옥처마의 비밀 2차시 지도안
한옥처마의 비밀 2차시 지도안성훈 김
 
한옥처마의 비밀 수업PPT
한옥처마의 비밀 수업PPT한옥처마의 비밀 수업PPT
한옥처마의 비밀 수업PPT성훈 김
 
햄스터 로봇 연결을 위한 설명 자료
햄스터 로봇 연결을 위한 설명 자료햄스터 로봇 연결을 위한 설명 자료
햄스터 로봇 연결을 위한 설명 자료성훈 김
 
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈성훈 김
 
한옥처마의 비밀 수업지도안 2차시
한옥처마의 비밀 수업지도안 2차시한옥처마의 비밀 수업지도안 2차시
한옥처마의 비밀 수업지도안 2차시성훈 김
 
한옥처마의 비밀 수업지도안 1차시
한옥처마의 비밀 수업지도안 1차시한옥처마의 비밀 수업지도안 1차시
한옥처마의 비밀 수업지도안 1차시성훈 김
 
3차시 말을 글자로
3차시 말을 글자로3차시 말을 글자로
3차시 말을 글자로성훈 김
 
1차시 앱인벤터 소개
1차시 앱인벤터 소개1차시 앱인벤터 소개
1차시 앱인벤터 소개성훈 김
 
Swsw 150319111524-conversion-gate01
Swsw 150319111524-conversion-gate01Swsw 150319111524-conversion-gate01
Swsw 150319111524-conversion-gate01성훈 김
 

Mehr von 성훈 김 (12)

영국BBC의 코딩교육
영국BBC의 코딩교육영국BBC의 코딩교육
영국BBC의 코딩교육
 
햄스터 로봇 기초 설치
햄스터 로봇 기초 설치햄스터 로봇 기초 설치
햄스터 로봇 기초 설치
 
한옥처마의 비밀 1차시 지도안
한옥처마의 비밀 1차시 지도안한옥처마의 비밀 1차시 지도안
한옥처마의 비밀 1차시 지도안
 
한옥처마의 비밀 2차시 지도안
한옥처마의 비밀 2차시 지도안한옥처마의 비밀 2차시 지도안
한옥처마의 비밀 2차시 지도안
 
한옥처마의 비밀 수업PPT
한옥처마의 비밀 수업PPT한옥처마의 비밀 수업PPT
한옥처마의 비밀 수업PPT
 
햄스터 로봇 연결을 위한 설명 자료
햄스터 로봇 연결을 위한 설명 자료햄스터 로봇 연결을 위한 설명 자료
햄스터 로봇 연결을 위한 설명 자료
 
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈
6 순차,반복,선택 구조의 명령을 이용한 로봇 제어하기 김성훈
 
한옥처마의 비밀 수업지도안 2차시
한옥처마의 비밀 수업지도안 2차시한옥처마의 비밀 수업지도안 2차시
한옥처마의 비밀 수업지도안 2차시
 
한옥처마의 비밀 수업지도안 1차시
한옥처마의 비밀 수업지도안 1차시한옥처마의 비밀 수업지도안 1차시
한옥처마의 비밀 수업지도안 1차시
 
3차시 말을 글자로
3차시 말을 글자로3차시 말을 글자로
3차시 말을 글자로
 
1차시 앱인벤터 소개
1차시 앱인벤터 소개1차시 앱인벤터 소개
1차시 앱인벤터 소개
 
Swsw 150319111524-conversion-gate01
Swsw 150319111524-conversion-gate01Swsw 150319111524-conversion-gate01
Swsw 150319111524-conversion-gate01
 

연구학교 데이터분석

  • 3. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 3 통계분석
  • 4. 1. 모집단과 표본 I. 기초통계개념 모집단 표본 모수 (parameter) 통계량 (statistics) 표본추출 (sampling) 4 추론통계
  • 5. I. 기초통계개념 5 분류 목적 및 이용분석 방법 기술통계 몇 개의 대표되는 숫자로 자료 전체를 요약하여 자료를 양적으로 축소하거 나, 정리된 표나 그래프를 통하여 자료의 특징을 파악하는 방법 => 빈도분석, 기술통계분석 등 이용 추론통계 둘 혹은 셋 이상의 집단 간에 차이가 있는지, 변수 간에 상관 혹은 영향관 계가 있는지를 표본자료로 파악하여 모집단에 적용하는 분석방법. 이 결과의 적용에 오류가 있을 수 있으며, 이를 확률적으로 파악함. => 교차분석, t-test분석, 분산분석, 상관관계, 회귀분석 등 이용 2. 기술통계와 추론통계
  • 6. 3. 가설 I. 기초통계개념 1)개념 분류 내용 귀무 가설 “아무런차이가없다”또는“전혀효과가없다”는내용을의미하는주장 대체로연구에서는귀무가설을거부하기위해 설정 대립 가설 “차이가있다”혹은“효과가있다”는귀무가설의 반대개념 귀무가설이기각되고대립가설이받아들여지면 자료는 “통계적으로유의하다”고표현 예)아프리카원주민의한국정당선호비율은? ->아무것도모르기때문에3개정당이면33%, 33%,33%로나타날것이다(무작위결과) 예)영유아의경제력과행복과의관계 ->영유아는경제(돈)에대한관념이형성되지않 았기때문에돈이많은것과행복은별개 귀무가설과 대립가설의 관계는 피고인의 무죄와 유죄와의 관계와 유사하다. 무죄 (귀무)라는 사실에 입각하여 증거가 많 아질수록 유죄(대립)로 간다. 6
  • 7. 3. 가설 I. 기초통계개념 차이의 가설 귀무가설: 소득수준에 따라서 선호하는 자동차 유형은 차이가 없다. 대립가설: 소득수준에 따라서 선호하는 자동차 유형은 차이가 있다. 상관 관계의 가설 영향 관계의 가설 귀무가설: 소득수준이 선호하는 자동차 유형에 영향을 미치지 않을 것이다. 대립가설: 소득수준이 선호하는 자동차 유형에 영향을 미칠 것이다. 귀무가설: 소득수준에 따라서 선호하는 자동차 유형은 관계가 없다. 대립가설: 소득수준에 따라서 선호하는 자동차 유형은 관계가 있다. 7 2)귀무가설과대립가설설정
  • 8. 3. 가설 I. 기초통계개념 가설 검정 표본으로부터 얻은 사실에 근거하여, 모집단에 대한 가설이 맞는지 틀리는지를 통계적으로 검정하는 방법 가설 기각 실제 표본의 관측치와 이론치와의 차이가 확률적인 오차의 범위를 넘 어 오류라고 판단되는 것 가설 채택 관측치와 이론치의 차이가 신뢰수준 범위내에 존재하는 것 8 3)가설의기각과채택
  • 9. 3. 가설 I. 기초통계개념 4)유의수준과임계치 유의수준 (significant level) 제 1종 오류를 범할 확률을 유의수준이라고 하여 α로 표시 보통 유의수준(α)은 0.10, 0.05, 0.01 등으로 정하는 경우가 많다. 임계치 (critical value) 주어진 유의수준에서 귀무가설의 채택과 기각에 관한 의사결정을 할 경우, 그 기준이 되는 점(기각치). 검정통계량 귀무가설(영가설:HO)채택 대립가설(연구가설:H1) 채택 신뢰수준 95% 귀무가설의 중심 유의수준(α )=0.05(5%) 임계치 α/2=0.025 α/2=0.025 9
  • 10. 전교 학생들의 평균 총점을 추정한 값은 300점이다. 그러나 다른 의견이 있어 표본 25명을 선발해 조사했더니 평균 총점이 310점이 나왔다. 이때 어느 의견이 더 타당한지 유의수준 5%에서 검정하시오. (단 총점의 모표준편차는 30이다.)
  • 11. 3. 가설 I. 기초통계개념 5)가설검정의예 예) A반 100명의 평균은 75점(표준편차 10), B반 100명의 평균은 80점(표준편차 16) 이라고 할 때, 두 반의 평균차이가 유의한지 가설을 설정하고 검증하여라 (신뢰수준 95%) • 귀무가설: 두 반의 평균은 다르지 않다. (두 반의 성적은 차이가 없다.) • 대립가설: 두 반의 평균은 다르다. (두 반의 성적은 차이가 있다.) 검정통계량 t값= 1.03: 귀무가설 채택 t값= 2.35: 대립가설 채택 신뢰수준 95% 차이가 없다 유의수준 (α)=0.05(5%) 임계치 검정통계량의 의미 귀 무가설로부터 약 몇배 떨어져 있다 α/2=0.025 α/2=0.025 11
  • 12. I. 기초통계개념 귀무가설/대립가설 의사결정대안 설정 유의수준(α) 선택 및 기각 영역 설정 표본통계량(검정통계량) 계산 도출 표본통계치를 이용한 가설 검정 및 최선의 대안 선택 H0:수업방식의 변화가 평균점수의 변화에 영향을 미치지 않을 것이다. H1:수업방식의 변화가 평균점수의 변화에 영향을 미칠 것이다. 유의수준 0.05(신뢰수준 95)에서 가설채택 여부 대립가설 채택, 즉 수업방식이 시험성적에 긍정적 영향을 미침 최선 대안: 새로운 방식의 수업을 지속적으로 실시함 통계량 t-value=3.134, p=0.001 12 4. 가설검정의 순서
  • 13. I. 기초통계개념 13 분석방법 독립-종속 귀무가설(H0)/대립가설(H1) 검정통계량 p 교차분석 범주-범주 H0: 독립변수에 따라 종속변수에는 차이가 없다. H1: 독립변수에 따라 종속변수는 차이가 있다. ᵡ2 P<0.05 →대립 독립표본 t-test 범주-연속 H0: 독립변수에 따라 종속변수에는 차이가 없다. H1: 독립변수에 따라 종속변수는 차이가 있다. t-value P<0.05 →대립 분산분석 범주-연속 H0: 독립변수에 따라 종속변수에는 차이가 없다. H1: 독립변수에 따라 종속변수는 차이가 있다. F-value P<0.05 →대립 상관관계 분석 연속-연속 H0: 독립변수와 종속변수는 상관관계가 없다. H1: 독립변수와 종속변수는 상관관계가 있다. r(rho) P<0.05 →대립 회귀분석 연속-연속 H0: 독립변수는 종속변수에 영향을 미치지 않는다. H1: 독립변수는 종속변수에 영향을 미친다. F-value t-value P<0.05 →대립 5. 분석방법과 통계량
  • 14. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 14 SPSS 중급통계분석
  • 15. 1. 4가지 척도 Ⅱ. 척도와 분석방법 15  척도/자료의 종류가 무엇인가에 따라 분석방법이 결정 됨.  따라서 척도의 자료의 종류를 이해하는 것은 분석에 앞서 매우 중요함.  척도란 사물이나 사람의 특성을 하나의 기준으로 숫자를 부여한 것. 종류 정의 (예) 구분 분석방법 명목척도 측정대상(응답자)을 단지 분류할 목 적으로 숫자를 부여한 척도 성별 범주형 자료 빈도분석 서열척도 측정대상(응답자)간에 순서/서열적 의미(높고 낮음)가 있는 척도 학력 등간척도 측정대상(응답자)간에 순서 뿐만 아 니라 숫자의 간격이 동일하여 양적 인 정도를 알 수 있는 척도 온도 연속형 자료 기술통계 비율척도 등간척도와 유사하나, 0의 의미가 ‘실제로 없다’고 말할 수 있는 척도 소득
  • 16. Ⅱ. 척도와 분석방법 척도와 분석간의 관계 독립변수 범주형 자료 연속형 자료 종속변수 범주형 자료 교차분석 로지스틱 회귀분석 프로빗 분석 판별 분석, 군집분석 연속형 자료 t-test 분석분석(ANOVA) 상관관계분석 회귀분석 경로분석 SEM분석 2. 척도와 척도의 분석방법 16
  • 17. Ⅱ. 척도와 분석방법 17 2. 척도와 척도의 분석방법 1)교차분석  독립변수와종속변수가모두범주형인경우두 변수간의관계를파악하는통계분석방법. 교차분석의 예 문1. 귀하의 성별은? ① 남성 ② 여성 문2. 귀하가 선호하는 패밀리레스토랑은? ① TGI ② 베니건스 ③ VIPS ④ 아웃백 구분 TGI 베니건스 VIPS 아웃백 전체 남 30 30 30 30 120명 여 25 25 30 50 130명 전체 55 55 60 80 250명
  • 18. Ⅱ. 척도와 분석방법 18 2. 척도와 척도의 분석방법 t-test와 분산분석의 예 문1. 귀하의 성별은? ① 남성 ② 여성 문2. 귀하의 연령대는? ① 20대 이하 ② 30대 ③ 40대 이상 문3. 귀하께서는 TGI에 얼마나 만족하십니까? ① 매우 불만족 ② 불만족 ③ 보통 ④ 만족 ⑤ 매우 만족 2)t-test와분산분석  독립변수가범주형이고,종속변수가연속형자료  독립변수 범주가 2개 : t-test  독립변수 범주가 3개 이상 : 분산분석 구분 N(명) 평균 표준편차 남 120 3.4 0.23 성별 여 130 3.2 0.3 20대이하 80 3.4 0.3 연령대 30대 90 3.2 0.27 40대이상 80 3.3 0.29 전체 250 3.3 0.31
  • 19. Ⅱ. 척도와 분석방법 19 3)상관관계분석과회귀분석 2. 척도와 척도의 분석방법  독립변수와 종속변수가 모두 연속형인 경우 두 변수간의 관계를 파악하는 통계분석방법.  두 변인간 상관 정도를 파악하는 분석 : 상관관계분석  독립변수가 종속변수에 미치는 영향 분석 : 회귀분석  상관관계분석  회귀분석 변수 TV광고 횟수 라디오 광고횟수 신문광고 횟수 온라인 광고횟수 매출액 0.343** 0.304** 0.294** 0.283** 변수 비표준화계수 표준화 계수 t p b S.E. β TV 0.232 0.085 0.343 2.729 0.000*** 라디오 0.193 0.097 0.310 1.990 0.032* 신문 0.094 0.092 0.293 1.022 0.432 온라인 0.087 0.088 0.292 0.989 0.842 R²=0.325, F=76.422, p=0.000*** 기간 TV 광고 횟수 라디오 광고횟수 신문광고 횟수 온라인 광고횟수 매출액 2009.1 4 12 23 23 12.5억 2009.2 5 13 24 32 12.9억 2009.3 4 15 25 46 12.6억 2009.4 5 13 30 45 13.5억 2009.5 6 12 34 57 14.5억 2009.6 6 17 15 65 16.5억 2009.7 5 18 32 43 15.4억 · · · · · · · · · · · · 2011.12. 7 19 25 56 18.3억
  • 20. Ⅱ. 척도와 분석방법2. 척도와 척도의 분석방법 4)로지스틱회귀분석/판별분석/군집분석 5)기타통계분석  독립변수가 연속형이고, 종속변수가 범주형 자 료  독립변수가 종속변수에 미치는 영향 분석 : 로지스틱 회귀분석 • 신체관련 변수(연령, 키, 몸무게, bmi 등), 건강행위 관련 변수 (흡연정도, 음주정도 등) 중 어떠한 변수가 암발생(정상/환자) 에 영향을 미치는가?  종속변수 집단을 판별하는 주요한 변수 분석 : 판별분석 • 고객분류(VIP고객/우수고객/일반고객)을 분류하는 소비 행위변수(쇼핑횟수, 시간, 지출액 등)은 무엇인가?  기준변수를 설정하여 유사한 특성을 보이는 소 비 집단(군집)을 파악하여 마케팅 조사에서는 특히 ‘시장세분화’에 많이 사용되는 분석 : 군집분석 • 고객소비특성에 따른 Heavy User, Middle User, Light User는? • 제품관여도/라이프스타일에 따른 소비군집은?  신뢰도 및 요인분석: 다항목으로 한 개념을 측정하고자 할 때, 척도의 타당도와 신뢰도를 측정하는 방법. 특히 요인분석은 군집분석과 결합하여 사용 (요인분석→군집화 기준변수 →군집분석) • 고객만족도를 조사하기 위하여 5개 문항은 타당한가? • 패션관심도, 외모관심도, 웰빙관심도 3개 요인으로 도출되어 군집분석 20  컨조인트분석: 결합분석이라고도 하며, 대안의 컨셉/제품/카피 안에 대한 최적의 조합을 찾아 내고, 세분시장별 중요 요인을 파악하고, 시장 점유율을 예측하는 방법 • 가격(300/400원), 디자인(전문적/전통적), 기능(옵션/노옵션)의 최적의 조합 컨셉?  대응분석과 다차원척도법: 지각도 작성(포지셔닝맵) 방법 • 경쟁사들과 자사에 대한 소비자의 지각형성도는? 자사의 경쟁업체는? • 어떤 포지셔닝 전략이 현실적(단기적), 이상적(중장기적)인가?
  • 21. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 21 SPSS 중급통계분석
  • 22. Ⅲ.t-test 22 1. 개념과 통계량 9✓ 개념 ➢ 기네스 맥주회사 과학자 고셋(Gosset) 이 1908년에 고안한 분석방법 ➢ 두 표본 집단 간에 평균의 차이를 검 증하기 위해 사용 ➢ 독립변수(2개 집단), 종속변수(연속형 자료) ➢ 일반적으로 t-test 분석이라 함은 독립표 본 t-test를 말함 ✓ 통계량 ➢ t-value : t-test분석의 검정통계량 • 집단 간에 평균차이가 얼마나 있는가를 계산한 결과 ➢ 유의확률(p) : 검정통계량을 t분포상에 위치한 확률값 • t 값을 확률적 값으로 변환한 값
  • 23. Ⅲ.t-test 23 2. t-test의 종류 일표본 t-test  특정한 평균을 기준으로 해당 표본의 평균이 같은지를 검정 • 예1) 우리 학교 학생의 영어성적은 전국 영어평균과 다른가? • 예2) 서울의 집값은 선진국에 비해 높은가? 독립표본 t-test  두 개의 독립적인 표본 간에 하나의 종속변수의 평균이 동일한가를 검증 • 예1) 남녀직원들 간에 회사에 대한 만족 수준은 같은가? 다른가? • 예2) 결혼한 사람과 결혼하지 않은 사람 중 누가 더 행복한가? 대응표본 t-test  동일한 표본의 A시점의 점수화 B시점의 점수 변화 차이를 검증 • 예1) 영상학습법 적용 이후 학생들의 성적은 올랐는가? • 예2) 결혼 전과 결혼 후 남성들의 인생관이 달라지는가?
  • 24. Ⅲ.t-test3. 일표본 t-test 1) 사용목적 표본의 평균이 어떤 수와 같은가를 검증 하기 위해 사용 알려진 평균 VS 표본데이터의 평균 비교 2) 가설검정과 검정통계량  귀무가설: 중간영어점수는 80점이다.  대립가설: 중간영어점수는 80점과 차이 가 있다.  검정통계량: t-value, 자유도(df), 이를 고려하여 -> 유의확률(p)의 계산구분 명수 평균 표준 편차 표준 오차 중간 영어점수 36 72.19 20.324 3.39 중간영어점수 : 80점 24
  • 25. Ⅲ.t-test 25 4. 독립표본 t-test 1) 사용목적  두 표본 집단 간에 평균의 차이를 검증하기 위해 사용  독립변수(2개 집단), 종속변수(연속형 자료) 2) 가설검정과 검정통계량  귀무가설: 통제집단과 실험집단의 중간영어 성취도점수는 차이가 없다.  대립가설: 통제집단과 실험집단의 중간영어 성취도점수는 차이가 있다.  검정통계량: t-value, 자유도: df, 이를 고려하여 -> 유의확률(p)의 계산구분 명수 평균 표준 편차 표준 오차 통제집단 20 71.40 20.41 4.56 실험집단 16 73.19 20.84 5.21
  • 26. Ⅲ.t-test 26 5. 대응표본 t-test 1) 사용목적  두 변수 간의 평균 차이를 분석  사전점수-사후점수, 중간고사-기말고사, 만족도-중요도 등의 차이 분석 2) 가설검정과 검정통계량  귀무가설 : 사전점수와 사후점수 간에는 차이가 없다.  대립가설 : 사전점수와 사후점수 간에는 차이가 있다. 검정통계량 : t-value, 자유도 : df, 이를 고려하여 -> 유의확률(p)의 계산 구분 명수 평균 표준 편차 표준 오차 사전점수 100 78.4 10.3 1.03 사후점수 100 82.3 11.2 1.12
  • 27. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 27 SPSS 중급통계분석
  • 28. 1. 분산분석의 개념 28 1) 개념과 통계량 개념  세 집단 이상 간의 평균차이 분석  독립변수(3집단 이상), 종속변수(연속형 변수) 2) 가설검정과 검정통계량  귀무가설: 인문/이공계/상경계 학생들 간에는 월평균 용돈에 차이가 없다.  대립가설: 인문/이공계/상경계 학생들 간에는 월평균 용돈에 차이가 있다.  검정통계량: F-value, 자유도: df, 이를 고려하여 –> 유의확률(p)의 계산 구분 명수 평균 표준 편차 왜도 첨도 표준오차 인문계 100 34.3 8.42 1.23 0.54 0.842 사후점수 100 36.4 9.43 2.43 0.94 0.943 상경계 100 39.4 7.54 1.95 1.31 0.754 [집단 기술통계] Ⅳ.분산분석(ANOVA)
  • 29. 2. 분산분석의 SPSS  분석 -> 평균비교 -> 일원배치 분산분석으로 들어간다. 요인에 범주형 독립변수를, 종속변수에 연속형 종속변수를 각각 넣는다. 전시관만족도.sav Ⅳ.분산분석(ANOVA) 29
  • 30. 2. 분산분석의 SPSS  옵션에서 ‘기술통계량’ 을 클릭한다. 사후분석에서 Scheffe 또는 Duncan 방법을 체 크한다.  (선택하지 않으면 각 집단별 평균 등이 나오지 않는다.) Ⅳ.분산분석(ANOVA) 30
  • 31. 2. 분산분석의 SPSS 31  사후검정을 왜 하는가? 분산분석의 귀무가설과 대립가설은 다음과 같다. 귀무가설: 집단 (A,B,C)간 평균 차이는 같다 (A=B=C) 대립가설: 집단 (A,B,C)간 평균 차이는 다르다 (A≠B 또는 B≠C 또는 C ≠A)  즉, 대립가설은 단 2개의 집단간에만 차이가 나타나도 채택된다. 따라서 어떤 집단 간에 차이가 나타나는지는 평균만으로는 부족하다.  Scheffe와 Duncan  일반적으로 집단의 표본수를 통제하지 못하는 서베이에서는 Scheffe의 방법을 실험연구처럼 표본수를 동일하게 할 경우는 Duncan방법을 선호한다. Ⅳ.분산분석(ANOVA)
  • 32. Ⅳ.분산분석(ANOVA)3. 분산분석의 결과 정리와 해석 결과 해석  관람객 집단 간에 전시환경만족도에 차이가 있는지를 파악하기 위해서 일원배치분산분석을 실시한 결과, 통계적으로 유의한 차이가 나타났다(p<0.05). Scheffe의 사후검증 결과, 선생님의 만족도가 5.92점으로 가 장 높은 반면, 학생 (초등학생, 중학생, 고등학생) 및 학부모의 만족도가 낮았다. 기타 집단은 그 중간 정도로 파악되었다. 32
  • 33. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 33 SPSS 중급통계분석
  • 34. 1. 개념 1) 개념  두 연속형 변수 간의 상관 정도를 파악  상관계수 (-1~+1)를 통해 표준화된 상관관계를 도출  주로 회귀분석을 하기 전에 독립↔종속 간의 상관이 있는지 탐색적 목적 2) 가설검정과 검정통계량  귀무가설: 공부시간/ 지능지수와 성적 간에는 상관관계가 없다.  대립가설: 공부시간/ 지능지수와 성적 간에는 상관관계가 있다.  검정통계량: 상관계수(r), 자료수 (n)를 고려하여 -> 유의확률(p)의 계산 구분 공부시간 지능지수 성적 공부시간 1 .123 .435 지능지수 .123 1 .343 성적 .435 .343 1 상관계수 의미 0.2 이하 두 변수 간 상관이 거의 없음 0.2~0.4 약한 상관관계가 존재 0.4~0.6 강한 상관관계가 존재 0.6 이상 매우 밀접한 상관관계 Ⅴ.상관관계분석 [상관분석하는 이유] (1) 회귀분석을 하기 위함 (2) 독립변수간 상관관계가 낮음을 확인(탐색적 성격) 독립 변수 종속 변수 독립변수들간의 상관관계는 낮을수록 좋음 -> 그렇지 않으면 다중공선성 문제 발생 -> 이 경우 독립변수 둘 중 하나를 빼야 함 (예: GDP, GNP -> 행복에 미치는 영향) 34
  • 35. 1. 개념 3) 상관관계 적용의 예  예1) 회사의 광고지출비용과 매출과는 상관이 있는가?  광고지출비용이 높은 월에 매출이 높고, 광고 지출비용이적 은 월에는 매출이 낮은 경향을 보 이는지,  예2) 소득과 행복간에는 상관이 있는가?  소득이 높은 사람은 행복점수가 높다고 응답하 고, 반대로 소득이 낮은 사람은 행복점수가 낮다 고 응답하는지 4) 상관계수와 산점도 Ⅴ.상관관계분석 35
  • 36. 2. 분산분석의 SPSS  분석 -> 상관분석 -> 이변량상관관계로 들어간다.  연속형 변수를 모두 이동시킨다.  확인을 누르면 분석 결과가 나타난다. 상관및회귀.sav Ⅴ.상관관계분석 36
  • 37. Ⅴ.상관관계분석3. 상관관계분석의 결과 정리와 해석 결과 해석  포도크기, 숙성기간과 포도판매가격 간의 상관관계를 파악하기 Pearson의 상관관계를 실시한 결과, 종속 변수인 판매가격은 포도크기 및 숙성기간과 모두 유의한 정(+)의 상관관계를 보이고 있다(p<0.05). 즉 포도 크기가 클수록, 숙성기간이 길수록 판매가격이 높아지는 경향이 존재하여, 포도크기와 숙성기간이 판매가 격에 미치는 영향관계가 성립될 수 있음을 의미한다. 반면, 독립변수인 포도크기와 숙성기간 간의 상관관계는 0.512로 유의하게 나타나고 있으나 일반적으로 독립변수 간에 지나친 상관으로 인해 나타날 다중공선성(collinearity)의 기준인 상관관계 0.8보다는 낮게 나타나고 있어, 이러한 문제는 제기되지 않는다고 판단된다. 37
  • 38. Ⅴ.상관관계분석3. 상관관계분석의 결과 정리와 해석 결과 해석 Cf) 자료가 5, 7점 척도가 아닌 연속적으로 범위가 큰 경우에는 상관이 높아도 선형이 아닐 수 있음 ex) BMI 와 윗몸 일으키기 따라서 반드시 그래프를 확인해 봐야 함 ⇒ SPSS 메뉴의 그래프 → 레거시 대화상자 → 산점도/점도표 → 단순 산점도 : X축 / Y축에 변수 설정 ⇒ 그래프 더블클릭 → 요소 → 전체적합선 클릭 ⇒ 그래프의 점 클릭 → R-click → 데이터 설명 보이기 ⇒ 그래프의 직선 클릭 → 회귀선 적합 확인 38
  • 39. 6 희귀분석 5 상관관계분석 4 ANOVA 3 t-test 2 척도와 분석 1 기초통계개념 39 SPSS 중급통계분석
  • 40. 1. 개념 40 1) 개념과 목적  연속형 원인변수가 연속형 결과변수에 영향을 미치는지를 파악하기 위함  원인변수와 결과변수 간에 영향관계(인과관계) 가 성립되는지가 가장 중요  ‘영향을 미치는가’ 와 ‘얼마나 영향을 미치는가’ 를 파악하는 것이 핵심 2) 가설검정과 검정통계량  귀무가설: 공부시간/ 지능지수는 성적에 영향을 미치지 않는다.  대립가설: 공부시간/ 지능지수는 성적에 영향을 미친다.  검정통계량: 모형 F검증/ 변수 t검증 -> 유의확률(p)의 계산 Ⅵ.회귀분석
  • 41. 1. 개념 41 공부시간/ 지능지수가 성적을 설명하는 정도(설 명력/결정계수): 71.2% 공부시간과 지능지수 중 성적에 유의한 영향을 미치는 변수: 공부시간 둘 중 더 큰 영향을 미치는 변수: 공부시 간(t=3.242) > 지능지수 (t=-0.351) 3) 단일회귀분석과 다중회귀분석  단일회귀분석 : 원인변수 1개가 결과변수에 영향을 미치는가를 파악하는 분석.  다중회귀분석 : 원인변수 2개 이상이 결과변수에 영향을 미치 는가를 파악하는 분석.  다중회귀분석에서는 여러 원인변수에서 ‘어느 변수가 결과변수에 더 중요한(큰) 영향을 미치는 가’를 파악하는 것이 목적 (상대적인 영향력) 4) 결과예시 회귀분석 결과예시: ‘공부시간과 지능지수가 성적에 미치 는 영향’ Ⅵ.회귀분석 요인 비표준화 계수 표준오차 T-value p 공부시간 4.427 1.365 3.242 0.014 지능지수 -0.101 0.288 -0.351 0.736 𝑅2=0.712 F=8.636 P=0.012 비표준화계수: 독립변수단위가 1증가할 때 종속변수가 변하는 정도
  • 42. 1. 개념 42  F-value와 p값 : 회귀모형이 적합한가(통계적으로 유의한 모형 인가)를 검증한 통계량.  F값은 클수록, p값은 0.05보다 작으면 통계적 으로 유의한 모형. 5) 주요통계량(1)  𝑅2( 설명력/ 결정계수) : 독립변수가 종속변수를 설명하는 정도  0~1 사이의 값을 가지며 1이면 100%의 설명 력을 의미함 Ⅵ.회귀분석 자유도 제곱합 제곱 평균 F 비 유의미한 F 회귀 3 81.282 27.094 40.161 0.000 잔차 396 267.158 0.675 계 399 348.400 회귀분석 통계량 다중상관계수 0.483 결정계수(𝑅2) 0.233 조정된 결정계수 0.227 표준오차 0.821 관측수 400 - 𝑅2은 ‘설명력’용어로 주로 사용, 가장 중요한 개념 - 𝑅2이 20~30%가 되어야 일반적, 거시경제/주식에 서는 5%도 안나옴
  • 43. 1. 개념 43 5) 주요통계량(2)  t-value와 p값 : 각 원인변수가 결과변수에 영향을 미치는가를 검증한 통계량.  t값은 클수록, p값은 0.05보다 작으면 통계적으 로 유의한 영향을 미침. Ⅵ.회귀분석 계수 표준 오차 t 통계량 P-값 Y절편 2.450 0.266 9.196 0.000 제품만족도 0.246 0.058 4.240 0.000 직원만족도 0.125 0.059 2.114 0.035 이미지만족도 0.229 0.064 3.595 0.000
  • 44. 2. 회귀분석의 SPSS  분석 → 회귀분석 → 선형으로 들어감 Ⅵ.회귀분석  종속변수에 ‘판매가’ , 독립변수에 ‘숙성기간’을 각각 투입함, 44
  • 45. 3. 회귀분석의 결과 정리와 해석 Ⅵ.회귀분석 결과 해석  모형요약 → 독립변수가 종속변수를 설명하는 정도(설명력/결정계수): 84.5%  분산 분석 → ‘회귀계수가 0이다(독립변수 변화에 따라 종속변수의 변화경향이 존재하지 않는다)’는 귀무가설에 대 한 검증 결과. F=310.019, p=0.000으로서 대립가설 ‘회귀계수는 0이 아니다. 즉 기울기가 존재한다’가 채택.  계수 → 독립변수인 숙성기간은 판매가에 유의한 정(+)의 영향을 미치는 것으로 나타남. 회귀식: y(판매가) = -2.891 + 2.492*X(숙성기간) [비표준화계수] - 상수: Y 절편 - B: 독립변수가 1증가할 때 종속변수의 변화정도, 즉, 회귀식의 기울기를 의미 - 표준오차: 다른 표본일 때의 오차 - 검정량(F): 𝑜 𝑜차이 관계의값 = 𝑜 𝑜차이 관계의값 𝑆 𝑁 = 표준오차 2.492 .142 = 310.019 45 - 회귀식: Y = 2.492X – 2.891

Hinweis der Redaktion

  1. 통계적 오류는 1종 오류와 2종 오류로 분류한다. 1종오류는 귀무가설이 실제로는 참이지만, 귀무가설을 잘못 기각하는 오류이다. 즉, 실제 음성인 것을 양성으로 잘못 판정하는 경우이다. 2종 오류는 귀무가설이 실제로는 거짓이지만, 귀무가설을 실수로 채택하는 오류이다. 즉, 실제 양성인 것을 음성으로 판단하는 경우이다. 다시 말해, 1종 오류는 채택해야할 가설을 기각하는 것이며, 2종 오류는 기각해야할 가설을 채택하는 오류이다.
  2. 유의수준 알파는 0.05인데, 반은 0.025에 해당하는 값을 표준정규분포표에서 찾아야한다. 1-0.025=0.975에 해당한다. Z값은 1.96에 해당한다. 검정통계량이 채택역 안에 위치하므로 귀무가설이 채택된다. 즉 총점의 평균은 300이다.