SlideShare ist ein Scribd-Unternehmen logo
1 von 69
Downloaden Sie, um offline zu lesen
1
Н.Хђдэрчулуун
Эпидемиологи Биостатистикийн Тэнхим
Нийгмийн Эрђђл Мэндийн Сургууль
Эрђђл Мэндийн Шинжлэх Ухааны Их Сургууль
e-mail: nhuderchuluun@yahoo.com
Энгийн Шугаман Регресс
(Simple Linear Regression)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
2
ёндсэн агуулга
 Хамаарлыг судлах
 Корреляцийн коэффициент буюу хамаарлын хђчийг
хэмжих тухай
 Энгийн шугаман регрессийн загвар
 Энгийн шугаман регрессийн загварийг тооцох
 Регрессийн шинжилгээний ђлдэгдэлийн шинжилгээ,
тђђний ђндсэн хэлбэрђђд
 Регрессийн шинжилгээ хийхээс өмнө тавигддаг
урьдач нөхцөлийн талаарх ойлголт
 Детерминацийн коэффициент болон ђл хамааралт
хувьсагчийн хамааралт байх нөхцөл
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
3
ёндсэн агуулга
 Регрессийн коэффициентын итгэх интервал тооцох ба
тайлбарлах
 Дурбин-Ватсоны статистик ашиглан автокорреляци
шалгах
 Корреляцийн коэффициентийг ђнэлэх
 Регрессийн итгэх интервал
 Дундажийн интгэх интерал
 Бодит (хувийн) таамгаласан итгэх интервал
(continued)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Статистик хамаарал
Хамаарлыг судлах
Хамаарлын хђч, нягтралыг судлах
(Корреляцийн шинжилгээ)
Хамаарлын хэлбэр чиглэлийг тодорхойлох
(Регрессийн шинжилгээ)
Судлагдаж буй ђзђђлэлтђђдийн хооронд хамаарал
буй эсхийг илрђђлэх
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 4
График арга (цэгэн дђрслэл)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 5
6
Корреляцийн Коэффициент
(Coefficient of Correlation)
 Хоѐр тоон ђзђђлэлтийн шугаман хамааралын
зэргийг тодорхойлдог.
 Корреляцийн коэффициент:
YX
n
1i
2
i
n
1i
2
i
n
1i
ii
SS
)Y,X(cov
)YY()XX(
)YY)(XX(
r 







Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
7
Корреляцийн Коэффициент, r
 Корреляцийн коэффициент –1 : 1 хооронд утга авна
 Корреляцийн коэффициентийн утга –1 рђђ ойртох
тусам хђчтэй урвуу шугаман хамааралтай
 Корреляцийн коэффициентийн утга 1 рђђ ойртох
тусам хђчтэй шууд шугаман хамааралтай
 Корреляцийн коэффициентийн утга 0 рђђ ойртох
тусам сул шугаман хамааралтай
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
8
Цэгэн дђрслэл (Scatter Plots)
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = +.3r = +1
Y
X
r = 0
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
9
Регрессийн Шинжилгээ
(Regression Analysis)
 Регрессийн шинжилгээ нь:
 õî¸ð ¿ç¿¿ëýëòèéí õîîðîíäûí ñòàòèñòèê õàìààðëûí
õýëáýðèéã òîãòîîх
 ñîíãîæ àâñàí íýã ¿ç¿¿ëýëòèéí óòãààñ íºãºº
¿ç¿¿ëýëòèéí íºõöºëò äóíäàæ óòãà õýðõýí õàìààð÷
áàéãààã èëýðõèéëýх
 Хамааран хувьсагч (Dependent variable): гол
тайлбарлуулагч ђзђђлэлт
 ёл хамааран хувьсагч (Independent variable): хамааран
хувьсагчийг тайлбарлагч ђзђђлэлт
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Regression
Models
Linear
Non-
Linear
2+ Explanatory
Variables
Simple
Non-
Linear
Multiple
Linear
1 Explanatory
Variable
Регрессийн загварын төрөл
(Type of Regression Model)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 10
Нэг хђчин
зђйл
Хоѐр буюу тђђнээс
дээш хђчин зђйл
11
Энгийн шугаман регрессийн
загвар (Simple Linear Regression Model)
Нэг эх олонлогоос сонгогдсон хоѐр ђзђђлэлтийн
хоорондын шугаман хамааралыг тодорхойлж,
прогноз, төлөвлөлт, бодлого боловсруулахад
хэрхэн ашиглах
Энгийн Шугам Регрессийн загвар:
Зөвхөн нэг ђл хамааран хувьсагч , X
X ба Y -ийн хоорондын шугаман функцийг
тодорхойлох
X –ийн өөрчлөлтөөр Y-ийн өөрчлөлтийг
тайлбарлах
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
12
Хамааралын Төрөл (Types of
Relationships)
Y
X
Y
X
Y
Y
X
X
Шугаман хамаарал Муруй шугаман хамаарал
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
13
Хамаарлыг хђчээр нь ангилах
Y
X
Y
X
Y
Y
X
X
Хђчтэй хамаарал Сул хамаарал
(continued)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
14
Хамаарлыг хђчээр нь ангилах
(continued)
Y
X
Y
X
Хамааралгђй
Статистик хамаарал: Сонгож
авсан нэг ђзђђлэлтийн утгаас
нөгөө ђзђђлэлтийн нөхцөлт
дундаж утга хэрхэн хамаарч
байгааг илэрхийлнэ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
15
ii10i εXββY 
Шугаман
Энгийн Шугаман Регрессийн
загвар (Simple Linear Regression Model)
Эх олонлогийн регрессийн загвар:
Эх олонлогын
Y тогтмол утга
Эх
олонлогын
мэдрэмж
Санамсаргђй
алдаа
Хамааран
хувьсагч
ёл хамааран
хувьсагч
Санамсаргђй алдаа
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Бђрэлдэхђђн:
16
(continued)
ёлдэгдэл буюу
алдаа
Y
X
Y ба Xi
харгалзах бодит
утга
Y ба Xi –ийн
шугаман дээрх
утга (Predicted
Value)
ii10i εXββY 
Xi
Slope = β1
Тогтмол
(Intercept) = β0
εi
Энгийн Шугаман Регрессийн
загвар (Simple Linear Regression Model)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
17
i10i XbbYˆ 
Эх олонлогын шугаман регрессийн ђнэлсэн
энгийн шугаман регрессийн тэгшитгэл
Энгийн Шугаман Регрессийн
Тэгшитгэл (Simple Linear Regression Equation)
Регрессийн
ђнэлэгдсэн
тогтмол утга
Регрессийн
ђнэлэгдсэн мэдрэмж
i ажиглалтын
ђнэлэгдсэн Y
утга
i ажиглалтын
X утга
ёлдэгдэл буюу алдааны ei дундаж утга нь “тэг”-тэй
тэнцђђ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
18
Хамгийн Бага Квадратын
арга (Least Squares Method)
 ёлдэгдэл буюу алдааны квадратыг хамгийн
бага байлгах:
 Параметрђђдийн хувьд минимизацийн
бодлого бодож, тэдгээрийг олох системийг
тодорхойлбол:
2
i10i
2
ii ))Xb(b(Ymin)Yˆ(Ymin  
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Хамгийн Бага Квадратын
арга (Least Squares Method)
 Параметрђђдийн хувьд минимизацийн
бодлого бодож, тэдгээрийг олох системийг
тодорхойлбол:
 Системээс параметрђђдийн ђнэлнэ.
19
 
  0
0
1
10
1
10






n
i
iii
n
i
ii
XbbYX
XbbY
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
20
Энгийн Шугаман Регрессийн
Жишээ
 Байрны ђнэд талбайн хэмжээнээс хэрхэн
хамаардаг байдлыг судлах зорилгоор судалгаа
хийв
 Санамсаргђй тђђвэрлэлтээр 10 байр сонгосон
 Хамааран хувьсагч (Y) = байрны ђнэ $1000
 ёл хамааран хувьсагч (X) = талбайн хэмжээ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
21
Байрны ђнэ талбайн хэмжээ
Байрны үнэ $1000
(Y)
Талбайн хэмжээ
(X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
22
0
50
100
150
200
250
300
350
400
450
0 500 1000 1500 2000 2500 3000
Square Feet
HousePrice($1000s)
График дђрслэл
 Байрны ђнэ талбайн хэмжээнээс
хамаарсан загвар: цэгэн дђрслэл
(scatter plot)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Excel программ ашиглан Регрессийн
шинжилгээ хийх (Regression Using Excel)
 Data / Data Analysis / Regression
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
24
ёр дђн (Excel Output)
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Регрессийн тэгшитгэл:
feet)(square0.1097798.24833pricehouse 
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
25
0
50
100
150
200
250
300
350
400
450
0 500 1000 1500 2000 2500 3000
Square Feet
HousePrice($1000s)
График дђрслэл (Graphical Presentation)
 Байрны ђнэ, талбайн хэмжээнээс хамаарсан
загвар: цэгэн дђрслэл ба регрессийн шугам
feet)(square0.1097798.24833pricehouse 
Slope
= 0.10977
Intercept
= 98.248
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
26
b0 буюу тогтмол коэффициентийг
тайлбарлах (Interpretation of the Intercept)
 b0 нь X буюу ђл хамааран хувьсагчаас бусад
хђчин зђйлийн нөлөөг харуулна.
feet)(square0.1097798.24833pricehouse 
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
27
b1 коэффициентийг тайлбарлах
(Interpretation of the Slope Coefficient)
 b1 нь Х буюу ђл хамааран хувьсагч нэг
нэгжээр өөрчлөгдөхөд Y буюу хамааран
хувьсагч хэрхэн өөрчлөгдөхийг харуулна.
 Жишээ: b1 = .10977 ба талбайн хэмжээ нэг
квадрат метрээр нэмэгдэхэд байрны ђнэ дундажаар
0.10977($1000) = $109.77 нэмэгдэнэ.
feet)(square0.1097798.24833pricehouse 
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
28
317.85
0)0.1098(20098.25
(sq.ft.)0.109898.25pricehouse



2000 квадрат метр
талбайтай байрны ђнэ:
2000 квадрат метр талбайтай байрны ђнэ
317.85($1,000s) = $317,850
Регрессийн шинжилгээны
ђр дђн
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
29
ёзђђлэлтийн Вариаци
(Measures of Variation)
 Дисперсийг нэмэх дђрэм:
SSESSRSST 
Total Sum of
Squares
Regression Sum
of Squares
Error Sum of
Squares
  2
i )YY(SST   2
ii )YˆY(SSE  2
i )YYˆ(SSR
ђђнд:
= хамааран хувьсагчийн дундаж утга
Yi = хамааран хувьсагчийн бодит утга
i = регрессийн шугаман дээрх утгаYˆ
Y
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
30
(continued)
Xi
Y
X
Yi
SST = (Yi - Y)2
SSE = (Yi - Yi )2

SSR = (Yi - Y)2

_
_
_
Y

Y
Y
_
Y

ёзђђлэлтийн Вариаци
(Measures of Variation)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
31
 Детерминацийн коэффициент нь рергессийн
тегшитгэлийг тайлбалагч гол ђзђђлэлт
 Тайлбарлагч хувьсагчийн хэдэн хувийг
тайлбарлаж буйг илэрхийлнэ
 Кореляцийн коэффициентийг квадрат зэрэгт
дэвшђђлсэнтэй тэнцђђ
Детерминацийн Коэффициент
(Coefficient of Determination), r2
1r0 2

squaresofsumtotal
squaresofsumregression
SST
SSR
r2

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
32
r2 = 1
Детерминацийн коэффициентийн
ерөнхий хэлбэрђђд
Y
X
Y
X
r2 = 1
r2 = 1
X ба Y хооронд төгс буюу
функцинал хамааралтай:
X хђчин зђйлийн өөрчлөлт нь
Y-ийн өөрчлөлтийг 100%
тайлбарлана
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
33
Детерминацийн коэффициентийн
ерөнхий хэлбэрђђд
Y
X
Y
X
0 < r2 < 1
X ба Y хооронд шугаман
хамааралтай:
X хђчин зђйлийн өөрчлөлт
нь Y-ийн өөрчлөлтөнд
нөлөө ђзђђлнэ.
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
(continued)
34
Детерминацийн коэффициентийн
ерөнхий хэлбэрђђд
r2 = 0
X ба Y хооронд шугаман
хамааралгђй:
X хђчин зђйлийн өөрчлөлт
нь Y-ийн өөрчлөлттөнд
нөлөөлдөггђй.
Y
X
r2 = 0
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
(continued)
35
ёр дђн (Excel Output)
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Байрны ђнийг тодорхойлсон
загвар 58.08% -ийг
тайлбарлах боломжтой
0.58082
32600.5000
18934.9348
SST
SSR
r2

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
36
Регрессийн шинжилгээний урьдач
нөхцөл (Assumptions of Regression)
 Алдааны нормал байх шинж (Normality of Error)
 ёлдэгдэл буюу алдаа (ε)-ны тархалт нь нормал
тархалттай байх
 Хомоскедастик байх шинж (Homoscedasticity)
 Алдааны магадлалт тархалт нь тогтмол вариацтай
байх
 Алдааны ђл хамааралт байх шинж (Independence of
Errors)
 Алдаа буюу ђлдэгдэл хувьсагчид нь бие биеэсээ ђл
хамаарах байх
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
37
ёлдэгдэлийн Шинжилгээ
(Residual Analysis)
 Бодит ажиглалтын утга, регрессийн шугаман дээрх
утгуудын зөрђђг ђлдэгдэл буюу алдаа
 Шугаман регрессийн ђлдэгдэлийн шинжилгээнд
тавигдах урьдач нөхцөлийг шалгах
 Шугаман нөхцөлийн шалгах
 Тогтмол вариацтай байх буюу гомоскедастик
нөхцөл(homoscedasticity)
 Нормал тархалтай байх нөцөлийг ђнэлэх
 ёл хамааралт байх нөхцөлийг ђнэлэх
 ёлдэгдэлийн График шинжилгээ
 ёлдэгдэлийн график дђрслэл
iii YˆYe 
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
38
ёлдэгдэлийн шугаман байх
нөхцөл (Residual Analysis for Linearity)
Шугаман биш Шугаман

x
residuals
x
Y
x
Y
x
residuals
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
39
ёлдэгдэлийн Шинжилгээний
Гомоскедастик нөхцөл
(Residual Analysis for Homoscedasticity )
Тогтмол биш дисперс  Тогтмол дисперс
x x
Y
x x
Y
residuals
residuals
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
40
ёлдэгдэлийн Шинжилгээний ђл
хамааралт байх нөхцөл
( Residual Analysis for Independence)
Хамааралт
ёл хамааралт
X
X
residuals
residuals
X
residuals

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
41
House Price Model Residual Plot
-60
-40
-20
0
20
40
60
80
0 1000 2000 3000
Square Feet
Residuals
ёлдэгдэлийн ђр дђн
RESIDUAL OUTPUT
Predicted
House Price Residuals
1 251.92316 -6.923162
2 273.87671 38.12329
3 284.85348 -5.853484
4 304.06284 3.937162
5 218.99284 -19.99284
6 268.38832 -49.38832
7 356.20251 48.79749
8 367.17929 -43.17929
9 254.6674 64.33264
10 284.85348 -29.85348
Регрессийн урьдач нөхцөл хангагдаж байна
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
42
 Цаг хугацааны мэдээлэлд өмнөх цаг
хугацааны тђвшингђђдннс хђчтэй
хамаарч байвал автокорреляци байна гэж
ђздэг
 ёлдэгдэл хувьсагчид өмнөх цаг
хугацааны тђвшингөөс хамаарах байдлыг
автокорреляци
Автокорреляци: Дурбин-Ватсоны
статистик(Autocorrelation: The Durbin-Watson Statistic)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
43
Автокорреляци (Autocorrelation)
 Автокорреляци гэдэг нь ђлдэгдэл (алдаа)-ийн
хоорондоо хамааралтай бадал
 Регрессийн урьдач нөхцөлийн нэг нь ђлдэгдэлђђд
нь санамсаргђй ба ђл хамааралт байх
Time (t) Residual Plot
-15
-10
-5
0
5
10
15
0 2 4 6 8
Time (t)
Residuals ёђнд, ђлдэгдэлђђд нь
санамсаргђй биш,
тодорхой мөчлөгт
өөрчлөгдөж байна.
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
44
Дурбин-Ватсоны шинжђђр
(The Durbin-Watson Statistic)





 n
1i
2
i
n
2i
2
1ii
e
)ee(
D
 0 ≤ D ≤ 4 хооронд утга авна
 D нь 2 орчимд байвал H0 ђнэн
 D нь 2-оос бага бол эерэг
автокореляци байж болох дохио, D
нь 2-оос их бол сөрөг автокореляци
байж болох дохио
 Дурбин-Ватсоны шинжђђрийг ашиглан
автокорреляци байгаа эсхийг шалгаж болно
H0: ђлдэгдэлђђд хамааралгђй
H1: автокореляци
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
45
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
 Дурбин- Ватсоны тестийг тооцох = D
Шийдвэр гаргах: хэрэв D < dL бол H0 няцаагдана
H0: эерэг автокорреляци байгаа
H1: эерэг автокорреляци байхгђй
0 dU 2dL
Няцаана H0 Зөвшөөрнө H0
Дурбин-Ватсоны хђснэтгээс dL ба dU утгыг олох
(тђђврийн хэмжээ n ба ђл хамааран хувьсагчийн тоо k)
Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
46
 Тђђврийн хэмжээ n = 25
Durbin-Watson Calculations
Sum of Squared
Difference of Residuals 3296.18
Sum of Squared
Residuals 3279.98
Durbin-Watson
Statistic 1.00494
y = 30.65 + 4.7038x
R
2
= 0.8976
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30
Time
Sales
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
1.00494
3279.98
3296.18
e
)e(e
D n
1i
2
i
n
2i
2
1ii








Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
47
 n = 25 ба k = 1 буюу нэг ђл хамааран хувьсагч
 Дурбин-Ватсоны хђснэгт, dL = 1.29 ба dU = 1.45
 D = 1.00494 < dL = 1.29, учир эерэг автокореляцтай
гэсэн таамаглалыг статистик ач холбогдолын тђвшинд
H0 –ийг няцаана
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
Шийдвэр: няцаана H0
D = 1.00494 < dL
0 dU=1.45 2dL=1.29
Reject H0 Do not reject H0Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
48
Мэдрэмж буюу Slope
 Регрессийн коэффициент (b1)-ийн стандарт
алдааг дараах байдлаар ђнэлдэг
 

2
i
YXYX
b
)X(X
S
SSX
S
S 1
ђђнд:
= Мэдрэмжийн ђнэлэгдсэн стандарт алдаа
= ёнэлгээний стандарт алдаа
1bS
2n
SSE
SYX


Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
49
ёр дђн
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
0.03297S 1b 
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
50
Мэдрэмжийн Стандарт алдаа
(Standard Errors of the Slope)
Y
X
Y
X
1bSsmall 1bSlarge
нь мэдрэмжийн хазайлт ба регрессийн шугамыг
өөрчлөх боломжтой байдаг
1bS
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн тухай тайлбар: t
тест (Inference about the Slope: t Test)
 Эх олонлогын мэдрэмж (slope) ђнэлэх t тест
 X ба Y хооронд шугаман хамаарал байдаг уу?
 Тэг ба альтарнатив таамаглал
H0: β1 = 0 (шугаман хамааралгђй)
H1: β1 ≠ 0 (шугаман хамааралтай)
 Тестийн статистик
1b
11
S
βb
t


2nd.f. 
ёђнд:
b1 = регрессийн тэгшитгэлийн
коэффициент
β1 = таамаглалын мэдрэмж
Sb1 = мэдрэмж (slope)-ийн
стандарт алдаа
51Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
House Price
in $1000s
(y)
Square Feet
(x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
(sq.ft.)0.109898.25pricehouse 
ёнэлэгдсэн регрессийн тэгшитгэл:
Загварт ђнэлэгдсэн утга 0.1098
Талбайн хэмжээ нь байрны ђнэд
нөлөөлөх хђчин зђйл мөн ђђ?
Мэдрэмжийн тухай тайлбар: t
тест (Inference about the Slope: t Test)
(continued)
52Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
H0: β1 = 0
H1: β1 ≠ 0
ёр дђн:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS
t
b1
32938.3
03297.0
010977.0
S
βb
t
1b
11





53Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
H0: β1 = 0
H1: β1 ≠ 0
Тестийн статистик: t = 3.329
Талбай хэмжээ нь байрны
ђнэд нөлөөлөх хђчин зђйл
мөн
ёр дђн:
Няцаана H0
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS tb1
Шийдвэр:
Дђгнэлт:
Няцаана H0Няцаана H0
a/2=.025
-tα/2
Зөвшөөрнө H0
0
tα/2
a/2=.025
-2.3060 2.3060 3.329
d.f. = 10-2 = 8
(continued)
54Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
H0: β1 = 0
H1: β1 ≠ 0
P-утга = 0.01039
Талбай хэмжээ нь байрны ђнэд
нөлөөлөх хђчин зђйл мөн
ёр дђн:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
P-value
Шийдвэр: P-value < α учир
Дђгнэлт:
(continued)
Хоѐр-талт тестийн ђед p-
утга тооцох
P(t > 3.329)+P(t < -3.329)
= 0.01039
( 8 d.f.)
55Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Няцаана H0
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
Регрессийн шинжилгээн дэхь
F-тест
 F тест:
ђђнд
MSE
MSR
F 
1kn
SSE
MSE
k
SSR
MSR



k ба (n – k - 1) чөлөөний зэргийн тоотой F тархалт ын утга,
тооцооны F утгатай харьцуулж тооцно
(k = регрессийн загвар дахь ђл хамааран хувьсагчийн тоо)
56Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
ёр дђн
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
11.0848
1708.1957
18934.9348
MSE
MSR
F 
1 ба 8 чөлөөний
зэрэгийн тоо
F-тестийн
P-утга
57Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
H0: β0 = β1 = 0
H1: β0 ≠ β1 ≠ 0
a = 0.05
df1= 1 df2 = 8
Тестийн статистик:
Шийдвэр:
Дђгнэлт:
α = 0.05 тђвшинд H0
няцаана
Регрессийн коэффициентууд
нэгэн зэрэг тэгтэй тэнцђђ биш0
a = .05
F.05 = 5.32
Няцаана H0Зөвшөрнө
H0
11.08
MSE
MSR
F 
Критик
утга:
Fa = 5.32
F-Тест
(continued)
F
58Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн Итгэх Интервал
(Confidence Interval for the Slope)
Мэдрэмжийн интервал ђнэлгээ:
ёр дђн:
95% итгэх тђвшинд мэдрэмжийн итгэх интервал нь
(0.0337, 0.1858)
1b2n1 Stb 
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
d.f. = n - 2
59Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Талбайн хэмжээг нэг нэгжээр нэмэгдэхэд
байрны ђнэ дундажаар 95% итгэх тђвшинд
$33.70 -оос $185.80 нэмэгдэнэ
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Мэдрэмжийн Итгэх Интервал
(Confidence Interval for the Slope)
(continued)
60Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Корреляцийн Коэффициентийг
ђнэлэх t тест
 Таамаглал
H0: ρ = 0 ( X ба Y хооронд хамааралгђй)
HA: ρ ≠ 0 (хамааралтай)
 Статистик тест
 ( n – 2 чөлөөний зэргийн тоо)
2n
r1
ρ-r
t
2



0bifrr
0bifrr
where
1
2
1
2


61Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Жишээ:
Байрны талбай хэмжээ ба байрны ђнэ
хооронд шугаман хамааралтай эсэхийг
ђнэлэх
H0: ρ = 0 (хамааралгђй)
H1: ρ ≠ 0 (хамааралтай)
a =.05 , df = 10 - 2 = 8
3.33
210
.7621
0.762
2n
r1
ρr
t
22









62Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Жишээ: Тестийн ђр дђн
Дђгнэлт:
5% ач
холбогдолын
тђвшинд
шугаман
хамааралтай
Шийдвэр гаргах:
H0 Няцаана
Няцаана H0Няцаана H0
a/2=.025
-tα/2
Зөвшөөрнө H0
0
tα/2
a/2=.025
-2.3060 2.3060
3.33
d.f. = 10-2 = 8
3.33
210
.7621
0.762
2n
r1
ρr
t
22









63Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Дундаж ба Таамагласан
бодит утгын ђнэлгээ
Y
XXi
Y = b0+b1Xi

Дундажийн
итгэх
интервал
Бодит (хувийн)
таамагласан итгэх
интервал
Y

64Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Y-ийн дундаж утгын итгэх
интервал
Xi тухайлсан утгаар өгөгдсөн Y-ийн дундаж
утгын ђнэлэгдсэн итгэх интервал
Дундажаас хазайх хазайлтын
квадрат утга, X
ihtY YX2n
XX|Y
Sˆ
:μ i



 



 2
i
2
i
2
i
i
)X(X
)X(X
n
1
SSX
)X(X
n
1
h
65Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Итгэх интервал
Бодит Y-ийн таамагласан итгэх
интервал
Xi тухайлсан утгаар өгөгдсөн Y-ийн хувийн
утгын ђнэлэгдсэн итгэх интервал
iYX2n
XX
h1StYˆ
:YforintervalConfidence i
 

66Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Дундаж утгын ђнэлгээ: Жишээ
2,000 квадрат метр байрны дундаж ђнийн 95%
интгэх интервал
ёнэлэгдсэн утга Yi = 317.85 ($1,000)

μY|X=X ђнэлгээний итгэх интервал
37.12317.85
)X(X
)X(X
n
1
StYˆ
2
i
2
i
YX2-n 




Итгэх интервал нь $280,660 аас $354,900
67Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Бодит утгын ђнэлгээ: Жишээ
2,000 квадрат метр байрны бодит (хувийн) 95%
таамагласан интервал
ёнэлэгдсэн утга Yi = 317.85 ($1,000s)

YX=X Таамагласан интервалын ђнэлгээ
102.28317.85
)X(X
)X(X
n
1
1StYˆ
2
i
2
i
YX1-n 




Таамагласан интервал $215,500 аас $420,070
68Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Амжилт хђсье!
69Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС

Weitere ähnliche Inhalte

Was ist angesagt?

Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...
Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...
Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...Adilbishiin Gelegjamts
 
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...Adilbishiin Gelegjamts
 
нөхөрлөл.Pptx
нөхөрлөл.Pptxнөхөрлөл.Pptx
нөхөрлөл.PptxI Student
 
Stat bolovsruulalt1
Stat bolovsruulalt1Stat bolovsruulalt1
Stat bolovsruulalt1Akhyt
 
Лекц №4 Санхүүгийн зах зээл
Лекц №4 Санхүүгийн зах зээлЛекц №4 Санхүүгийн зах зээл
Лекц №4 Санхүүгийн зах зээлGunjargal
 
Lecture 4, 5
Lecture 4, 5Lecture 4, 5
Lecture 4, 5Bbujee
 
Lecture 16
Lecture   16Lecture   16
Lecture 16Tj Crew
 
Зардлын бүртгэл Лекц 2
Зардлын бүртгэл Лекц 2Зардлын бүртгэл Лекц 2
Зардлын бүртгэл Лекц 2Bbujee
 
Lecture №13,14,15,16
Lecture №13,14,15,16Lecture №13,14,15,16
Lecture №13,14,15,16ariunubu
 
Бие даалтын ажил хийх зөвлөмж
Бие даалтын ажил хийх зөвлөмжБие даалтын ажил хийх зөвлөмж
Бие даалтын ажил хийх зөвлөмжTeacher's E-content
 
Зардлын бүртгэл Лекц 5,6
Зардлын бүртгэл Лекц 5,6Зардлын бүртгэл Лекц 5,6
Зардлын бүртгэл Лекц 5,6Bbujee
 
Lecture №5,6,7,8
Lecture №5,6,7,8Lecture №5,6,7,8
Lecture №5,6,7,8ariunubu
 
Санхүүгийн хөшүүрэг
Санхүүгийн хөшүүрэгСанхүүгийн хөшүүрэг
Санхүүгийн хөшүүрэгShunkhlai Group LLC
 
Маркетингийн орчин
Маркетингийн орчин Маркетингийн орчин
Маркетингийн орчин dagarzandraidorjmyag
 
Түүвэр , түүвэрлэлтийн арга зүй
Түүвэр , түүвэрлэлтийн арга зүйТүүвэр , түүвэрлэлтийн арга зүй
Түүвэр , түүвэрлэлтийн арга зүйSerod Khuyagaa
 
Lekts 7. tuuver sudalgaa
Lekts 7. tuuver sudalgaaLekts 7. tuuver sudalgaa
Lekts 7. tuuver sudalgaabiedaalt
 
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС Chuluun Zulaa
 
зардлын ангилал, зардлын динамик шинжилгээ
зардлын ангилал, зардлын динамик шинжилгээзардлын ангилал, зардлын динамик шинжилгээ
зардлын ангилал, зардлын динамик шинжилгээEnebish Vandandulam
 
Shuud ba shuud bus tatwar
Shuud ba shuud bus tatwarShuud ba shuud bus tatwar
Shuud ba shuud bus tatwarBuka King
 
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...Adilbishiin Gelegjamts
 

Was ist angesagt? (20)

Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...
Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...
Удирдлагын зохион байгуулалт, зохион байгуулалтын хэлбэрүүд ...
 
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...
Менежментийн онол, онолын үүсэл, хөгжил, Монгол онол ...
 
нөхөрлөл.Pptx
нөхөрлөл.Pptxнөхөрлөл.Pptx
нөхөрлөл.Pptx
 
Stat bolovsruulalt1
Stat bolovsruulalt1Stat bolovsruulalt1
Stat bolovsruulalt1
 
Лекц №4 Санхүүгийн зах зээл
Лекц №4 Санхүүгийн зах зээлЛекц №4 Санхүүгийн зах зээл
Лекц №4 Санхүүгийн зах зээл
 
Lecture 4, 5
Lecture 4, 5Lecture 4, 5
Lecture 4, 5
 
Lecture 16
Lecture   16Lecture   16
Lecture 16
 
Зардлын бүртгэл Лекц 2
Зардлын бүртгэл Лекц 2Зардлын бүртгэл Лекц 2
Зардлын бүртгэл Лекц 2
 
Lecture №13,14,15,16
Lecture №13,14,15,16Lecture №13,14,15,16
Lecture №13,14,15,16
 
Бие даалтын ажил хийх зөвлөмж
Бие даалтын ажил хийх зөвлөмжБие даалтын ажил хийх зөвлөмж
Бие даалтын ажил хийх зөвлөмж
 
Зардлын бүртгэл Лекц 5,6
Зардлын бүртгэл Лекц 5,6Зардлын бүртгэл Лекц 5,6
Зардлын бүртгэл Лекц 5,6
 
Lecture №5,6,7,8
Lecture №5,6,7,8Lecture №5,6,7,8
Lecture №5,6,7,8
 
Санхүүгийн хөшүүрэг
Санхүүгийн хөшүүрэгСанхүүгийн хөшүүрэг
Санхүүгийн хөшүүрэг
 
Маркетингийн орчин
Маркетингийн орчин Маркетингийн орчин
Маркетингийн орчин
 
Түүвэр , түүвэрлэлтийн арга зүй
Түүвэр , түүвэрлэлтийн арга зүйТүүвэр , түүвэрлэлтийн арга зүй
Түүвэр , түүвэрлэлтийн арга зүй
 
Lekts 7. tuuver sudalgaa
Lekts 7. tuuver sudalgaaLekts 7. tuuver sudalgaa
Lekts 7. tuuver sudalgaa
 
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
 
зардлын ангилал, зардлын динамик шинжилгээ
зардлын ангилал, зардлын динамик шинжилгээзардлын ангилал, зардлын динамик шинжилгээ
зардлын ангилал, зардлын динамик шинжилгээ
 
Shuud ba shuud bus tatwar
Shuud ba shuud bus tatwarShuud ba shuud bus tatwar
Shuud ba shuud bus tatwar
 
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...
Санхүүгийн шинжилгээ /санхүүгийн тайлангийн шинжилгээ, харьцаа, санхүүгийн хү...
 

Andere mochten auch

дасгал корреляци регресс
дасгал корреляци регрессдасгал корреляци регресс
дасгал корреляци регрессzorigoo.sph
 
Macroeconomic modelling using Eviews
Macroeconomic modelling using EviewsMacroeconomic modelling using Eviews
Macroeconomic modelling using EviewsMuhammad Anees
 
СЭЗШ-ээ хичээлийн Бие даалт №2
СЭЗШ-ээ хичээлийн Бие даалт №2СЭЗШ-ээ хичээлийн Бие даалт №2
СЭЗШ-ээ хичээлийн Бие даалт №2Byambadrj Myagmar
 
СЭЗШ хичээлийн бие даалт №1-ийг хийх загвар
СЭЗШ хичээлийн бие даалт №1-ийг хийх загварСЭЗШ хичээлийн бие даалт №1-ийг хийх загвар
СЭЗШ хичээлийн бие даалт №1-ийг хийх загварByambadrj Myagmar
 
статистик тархалт
статистик тархалтстатистик тархалт
статистик тархалтSerod Khuyagaa
 
хэмжилтийн математик боловсруулалт, шинжилгээ
хэмжилтийн математик боловсруулалт, шинжилгээхэмжилтийн математик боловсруулалт, шинжилгээ
хэмжилтийн математик боловсруулалт, шинжилгээLuvsandorj Tsogdov
 
эрүүл мэндийн статистик лекц 1
эрүүл мэндийн статистик лекц 1эрүүл мэндийн статистик лекц 1
эрүүл мэндийн статистик лекц 1Serod Khuyagaa
 
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгавар
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгаваркорреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгавар
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгаварZorigoo Bayar
 
Bie daaltiin ajil 2
Bie daaltiin ajil 2Bie daaltiin ajil 2
Bie daaltiin ajil 2BPurev
 
Correlation, other correlation
Correlation, other correlationCorrelation, other correlation
Correlation, other correlationzorigoo.sph
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2zorigoo.sph
 

Andere mochten auch (16)

дасгал корреляци регресс
дасгал корреляци регрессдасгал корреляци регресс
дасгал корреляци регресс
 
Econo intro - part ii
Econo   intro - part iiEcono   intro - part ii
Econo intro - part ii
 
Orlogo grap 02
Orlogo grap 02Orlogo grap 02
Orlogo grap 02
 
Macroeconomic modelling using Eviews
Macroeconomic modelling using EviewsMacroeconomic modelling using Eviews
Macroeconomic modelling using Eviews
 
СЭЗШ-ээ хичээлийн Бие даалт №2
СЭЗШ-ээ хичээлийн Бие даалт №2СЭЗШ-ээ хичээлийн Бие даалт №2
СЭЗШ-ээ хичээлийн Бие даалт №2
 
СЭЗШ хичээлийн бие даалт №1-ийг хийх загвар
СЭЗШ хичээлийн бие даалт №1-ийг хийх загварСЭЗШ хичээлийн бие даалт №1-ийг хийх загвар
СЭЗШ хичээлийн бие даалт №1-ийг хийх загвар
 
статистик тархалт
статистик тархалтстатистик тархалт
статистик тархалт
 
хэмжилтийн математик боловсруулалт, шинжилгээ
хэмжилтийн математик боловсруулалт, шинжилгээхэмжилтийн математик боловсруулалт, шинжилгээ
хэмжилтийн математик боловсруулалт, шинжилгээ
 
эрүүл мэндийн статистик лекц 1
эрүүл мэндийн статистик лекц 1эрүүл мэндийн статистик лекц 1
эрүүл мэндийн статистик лекц 1
 
HRON110- Хичээл 11
HRON110- Хичээл 11HRON110- Хичээл 11
HRON110- Хичээл 11
 
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгавар
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгаваркорреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгавар
корреляци ба регрессийн шинжилгээ хичэлийн гэрийн даалгавар
 
HRON110- Хичээл 9
HRON110- Хичээл 9HRON110- Хичээл 9
HRON110- Хичээл 9
 
Bie daaltiin ajil 2
Bie daaltiin ajil 2Bie daaltiin ajil 2
Bie daaltiin ajil 2
 
Correlation, other correlation
Correlation, other correlationCorrelation, other correlation
Correlation, other correlation
 
Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2
 
тойм статистик лекц 2
тойм статистик лекц 2тойм статистик лекц 2
тойм статистик лекц 2
 

Files

  • 1. 1 Н.Хђдэрчулуун Эпидемиологи Биостатистикийн Тэнхим Нийгмийн Эрђђл Мэндийн Сургууль Эрђђл Мэндийн Шинжлэх Ухааны Их Сургууль e-mail: nhuderchuluun@yahoo.com Энгийн Шугаман Регресс (Simple Linear Regression) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 2. 2 ёндсэн агуулга  Хамаарлыг судлах  Корреляцийн коэффициент буюу хамаарлын хђчийг хэмжих тухай  Энгийн шугаман регрессийн загвар  Энгийн шугаман регрессийн загварийг тооцох  Регрессийн шинжилгээний ђлдэгдэлийн шинжилгээ, тђђний ђндсэн хэлбэрђђд  Регрессийн шинжилгээ хийхээс өмнө тавигддаг урьдач нөхцөлийн талаарх ойлголт  Детерминацийн коэффициент болон ђл хамааралт хувьсагчийн хамааралт байх нөхцөл Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 3. 3 ёндсэн агуулга  Регрессийн коэффициентын итгэх интервал тооцох ба тайлбарлах  Дурбин-Ватсоны статистик ашиглан автокорреляци шалгах  Корреляцийн коэффициентийг ђнэлэх  Регрессийн итгэх интервал  Дундажийн интгэх интерал  Бодит (хувийн) таамгаласан итгэх интервал (continued) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 4. Статистик хамаарал Хамаарлыг судлах Хамаарлын хђч, нягтралыг судлах (Корреляцийн шинжилгээ) Хамаарлын хэлбэр чиглэлийг тодорхойлох (Регрессийн шинжилгээ) Судлагдаж буй ђзђђлэлтђђдийн хооронд хамаарал буй эсхийг илрђђлэх Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 4
  • 5. График арга (цэгэн дђрслэл) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 5
  • 6. 6 Корреляцийн Коэффициент (Coefficient of Correlation)  Хоѐр тоон ђзђђлэлтийн шугаман хамааралын зэргийг тодорхойлдог.  Корреляцийн коэффициент: YX n 1i 2 i n 1i 2 i n 1i ii SS )Y,X(cov )YY()XX( )YY)(XX( r         Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 7. 7 Корреляцийн Коэффициент, r  Корреляцийн коэффициент –1 : 1 хооронд утга авна  Корреляцийн коэффициентийн утга –1 рђђ ойртох тусам хђчтэй урвуу шугаман хамааралтай  Корреляцийн коэффициентийн утга 1 рђђ ойртох тусам хђчтэй шууд шугаман хамааралтай  Корреляцийн коэффициентийн утга 0 рђђ ойртох тусам сул шугаман хамааралтай Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 8. 8 Цэгэн дђрслэл (Scatter Plots) Y X Y X Y X Y X Y X r = -1 r = -.6 r = 0 r = +.3r = +1 Y X r = 0 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 9. 9 Регрессийн Шинжилгээ (Regression Analysis)  Регрессийн шинжилгээ нь:  õî¸ð ¿ç¿¿ëýëòèéí õîîðîíäûí ñòàòèñòèê õàìààðëûí õýëáýðèéã òîãòîîх  ñîíãîæ àâñàí íýã ¿ç¿¿ëýëòèéí óòãààñ íºãºº ¿ç¿¿ëýëòèéí íºõöºëò äóíäàæ óòãà õýðõýí õàìààð÷ áàéãààã èëýðõèéëýх  Хамааран хувьсагч (Dependent variable): гол тайлбарлуулагч ђзђђлэлт  ёл хамааран хувьсагч (Independent variable): хамааран хувьсагчийг тайлбарлагч ђзђђлэлт Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 10. Regression Models Linear Non- Linear 2+ Explanatory Variables Simple Non- Linear Multiple Linear 1 Explanatory Variable Регрессийн загварын төрөл (Type of Regression Model) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 10 Нэг хђчин зђйл Хоѐр буюу тђђнээс дээш хђчин зђйл
  • 11. 11 Энгийн шугаман регрессийн загвар (Simple Linear Regression Model) Нэг эх олонлогоос сонгогдсон хоѐр ђзђђлэлтийн хоорондын шугаман хамааралыг тодорхойлж, прогноз, төлөвлөлт, бодлого боловсруулахад хэрхэн ашиглах Энгийн Шугам Регрессийн загвар: Зөвхөн нэг ђл хамааран хувьсагч , X X ба Y -ийн хоорондын шугаман функцийг тодорхойлох X –ийн өөрчлөлтөөр Y-ийн өөрчлөлтийг тайлбарлах Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 12. 12 Хамааралын Төрөл (Types of Relationships) Y X Y X Y Y X X Шугаман хамаарал Муруй шугаман хамаарал Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 13. 13 Хамаарлыг хђчээр нь ангилах Y X Y X Y Y X X Хђчтэй хамаарал Сул хамаарал (continued) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 14. 14 Хамаарлыг хђчээр нь ангилах (continued) Y X Y X Хамааралгђй Статистик хамаарал: Сонгож авсан нэг ђзђђлэлтийн утгаас нөгөө ђзђђлэлтийн нөхцөлт дундаж утга хэрхэн хамаарч байгааг илэрхийлнэ Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 15. 15 ii10i εXββY  Шугаман Энгийн Шугаман Регрессийн загвар (Simple Linear Regression Model) Эх олонлогийн регрессийн загвар: Эх олонлогын Y тогтмол утга Эх олонлогын мэдрэмж Санамсаргђй алдаа Хамааран хувьсагч ёл хамааран хувьсагч Санамсаргђй алдаа Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС Бђрэлдэхђђн:
  • 16. 16 (continued) ёлдэгдэл буюу алдаа Y X Y ба Xi харгалзах бодит утга Y ба Xi –ийн шугаман дээрх утга (Predicted Value) ii10i εXββY  Xi Slope = β1 Тогтмол (Intercept) = β0 εi Энгийн Шугаман Регрессийн загвар (Simple Linear Regression Model) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 17. 17 i10i XbbYˆ  Эх олонлогын шугаман регрессийн ђнэлсэн энгийн шугаман регрессийн тэгшитгэл Энгийн Шугаман Регрессийн Тэгшитгэл (Simple Linear Regression Equation) Регрессийн ђнэлэгдсэн тогтмол утга Регрессийн ђнэлэгдсэн мэдрэмж i ажиглалтын ђнэлэгдсэн Y утга i ажиглалтын X утга ёлдэгдэл буюу алдааны ei дундаж утга нь “тэг”-тэй тэнцђђ Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 18. 18 Хамгийн Бага Квадратын арга (Least Squares Method)  ёлдэгдэл буюу алдааны квадратыг хамгийн бага байлгах:  Параметрђђдийн хувьд минимизацийн бодлого бодож, тэдгээрийг олох системийг тодорхойлбол: 2 i10i 2 ii ))Xb(b(Ymin)Yˆ(Ymin   Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 19. Хамгийн Бага Квадратын арга (Least Squares Method)  Параметрђђдийн хувьд минимизацийн бодлого бодож, тэдгээрийг олох системийг тодорхойлбол:  Системээс параметрђђдийн ђнэлнэ. 19     0 0 1 10 1 10       n i iii n i ii XbbYX XbbY Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 20. 20 Энгийн Шугаман Регрессийн Жишээ  Байрны ђнэд талбайн хэмжээнээс хэрхэн хамаардаг байдлыг судлах зорилгоор судалгаа хийв  Санамсаргђй тђђвэрлэлтээр 10 байр сонгосон  Хамааран хувьсагч (Y) = байрны ђнэ $1000  ёл хамааран хувьсагч (X) = талбайн хэмжээ Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 21. 21 Байрны ђнэ талбайн хэмжээ Байрны үнэ $1000 (Y) Талбайн хэмжээ (X) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 22. 22 0 50 100 150 200 250 300 350 400 450 0 500 1000 1500 2000 2500 3000 Square Feet HousePrice($1000s) График дђрслэл  Байрны ђнэ талбайн хэмжээнээс хамаарсан загвар: цэгэн дђрслэл (scatter plot) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 23. Excel программ ашиглан Регрессийн шинжилгээ хийх (Regression Using Excel)  Data / Data Analysis / Regression Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 24. 24 ёр дђн (Excel Output) Regression Statistics Multiple R 0.76211 R Square 0.58082 Adjusted R Square 0.52842 Standard Error 41.33032 Observations 10 ANOVA df SS MS F Significance F Regression 1 18934.9348 18934.9348 11.0848 0.01039 Residual 8 13665.5652 1708.1957 Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Регрессийн тэгшитгэл: feet)(square0.1097798.24833pricehouse  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 25. 25 0 50 100 150 200 250 300 350 400 450 0 500 1000 1500 2000 2500 3000 Square Feet HousePrice($1000s) График дђрслэл (Graphical Presentation)  Байрны ђнэ, талбайн хэмжээнээс хамаарсан загвар: цэгэн дђрслэл ба регрессийн шугам feet)(square0.1097798.24833pricehouse  Slope = 0.10977 Intercept = 98.248 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 26. 26 b0 буюу тогтмол коэффициентийг тайлбарлах (Interpretation of the Intercept)  b0 нь X буюу ђл хамааран хувьсагчаас бусад хђчин зђйлийн нөлөөг харуулна. feet)(square0.1097798.24833pricehouse  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 27. 27 b1 коэффициентийг тайлбарлах (Interpretation of the Slope Coefficient)  b1 нь Х буюу ђл хамааран хувьсагч нэг нэгжээр өөрчлөгдөхөд Y буюу хамааран хувьсагч хэрхэн өөрчлөгдөхийг харуулна.  Жишээ: b1 = .10977 ба талбайн хэмжээ нэг квадрат метрээр нэмэгдэхэд байрны ђнэ дундажаар 0.10977($1000) = $109.77 нэмэгдэнэ. feet)(square0.1097798.24833pricehouse  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 28. 28 317.85 0)0.1098(20098.25 (sq.ft.)0.109898.25pricehouse    2000 квадрат метр талбайтай байрны ђнэ: 2000 квадрат метр талбайтай байрны ђнэ 317.85($1,000s) = $317,850 Регрессийн шинжилгээны ђр дђн Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 29. 29 ёзђђлэлтийн Вариаци (Measures of Variation)  Дисперсийг нэмэх дђрэм: SSESSRSST  Total Sum of Squares Regression Sum of Squares Error Sum of Squares   2 i )YY(SST   2 ii )YˆY(SSE  2 i )YYˆ(SSR ђђнд: = хамааран хувьсагчийн дундаж утга Yi = хамааран хувьсагчийн бодит утга i = регрессийн шугаман дээрх утгаYˆ Y Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 30. 30 (continued) Xi Y X Yi SST = (Yi - Y)2 SSE = (Yi - Yi )2  SSR = (Yi - Y)2  _ _ _ Y  Y Y _ Y  ёзђђлэлтийн Вариаци (Measures of Variation) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 31. 31  Детерминацийн коэффициент нь рергессийн тегшитгэлийг тайлбалагч гол ђзђђлэлт  Тайлбарлагч хувьсагчийн хэдэн хувийг тайлбарлаж буйг илэрхийлнэ  Кореляцийн коэффициентийг квадрат зэрэгт дэвшђђлсэнтэй тэнцђђ Детерминацийн Коэффициент (Coefficient of Determination), r2 1r0 2  squaresofsumtotal squaresofsumregression SST SSR r2  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 32. 32 r2 = 1 Детерминацийн коэффициентийн ерөнхий хэлбэрђђд Y X Y X r2 = 1 r2 = 1 X ба Y хооронд төгс буюу функцинал хамааралтай: X хђчин зђйлийн өөрчлөлт нь Y-ийн өөрчлөлтийг 100% тайлбарлана Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 33. 33 Детерминацийн коэффициентийн ерөнхий хэлбэрђђд Y X Y X 0 < r2 < 1 X ба Y хооронд шугаман хамааралтай: X хђчин зђйлийн өөрчлөлт нь Y-ийн өөрчлөлтөнд нөлөө ђзђђлнэ. Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС (continued)
  • 34. 34 Детерминацийн коэффициентийн ерөнхий хэлбэрђђд r2 = 0 X ба Y хооронд шугаман хамааралгђй: X хђчин зђйлийн өөрчлөлт нь Y-ийн өөрчлөлттөнд нөлөөлдөггђй. Y X r2 = 0 Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС (continued)
  • 35. 35 ёр дђн (Excel Output) Regression Statistics Multiple R 0.76211 R Square 0.58082 Adjusted R Square 0.52842 Standard Error 41.33032 Observations 10 ANOVA df SS MS F Significance F Regression 1 18934.9348 18934.9348 11.0848 0.01039 Residual 8 13665.5652 1708.1957 Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Байрны ђнийг тодорхойлсон загвар 58.08% -ийг тайлбарлах боломжтой 0.58082 32600.5000 18934.9348 SST SSR r2  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 36. 36 Регрессийн шинжилгээний урьдач нөхцөл (Assumptions of Regression)  Алдааны нормал байх шинж (Normality of Error)  ёлдэгдэл буюу алдаа (ε)-ны тархалт нь нормал тархалттай байх  Хомоскедастик байх шинж (Homoscedasticity)  Алдааны магадлалт тархалт нь тогтмол вариацтай байх  Алдааны ђл хамааралт байх шинж (Independence of Errors)  Алдаа буюу ђлдэгдэл хувьсагчид нь бие биеэсээ ђл хамаарах байх Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 37. 37 ёлдэгдэлийн Шинжилгээ (Residual Analysis)  Бодит ажиглалтын утга, регрессийн шугаман дээрх утгуудын зөрђђг ђлдэгдэл буюу алдаа  Шугаман регрессийн ђлдэгдэлийн шинжилгээнд тавигдах урьдач нөхцөлийг шалгах  Шугаман нөхцөлийн шалгах  Тогтмол вариацтай байх буюу гомоскедастик нөхцөл(homoscedasticity)  Нормал тархалтай байх нөцөлийг ђнэлэх  ёл хамааралт байх нөхцөлийг ђнэлэх  ёлдэгдэлийн График шинжилгээ  ёлдэгдэлийн график дђрслэл iii YˆYe  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 38. 38 ёлдэгдэлийн шугаман байх нөхцөл (Residual Analysis for Linearity) Шугаман биш Шугаман  x residuals x Y x Y x residuals Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 39. 39 ёлдэгдэлийн Шинжилгээний Гомоскедастик нөхцөл (Residual Analysis for Homoscedasticity ) Тогтмол биш дисперс  Тогтмол дисперс x x Y x x Y residuals residuals Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 40. 40 ёлдэгдэлийн Шинжилгээний ђл хамааралт байх нөхцөл ( Residual Analysis for Independence) Хамааралт ёл хамааралт X X residuals residuals X residuals  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 41. 41 House Price Model Residual Plot -60 -40 -20 0 20 40 60 80 0 1000 2000 3000 Square Feet Residuals ёлдэгдэлийн ђр дђн RESIDUAL OUTPUT Predicted House Price Residuals 1 251.92316 -6.923162 2 273.87671 38.12329 3 284.85348 -5.853484 4 304.06284 3.937162 5 218.99284 -19.99284 6 268.38832 -49.38832 7 356.20251 48.79749 8 367.17929 -43.17929 9 254.6674 64.33264 10 284.85348 -29.85348 Регрессийн урьдач нөхцөл хангагдаж байна Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 42. 42  Цаг хугацааны мэдээлэлд өмнөх цаг хугацааны тђвшингђђдннс хђчтэй хамаарч байвал автокорреляци байна гэж ђздэг  ёлдэгдэл хувьсагчид өмнөх цаг хугацааны тђвшингөөс хамаарах байдлыг автокорреляци Автокорреляци: Дурбин-Ватсоны статистик(Autocorrelation: The Durbin-Watson Statistic) Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 43. 43 Автокорреляци (Autocorrelation)  Автокорреляци гэдэг нь ђлдэгдэл (алдаа)-ийн хоорондоо хамааралтай бадал  Регрессийн урьдач нөхцөлийн нэг нь ђлдэгдэлђђд нь санамсаргђй ба ђл хамааралт байх Time (t) Residual Plot -15 -10 -5 0 5 10 15 0 2 4 6 8 Time (t) Residuals ёђнд, ђлдэгдэлђђд нь санамсаргђй биш, тодорхой мөчлөгт өөрчлөгдөж байна. Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 44. 44 Дурбин-Ватсоны шинжђђр (The Durbin-Watson Statistic)       n 1i 2 i n 2i 2 1ii e )ee( D  0 ≤ D ≤ 4 хооронд утга авна  D нь 2 орчимд байвал H0 ђнэн  D нь 2-оос бага бол эерэг автокореляци байж болох дохио, D нь 2-оос их бол сөрөг автокореляци байж болох дохио  Дурбин-Ватсоны шинжђђрийг ашиглан автокорреляци байгаа эсхийг шалгаж болно H0: ђлдэгдэлђђд хамааралгђй H1: автокореляци Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 45. 45 Эерэг Автокорреляцийг шалгах (Testing for Positive Autocorrelation)  Дурбин- Ватсоны тестийг тооцох = D Шийдвэр гаргах: хэрэв D < dL бол H0 няцаагдана H0: эерэг автокорреляци байгаа H1: эерэг автокорреляци байхгђй 0 dU 2dL Няцаана H0 Зөвшөөрнө H0 Дурбин-Ватсоны хђснэтгээс dL ба dU утгыг олох (тђђврийн хэмжээ n ба ђл хамааран хувьсагчийн тоо k) Inconclusive Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 46. 46  Тђђврийн хэмжээ n = 25 Durbin-Watson Calculations Sum of Squared Difference of Residuals 3296.18 Sum of Squared Residuals 3279.98 Durbin-Watson Statistic 1.00494 y = 30.65 + 4.7038x R 2 = 0.8976 0 20 40 60 80 100 120 140 160 0 5 10 15 20 25 30 Time Sales Эерэг Автокорреляцийг шалгах (Testing for Positive Autocorrelation) (continued) 1.00494 3279.98 3296.18 e )e(e D n 1i 2 i n 2i 2 1ii         Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 47. 47  n = 25 ба k = 1 буюу нэг ђл хамааран хувьсагч  Дурбин-Ватсоны хђснэгт, dL = 1.29 ба dU = 1.45  D = 1.00494 < dL = 1.29, учир эерэг автокореляцтай гэсэн таамаглалыг статистик ач холбогдолын тђвшинд H0 –ийг няцаана Эерэг Автокорреляцийг шалгах (Testing for Positive Autocorrelation) (continued) Шийдвэр: няцаана H0 D = 1.00494 < dL 0 dU=1.45 2dL=1.29 Reject H0 Do not reject H0Inconclusive Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 48. 48 Мэдрэмж буюу Slope  Регрессийн коэффициент (b1)-ийн стандарт алдааг дараах байдлаар ђнэлдэг    2 i YXYX b )X(X S SSX S S 1 ђђнд: = Мэдрэмжийн ђнэлэгдсэн стандарт алдаа = ёнэлгээний стандарт алдаа 1bS 2n SSE SYX   Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 49. 49 ёр дђн Regression Statistics Multiple R 0.76211 R Square 0.58082 Adjusted R Square 0.52842 Standard Error 41.33032 Observations 10 ANOVA df SS MS F Significance F Regression 1 18934.9348 18934.9348 11.0848 0.01039 Residual 8 13665.5652 1708.1957 Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 0.03297S 1b  Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 50. 50 Мэдрэмжийн Стандарт алдаа (Standard Errors of the Slope) Y X Y X 1bSsmall 1bSlarge нь мэдрэмжийн хазайлт ба регрессийн шугамыг өөрчлөх боломжтой байдаг 1bS Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 51. Мэдрэмжийн тухай тайлбар: t тест (Inference about the Slope: t Test)  Эх олонлогын мэдрэмж (slope) ђнэлэх t тест  X ба Y хооронд шугаман хамаарал байдаг уу?  Тэг ба альтарнатив таамаглал H0: β1 = 0 (шугаман хамааралгђй) H1: β1 ≠ 0 (шугаман хамааралтай)  Тестийн статистик 1b 11 S βb t   2nd.f.  ёђнд: b1 = регрессийн тэгшитгэлийн коэффициент β1 = таамаглалын мэдрэмж Sb1 = мэдрэмж (slope)-ийн стандарт алдаа 51Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 52. House Price in $1000s (y) Square Feet (x) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700 (sq.ft.)0.109898.25pricehouse  ёнэлэгдсэн регрессийн тэгшитгэл: Загварт ђнэлэгдсэн утга 0.1098 Талбайн хэмжээ нь байрны ђнэд нөлөөлөх хђчин зђйл мөн ђђ? Мэдрэмжийн тухай тайлбар: t тест (Inference about the Slope: t Test) (continued) 52Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 53. Мэдрэмжийн тухай тайлбар: t тестийн жишээ (Inference about the Slope: t Test Example) H0: β1 = 0 H1: β1 ≠ 0 ёр дђн: Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Square Feet 0.10977 0.03297 3.32938 0.01039 1bS t b1 32938.3 03297.0 010977.0 S βb t 1b 11      53Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 54. H0: β1 = 0 H1: β1 ≠ 0 Тестийн статистик: t = 3.329 Талбай хэмжээ нь байрны ђнэд нөлөөлөх хђчин зђйл мөн ёр дђн: Няцаана H0 Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Square Feet 0.10977 0.03297 3.32938 0.01039 1bS tb1 Шийдвэр: Дђгнэлт: Няцаана H0Няцаана H0 a/2=.025 -tα/2 Зөвшөөрнө H0 0 tα/2 a/2=.025 -2.3060 2.3060 3.329 d.f. = 10-2 = 8 (continued) 54Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС Мэдрэмжийн тухай тайлбар: t тестийн жишээ (Inference about the Slope: t Test Example)
  • 55. H0: β1 = 0 H1: β1 ≠ 0 P-утга = 0.01039 Талбай хэмжээ нь байрны ђнэд нөлөөлөх хђчин зђйл мөн ёр дђн: Coefficients Standard Error t Stat P-value Intercept 98.24833 58.03348 1.69296 0.12892 Square Feet 0.10977 0.03297 3.32938 0.01039 P-value Шийдвэр: P-value < α учир Дђгнэлт: (continued) Хоѐр-талт тестийн ђед p- утга тооцох P(t > 3.329)+P(t < -3.329) = 0.01039 ( 8 d.f.) 55Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС Няцаана H0 Мэдрэмжийн тухай тайлбар: t тестийн жишээ (Inference about the Slope: t Test Example)
  • 56. Регрессийн шинжилгээн дэхь F-тест  F тест: ђђнд MSE MSR F  1kn SSE MSE k SSR MSR    k ба (n – k - 1) чөлөөний зэргийн тоотой F тархалт ын утга, тооцооны F утгатай харьцуулж тооцно (k = регрессийн загвар дахь ђл хамааран хувьсагчийн тоо) 56Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 57. ёр дђн Regression Statistics Multiple R 0.76211 R Square 0.58082 Adjusted R Square 0.52842 Standard Error 41.33032 Observations 10 ANOVA df SS MS F Significance F Regression 1 18934.9348 18934.9348 11.0848 0.01039 Residual 8 13665.5652 1708.1957 Total 9 32600.5000 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 11.0848 1708.1957 18934.9348 MSE MSR F  1 ба 8 чөлөөний зэрэгийн тоо F-тестийн P-утга 57Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 58. H0: β0 = β1 = 0 H1: β0 ≠ β1 ≠ 0 a = 0.05 df1= 1 df2 = 8 Тестийн статистик: Шийдвэр: Дђгнэлт: α = 0.05 тђвшинд H0 няцаана Регрессийн коэффициентууд нэгэн зэрэг тэгтэй тэнцђђ биш0 a = .05 F.05 = 5.32 Няцаана H0Зөвшөрнө H0 11.08 MSE MSR F  Критик утга: Fa = 5.32 F-Тест (continued) F 58Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 59. Мэдрэмжийн Итгэх Интервал (Confidence Interval for the Slope) Мэдрэмжийн интервал ђнэлгээ: ёр дђн: 95% итгэх тђвшинд мэдрэмжийн итгэх интервал нь (0.0337, 0.1858) 1b2n1 Stb  Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 d.f. = n - 2 59Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 60. Талбайн хэмжээг нэг нэгжээр нэмэгдэхэд байрны ђнэ дундажаар 95% итгэх тђвшинд $33.70 -оос $185.80 нэмэгдэнэ Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386 Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580 Мэдрэмжийн Итгэх Интервал (Confidence Interval for the Slope) (continued) 60Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 61. Корреляцийн Коэффициентийг ђнэлэх t тест  Таамаглал H0: ρ = 0 ( X ба Y хооронд хамааралгђй) HA: ρ ≠ 0 (хамааралтай)  Статистик тест  ( n – 2 чөлөөний зэргийн тоо) 2n r1 ρ-r t 2    0bifrr 0bifrr where 1 2 1 2   61Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 62. Жишээ: Байрны талбай хэмжээ ба байрны ђнэ хооронд шугаман хамааралтай эсэхийг ђнэлэх H0: ρ = 0 (хамааралгђй) H1: ρ ≠ 0 (хамааралтай) a =.05 , df = 10 - 2 = 8 3.33 210 .7621 0.762 2n r1 ρr t 22          62Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 63. Жишээ: Тестийн ђр дђн Дђгнэлт: 5% ач холбогдолын тђвшинд шугаман хамааралтай Шийдвэр гаргах: H0 Няцаана Няцаана H0Няцаана H0 a/2=.025 -tα/2 Зөвшөөрнө H0 0 tα/2 a/2=.025 -2.3060 2.3060 3.33 d.f. = 10-2 = 8 3.33 210 .7621 0.762 2n r1 ρr t 22          63Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 64. Дундаж ба Таамагласан бодит утгын ђнэлгээ Y XXi Y = b0+b1Xi  Дундажийн итгэх интервал Бодит (хувийн) таамагласан итгэх интервал Y  64Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 65. Y-ийн дундаж утгын итгэх интервал Xi тухайлсан утгаар өгөгдсөн Y-ийн дундаж утгын ђнэлэгдсэн итгэх интервал Дундажаас хазайх хазайлтын квадрат утга, X ihtY YX2n XX|Y Sˆ :μ i          2 i 2 i 2 i i )X(X )X(X n 1 SSX )X(X n 1 h 65Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС Итгэх интервал
  • 66. Бодит Y-ийн таамагласан итгэх интервал Xi тухайлсан утгаар өгөгдсөн Y-ийн хувийн утгын ђнэлэгдсэн итгэх интервал iYX2n XX h1StYˆ :YforintervalConfidence i    66Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 67. Дундаж утгын ђнэлгээ: Жишээ 2,000 квадрат метр байрны дундаж ђнийн 95% интгэх интервал ёнэлэгдсэн утга Yi = 317.85 ($1,000)  μY|X=X ђнэлгээний итгэх интервал 37.12317.85 )X(X )X(X n 1 StYˆ 2 i 2 i YX2-n      Итгэх интервал нь $280,660 аас $354,900 67Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
  • 68. Бодит утгын ђнэлгээ: Жишээ 2,000 квадрат метр байрны бодит (хувийн) 95% таамагласан интервал ёнэлэгдсэн утга Yi = 317.85 ($1,000s)  YX=X Таамагласан интервалын ђнэлгээ 102.28317.85 )X(X )X(X n 1 1StYˆ 2 i 2 i YX1-n      Таамагласан интервал $215,500 аас $420,070 68Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС