15. Variaţia erorilor în jurul dreptei de regresie X 1 X 2 X Y f(e) Valorile y sînt normal distribu i te în jurul dreptei de regresie . Pentru fiecare valoare x , dispersia în jurul dreptei de regresie este constantă . Dreapta de regresie
16. Clasificarea modelelor de regresie Modele de regresie Linear Non- Linear 2+ Variabile explicative Simple Multiple Linear 1 Variabilă explicativă Non- Linear
17. Tipuri de modele de regresie Legătură liniară directă Legătură liniară inversă Legătură neliniară Absenţa vreunei legături
25. Dacă presupunem că media şi dispersia lui sînt 0 şi 2 , atunci media lui Y pentru o valoare particulară a lui X este dată de relaţia: Dispersia lui Y pentru o valoare particulară a lui X este dată de relaţia: Media şi dispersia variabilei dependente
28. Modelul de regresie liniară la nivelul populaţiei i = Eroarea Y X Valoarea observată Valoarea observată YX i X 0 1 Y X i i i 0 1 (E(Y))
29. Modelul de regresie liniară la nivelul eşantionului Y i = Valoarea estimată a lui Y pentru observaţia i X i = Valoarea lui X pentru observaţia i = Estimatorul termenului liber 0 = Estimatorul pantei 1
47. Descompunerea variaţiei X i Y i = β ^ 0 + β ^ 1 X i Y X Y SST = ( Y i - Y ) 2 SSE = ( Y i - Y i ) 2 SSR = ( Y i - Y ) 2 _ _ _
48. ANOVA pentru regresie S ST = SSR + SSE SST = Total Sum of Squares Măsoară variaţia valorilor observate Y i în jurul mediei Y _ SS R = Regression Sum of Squares Măsoară variaţia explicată de modelul de regresie SS E = Error Sum of Squares Măsoară variaţia ce poate fi atribuită altor factori, diferiţi de variabila explicativă X
49.
50.
51.
52.
53.
54. Coeficientul de determinaţie şi coeficientul de corelaţie liniară R 2 = 1, R 2 = 1, R 2 = .8, R 2 = 0, Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ r = +1 r = -1 r = +0.9 r = 0
55. Tabelul ANOVA Testul este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia varianţei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul acesta este cea de model nevalid. k-numărul de parametrii ai modelului
67. Predicţia pentru modelul particular de regresie dintre chirie şi suprafaţă Valoarea suprafeţei pentru un apartament Chiria prezisă de model pentru un apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria medie a unui apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria unui apartament cu suprafaţa de 100 m2
81. Profitability Competition Market awareness Customers Community Margin Rooms Nearest Office space College enrollment Income Disttwn Distance to downtown. Median household income. Distance to the nearest La Quinta inn. Number of hotels/motels rooms within 3 miles from the site. Physical
86. + + + + + + + + + + Residuals Time Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I negativa + + + + 0 0 Residuals Time + Autocorelatie de ordinul I negativa
87.
88. d L d U 2 0 4 4-d U 4-d L Auto corelatie Auto corelatie indecizie Indecizie Indepen denta Indepen denta
89.
90.
91.
92.
Hinweis der Redaktion
7
91
24 This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
52
105
115
118 The closer to the mean, the less variability. This is due to the variability in estimated slope parameters.
121
122 Note the 1 under the radical in the standard error formula. The effect of the extra Syx is to increase the width of the interval. This will be seen in the interval bands.
123 The error in predicting some future value of Y is the sum of 2 errors: 1. the error of estimating the mean Y , E(Y|X) 2. the random error that is a component of the value of Y to be predicted. Even if we knew the population regression line exactly, we would still make error.
124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx)