Regresie

Regresia – scurt istoric al termenului ,[object Object],[object Object],[object Object],[object Object]

Modele ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Tipuri de modele probabiliste Modele probabiliste Modele de regresie Modele de corelatie Alte modele

Regresia – metodă de modelare a legăturilor dintre variabile ,[object Object],[object Object],Variabila dependentă (variabila endogenă) Variabile independente (variabile exogene /explicative) Variabila rezidual ă

Exemplu: Legea lui Keynes privind legătura dintre venit şi consum ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ipotezele modelului de regresie (Ipotezele Gauss -Markov) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],E(  )=    +  x +  = (  +  ) +  x + (  -  )

Exemplu de încălcare a ipotezei de homoscedasticitate

[object Object],[object Object],[object Object],[object Object],[object Object]

Ipotezele de normalitate şi homoscedasticitate

Variaţia erorilor în jurul dreptei de regresie X 1 X 2 X Y f(e) Valorile y sînt normal distribu i te în jurul dreptei de regresie . Pentru fiecare valoare x , dispersia în jurul dreptei de regresie este constantă . Dreapta de regresie

Clasificarea modelelor de regresie Modele de regresie Linear Non- Linear 2+ Variabile explicative Simple Multiple Linear 1 Variabilă explicativă Non- Linear

Tipuri de modele de regresie Legătură liniară directă Legătură liniară inversă Legătură neliniară Absenţa vreunei legături

Modelul de regresie liniară simplă

Exemplu practic ,[object Object],[object Object]

Regresia folosind EXCEL Accesăm meniul TOOLS >DATA ANALYSIS>REGRESSION

Regresia folosind EXCEL Select ăm valorile variabilelor

Corelograma(Scatter plot) ,[object Object]

Modelul de regresie liniară simplă Y intercept ( termenul constant ) Panta dreptei de regresie Variabila de perturbaţie Variabila dependentă(răspuns) Variabila independentă (explicativă) ,[object Object],[object Object]

Dacă presupunem că media şi dispersia lui  sînt 0 şi  2 , atunci media lui Y pentru o valoare particulară a lui X este dată de relaţia: Dispersia lui Y pentru o valoare particulară a lui X este dată de relaţia: Media şi dispersia variabilei dependente

[object Object],[object Object],[object Object],[object Object]

Distribuţia condiţionată a lui Y Y X Dreapta de regresie

Modelul de regresie liniară la nivelul populaţiei  i = Eroarea Y X Valoarea observată Valoarea observată    YX i X   0 1 Y X i i i       0 1 (E(Y))

Modelul de regresie liniară la nivelul eşantionului Y i  = Valoarea estimată a lui Y pentru observaţia i X i = Valoarea lui X pentru observaţia i = Estimatorul termenului liber  0 = Estimatorul pantei  1

Estimarea parametrilor modelului de regresie ,[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object]

Estimatorii modelului de regresie

Notaţii ,[object Object],[object Object]

[object Object],[object Object],Estimatorul dispersiei modelului

Propriet ăţile estimatorilor modelului de regresie

Distribuţia estimatorului pantei de regresie ,[object Object],[object Object],[object Object],[object Object],[object Object],Sampling Distribution  1  1 S ^ ^

Eroarea standard a estimatorilor Erorile standard vor fi folosite la testarea semnificaţiei parametrilor modelului de regresie

Testul t pentru panta dreptei de regresie(slope) ,[object Object],[object Object]

Exemple de acceptare a ipotezei

Exemple de respingere a ipotezei

Testul t pentru termenul liber(intercept) ,[object Object]

Intervale de încredere pentru parametrii modelului ,[object Object],[object Object],[object Object]

Teorema Gauss-Markov ,[object Object]

Exemplu-chiria ca func ţie de suprafaţă ,[object Object],[object Object],[object Object],[object Object]

Analiza varianţei pentru modelul de regresie ,[object Object],[object Object],[object Object]

Descompunerea variaţiei X i Y i = β ^ 0 + β ^ 1 X i Y X Y SST =  ( Y i - Y ) 2 SSE =  ( Y i - Y i ) 2  SSR =  ( Y i - Y ) 2   _ _ _

ANOVA pentru regresie S ST = SSR + SSE SST = Total Sum of Squares Măsoară variaţia valorilor observate Y i în jurul mediei Y _ SS R = Regression Sum of Squares Măsoară variaţia explicată de modelul de regresie SS E = Error Sum of Squares Măsoară variaţia ce poate fi atribuită altor factori, diferiţi de variabila explicativă X

Coeficientul de determinaţie R 2 ,[object Object],[object Object]

Exemplu-chiria ca func ţie de suprafaţă ,[object Object]

Observaţii ,[object Object],[object Object]

Foarte important!! ,[object Object],[object Object],[object Object],[object Object]

Coeficientul de determinaţie şi coeficientul de corelaţie liniară R 2 = 1, R 2 = 1, R 2 = .8, R 2 = 0, Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ r = +1 r = -1 r = +0.9 r = 0

Tabelul ANOVA Testul este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia varianţei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul acesta este cea de model nevalid. k-numărul de parametrii ai modelului

Predicţia folosind modelul de regresie ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Interval de încredere pentru media lui Y

Factori care afectează lungimea intervalului de încredere ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Distanţa lui X p faţă de media  X Dispersie mai mare decît la X 1  X

Exemplu ,[object Object],[object Object],[object Object],[object Object]

Soluţie Valoarea particulară pentru X

Interval de predicţie pentru valori particulare

Predicţia pentru modelul particular de regresie dintre chirie şi suprafaţă Valoarea suprafeţei pentru un apartament Chiria prezisă de model pentru un apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria medie a unui apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria unui apartament cu suprafaţa de 100 m2

Verificarea ipotezelor privind variabila reziduala ,[object Object],[object Object]

Standardized residual i = Residual i / Standard deviation

Variabilele reziduale sînt necorelate?

[object Object],[object Object],+ + + + + + + + + + + + + + + + + + + + + + + + y ^ Residual Imprastierea creste odata cu y ^ y + + + + + + + + + + + + + + + + + + + + + + +

[object Object],+ + + + + + + + + + + + + + + + + + + + + + + + y ^ Residual ^ y + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + Time Residual Residual Time + + + Independenta erorilor in timp Tipuri de variabila reziduala care indica exixtenta autocorelatiei erorilor In timp. 0 0

Regresie multipla ,[object Object],Coeficienti de regresie Variabila eroare Variabila Dependenta Variabile Independente

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Examplu Stabilirea locatiei unui hotel

Profitability Competition Market awareness Customers Community Margin Rooms Nearest Office space College enrollment Income Disttwn Distance to downtown. Median household income. Distance to the nearest La Quinta inn. Number of hotels/motels rooms within 3 miles from the site. Physical

[object Object],[object Object],[object Object]

MARGIN = 72.455 - 0.008 ROOMS - 1.646 NEAREST + 0.02 OFFICE +0.212 COLLEGE - 0.413 INCOME + 0.225 DISTTWN

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],MARGIN = 72.455 - 0.008 (3815) - 1.646 (3.4) + 0.02( 476) +0.212 (24.5) - 0.413( 39) + 0.225 (3.6) = 37.1%

+ + + + + + + + + + Residuals Time Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I negativa + + + + 0 0 Residuals Time + Autocorelatie de ordinul I negativa

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

d L d U 2 0 4 4-d U 4-d L Auto corelatie Auto corelatie indecizie Indecizie Indepen denta Indepen denta

Variabile calitative ,[object Object],[object Object],[object Object],1 if a first condition out of two is met 0 if a second condition out of two is met I= 1 if data were collected before 1980 0 if data were collected after 1980 1 if the temperature was below 50 o 0 if the temperature was 50 o or more 1 if a degree earned is in Finance 0 if a degree earned is not in Finance

Variabile calitative ,[object Object],[object Object],[object Object],[object Object],[object Object],I 1 = 1 if the color is white 0 if the color is not white I 2 = 1 if the color is silver 0 if the color is not silver

[object Object],White car Other color Silver color

Regresie

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie Regresie

Ähnlich wie Regresie (17)

Regresie

Hinweis der Redaktion