SlideShare ist ein Scribd-Unternehmen logo
1 von 92
REGRESIE SI CORELATIE
Regresia  – scurt istoric al termenului ,[object Object],[object Object],[object Object],[object Object]
Modele ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Tipuri de modele probabiliste Modele probabiliste Modele de regresie Modele de corelatie Alte  modele
Regresia – metodă de modelare a legăturilor dintre variabile ,[object Object],[object Object],Variabila dependentă (variabila endogenă) Variabile independente (variabile exogene /explicative) Variabila rezidual ă
Exemplu: Legea lui Keynes privind legătura dintre venit şi consum ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Ipotezele modelului de regresie (Ipotezele Gauss -Markov) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Modele ce pot fi linearizate
[object Object],[object Object],[object Object],[object Object],E(  )=         +   x +    = (  +  ) +   x + (  -  )
Exemplu de încălcare a ipotezei de homoscedasticitate
[object Object],[object Object],[object Object],[object Object],[object Object]
Ipotezele de normalitate şi homoscedasticitate
Variaţia erorilor în jurul dreptei de regresie X 1 X 2 X Y f(e) Valorile y   sînt  normal  distribu i te  în jurul dreptei de regresie . Pentru fiecare valoare x ,  dispersia   în jurul dreptei de regresie este  constantă . Dreapta de regresie
Clasificarea modelelor de regresie Modele de regresie Linear Non- Linear 2+   Variabile explicative Simple Multiple Linear 1  Variabilă explicativă Non- Linear
Tipuri de modele de regresie   Legătură liniară directă Legătură liniară inversă Legătură neliniară Absenţa vreunei legături
Modelul de regresie liniară simplă
Exemplu practic ,[object Object],[object Object]
Regresia folosind EXCEL Accesăm meniul TOOLS >DATA ANALYSIS>REGRESSION
Regresia folosind EXCEL Select ăm valorile variabilelor
 
Corelograma(Scatter plot) ,[object Object]
Modelul de regresie liniară simplă Y  intercept ( termenul constant ) Panta dreptei de regresie Variabila de perturbaţie Variabila dependentă(răspuns) Variabila independentă (explicativă) ,[object Object],[object Object]
Dacă presupunem că media şi dispersia lui      sînt  0  şi    2 ,  atunci media lui Y pentru o valoare particulară a lui X este dată de relaţia: Dispersia lui Y pentru o valoare particulară a lui X este dată de relaţia: Media şi dispersia variabilei dependente
[object Object],[object Object],[object Object],[object Object]
Distribuţia condiţionată a lui Y Y X Dreapta de regresie
Modelul de regresie liniară la nivelul populaţiei  i =  Eroarea Y X Valoarea observată Valoarea observată    YX i X   0 1 Y X i i i       0 1 (E(Y))
Modelul de regresie liniară la nivelul eşantionului Y i   =  Valoarea estimată a lui   Y   pentru observaţia   i X i  =  Valoarea lui   X  pentru observaţia   i =  Estimatorul termenului liber    0 =  Estimatorul pantei    1
Estimarea parametrilor modelului de regresie ,[object Object],[object Object],[object Object],[object Object]
Ilustrare grafică
[object Object],[object Object]
Estimatorii modelului de regresie
Notaţii ,[object Object],[object Object]
[object Object],[object Object],Estimatorul dispersiei modelului
Propriet ăţile estimatorilor modelului de regresie
Distribuţia estimatorului pantei de regresie ,[object Object],[object Object],[object Object],[object Object],[object Object],Sampling Distribution  1  1 S ^ ^
Eroarea standard a estimatorilor Erorile standard vor fi folosite la testarea semnificaţiei parametrilor modelului de regresie
Testul t pentru panta dreptei de regresie(slope) ,[object Object],[object Object]
Exemple de acceptare a ipotezei
Exemple de respingere a ipotezei
Testul t pentru termenul liber(intercept) ,[object Object]
Intervale de încredere pentru parametrii modelului ,[object Object],[object Object],[object Object]
Teorema Gauss-Markov ,[object Object]
Exemplu-chiria ca func ţie de suprafaţă ,[object Object],[object Object],[object Object],[object Object]
Analiza varianţei pentru modelul de regresie ,[object Object],[object Object],[object Object]
Descompunerea variaţiei X i Y i  =  β ^ 0  +  β ^ 1 X i Y X Y SST  =    ( Y i   -   Y ) 2 SSE  =  ( Y i   -   Y i  ) 2    SSR  =   ( Y i  -   Y ) 2     _ _ _
ANOVA pentru regresie S ST  =   SSR  +   SSE SST   =   Total Sum of Squares   Măsoară variaţia valorilor observate  Y i   în jurul mediei   Y _ SS R   =   Regression  Sum of Squares   Măsoară variaţia explicată de modelul de regresie SS E   =   Error  Sum of Squares   Măsoară variaţia ce poate fi atribuită altor factori, diferiţi de variabila explicativă X
 
Coeficientul de determinaţie R 2 ,[object Object],[object Object]
Exemplu-chiria ca func ţie de suprafaţă ,[object Object]
Observaţii ,[object Object],[object Object]
Foarte important!! ,[object Object],[object Object],[object Object],[object Object]
Coeficientul de determinaţie şi coeficientul de corelaţie liniară   R 2  = 1, R 2  = 1, R 2  = .8, R 2  = 0, Y Y i =  b 0 +  b 1 X i X ^ Y Y i =  b 0 +  b 1 X i X ^ Y Y i =  b 0 +  b 1 X i X ^ Y Y i =  b 0 +  b 1 X i X ^ r  = +1 r  = -1 r  = +0.9 r  = 0
Tabelul ANOVA Testul  este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia varianţei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul acesta este cea de model nevalid. k-numărul de parametrii ai modelului
ANOVA
Predicţia folosind modelul de regresie ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Ce prezicem
Interval de încredere pentru media lui Y
Factori care afectează lungimea intervalului de încredere ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Distanţa lui   X p   faţă de media  X Dispersie mai mare decît la   X 1  X
Exemplu ,[object Object],[object Object],[object Object],[object Object]
Soluţie Valoarea particulară pentru X
Interval de predicţie pentru valori particulare
Predicţia
Hyperbolic Interval Bands
Predicţia pentru modelul particular de regresie dintre chirie şi suprafaţă Valoarea suprafeţei pentru un apartament Chiria prezisă de model pentru un apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria medie a unui apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria unui apartament cu suprafaţa de 100 m2
Verificarea ipotezelor privind variabila reziduala ,[object Object],[object Object]
Standardized residual i = Residual i / Standard deviation
 
Normal Probability Plot
 
Variabilele reziduale sînt necorelate?
 
[object Object],[object Object],+ + + + + + + + + + + + + + + + + + + + + + + + y ^ Residual Imprastierea creste odata cu  y ^ y + + + + + + + + + + + + + + + + + + + + + + +
[object Object],+ + + + + + + + + + + + + + + + + + + + + + + + y ^ Residual ^ y + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ + + + + + + + + + + + + + + + + + + + + + + + + Time Residual Residual Time + + + Independenta erorilor in timp Tipuri de variabila reziduala care indica exixtenta autocorelatiei erorilor In timp. 0 0
REGRESIE MULTIPLA
Regresie multipla ,[object Object],Coeficienti de  regresie Variabila eroare  Variabila Dependenta  Variabile Independente
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Examplu  Stabilirea locatiei unui hotel
Profitability Competition Market  awareness Customers Community Margin Rooms Nearest Office space College enrollment Income Disttwn Distance to downtown. Median household income. Distance to the nearest La Quinta inn. Number of  hotels/motels rooms within  3 miles from  the site. Physical
[object Object],[object Object],[object Object]
MARGIN  = 72.455  -  0.008 ROOMS   - 1.646 NEAREST    + 0.02 OFFICE  +0.212 COLLEGE    - 0.413 INCOME  + 0.225 DISTTWN
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],MARGIN  = 72.455  -  0.008 (3815)   - 1.646 (3.4)  + 0.02( 476)   +0.212 (24.5)  - 0.413( 39)  + 0.225 (3.6) = 37.1%
Testul Durbin - Watson
+ + + + + + + + + + Residuals Time Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I negativa + + + + 0 0 Residuals Time + Autocorelatie de ordinul I negativa
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
d L d U 2 0 4 4-d U 4-d L Auto corelatie Auto corelatie indecizie Indecizie Indepen denta Indepen denta
Variabile calitative ,[object Object],[object Object],[object Object],1  if a first condition out of two is met 0  if a second condition out of two is met I= 1  if data were collected before 1980 0  if data were collected after 1980 1  if the temperature was below 50 o 0  if the temperature was 50 o  or more 1  if a degree earned is in Finance 0  if a degree earned is not in Finance
Variabile calitative ,[object Object],[object Object],[object Object],[object Object],[object Object],I 1  = 1 if the color is white 0 if the color is not white I 2  = 1 if the color is silver 0 if the color is not silver
[object Object],White car Other color Silver color
 

Weitere ähnliche Inhalte

Was ist angesagt?

Curs12 ipoteze dv (1)
Curs12 ipoteze dv (1)Curs12 ipoteze dv (1)
Curs12 ipoteze dv (1)
Suciu Bogdan
 
Cangurul si ornitorincul_clasa_6
Cangurul si ornitorincul_clasa_6Cangurul si ornitorincul_clasa_6
Cangurul si ornitorincul_clasa_6
Cristiano Ionut
 
53510163 caiet-aplicatii-analiza-economico-f
53510163 caiet-aplicatii-analiza-economico-f53510163 caiet-aplicatii-analiza-economico-f
53510163 caiet-aplicatii-analiza-economico-f
Alexandru Costache
 
Transformarea stea – triunghi si triunghi stea rezistoare
Transformarea stea – triunghi si triunghi stea rezistoareTransformarea stea – triunghi si triunghi stea rezistoare
Transformarea stea – triunghi si triunghi stea rezistoare
neculaitarabuta
 
Managementul carierei
Managementul cariereiManagementul carierei
Managementul carierei
Rodica B
 

Was ist angesagt? (20)

37349360 mecanismul-financiar
37349360 mecanismul-financiar37349360 mecanismul-financiar
37349360 mecanismul-financiar
 
Lucrare de licență contabilitatea și gestiunea trezoreriei .
Lucrare de licență contabilitatea și gestiunea trezoreriei . Lucrare de licență contabilitatea și gestiunea trezoreriei .
Lucrare de licență contabilitatea și gestiunea trezoreriei .
 
Regresia
RegresiaRegresia
Regresia
 
Recenzie (varianta completa)
Recenzie (varianta completa)Recenzie (varianta completa)
Recenzie (varianta completa)
 
Managementul proiectelor
Managementul proiectelorManagementul proiectelor
Managementul proiectelor
 
Formule trigonometrie liceu
Formule trigonometrie liceuFormule trigonometrie liceu
Formule trigonometrie liceu
 
Analiza rentabilitatii
Analiza rentabilitatiiAnaliza rentabilitatii
Analiza rentabilitatii
 
4 organizarea structurala
4 organizarea  structurala4 organizarea  structurala
4 organizarea structurala
 
Curs12 ipoteze dv (1)
Curs12 ipoteze dv (1)Curs12 ipoteze dv (1)
Curs12 ipoteze dv (1)
 
Finante internationale teste grila
Finante internationale teste grilaFinante internationale teste grila
Finante internationale teste grila
 
Educatie Financiara pentru ONG-uri - Planificare financiara
Educatie Financiara pentru ONG-uri - Planificare financiaraEducatie Financiara pentru ONG-uri - Planificare financiara
Educatie Financiara pentru ONG-uri - Planificare financiara
 
Cangurul si ornitorincul_clasa_6
Cangurul si ornitorincul_clasa_6Cangurul si ornitorincul_clasa_6
Cangurul si ornitorincul_clasa_6
 
sinteza formule trigonometrie
sinteza formule trigonometriesinteza formule trigonometrie
sinteza formule trigonometrie
 
Acizii nucleici 2
Acizii nucleici 2Acizii nucleici 2
Acizii nucleici 2
 
Formule matematice cls. v viii in doua pagini
Formule matematice cls. v   viii in doua paginiFormule matematice cls. v   viii in doua pagini
Formule matematice cls. v viii in doua pagini
 
53510163 caiet-aplicatii-analiza-economico-f
53510163 caiet-aplicatii-analiza-economico-f53510163 caiet-aplicatii-analiza-economico-f
53510163 caiet-aplicatii-analiza-economico-f
 
Autocorrelation (1)
Autocorrelation (1)Autocorrelation (1)
Autocorrelation (1)
 
Transformarea stea – triunghi si triunghi stea rezistoare
Transformarea stea – triunghi si triunghi stea rezistoareTransformarea stea – triunghi si triunghi stea rezistoare
Transformarea stea – triunghi si triunghi stea rezistoare
 
Elaborarea si managementul proiectelor
Elaborarea si managementul proiectelorElaborarea si managementul proiectelor
Elaborarea si managementul proiectelor
 
Managementul carierei
Managementul cariereiManagementul carierei
Managementul carierei
 

Ähnlich wie Regresie (16)

44657669 econometrie-aplicata-in-finante
44657669 econometrie-aplicata-in-finante44657669 econometrie-aplicata-in-finante
44657669 econometrie-aplicata-in-finante
 
9 statistica desriptiva
9 statistica desriptiva9 statistica desriptiva
9 statistica desriptiva
 
curs4-curs-5-curs6.pdf
curs4-curs-5-curs6.pdfcurs4-curs-5-curs6.pdf
curs4-curs-5-curs6.pdf
 
Curs02 (2014)
Curs02 (2014)Curs02 (2014)
Curs02 (2014)
 
Curs regresie statistica economica
Curs regresie statistica economicaCurs regresie statistica economica
Curs regresie statistica economica
 
Elemente de statistica
Elemente de statisticaElemente de statistica
Elemente de statistica
 
C4 regr lin multipla
C4 regr lin multiplaC4 regr lin multipla
C4 regr lin multipla
 
C4 regr lin multipla
C4 regr lin multiplaC4 regr lin multipla
C4 regr lin multipla
 
Metoda backtracking(1)
Metoda backtracking(1)Metoda backtracking(1)
Metoda backtracking(1)
 
Curs7 econometrie regr_neliniara 2013
Curs7 econometrie regr_neliniara 2013Curs7 econometrie regr_neliniara 2013
Curs7 econometrie regr_neliniara 2013
 
Indicatori statistici
Indicatori statisticiIndicatori statistici
Indicatori statistici
 
Compunerea oscilatiilor perpendiculare
Compunerea oscilatiilor perpendiculareCompunerea oscilatiilor perpendiculare
Compunerea oscilatiilor perpendiculare
 
Curs 3
Curs 3Curs 3
Curs 3
 
Distributia multinomiala
Distributia multinomialaDistributia multinomiala
Distributia multinomiala
 
2013 econometrie c04_2013
2013 econometrie c04_20132013 econometrie c04_2013
2013 econometrie c04_2013
 
2013 econometrie c05_c06_2013
2013 econometrie c05_c06_20132013 econometrie c05_c06_2013
2013 econometrie c05_c06_2013
 

Regresie

  • 2.
  • 3.
  • 4.
  • 5. Tipuri de modele probabiliste Modele probabiliste Modele de regresie Modele de corelatie Alte modele
  • 6.
  • 7.
  • 8.
  • 9.
  • 10. Modele ce pot fi linearizate
  • 11.
  • 12. Exemplu de încălcare a ipotezei de homoscedasticitate
  • 13.
  • 14. Ipotezele de normalitate şi homoscedasticitate
  • 15. Variaţia erorilor în jurul dreptei de regresie X 1 X 2 X Y f(e) Valorile y sînt normal distribu i te în jurul dreptei de regresie . Pentru fiecare valoare x , dispersia în jurul dreptei de regresie este constantă . Dreapta de regresie
  • 16. Clasificarea modelelor de regresie Modele de regresie Linear Non- Linear 2+ Variabile explicative Simple Multiple Linear 1 Variabilă explicativă Non- Linear
  • 17. Tipuri de modele de regresie Legătură liniară directă Legătură liniară inversă Legătură neliniară Absenţa vreunei legături
  • 18. Modelul de regresie liniară simplă
  • 19.
  • 20. Regresia folosind EXCEL Accesăm meniul TOOLS >DATA ANALYSIS>REGRESSION
  • 21. Regresia folosind EXCEL Select ăm valorile variabilelor
  • 22.  
  • 23.
  • 24.
  • 25. Dacă presupunem că media şi dispersia lui  sînt 0 şi  2 , atunci media lui Y pentru o valoare particulară a lui X este dată de relaţia: Dispersia lui Y pentru o valoare particulară a lui X este dată de relaţia: Media şi dispersia variabilei dependente
  • 26.
  • 27. Distribuţia condiţionată a lui Y Y X Dreapta de regresie
  • 28. Modelul de regresie liniară la nivelul populaţiei  i = Eroarea Y X Valoarea observată Valoarea observată    YX i X   0 1 Y X i i i       0 1 (E(Y))
  • 29. Modelul de regresie liniară la nivelul eşantionului Y i  = Valoarea estimată a lui Y pentru observaţia i X i = Valoarea lui X pentru observaţia i = Estimatorul termenului liber  0 = Estimatorul pantei  1
  • 30.
  • 32.
  • 34.
  • 35.
  • 36. Propriet ăţile estimatorilor modelului de regresie
  • 37.
  • 38. Eroarea standard a estimatorilor Erorile standard vor fi folosite la testarea semnificaţiei parametrilor modelului de regresie
  • 39.
  • 40. Exemple de acceptare a ipotezei
  • 41. Exemple de respingere a ipotezei
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47. Descompunerea variaţiei X i Y i = β ^ 0 + β ^ 1 X i Y X Y SST =  ( Y i - Y ) 2 SSE =  ( Y i - Y i ) 2  SSR =  ( Y i - Y ) 2   _ _ _
  • 48. ANOVA pentru regresie S ST = SSR + SSE SST = Total Sum of Squares Măsoară variaţia valorilor observate Y i în jurul mediei Y _ SS R = Regression Sum of Squares Măsoară variaţia explicată de modelul de regresie SS E = Error Sum of Squares Măsoară variaţia ce poate fi atribuită altor factori, diferiţi de variabila explicativă X
  • 49.  
  • 50.
  • 51.
  • 52.
  • 53.
  • 54. Coeficientul de determinaţie şi coeficientul de corelaţie liniară R 2 = 1, R 2 = 1, R 2 = .8, R 2 = 0, Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ Y Y i = b 0 + b 1 X i X ^ r = +1 r = -1 r = +0.9 r = 0
  • 55. Tabelul ANOVA Testul este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia varianţei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul acesta este cea de model nevalid. k-numărul de parametrii ai modelului
  • 56. ANOVA
  • 57.
  • 59. Interval de încredere pentru media lui Y
  • 60.
  • 61. Distanţa lui X p faţă de media  X Dispersie mai mare decît la X 1  X
  • 62.
  • 64. Interval de predicţie pentru valori particulare
  • 67. Predicţia pentru modelul particular de regresie dintre chirie şi suprafaţă Valoarea suprafeţei pentru un apartament Chiria prezisă de model pentru un apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria medie a unui apartament cu suprafaţa de 100 m2 Interval de încredere pentru chiria unui apartament cu suprafaţa de 100 m2
  • 68.
  • 69. Standardized residual i = Residual i / Standard deviation
  • 70.  
  • 72.  
  • 74.  
  • 75.
  • 76.
  • 77. + + + + + + + + + + + + + + + + + + + + + + + + + Time Residual Residual Time + + + Independenta erorilor in timp Tipuri de variabila reziduala care indica exixtenta autocorelatiei erorilor In timp. 0 0
  • 79.
  • 80.
  • 81. Profitability Competition Market awareness Customers Community Margin Rooms Nearest Office space College enrollment Income Disttwn Distance to downtown. Median household income. Distance to the nearest La Quinta inn. Number of hotels/motels rooms within 3 miles from the site. Physical
  • 82.
  • 83. MARGIN = 72.455 - 0.008 ROOMS - 1.646 NEAREST + 0.02 OFFICE +0.212 COLLEGE - 0.413 INCOME + 0.225 DISTTWN
  • 84.
  • 85. Testul Durbin - Watson
  • 86. + + + + + + + + + + Residuals Time Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I pozitiva Autocorelatie de ordinul I negativa + + + + 0 0 Residuals Time + Autocorelatie de ordinul I negativa
  • 87.
  • 88. d L d U 2 0 4 4-d U 4-d L Auto corelatie Auto corelatie indecizie Indecizie Indepen denta Indepen denta
  • 89.
  • 90.
  • 91.
  • 92.  

Hinweis der Redaktion

  1. 7
  2. 91
  3. 24 This teleology is based on the number of explanatory variables & nature of relationship between X & Y.
  4. 52
  5. 105
  6. 115
  7. 118 The closer to the mean, the less variability. This is due to the variability in estimated slope parameters.
  8. 121
  9. 122 Note the 1 under the radical in the standard error formula. The effect of the extra Syx is to increase the width of the interval. This will be seen in the interval bands.
  10. 123 The error in predicting some future value of Y is the sum of 2 errors: 1. the error of estimating the mean Y , E(Y|X) 2. the random error that is a component of the value of Y to be predicted. Even if we knew the population regression line exactly, we would still make  error.
  11. 124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx)