Apuntes de econometría i (segunda parte)

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA

Regresión con dos variables, estimación de intervalos y prueba de hipótesis:

La teoría de la estimación consta de dos partes, la estimación puntual y la estimación de intervalos. La
primera se ha analizado en los capítulos anteriores, y la segunda se desarrolla a continuación.

*Prerrequisitos estadísticos y estimación de intervalos, algunas ideas básicas: control de lectura

Intervalos de confianza para  1 y  2 :

Donde (1-  ) es el coeficiente de confianza, y el nivel de significación, t es la distribución de “Student” y
t  es el valor crítico que se lee en las tablas con (n – 2) grados de libertad (g de l.), y un nivel
2

significación de .
2

De acuerdo al teorema 5:

Zi
T= 1/ 2
 Z2 
 
 k 

        
 2  2   2  2   2  2 
Z1         
   
1/ 2
 2 
1/ 2

Var   2   
   x 2 
 i   xi 
2 1/ 2

 2

Z 2  n  2 2


  
  2   2   xi2
1/ 2  


  2   2   xi
2

1/ 2

     


  2   2   xi
2

1/ 2

t= 
1/ 2
 

 

  2 
 
 n  2 
 n  2 2  

 


  
 2  2 
t=  
 
ee  2 
 

Pr  t / 2  t  t / 2   1   

Felipe Lemarie Jorge Salgado Juan C. Serrano


    
  2  2  
Pr  t / 2     t   1   
 /2
    
ee  2 

   


         
Pr  t / 2 ee  2     2   2   t / 2 ee  2   1   
      

         
Pr t / 2 ee  2     2   2   t / 2 ee  2   1   
      

    
  
Pr  2  t / 2 ee  2    2   2  t / 2 ee  2   1   
    

Pasa cerca del origen
    
  
Pr  2  t / 2 ee  2    2   2  t / 2 ee  2   1   
    

  
  
Pr 1  t / 2 ee 1   1  1  t / 2 ee 1   1   
    

Ejemplo con la muestra 1:

 2  0.5091 ee(  )  0.0375
ˆ ˆ2

8 g de l   5%

Al 95% de nivel de confianza,
t0.025  2.306

Pt 0.509  2.306(0.0357)   2  0.509  2.306(0.0357)  95%

Pt (0.4268   2  0.5917)  95%

Quiere decir que el 95% de los intervalos obtenidos de las 7.5 * 10^10 muestras contendrán al verdadero  2
. El intervalo anterior tiene el 95% de probabilidad de contener el verdadero  2 .

Intervalo de confianza para  2 :

Se define como:



 
Pr 2     2  2   (1   )

 1 
  2  2 

Donde 2  
y 2 son los valores críticos que se lee en las tablas con (n-2) grados de libertad g. l.

 1
 

 2  2
 2

Para muestra caso:   (n  2) 2 2



 2 
2  2 
Pr  1   (n  2) 2    (1   )
  2   


2



 
1 2 1 
Pr  2   2   (1   )
  1  2 
  2  (n  2)  
 2 

  2  2    2  2 
 (n  2)  (n  2)    (n  2)  (n  2)  
Pr    2
  (1   ) Pr   
2
  (1   )
 2  
2   2  2   
(1 )
  1 .. 
  2 
  ( )  
 
 2
2 2

Ejemplo: con la muestra 1;

 2
 = 42,1591; 8 g.l   5%

 8 * 42.1591  2 8 * 42.1591 19.2347  2 154.7336 
Pr      95% Pr      95%
 17.5346 1 2.1797   1 1 1 

Control de lectura: Prueba de Hipótesis comentarios generales.

Quiere decir que el 95% de los intervalos
obtenidos de las 7.5 * 10^10 muestras
contendrán al verdadero  2 . El intervalo
anterior tiene el 95% de probabilidad de
contener el verdadero  2 .



Prueba de hipótesis: método del intervalo de confianza.

Prueba de dos colas:

Se construye un intervalo de confianza para  2 al 95%. Si  2 bajo la H 0 se encuentra dentro de este
intervalo no se rechaza la H 0 (se acepta la hipótesis nula), pero si esta fuera del intervalo, se rechaza la H 0
(aceptar la H 1 ).

Ejemplo: se conoce que  2 =0.5091, pero se postula que:
H 0 :  2 =0,3 → Hipótesis simple

H 1 :  2  0,3 → Hipótesis compuesta


Entonces, es el  2 compatible con la H 0 ?
Para responder acudimos al intervalo de confianza obtenido anteriormente:

“En última instancia nos tenemos que comparar con los valores poblacionales.”

Pr 0,4268   2  0,5914  95%

Pr 0,4268  0,3  0,5914  95%

La H 0 está fuera del intervalo, se rechaza la H 0 (se acepta H 1 ) al 95% de confianza. (HACER LO MISMO

CON 1 Y CON LAMUESTRA 2)
Prueba de 1 cola:

Se determina de acuerdo al planteamiento de la H 1 . Nuevamente se conoce que  2 =0.5091 pero se
postula que H 0 :  2  0.3 ; H 1 :  2  0.3 .

Pr(0.42   2  0.5914) =95%
La H 0 esta fuera del intervalo, se rechaza H 0 (se acepta H 1 ) al 95% de confianza.

Prueba de hipótesis: método de la prueba de significación

Es un procedimiento mediante el cual se utiliza los resultados muéstrales para verificar la verdad o falsedad
de una H o a través de la t de Student

Prueba de dos colas:

Pr(t   t  t  )  (1   )
2 2



   *
 
     
 2 2
Pr  t 



  t   (1   )

 2 ee(  ) 2

 2 
 

 *       
Pr   2  t ee  2    2   2  t ee  2   1   
*

 2   2  
*
Donde  es el valor de  bajo la H o ,  t  y t  son los valores críticos. El intervalo es conocido como
2 2 2 2
la “región de aceptación” de la H o y las regiones fuera del intervalo se llama “región de rechazo” o
“regiones criticas” de la H o

 
Ejemplo: 2  0.5091 ee(  )  0.0375
2
8g. de l t 0.025  2.306

Se puede utilizar las 2 formas:

La primera:

H o :  2  0,3
*
H 1 :  2  0,3
*

 0,509  0,3 
Pr   2,306   2,306   95%
 0,0357 

Pr  2,306  5,86  2,306  95%

Región de
Rechazo H o

Región de
Rechazo H o

Se rechaza la hipótesis nula y en consecuencias se acepta la H 1 .



La segunda:

* *
H o    0.3 H 1    0.3
2 2

 

Pr 0.3  2.306(0.0375)    0.3  2.306(0.0375)  95%
2
 

Pr(0.2177    0.3823)  95%
2

Pr(0.2177  0.509  0.3823)  95%

Región de
Rechazo H o
2,5% Región
de rechazo H o

0,2177 0,3 0,3823
3
0,509

Se dice que una prueba es estadísticamente significativa si el valor del estadígrafo de prueba cae en la región
de rechazo de la H 0 ; y una prueba es estadísticamente no significativa si el valor del estadígrafo de la
prueba cae en la región de aceptación H 0

Prueba de una cola:

El procedimiento es similar, cambia en el planteamiento de las hipótesis.

Ejemplo: muestra 1.
 2  0.5091 ee(  )  0.0375 ; 8 g de l
ˆ ˆ2

t 0.05  1.86

H 0 :  2  0,3 → Hipótesis simple
*

H 1 :  2  0,3 → Hipótesis compuesta
*

Así mismo, se pueden utilizar las dos formas:



La primera:

2  2
*
0,509  0,3
t 

ee(  2 ) 0,0357

Rechazo a H 0

8 grados de
libertad.
Se rechaza H 0 y se acepta H 1

La segunda:

 * 

2  2  t  ee(  )  0.34  1.86(0.0357)  0.3644
2

Rechazo a H 0



Prueba de significación para  2

 
Pr 2     2  2   (1   )

 1 
  2  2 

 2

  (n  2) 2
2



Ejemplo con la muestra 1:

2
 = 42.1591 8 g de l

 =5%

H 0 :  2 =85 → Hipótesis simple

H 1 :  2  85 → Hipótesis compuesta

42.1591
2  8 *  3.97
85

Pr 2.1797  3.97  17.5346  95% Se acepta H 0

Regla práctica “2-t” (Ho : Bi = 0)

Es lo que se utiliza en el trabajo empírico:

Ho:  i  0 y H1:  i  0 . Es un mecanismo para establecer si Y tiene relación con la variable explicativa X.

Si el de número de g. de l. es más de 20 al 95 % entonces Ho puede ser rechazada si

t 2

  
 i  i 
ti   
 
ee  i 
 

Ho:  i  0 H1:  i  0 .

i
t  i  Es la pendiente , por lo que la t de student puede ser, negativo o positivo.
 
ee  i 
 


“En la nomenclatura internacional Bo , es igual a la intersección. “Gujarati tiene un problema de notación
está al revés.”

Xi =  o  1 X 1i   2 X 2i

 

 i 
Cuando  i > 0 t i =   >2
 
ee  i 
 
 

 i 
Cuando  i < 0 t i =
  <-2
 
ee  i 
 
 
 i 
  >2
ti =
 
ee  i 
 


Si t  2 : se rechaza H o y se acepta H 1 ; la presencia de la variable a la que pertenece  i es justificada en el
modelo porque es estadísticamente significativa para la variable dependiente.


Si t  2 : no se rechaza H o y se acepta H 1 ; la presencia de la variable a la que pertenece  i no se justifica
en el modelo porque no es estadísticamente significativa para la variable dependiente.

Se dice que una prueba es estadísticamente significativa, o es verdadero, si el valor del estadígrafo de prueba
cae en la región de rechazo, mayor que dos y menor que menos dos. Ahí se rechaza que el regresor es 0, se
acepta que es diferente a 0 y eso quiere decir que la variable es significativa, para la variable dependiente.

2.5% Región de 2.5% Región de
rechazo Ho rechazo de Ho
Región de
aceptación Ho



La única t de student que no me interesa es la de la intersección. Si la intersección pasa por el origen la
1  0.

Ejemplo:
Yi  24.4545+0.5091 X i
(6.4138) (0.0357)

24.4545 La propensión marginal a consumir
t1 =  3.813 es muy significativa, razón por la
6.4138
 
cual 1 y 1 son estadísticamente
0.5091
t2 =  14.243 significativos.
0.0357

ˆ ˆ
 1 y  2 son estadísticamente significativos.

El valor P:

Denominado el valor de probabilidad, es el nivel de significación mas bajo al cual se puede rechazar una H o
o la probabilidad exacta de cometer un error tipo 1

Nota: La probabilidad de cometer un error tipo 1 es la probabilidad de rechazar la hipótesis cuando es
verdadera; la probabilidad de cometer un error tipo 2 es la probabilidad de acertar la hipótesis cuando es
falsa.

En la practica es la superficie de la región de rechazo determinada por un valor de la t de student (el riesgo)];
a medida que aumenta el valor absoluto de la t de student, disminuye el valor P.

Conclusiones prácticas del valor p:
Ejemplo:
Si excede a 0,05 necesitamos la tabla t de
student para ver su valor real. t1 = 3.8128 valor p = 3.8128
Cuando tenemos más de 36 la t de t1 = 14.2605 valor p = 0.0000
student es dos.

Análisis de Varianza:

Recordando:
Importante: Los símbolos que no están con asteriscos son desviaciones respecto a la media.

STC = SEC+SRC

2 2 2  2
yi2   y i   u i  y i   2 xi2
 2 2
y   2 x   u i
2
i
2
i



Tabla Anova

Fuente de Suma de g de l Suma Promedio
Variación Cuadrados de Cuadrados

Debido a regresión  2  2

(SEC) 2 x 2
i 1  2  xi2

Debido a residuos
(SRC) ui
2

(n-2)
 2
 
u 2
i

(n  2)

Se construye una F

SPC de SEC
F
SPC de SRC

La relación también se puede obtener a partir del teorema 6:

  
2
  
     2  2 
 2  2  
 ee     


  2  Var   2 
 
F 1 1   
Z /k

 
Z 2 / k2
n  2 2
2
n  2 2 2

2
  
 2  2    
     

 2  2
 2
 ee      
2

 2     2   2   xi2
F
x 2
i
   
  
  
2 n  2 2 2
2 n  2 2

Los grados de libertad son los números de restricciones, y la restricción es el
equivalente al regresor.

En el software E views la prob representa el riesgo.




(  2   2 ) xi2
F 
2
Ho:  i =0 ; H 1 :  i  0


 2 2  xi2
F 
2
Si F> que el valor crítico de la distribución F; se rechaza Ho y se acepta H 1 .
Si F< que el valor crítico de la distribución F; se acepta Ho.
Ejemplo:
 
 2 =0.5091 x 2
i =33000  2 = 421591

(0.5091) 2 (33000)
F = 202.875
42.1591

F no califica intersección; F califica pendientes B1 B2 B3

De la tabla F, con  = 5%; k=1 y k= 8 g. de l. F= 5.32. Se rechaza Ho y se acepta H 1 .
Nota: de acuerdo al teorema 7:
F1,k  t 2 k F1,k  (14.24317)  202.8679

Aplicación de la regresión: problema de predicción:

Con la regresión muestral estimada, se puede “predecir” valores de Y correspondiente a algún nivel de X.
Hay dos clases de predicción: la predicción media y la predicción individual

Predicción media

Se desea predecir E Y / X 0  100 : el promedio de los consumos cuando en nivel de ingreso es igual a 100
  

Yo  1   2 X 0  24.4545  0.5091(100)


Yo  75.3645 ---- el valor real de la tabla es 77

Puesto que Yo es un estimador, es probable que éste sea diferente de un verdadero valor. La diferencia entre
los dos dará alguna idea sobre el error de predicción; para evaluar este error es necesario encontrar la

distribución muestral de Yo , o sea su media y su varianza.
  

Yo  1   2 X 0

  
E (Y )  E (    X 0 )  1   2 X 0
o 1 2




Lo que quiere decir que Y0 está normalmente distribuida con media (  1   2 X 0 ); y la varianza es:

  
Var (Y )  Var (    X o )
o 1 2

    
Var (Y )  Var (  )  X oVar (  )  2 X o Cov(  ,  )
o 1 2 1 2

2 
X i2  2 
 2 
   2 
Var (Yo )       2X
__

O 

  x 2 
 n x 2  X o   x 2  
X 

i 
 i   i 

 2 _ 
 X i  nX o  2no X
2

Var (Y )   2

o
 n xi2 
 
 

 _ _ 
 1 X o  2no X  X 2 
2
Var (Y )   2
 n

o
2
 xi

 
 
  __

1  Xo  X 
Var (Yo )   2   


n  xi 
2

 
 

 
Conocida la Var  Y0  y por tanto ee  Yo  se puede plantear la distribución t de Student para construir
   
  
Y 
intervalos de confianza del verdadero E  o  y hacer pruebas de hipótesis.
 X0 
 

 
Conocida la Var ( y 0 ) y por tanto ee ( y 0 ) se puede plantear la distribución t de Student para construir

intervalos de confianza del verdadero E ( y 0 / x0 ) y hacer pruebas de hipótesis.


  
y 0  E  y o / xo 
t=  

ee ( y0 )



 
   
 y 0  E  y o / xo  
Pr  t      t   (1   )
 
 2 ee ( y0 ) 2 

 


  
    
Pr  y 0  t ee ( y0 )  y 0  E yo / xo   y 0  t ee ( y0 )  (1   )
 2   2 

Ejemplo:

 2 
  42.1591 X  42.1591 x 2
i =33000 y 0  75.3645 t  =2.306
2
  1 (100  170)  2
Var ( y 0 ) = 42.1591     = 10.4759
10 33000 

ee Yo   3,2366
 
 

   
Pr 75,3645  2,3063,2366  E Yo / X o   75,3645  2,3063,2366  95%
   

   
Pr 67,901  E  Yo / X o   82,8281
   

Pr67,901  77  82,8281

Predicción individual

Se desea predecir el Yo (predicción individual) de una de las familias, cuando X o  100

 
Yo   1   2 X o  uo

Un buen estimador de Yo  75,3645 , es probable que este sea diferente de su verdadero valor. La diferencia
entre los dos dará alguna idea sobre el error de predicción. Para evaluar este error es necesario encontrar la
distribución inicial de Yo , o sea su media y su varianza.

Hay 75.400 millones de ecuaciones, con 75.400 de Yo , por lo que puedo construir una distribución
normal, por lo que necesito la media y la varianza.



 
      
E Yo   E   1   2 X o  uo   E   1   E   2  X i  E   1   E uo 
       
E Yo   1   2 X o

Lo que quiere decir que Yo está normalmente distribuido con media 1   2 X o  y la va varianza es:

       
Var Yo   Var   1   2 X   uo   Var   1   2 X   Var uO 
    

      
Var Yo   Var   1   X o Var   2   2 X o Cov  1   2   Var (u o )
2

     

  X i2   2   __  2 
Var Yo    2   X o2     2 X o  X      2
 n x 2    x2     x 2 
 i   i    i 

 __

  X i  X o  2nX o X 
2

Var Yo    1 
2

 n xi2 
 

__ 2 __ 2

x  X
2
i i
2
nX X i
2
 x n X
2
i

 __ 2 __ 
  xi2  n X  nX o  2nX o X 
2

Var Yo    2 1  
 n xi2 
 

 1 X 2  2X X  X 2 
Var Y0    1   0
2 0 
 n
  xi2



 1 X X 2
Var Y0    1   0 2 
2  
 n
  xi  
Conocida la Var Y0  y por tanto eeY0  se puede plantear la t de Student para hacer pruebas de hipótesis.
(PUEDE IR EN LA PRUEBA)

Y0  E Y0 / X 0 
t
eeY0 

 Y  E Y0 / X 0  
Pr  t   0  t    (1   )
 2 eeY0  2 



 
Pr Y0  t  eeY0   E Y0 / X 0   Y0  t  eeY0   (1   )
 2 2 

Ejemplo:

2
 = 42.1591 X  170 x 2
i 33000
Y 0 =75.3645 t   2.306
2

 1 100  170 
2
Var Y0   42.1591
1     52.635
 10 33000  
eeY0   7.255

Pr58.6345  EY0 / X 0   92.0945  95%

Control de Lectura: Informe de resultados
Control de Lectura: Evaluación de resultados

Prueba de normalidad de Jarque Bera

n =Tamaño de la muestra.
S = El sesgo mide si es simétrica o asimétrica.
K=Curtosis

Para una variable normalmente distribuida S = 0 Y K = 3, en cuyo caso el estadígrafo J-B = 0 y el valor probabilística es 1; si la
variable no está normalmente distribuida, el estadígrafo J-B aumenta, y el valor p tenderá a cero.

 Si el sesgo es igual a cero es absolutamente simétrica. Es decir la moda la mediana y la media coinciden.
 Lo que me interesa es el valor probabilística.

 Si es que la normal estandarizada tiene un Jarque Bera de cero esa distribución esta normalmente distribuida en un
cien por ciento.

 Si el Jarque Bera aumenta la probabilidad de que sea normal disminuye.

 Cuando K < 3 la distribución es más ancha y más baja que la normal.

Ejemplo:

S= 0.398346 K=1.890997
 (0.398346) 2 1.890997  32 
J-B= 10     0.77692
 6 24 



Valor p=0.6781  67.81%

EQ01
 
Yi  Y i  u i



EQ02
 
Yi  Y i  u i



Prueba de autocorreción de primer orden:

Se utiliza el estadígrafo Dublín Watson:

2
 n

 u t  u t 1 
D W  2  


 ut2

 2   n 2 
 u t  2u t u t 1  u t 1 
2 

D W  


 u t2

n  n   n 2
 ut2  2 ut ut 1   u t 1
D W  2 2

2

u 2
t

Si n es grande:

Se considera n grande desde un fenómeno conocido como la estacionalidad.

2 2 n 2
u
n
t 1 ~ ut
2

1 2 3 (n-1) n

n  n 

U ~ U
1
t
2

2
t
2



n  n  
2 U t2  2 U t U t 1
D W  2
n
2


U
2
t
2

1 2 3 n-1 n
111
141

  
 n 

  U t U t 1 
D  W  21  2 n  

 U t2  
 
2

n  

 U t U t 1
 2
n 

U t2
2


D  W  2(1   )


Si   0  D W  2  no autocorrelación


Si   1  D W  0  autocorrelación  


Si   1  D W  4  autocorrelación 

0 2 4

Autocorr (+) No Autocorr Autocorr (-)

IDP3  PIB4

IDP4  PIB3
Autocorr (-)



0 DU DU 2 4- DU 4 - D1

Autocorr
D1
Indecisión No hay Autocorrelación Indecisión Autocorr
D1
(+) (-)

1.65  D  W 2.35

Ejemplo: D – W (3,31)

DL  1.23 DU  1.65

4  DU  4  1.65  2.35

Extensiones del modelo de regresión lineal de dos variables
Regresión a través del origen

Si la nube de puntos está apuntando al origen y la regresión pasa por ahí los mínimos cuadrados si se
cumplen, si la nube de puntos no apunta al origen y la regresión si pasa por ahí, los mínimos cuadrados no
se cumplen.

A)



B)

A) No se cumple con MCO
B) Se cumple con MCO

Hay ocasiones en las cuales la función de regresión poblacional de dos variables pasa por el origen  1
0

 
Yi   2 X i  ui Yi   2 X i  u i
 
Y i   2 Xi
2 2

 u i    Yi  Y i     Yi   2 X i 
 2  
   
   

 2 
  u i 
 
   2  Y   X  X   0


  i 2 i  i
 
2

 

 Yi   2 X i  X i   0
 

 
2

 Yi X i   2 X i   0




 X i Yi   2 X i
2
0






X Y i i
2
X i
2

 

X ( 2 X i   i )  2  X i2   X i  i

i
2
X i
2
X i
2

    X

X  i i
2 2
 i
2

  
     X  i i
 2 2
  X i
2

Porque las X i no son estocásticas y las  1 son homoscedásticas y no correlacionadas:

  
2
  X 2u 2   X 2 E u 2
E      E 
i i
 i i

E u i2    
 2

2
   X i2 2 
   X i2
2
 X i2      

2 2
1   
  
__ __
1
Var(X)   xi2    X i  X   E  X i  X 
n n    

 E (  i2 ) 2
E ( 2   2 ) 2  
 X i2  X i2
   
2
Var   2 
   Xi
2

 2
 2
 
 i

(n  1)

Pero el modelo sin intersección tiene algunos problemas.

Primero:
 2
  i 


 2 (Yi   2 X i )( X i )  0
 2

 (Yi   2 X i )( X i )  0

 (Y i  Y i )( X i )  0




i Xi  0
Es decir los residuos y la variable X no están correlacionados. Sin embargo, en el modelo con intersección,

 i  0 , se puede aseverar que:
2   
 i
  (Yi  Y i ) 2   (Yi  1   2 X i ) 2
 2
 (  i )  


 2 (Yi  1   2 X i )(1)  0
 1


 (Yi  Y i ) =0

 i 0

 
Pero como en el modelo sin intersección,  i  0 ; no se puede afirmar que la  i  0.
TRAER TABLA 6,1 Y 6,2

Segundo:
__
 __ 
Recuérdese que el modelo con intersección,  1  0, se demostró que: Y  Y . Pero el modelo sin

intersección,  1  0 :

   
u i  Yi  Y i Yi  Y i  u i

 
 Yi   Y i   u i
 
 Yi 
Y i 
ui
n n n

 
u i = 0 (esto no necesariamente sucede si  1  0 ; como se demostró anteriormente) entonces:

u i 0
__
__  
Y  Y  ui
__
__ 
Y Y

Tercero:




El coeficiente de determinación en el modelo con intersección,  1  0 , siempre es positivo. (La suma
estimada de cuadrados es un numero positivo, positivo para positivo da un coeficiente de determinación

positivo). Pero en el modelo sin intersección, 1  0 , puede ser negativo:

SEC STC  SRC  i
2
SRC
r 
2
  1  1
 yi
2
STC STC STC

En el modelo con intersección, 1  0 : STC  SEC  SRC ; SRC  STC . Y por tanto, el r 2 siempre
será positivo.


En el modelo sin intersección, 1  0 :
 
Yi   2 X i   i

2  
 X      2 X 2  2 2X  2

Yi   2 i
 

i 
2

 
2 i 2 i i i

  

 Yi 2   22  X i2  2  2   i X i    i2    i X i  0
 

 Yi 2   22  X i2   i2
 

 i
2
  Yi   22  X i22

Por otro lado:

 __

yi   Yi  Y 
 

2
 
__ __ __ 2
y   Yi  Y   Yi 2  2Yi Y  Y
2
i
 
__ __ 2

y 2
i  Yi  2 Y Yi  n Y
2

__
Y
Y i
__
n Y   Yi
n



__ 2 __ 2 __ 2

y 2
i  Yi  2n Y  n Y  Yi  n Y
2 2

__ 2

Y i
2
  y n Y
2
i

__ 2  2
u 2
i   y n Y   2  X i2
2
i

__ 2  2
Si: n Y   2  X i2

SRC > STC

Y entonces, el r 2 será negativo.

Se acostumbra calcular con:

 X 
rs2 
i

 X Y i
2
i
2

Aunque no es comparable con el r 2 convencional tiene un intervalo de 0  r 2  1 y no está incorporando en
los paquetes econométricos. En conclusión, en todos los modelos se debe incluir la intersección para que los
mínimos cuadrados se cumplan.

Realizar:

IDP3  PIB4
IDP4  PIB3
Autocorr (-)

Ejemplo: consideremos la información de la tabla 6.1; Y  GAF  36.57821 y X  GPM  28.94210 (Ejer-
6.1)
EQ1 : GAF C GPM

GAF= 1.279719  1.069084GMP
(7.688560) (0.238315)
0.166445 4.486004


La t de Student de  1 están más bajo que 2 y por eso el valor probabilístico es de 0.8719, entonces, se

puede concluir que  1  0

EQ 2 : GAF GPM
GAF=1.089912 GMP
(0.191551)
5.689922



La diferencia entre 1.069084 y 1.089912 no e mucha; sin embargo, en general en estos casos se debe
mantener la intersección para que se cumplan los mínimos cuadrados ordinarios.

Pasa cerca del
origen
    
  
Pr  2  t / 2 ee  2    2   2  t / 2 ee  2   1   
    

La variable incide en la variable dependiente.
Si la t de student de la intersección está baja, pasa cerca del origen.

Regresor
significativo,
pero no se
cumplen los
MCO.

- Si hago que pase por el origen no se cumplen los mínimos cuadrados ordinarios no se cumplen.
Econometricamente la regresión no sirve.

- Técnicamente no sirve.

-Cuando la intersección es cero (  1 ) el software informático me indica.

-En todos los modelos que yo proponga debemos incluir una intersección para asegurarnos que los mínimos
cuadrados ordinarios se cumplan para asegurarnos que todo es verdadero.

Escalas y unidades de medición:



El problema: hay alguna diferencia en los resultados de la regresión si las unidades en las cuales se miden
las variables Y y X son distintas? De ser así, como se debe proceder?

  
Yi  1   2 X i   i

Yi *  W1Yi X i*  W2 X i

(los valores estrellados son con diferentes variables)

Donde W1 y W2 , se denominan factores de escala, W1 puede ser igual o diferente a W2 :

ˆ ˆ*
Yi*  1*   2  X i*  ui*
ˆ

ˆ*
2 
x y *
i
*
i ˆ ˆ*
1*  Y *   2 X *
x 2*
i

ˆ *   *2   X i 
 
 
2*

Var 1
 n x 2* 
 i 

ˆ* 
Var  2 
 *2
ˆ *2

u
ˆ *2
i

 xi2* n  2

Con las siguientes relaciones:

Yi*  w1Yi , yi*  w1 yi , X i*  w2 X i

xi*  w2 xi , ui*  w2 ui , Y *  w1Y y X *  w1 X
ˆ ˆ


2 
x y *
i
*
i

 (w x )(w y )  w w  x y
2 i 1 i 1 2 i i

w1 
2
x *2
i  (w x ) 2 i w x
2
2
2
i w2

* w1 
2  2
w2

 w1  
   
* * * *   
 1  Y   2 X  w1 Y  
   2 w2 X  w1 Y  w1  2 X  w1  Y   2 X   w1  1
  
 w2   

* 
 1  w1  1



2
w  


   
 
 i i 



*2
 i
*2
   w12  i2  w 2   i  w 2  2
n  2 n  2 n  2 i
n  2 1
 
 *2  w12  2
2
  *   w 2Var  
Var 1    *    w1
Var 2  
   
 Var 2 
 1
       ws   
1
 

2*
 1
u
ˆ *2
i

 w u 
i
ˆ 2
i

 w y 
r
y 2
i i
2
i

w12  u12
ˆ u
ˆ *2

  1  r2
2* i
r
w12  yi2 y 2
i

r *2  r 2

Ejemplo: consideremos la información de la tabla 6.2 :

IDP1= 146,5929, IDP2 = 146592.9
PIB1= 455,2486, PIB2 = 455248,6

PRIMERA ECUACIÓN:

EQ01: IDP1 C PIB1

(W1=1) (W2=1)



IDP1= -1026,498 + 0.3016PIB
(257,5874) (0,0399900)
-3,985047 7,558482

ˆ
Var (1 )  66351,27
ˆ
Var ( )  0,001592
2

 2  2969,4988 (Esta información la obtenemos mediante la calculadora)
ˆ

 2  54,49311

r2= 0,877170

SEGUNDA ECUACIÓN:

EQ02: IDP2 C PIB2
W1  1000 W2  1000
IDP2= -1026498+0.301583 PIB2
(257587.4) (0.039900)
-3.985047 7.558482

  
var 1*   6.64 *1010
 
 
 * 
var  2   0.001592
 
 

 *2  2969498800




 *  54493.11
r *2  0.877170

TERCERA ECUACIÓN

EQ03: IDP1 c PIB2

W i  1 W 2  1000

IDP1= -1026.498 + 0.000302 PIB2

5
(257.5874) (.399 *10 )
(-3.98504) (7.558482)

  
Var   1*   66351.27
 
 

Var  2*   1.59 *10 9


 
 

  2969.4988
*2


 *  54.49311

r *2  0.877170

Regresión sobre las variables estandarizadas:



Para evitar el problema anterior se puede plantear la regresión con ambas variables estandarizadas.

Yi  Y Xi  X
Yi*  X i* 
SY SX

ˆ ˆ*
Yi*  1*   2 X i*  ui*
ˆ

ˆ ˆ*
1*  Y *   2 X Y* 0 X* 0

Análisis de Y *  0

1 Y  Y 
 Y Y 
1 1 1
Y* 
n
 Yi*  n  iS  nS i
nS y
y i 0
Y y

ˆ
1*  0

ˆ*
Yi*   2 X i*  ui*
ˆ

En este caso, si la variable independiente estandarizada se aumenta en una desviación estándar, la variable
*
dependiente estandarizada se incrementa en  2 desviaciones estándar. Por otro lado:

*
2 
x y *
i
*
i

 ( X  X )(Y  Y
*
i
*
i
* *
)

X Y * *
i i

x *2
i (X  X ) *
i
* 2
X *2
i

(X i  X )(Yi  Y )
* SxSy Sx  xi y i
2  
 (X i  X )2 Sy  xi2
Sx 2

*   Sx 
 2   2
 

 Sy 

Ejemplo: consideremos la información de la tabla 6.2; (ejemplo 6,2)



PIB3  ( PIB1  @mean(PIB1)/@stdev(PIB1)



PIB4  ( PIB2  @mean(PIB2)/@stdev(PIB2)

IDP3  ( IDP1  @mean(IDP1)/@stdev(IDP1)

IDP4  ( IDP2  @mean(IDP2)/@stdev(IDP2)



EQ  5= IDP3 c PIB3
Dependent Variable: IDP3
Method: Least Squares
Date: 06/05/07 Time: 09:30
Sample: 1988 1997
Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob.

C 1.78E-16 0.117552 1.51E-15 1.0000
PIB3 0.936574 0.123910 7.558482 0.0001

R-squared 0.877170 Mean dependent var 0.000000
Adjusted R-squared 0.861816 S.D. dependent var 1.000000
S.E. of regresión 0.371731 Akaike info criterion 1.035563
Sum squared resid 1.105470 Schwarz criterion 1.096080
Log likelihood -3.177815 F-statistic 57.13064
Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066

IDP3  1.78 *10 16  0.936574PIB3
(0.117552) (0.123910)
15
1.5 *10 7.558482

r 2  0.877170 r 2  0.861816 = r cuadrado ajustado.

EQ  6: IDP3 PIB3

Date: 06/05/07 Time: 09:32
Sample: 1988 1997




PIB3 0.936574 0.116824 8.016980 0.0000

S.E. of regression 0.350471 Akaike info criterion 0.835563
Log likelihood -3.177815 Durbin-Watson stat 0.614662

IDP3=0.936574 PIB3
(0.116824)
(8.01698)

r 2  0.877170 r 2  0.877170

El r y el r cuadrado son los mismo.

EQ  7= IDP4 c PIB4

Date: 06/05/07 Time: 09:48
Sample: 1988 1997


C -6.15E-18 0.117552 -5.23E-17 1.0000
PIB4 0.936574 0.123910 7.558482 0.0001

R-squared 0.877170 Mean dependent var -4.44E-17
Log likelihood -3.177815 F-statistic 57.13064

IDP4  6.15 *10 18  0.936574PIB4
(0.117552) (0.123910)
 5.23 *10 17
7.558482

r 2  0.877170 r 2  0.861816

EQ  8: IDP4 PIB4



Date: 06/05/07 Time: 09:49
Sample: 1988 1997


PIB4 0.936574 0.116824 8.016980 0.0000

R-squared 0.877170 Mean dependent var -4.44E-17
Log likelihood -3.177815 Durbin-Watson stat 0.614662

IDP4=0.936574 PIB4
(0.116824)
(8.01698)

r 2  0.877170 r 2  0.877170

Si el PIB aumenta en una desviación
Estandar el IDP aumenta en 0,94
desviaciones estandar. Recordemos que
aumenta por que tiene signo positivo.

La regresión con variables estandarizadas es el único modelo que cruza por el origen cumpliendo los MCO.
Independientemente de cómo se plantea las variables, la regresión es la misma. La interpretación es: si el
PIB aumenta en una desviación estándar, el IDP se incrementa en 0.94 desviaciones estándar. Nótese que en
2
el modelo sin intersección el r es igual al r 2 .

Realizar:

IDP3  PIB4
IDP4  PIB3

Formas funcionales de los modeles de regresión
Modelos log-lineal (log-log):

Es la manera más sencilla de obtener una elasticidad. Es el mejor indicador de todos los indicadores.



También denominado modelo de elasticidad constante, por que mide la elasticidad de Y con respecto a X.
Supongamos la función exponencial (Coub Douglas).

Yi  1 X i 2 e ui

dY
dY X
EYX  Y  *
dX dX Y
X

1 2 X i 1eu X i
2 i

EYX   2
1 X i eu 2 i

ln Yi  ln 1  ln  2 X i  ui

ln Yi    ln  2 X i  ui

Linealizar es sacar los logaritmos a ambos lados.

Consideremos la información de la tabla 6.3;
GSE=135.2642, GBD=65.25941, GBP=61.19171, GCP=160.5416 (Ejer-6.3)

*Generalmente expresar una variable con tres letras*
*ese log es el logaritmo naperiano (base e) ya no se trabaja con el logaritmo decimal*

LGSE=LOG(GSE)
LGBD=LOS(GBD)
LGBP=LOG(GBP)
LGCP=LOG(GCP)

Vamos a ver la elasticidad de los tres primeros cuando el gasto total aumenta

EQ01: LGSE C LGCP

Dependent Variable: LGBD
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3


C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000




S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130

LGSE=0.130296 + 0.919989LGCP
(0.064914) (0.007681) error estándar
(1.591280) (119.7712) t de student

La intersección esta pasando cerca del origen, no en el origen, pero como yo necesito que exista la
intersección para que se cumplan los MCO yo no le hago caso a la t de student de la regresión.

Cuando los gastos de consumo personal total aumenta en un 1% (no el logaritmo de los gastos), entonces los
gastos en servicios (GSE) aumenta en 0.92%. Si el signo es negativo el GSE disminuye.

EQ02= LGBD C LGCP

Dependent Variable: LGBD
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3


C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000

S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130

LGBD= -9.697098 + 1.905633LGCP
(0.434127) (0.051370) error estándar
-22.33702 37.09622 t de student
La intersección pasa lejos del origen, por que la t de student es alta 22.33702 (nada mas no hay otra
explicación que dar)

Si los gastos totales aumenta en 1% los gastos en bienes duraderos (GBD) se incrementaran en 1.91%
(aprox)

EQ03= LGBP C LGCP



LGBP = 0.780076 + 0.767695 LGCP
(0.077143) (0.009128) error estándar
10.11202 84.10016 t de student

Si los gastos totales aumentan en 1% los gastos en bienes perecederos se incrementaran en 0.77% (aprox)

Modelo log-lin:

También denominado semilog por que solamente una variable aparece en forma logarítmica, mide la tasa de
crecimiento instantáneo de variables.

Yt  Yo (1  r ) t

ln Yt  ln Yo  t log(1  r )

1  lnY0  2  ln 1  r 

ln Yt  1   2t  ut

 2 mide el cambio relativo de Y(%) debido a un cambio de t, se conoce como la semielasticidad de Y
respecto a t.

Modelo de tendencia lineal:

En lugar de estimar el modelo anterior, algunas veces se estima el siguiente.

Yt  1   2t  ut

Que se denomina modelo de tendencia lineal, la variable de tiempo (t) se conoce como la variable de
tendencia, que puede ser creciente o decreciente.
Mide el cambio de Y en valores absolutos por una unidad de tiempo.

En el examen necesitamos las cifras de view/ estimation out put

Modelo lin-log control de lectura
Ejemplo: consideremos la información de la tabla 6.3, (Ejer. 6.3).

EQ 4 : LGSE C t
LGSE: 7.788347 + 0.007466t
(0.002289) (0.000167)
3402.198 44.71844

La tasa de crecimiento instantáneo de los gastos en servicios es de 0.747%

EQ 5 : LGBD C t
LGBD= 6.221691+0.015445t
(0.0007597) (0.000554)



818.9877 27.87711
La tasa de crecimiento instantáneo de los gastos en bienes duraderos es de 1.54%.

(Las cifras q me debe poner es del view stimation output cifras decimales q se deben declarar)

EQ 6 : LGBP C t
LGBP=7.192967+0.006229t
(0.002077) (0.000151)
3463.080 41.11945
La tasa de crecimiento instantáneo de los gastos en bienes perecederos es de 0.623%
EQ 7 : LGCP C t
LGCP= 8.353433+0.008114t
(0.002342) (0.000171)
3566.568 47.50231
La tasa de crecimiento instantáneo de los gastos en consumo personal total es de 0.81%

EQ 9 : GBD c t
GBD= 496.0818 + 9.442095t
(5.540763) (0.404102)
Los gastos en bienes duraderos han aumentado en 9.44 dólares trimestrales
19.79 equivale al 0.747%

EQ10 : GBP c t
GBP=1327.086 + 8.952273
(3.55064) (0.244693)
395.5467 36.58567
Los gastos en bienes perecederos han aumentado en 8.95 dólares trimestralmente

EQ11: GCP c t


Apuntes de econometría i (segunda parte)

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (20)

Apuntes de econometría i (segunda parte)