Este documento presenta los conceptos de regresión con dos variables, estimación de intervalos y prueba de hipótesis. Explica cómo calcular intervalos de confianza para los parámetros β1 y β2 y para la varianza σ2 en una regresión. También describe el método del intervalo de confianza para realizar pruebas de hipótesis, comparando valores poblacionales con los intervalos muestrales.
1. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Regresión con dos variables, estimación de intervalos y prueba de hipótesis:
La teoría de la estimación consta de dos partes, la estimación puntual y la estimación de intervalos. La
primera se ha analizado en los capítulos anteriores, y la segunda se desarrolla a continuación.
*Prerrequisitos estadísticos y estimación de intervalos, algunas ideas básicas: control de lectura
Intervalos de confianza para 1 y 2 :
Donde (1- ) es el coeficiente de confianza, y el nivel de significación, t es la distribución de “Student” y
t es el valor crítico que se lee en las tablas con (n – 2) grados de libertad (g de l.), y un nivel
2
significación de .
2
De acuerdo al teorema 5:
Zi
T= 1/ 2
Z2
k
2 2 2 2 2 2
Z1
1/ 2
2
1/ 2
Var 2
x 2
i xi
2 1/ 2
2
Z 2 n 2 2
2 2 xi2
1/ 2
2 2 xi
2
1/ 2
2 2 xi
2
1/ 2
t=
1/ 2
2
n 2
n 2 2
2 2
t=
ee 2
Pr t / 2 t t / 2 1
Felipe Lemarie Jorge Salgado Juan C. Serrano
3. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Pr 2 2 2 (1 )
1
2 2
Donde 2
y 2 son los valores críticos que se lee en las tablas con (n-2) grados de libertad g. l.
1
2 2
2
Para muestra caso: (n 2) 2 2
2
2 2
Pr 1 (n 2) 2 (1 )
2
2
1 2 1
Pr 2 2 (1 )
1 2
2 (n 2)
2
2 2 2 2
(n 2) (n 2) (n 2) (n 2)
Pr 2
(1 ) Pr
2
(1 )
2
2 2 2
(1 )
1 ..
2
( )
2
2 2
Ejemplo: con la muestra 1;
2
= 42,1591; 8 g.l 5%
8 * 42.1591 2 8 * 42.1591 19.2347 2 154.7336
Pr 95% Pr 95%
17.5346 1 2.1797 1 1 1
Control de lectura: Prueba de Hipótesis comentarios generales.
Quiere decir que el 95% de los intervalos
obtenidos de las 7.5 * 10^10 muestras
contendrán al verdadero 2 . El intervalo
anterior tiene el 95% de probabilidad de
contener el verdadero 2 .
Felipe Lemarie Jorge Salgado Juan C. Serrano
4. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Prueba de hipótesis: método del intervalo de confianza.
Prueba de dos colas:
Se construye un intervalo de confianza para 2 al 95%. Si 2 bajo la H 0 se encuentra dentro de este
intervalo no se rechaza la H 0 (se acepta la hipótesis nula), pero si esta fuera del intervalo, se rechaza la H 0
(aceptar la H 1 ).
Ejemplo: se conoce que 2 =0.5091, pero se postula que:
H 0 : 2 =0,3 → Hipótesis simple
H 1 : 2 0,3 → Hipótesis compuesta
Entonces, es el 2 compatible con la H 0 ?
Para responder acudimos al intervalo de confianza obtenido anteriormente:
“En última instancia nos tenemos que comparar con los valores poblacionales.”
Pr 0,4268 2 0,5914 95%
Pr 0,4268 0,3 0,5914 95%
La H 0 está fuera del intervalo, se rechaza la H 0 (se acepta H 1 ) al 95% de confianza. (HACER LO MISMO
CON 1 Y CON LAMUESTRA 2)
Prueba de 1 cola:
Se determina de acuerdo al planteamiento de la H 1 . Nuevamente se conoce que 2 =0.5091 pero se
postula que H 0 : 2 0.3 ; H 1 : 2 0.3 .
Pr(0.42 2 0.5914) =95%
La H 0 esta fuera del intervalo, se rechaza H 0 (se acepta H 1 ) al 95% de confianza.
Prueba de hipótesis: método de la prueba de significación
Es un procedimiento mediante el cual se utiliza los resultados muéstrales para verificar la verdad o falsedad
de una H o a través de la t de Student
Prueba de dos colas:
Pr(t t t ) (1 )
2 2
Felipe Lemarie Jorge Salgado Juan C. Serrano
5. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
*
2 2
Pr t
t (1 )
2 ee( ) 2
2
*
Pr 2 t ee 2 2 2 t ee 2 1
*
2 2
*
Donde es el valor de bajo la H o , t y t son los valores críticos. El intervalo es conocido como
2 2 2 2
la “región de aceptación” de la H o y las regiones fuera del intervalo se llama “región de rechazo” o
“regiones criticas” de la H o
Ejemplo: 2 0.5091 ee( ) 0.0375
2
8g. de l t 0.025 2.306
Se puede utilizar las 2 formas:
La primera:
H o : 2 0,3
*
H 1 : 2 0,3
*
0,509 0,3
Pr 2,306 2,306 95%
0,0357
Pr 2,306 5,86 2,306 95%
Región de
Rechazo H o
Región de
Rechazo H o
Se rechaza la hipótesis nula y en consecuencias se acepta la H 1 .
Felipe Lemarie Jorge Salgado Juan C. Serrano
6. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
La segunda:
* *
H o 0.3 H 1 0.3
2 2
Pr 0.3 2.306(0.0375) 0.3 2.306(0.0375) 95%
2
Pr(0.2177 0.3823) 95%
2
Pr(0.2177 0.509 0.3823) 95%
Región de
Rechazo H o
2,5% Región
de rechazo H o
0,2177 0,3 0,3823
3
0,509
Se dice que una prueba es estadísticamente significativa si el valor del estadígrafo de prueba cae en la región
de rechazo de la H 0 ; y una prueba es estadísticamente no significativa si el valor del estadígrafo de la
prueba cae en la región de aceptación H 0
Prueba de una cola:
El procedimiento es similar, cambia en el planteamiento de las hipótesis.
Ejemplo: muestra 1.
2 0.5091 ee( ) 0.0375 ; 8 g de l
ˆ ˆ2
t 0.05 1.86
H 0 : 2 0,3 → Hipótesis simple
*
H 1 : 2 0,3 → Hipótesis compuesta
*
Así mismo, se pueden utilizar las dos formas:
Felipe Lemarie Jorge Salgado Juan C. Serrano
7. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
La primera:
2 2
*
0,509 0,3
t
ee( 2 ) 0,0357
Rechazo a H 0
8 grados de
libertad.
Se rechaza H 0 y se acepta H 1
La segunda:
*
2 2 t ee( ) 0.34 1.86(0.0357) 0.3644
2
Rechazo a H 0
Felipe Lemarie Jorge Salgado Juan C. Serrano
8. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Prueba de significación para 2
Pr 2 2 2 (1 )
1
2 2
2
(n 2) 2
2
Ejemplo con la muestra 1:
2
= 42.1591 8 g de l
=5%
H 0 : 2 =85 → Hipótesis simple
H 1 : 2 85 → Hipótesis compuesta
42.1591
2 8 * 3.97
85
Pr 2.1797 3.97 17.5346 95% Se acepta H 0
Regla práctica “2-t” (Ho : Bi = 0)
Es lo que se utiliza en el trabajo empírico:
Ho: i 0 y H1: i 0 . Es un mecanismo para establecer si Y tiene relación con la variable explicativa X.
Si el de número de g. de l. es más de 20 al 95 % entonces Ho puede ser rechazada si
t 2
i i
ti
ee i
Ho: i 0 H1: i 0 .
i
t i Es la pendiente , por lo que la t de student puede ser, negativo o positivo.
ee i
Felipe Lemarie Jorge Salgado Juan C. Serrano
9. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
“En la nomenclatura internacional Bo , es igual a la intersección. “Gujarati tiene un problema de notación
está al revés.”
Xi = o 1 X 1i 2 X 2i
i
Cuando i > 0 t i = >2
ee i
i
Cuando i < 0 t i =
<-2
ee i
i
>2
ti =
ee i
Si t 2 : se rechaza H o y se acepta H 1 ; la presencia de la variable a la que pertenece i es justificada en el
modelo porque es estadísticamente significativa para la variable dependiente.
Si t 2 : no se rechaza H o y se acepta H 1 ; la presencia de la variable a la que pertenece i no se justifica
en el modelo porque no es estadísticamente significativa para la variable dependiente.
Se dice que una prueba es estadísticamente significativa, o es verdadero, si el valor del estadígrafo de prueba
cae en la región de rechazo, mayor que dos y menor que menos dos. Ahí se rechaza que el regresor es 0, se
acepta que es diferente a 0 y eso quiere decir que la variable es significativa, para la variable dependiente.
2.5% Región de 2.5% Región de
rechazo Ho rechazo de Ho
Región de
aceptación Ho
Felipe Lemarie Jorge Salgado Juan C. Serrano
10. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
La única t de student que no me interesa es la de la intersección. Si la intersección pasa por el origen la
1 0.
Ejemplo:
Yi 24.4545+0.5091 X i
(6.4138) (0.0357)
24.4545 La propensión marginal a consumir
t1 = 3.813 es muy significativa, razón por la
6.4138
cual 1 y 1 son estadísticamente
0.5091
t2 = 14.243 significativos.
0.0357
ˆ ˆ
1 y 2 son estadísticamente significativos.
El valor P:
Denominado el valor de probabilidad, es el nivel de significación mas bajo al cual se puede rechazar una H o
o la probabilidad exacta de cometer un error tipo 1
Nota: La probabilidad de cometer un error tipo 1 es la probabilidad de rechazar la hipótesis cuando es
verdadera; la probabilidad de cometer un error tipo 2 es la probabilidad de acertar la hipótesis cuando es
falsa.
En la practica es la superficie de la región de rechazo determinada por un valor de la t de student (el riesgo)];
a medida que aumenta el valor absoluto de la t de student, disminuye el valor P.
Conclusiones prácticas del valor p:
Ejemplo:
Si excede a 0,05 necesitamos la tabla t de
student para ver su valor real. t1 = 3.8128 valor p = 3.8128
Cuando tenemos más de 36 la t de t1 = 14.2605 valor p = 0.0000
student es dos.
Análisis de Varianza:
Recordando:
Importante: Los símbolos que no están con asteriscos son desviaciones respecto a la media.
STC = SEC+SRC
2 2 2 2
yi2 y i u i y i 2 xi2
2 2
y 2 x u i
2
i
2
i
Felipe Lemarie Jorge Salgado Juan C. Serrano
11. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Tabla Anova
Fuente de Suma de g de l Suma Promedio
Variación Cuadrados de Cuadrados
Debido a regresión 2 2
(SEC) 2 x 2
i 1 2 xi2
Debido a residuos
(SRC) ui
2
(n-2)
2
u 2
i
(n 2)
Se construye una F
SPC de SEC
F
SPC de SRC
La relación también se puede obtener a partir del teorema 6:
2
2 2
2 2
ee
2 Var 2
F 1 1
Z /k
Z 2 / k2
n 2 2
2
n 2 2 2
2
2 2
2 2
2
ee
2
2 2 2 xi2
F
x 2
i
2 n 2 2 2
2 n 2 2
Los grados de libertad son los números de restricciones, y la restricción es el
equivalente al regresor.
En el software E views la prob representa el riesgo.
Felipe Lemarie Jorge Salgado Juan C. Serrano
12. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
( 2 2 ) xi2
F
2
Ho: i =0 ; H 1 : i 0
2 2 xi2
F
2
Si F> que el valor crítico de la distribución F; se rechaza Ho y se acepta H 1 .
Si F< que el valor crítico de la distribución F; se acepta Ho.
Ejemplo:
2 =0.5091 x 2
i =33000 2 = 421591
(0.5091) 2 (33000)
F = 202.875
42.1591
F no califica intersección; F califica pendientes B1 B2 B3
De la tabla F, con = 5%; k=1 y k= 8 g. de l. F= 5.32. Se rechaza Ho y se acepta H 1 .
Nota: de acuerdo al teorema 7:
F1,k t 2 k F1,k (14.24317) 202.8679
Aplicación de la regresión: problema de predicción:
Con la regresión muestral estimada, se puede “predecir” valores de Y correspondiente a algún nivel de X.
Hay dos clases de predicción: la predicción media y la predicción individual
Predicción media
Se desea predecir E Y / X 0 100 : el promedio de los consumos cuando en nivel de ingreso es igual a 100
Yo 1 2 X 0 24.4545 0.5091(100)
Yo 75.3645 ---- el valor real de la tabla es 77
Puesto que Yo es un estimador, es probable que éste sea diferente de un verdadero valor. La diferencia entre
los dos dará alguna idea sobre el error de predicción; para evaluar este error es necesario encontrar la
distribución muestral de Yo , o sea su media y su varianza.
Yo 1 2 X 0
E (Y ) E ( X 0 ) 1 2 X 0
o 1 2
Felipe Lemarie Jorge Salgado Juan C. Serrano
13. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Lo que quiere decir que Y0 está normalmente distribuida con media ( 1 2 X 0 ); y la varianza es:
Var (Y ) Var ( X o )
o 1 2
Var (Y ) Var ( ) X oVar ( ) 2 X o Cov( , )
o 1 2 1 2
2
X i2 2
2
2
Var (Yo ) 2X
__
O
x 2
n x 2 X o x 2
X
i
i i
2 _
X i nX o 2no X
2
Var (Y ) 2
o
n xi2
_ _
1 X o 2no X X 2
2
Var (Y ) 2
n
o
2
xi
__
1 Xo X
Var (Yo ) 2
n xi
2
Conocida la Var Y0 y por tanto ee Yo se puede plantear la distribución t de Student para construir
Y
intervalos de confianza del verdadero E o y hacer pruebas de hipótesis.
X0
Conocida la Var ( y 0 ) y por tanto ee ( y 0 ) se puede plantear la distribución t de Student para construir
intervalos de confianza del verdadero E ( y 0 / x0 ) y hacer pruebas de hipótesis.
y 0 E y o / xo
t=
ee ( y0 )
Felipe Lemarie Jorge Salgado Juan C. Serrano
14. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
y 0 E y o / xo
Pr t t (1 )
2 ee ( y0 ) 2
Pr y 0 t ee ( y0 ) y 0 E yo / xo y 0 t ee ( y0 ) (1 )
2 2
Ejemplo:
2
42.1591 X 42.1591 x 2
i =33000 y 0 75.3645 t =2.306
2
1 (100 170) 2
Var ( y 0 ) = 42.1591 = 10.4759
10 33000
ee Yo 3,2366
Pr 75,3645 2,3063,2366 E Yo / X o 75,3645 2,3063,2366 95%
Pr 67,901 E Yo / X o 82,8281
Pr67,901 77 82,8281
Predicción individual
Se desea predecir el Yo (predicción individual) de una de las familias, cuando X o 100
Yo 1 2 X o uo
Un buen estimador de Yo 75,3645 , es probable que este sea diferente de su verdadero valor. La diferencia
entre los dos dará alguna idea sobre el error de predicción. Para evaluar este error es necesario encontrar la
distribución inicial de Yo , o sea su media y su varianza.
Hay 75.400 millones de ecuaciones, con 75.400 de Yo , por lo que puedo construir una distribución
normal, por lo que necesito la media y la varianza.
Felipe Lemarie Jorge Salgado Juan C. Serrano
15. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
E Yo E 1 2 X o uo E 1 E 2 X i E 1 E uo
E Yo 1 2 X o
Lo que quiere decir que Yo está normalmente distribuido con media 1 2 X o y la va varianza es:
Var Yo Var 1 2 X uo Var 1 2 X Var uO
Var Yo Var 1 X o Var 2 2 X o Cov 1 2 Var (u o )
2
X i2 2 __ 2
Var Yo 2 X o2 2 X o X 2
n x 2 x2 x 2
i i i
__
X i X o 2nX o X
2
Var Yo 1
2
n xi2
__ 2 __ 2
x X
2
i i
2
nX X i
2
x n X
2
i
__ 2 __
xi2 n X nX o 2nX o X
2
Var Yo 2 1
n xi2
1 X 2 2X X X 2
Var Y0 1 0
2 0
n
xi2
1 X X 2
Var Y0 1 0 2
2
n
xi
Conocida la Var Y0 y por tanto eeY0 se puede plantear la t de Student para hacer pruebas de hipótesis.
(PUEDE IR EN LA PRUEBA)
Y0 E Y0 / X 0
t
eeY0
Y E Y0 / X 0
Pr t 0 t (1 )
2 eeY0 2
Felipe Lemarie Jorge Salgado Juan C. Serrano
16. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Pr Y0 t eeY0 E Y0 / X 0 Y0 t eeY0 (1 )
2 2
Ejemplo:
2
= 42.1591 X 170 x 2
i 33000
Y 0 =75.3645 t 2.306
2
1 100 170
2
Var Y0 42.1591
1 52.635
10 33000
eeY0 7.255
Pr58.6345 EY0 / X 0 92.0945 95%
Control de Lectura: Informe de resultados
Control de Lectura: Evaluación de resultados
Prueba de normalidad de Jarque Bera
n =Tamaño de la muestra.
S = El sesgo mide si es simétrica o asimétrica.
K=Curtosis
Para una variable normalmente distribuida S = 0 Y K = 3, en cuyo caso el estadígrafo J-B = 0 y el valor probabilística es 1; si la
variable no está normalmente distribuida, el estadígrafo J-B aumenta, y el valor p tenderá a cero.
Si el sesgo es igual a cero es absolutamente simétrica. Es decir la moda la mediana y la media coinciden.
Lo que me interesa es el valor probabilística.
Si es que la normal estandarizada tiene un Jarque Bera de cero esa distribución esta normalmente distribuida en un
cien por ciento.
Si el Jarque Bera aumenta la probabilidad de que sea normal disminuye.
Cuando K < 3 la distribución es más ancha y más baja que la normal.
Ejemplo:
S= 0.398346 K=1.890997
(0.398346) 2 1.890997 32
J-B= 10 0.77692
6 24
Felipe Lemarie Jorge Salgado Juan C. Serrano
17. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Valor p=0.6781 67.81%
EQ01
Yi Y i u i
Felipe Lemarie Jorge Salgado Juan C. Serrano
18. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
EQ02
Yi Y i u i
Felipe Lemarie Jorge Salgado Juan C. Serrano
19. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Prueba de autocorreción de primer orden:
Se utiliza el estadígrafo Dublín Watson:
2
n
u t u t 1
D W 2
ut2
2 n 2
u t 2u t u t 1 u t 1
2
D W
u t2
n n n 2
ut2 2 ut ut 1 u t 1
D W 2 2
2
u 2
t
Si n es grande:
Se considera n grande desde un fenómeno conocido como la estacionalidad.
2 2 n 2
u
n
t 1 ~ ut
2
1 2 3 (n-1) n
n n
U ~ U
1
t
2
2
t
2
Felipe Lemarie Jorge Salgado Juan C. Serrano
20. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
n n
2 U t2 2 U t U t 1
D W 2
n
2
U
2
t
2
1 2 3 n-1 n
111
141
n
U t U t 1
D W 21 2 n
U t2
2
n
U t U t 1
2
n
U t2
2
D W 2(1 )
Si 0 D W 2 no autocorrelación
Si 1 D W 0 autocorrelación
Si 1 D W 4 autocorrelación
0 2 4
Autocorr (+) No Autocorr Autocorr (-)
IDP3 PIB4
IDP4 PIB3
Autocorr (-)
Felipe Lemarie Jorge Salgado Juan C. Serrano
21. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
0 DU DU 2 4- DU 4 - D1
Autocorr
D1
Indecisión No hay Autocorrelación Indecisión Autocorr
D1
(+) (-)
1.65 D W 2.35
Ejemplo: D – W (3,31)
DL 1.23 DU 1.65
4 DU 4 1.65 2.35
Extensiones del modelo de regresión lineal de dos variables
Regresión a través del origen
Si la nube de puntos está apuntando al origen y la regresión pasa por ahí los mínimos cuadrados si se
cumplen, si la nube de puntos no apunta al origen y la regresión si pasa por ahí, los mínimos cuadrados no
se cumplen.
A)
Felipe Lemarie Jorge Salgado Juan C. Serrano
22. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
B)
A) No se cumple con MCO
B) Se cumple con MCO
Hay ocasiones en las cuales la función de regresión poblacional de dos variables pasa por el origen 1
0
Yi 2 X i ui Yi 2 X i u i
Y i 2 Xi
2 2
u i Yi Y i Yi 2 X i
2
2
u i
2 Y X X 0
i 2 i i
2
Yi 2 X i X i 0
2
Yi X i 2 X i 0
X i Yi 2 X i
2
0
Felipe Lemarie Jorge Salgado Juan C. Serrano
23. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
X Y i i
2
X i
2
X ( 2 X i i ) 2 X i2 X i i
i
2
X i
2
X i
2
X
X i i
2 2
i
2
X i i
2 2
X i
2
Porque las X i no son estocásticas y las 1 son homoscedásticas y no correlacionadas:
2
X 2u 2 X 2 E u 2
E E
i i
i i
E u i2
2
2
X i2 2
X i2
2
X i2
2 2
1
__ __
1
Var(X) xi2 X i X E X i X
n n
E ( i2 ) 2
E ( 2 2 ) 2
X i2 X i2
2
Var 2
Xi
2
2
2
i
(n 1)
Pero el modelo sin intersección tiene algunos problemas.
Primero:
2
i
2 (Yi 2 X i )( X i ) 0
2
(Yi 2 X i )( X i ) 0
(Y i Y i )( X i ) 0
Felipe Lemarie Jorge Salgado Juan C. Serrano
24. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
i Xi 0
Es decir los residuos y la variable X no están correlacionados. Sin embargo, en el modelo con intersección,
i 0 , se puede aseverar que:
2
i
(Yi Y i ) 2 (Yi 1 2 X i ) 2
2
( i )
2 (Yi 1 2 X i )(1) 0
1
(Yi Y i ) =0
i 0
Pero como en el modelo sin intersección, i 0 ; no se puede afirmar que la i 0.
TRAER TABLA 6,1 Y 6,2
Segundo:
__
__
Recuérdese que el modelo con intersección, 1 0, se demostró que: Y Y . Pero el modelo sin
intersección, 1 0 :
u i Yi Y i Yi Y i u i
Yi Y i u i
Yi
Y i
ui
n n n
u i = 0 (esto no necesariamente sucede si 1 0 ; como se demostró anteriormente) entonces:
u i 0
__
__
Y Y ui
__
__
Y Y
Tercero:
Felipe Lemarie Jorge Salgado Juan C. Serrano
25. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
El coeficiente de determinación en el modelo con intersección, 1 0 , siempre es positivo. (La suma
estimada de cuadrados es un numero positivo, positivo para positivo da un coeficiente de determinación
positivo). Pero en el modelo sin intersección, 1 0 , puede ser negativo:
SEC STC SRC i
2
SRC
r
2
1 1
yi
2
STC STC STC
En el modelo con intersección, 1 0 : STC SEC SRC ; SRC STC . Y por tanto, el r 2 siempre
será positivo.
En el modelo sin intersección, 1 0 :
Yi 2 X i i
2
X 2 X 2 2 2X 2
Yi 2 i
i
2
2 i 2 i i i
Yi 2 22 X i2 2 2 i X i i2 i X i 0
Yi 2 22 X i2 i2
i
2
Yi 22 X i22
Por otro lado:
__
yi Yi Y
2
__ __ __ 2
y Yi Y Yi 2 2Yi Y Y
2
i
__ __ 2
y 2
i Yi 2 Y Yi n Y
2
__
Y
Y i
__
n Y Yi
n
Felipe Lemarie Jorge Salgado Juan C. Serrano
26. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
__ 2 __ 2 __ 2
y 2
i Yi 2n Y n Y Yi n Y
2 2
__ 2
Y i
2
y n Y
2
i
__ 2 2
u 2
i y n Y 2 X i2
2
i
__ 2 2
Si: n Y 2 X i2
SRC > STC
Y entonces, el r 2 será negativo.
Se acostumbra calcular con:
X
rs2
i
X Y i
2
i
2
Aunque no es comparable con el r 2 convencional tiene un intervalo de 0 r 2 1 y no está incorporando en
los paquetes econométricos. En conclusión, en todos los modelos se debe incluir la intersección para que los
mínimos cuadrados se cumplan.
Realizar:
IDP3 PIB4
IDP4 PIB3
Autocorr (-)
Ejemplo: consideremos la información de la tabla 6.1; Y GAF 36.57821 y X GPM 28.94210 (Ejer-
6.1)
EQ1 : GAF C GPM
GAF= 1.279719 1.069084GMP
(7.688560) (0.238315)
0.166445 4.486004
La t de Student de 1 están más bajo que 2 y por eso el valor probabilístico es de 0.8719, entonces, se
puede concluir que 1 0
EQ 2 : GAF GPM
GAF=1.089912 GMP
(0.191551)
5.689922
Felipe Lemarie Jorge Salgado Juan C. Serrano
27. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
La diferencia entre 1.069084 y 1.089912 no e mucha; sin embargo, en general en estos casos se debe
mantener la intersección para que se cumplan los mínimos cuadrados ordinarios.
Pasa cerca del
origen
Pr 2 t / 2 ee 2 2 2 t / 2 ee 2 1
La variable incide en la variable dependiente.
Si la t de student de la intersección está baja, pasa cerca del origen.
Regresor
significativo,
pero no se
cumplen los
MCO.
- Si hago que pase por el origen no se cumplen los mínimos cuadrados ordinarios no se cumplen.
Econometricamente la regresión no sirve.
- Técnicamente no sirve.
-Cuando la intersección es cero ( 1 ) el software informático me indica.
-En todos los modelos que yo proponga debemos incluir una intersección para asegurarnos que los mínimos
cuadrados ordinarios se cumplan para asegurarnos que todo es verdadero.
Escalas y unidades de medición:
Felipe Lemarie Jorge Salgado Juan C. Serrano
28. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
El problema: hay alguna diferencia en los resultados de la regresión si las unidades en las cuales se miden
las variables Y y X son distintas? De ser así, como se debe proceder?
Yi 1 2 X i i
Yi * W1Yi X i* W2 X i
(los valores estrellados son con diferentes variables)
Donde W1 y W2 , se denominan factores de escala, W1 puede ser igual o diferente a W2 :
ˆ ˆ*
Yi* 1* 2 X i* ui*
ˆ
ˆ*
2
x y *
i
*
i ˆ ˆ*
1* Y * 2 X *
x 2*
i
ˆ * *2 X i
2*
Var 1
n x 2*
i
ˆ*
Var 2
*2
ˆ *2
u
ˆ *2
i
xi2* n 2
Con las siguientes relaciones:
Yi* w1Yi , yi* w1 yi , X i* w2 X i
xi* w2 xi , ui* w2 ui , Y * w1Y y X * w1 X
ˆ ˆ
2
x y *
i
*
i
(w x )(w y ) w w x y
2 i 1 i 1 2 i i
w1
2
x *2
i (w x ) 2 i w x
2
2
2
i w2
* w1
2 2
w2
w1
* * * *
1 Y 2 X w1 Y
2 w2 X w1 Y w1 2 X w1 Y 2 X w1 1
w2
*
1 w1 1
Felipe Lemarie Jorge Salgado Juan C. Serrano
29. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
2
w
i i
*2
i
*2
w12 i2 w 2 i w 2 2
n 2 n 2 n 2 i
n 2 1
*2 w12 2
2
* w 2Var
Var 1 * w1
Var 2
Var 2
1
ws
1
2*
1
u
ˆ *2
i
w u
i
ˆ 2
i
w y
r
y 2
i i
2
i
w12 u12
ˆ u
ˆ *2
1 r2
2* i
r
w12 yi2 y 2
i
r *2 r 2
Ejemplo: consideremos la información de la tabla 6.2 :
IDP1= 146,5929, IDP2 = 146592.9
PIB1= 455,2486, PIB2 = 455248,6
PRIMERA ECUACIÓN:
EQ01: IDP1 C PIB1
(W1=1) (W2=1)
Felipe Lemarie Jorge Salgado Juan C. Serrano
30. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
IDP1= -1026,498 + 0.3016PIB
(257,5874) (0,0399900)
-3,985047 7,558482
ˆ
Var (1 ) 66351,27
ˆ
Var ( ) 0,001592
2
2 2969,4988 (Esta información la obtenemos mediante la calculadora)
ˆ
2 54,49311
r2= 0,877170
SEGUNDA ECUACIÓN:
EQ02: IDP2 C PIB2
W1 1000 W2 1000
IDP2= -1026498+0.301583 PIB2
(257587.4) (0.039900)
-3.985047 7.558482
var 1* 6.64 *1010
*
var 2 0.001592
*2 2969498800
Felipe Lemarie Jorge Salgado Juan C. Serrano
31. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
* 54493.11
r *2 0.877170
TERCERA ECUACIÓN
EQ03: IDP1 c PIB2
W i 1 W 2 1000
IDP1= -1026.498 + 0.000302 PIB2
5
(257.5874) (.399 *10 )
(-3.98504) (7.558482)
Var 1* 66351.27
Var 2* 1.59 *10 9
2969.4988
*2
* 54.49311
r *2 0.877170
Regresión sobre las variables estandarizadas:
Felipe Lemarie Jorge Salgado Juan C. Serrano
32. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Para evitar el problema anterior se puede plantear la regresión con ambas variables estandarizadas.
Yi Y Xi X
Yi* X i*
SY SX
ˆ ˆ*
Yi* 1* 2 X i* ui*
ˆ
ˆ ˆ*
1* Y * 2 X Y* 0 X* 0
Análisis de Y * 0
1 Y Y
Y Y
1 1 1
Y*
n
Yi* n iS nS i
nS y
y i 0
Y y
ˆ
1* 0
ˆ*
Yi* 2 X i* ui*
ˆ
En este caso, si la variable independiente estandarizada se aumenta en una desviación estándar, la variable
*
dependiente estandarizada se incrementa en 2 desviaciones estándar. Por otro lado:
*
2
x y *
i
*
i
( X X )(Y Y
*
i
*
i
* *
)
X Y * *
i i
x *2
i (X X ) *
i
* 2
X *2
i
(X i X )(Yi Y )
* SxSy Sx xi y i
2
(X i X )2 Sy xi2
Sx 2
* Sx
2 2
Sy
Ejemplo: consideremos la información de la tabla 6.2; (ejemplo 6,2)
Felipe Lemarie Jorge Salgado Juan C. Serrano
33. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
PIB3 ( PIB1 @mean(PIB1)/@stdev(PIB1)
Felipe Lemarie Jorge Salgado Juan C. Serrano
34. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
PIB4 ( PIB2 @mean(PIB2)/@stdev(PIB2)
IDP3 ( IDP1 @mean(IDP1)/@stdev(IDP1)
IDP4 ( IDP2 @mean(IDP2)/@stdev(IDP2)
Felipe Lemarie Jorge Salgado Juan C. Serrano
35. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
EQ 5= IDP3 c PIB3
Dependent Variable: IDP3
Method: Least Squares
Date: 06/05/07 Time: 09:30
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 1.78E-16 0.117552 1.51E-15 1.0000
PIB3 0.936574 0.123910 7.558482 0.0001
R-squared 0.877170 Mean dependent var 0.000000
Adjusted R-squared 0.861816 S.D. dependent var 1.000000
S.E. of regresión 0.371731 Akaike info criterion 1.035563
Sum squared resid 1.105470 Schwarz criterion 1.096080
Log likelihood -3.177815 F-statistic 57.13064
Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066
IDP3 1.78 *10 16 0.936574PIB3
(0.117552) (0.123910)
15
1.5 *10 7.558482
r 2 0.877170 r 2 0.861816 = r cuadrado ajustado.
EQ 6: IDP3 PIB3
Dependent Variable: IDP3
Method: Least Squares
Date: 06/05/07 Time: 09:32
Sample: 1988 1997
Included observations: 10
Felipe Lemarie Jorge Salgado Juan C. Serrano
36. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Variable Coefficient Std. Error t-Statistic Prob.
PIB3 0.936574 0.116824 8.016980 0.0000
R-squared 0.877170 Mean dependent var 0.000000
Adjusted R-squared 0.877170 S.D. dependent var 1.000000
S.E. of regression 0.350471 Akaike info criterion 0.835563
Sum squared resid 1.105470 Schwarz criterion 0.865821
Log likelihood -3.177815 Durbin-Watson stat 0.614662
IDP3=0.936574 PIB3
(0.116824)
(8.01698)
r 2 0.877170 r 2 0.877170
El r y el r cuadrado son los mismo.
EQ 7= IDP4 c PIB4
Dependent Variable: IDP4
Method: Least Squares
Date: 06/05/07 Time: 09:48
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -6.15E-18 0.117552 -5.23E-17 1.0000
PIB4 0.936574 0.123910 7.558482 0.0001
R-squared 0.877170 Mean dependent var -4.44E-17
Adjusted R-squared 0.861816 S.D. dependent var 1.000000
S.E. of regression 0.371731 Akaike info criterion 1.035563
Sum squared resid 1.105470 Schwarz criterion 1.096080
Log likelihood -3.177815 F-statistic 57.13064
Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066
IDP4 6.15 *10 18 0.936574PIB4
(0.117552) (0.123910)
5.23 *10 17
7.558482
r 2 0.877170 r 2 0.861816
EQ 8: IDP4 PIB4
Felipe Lemarie Jorge Salgado Juan C. Serrano
37. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
Dependent Variable: IDP4
Method: Least Squares
Date: 06/05/07 Time: 09:49
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
PIB4 0.936574 0.116824 8.016980 0.0000
R-squared 0.877170 Mean dependent var -4.44E-17
Adjusted R-squared 0.877170 S.D. dependent var 1.000000
S.E. of regression 0.350471 Akaike info criterion 0.835563
Sum squared resid 1.105470 Schwarz criterion 0.865821
Log likelihood -3.177815 Durbin-Watson stat 0.614662
IDP4=0.936574 PIB4
(0.116824)
(8.01698)
r 2 0.877170 r 2 0.877170
Si el PIB aumenta en una desviación
Estandar el IDP aumenta en 0,94
desviaciones estandar. Recordemos que
aumenta por que tiene signo positivo.
La regresión con variables estandarizadas es el único modelo que cruza por el origen cumpliendo los MCO.
Independientemente de cómo se plantea las variables, la regresión es la misma. La interpretación es: si el
PIB aumenta en una desviación estándar, el IDP se incrementa en 0.94 desviaciones estándar. Nótese que en
2
el modelo sin intersección el r es igual al r 2 .
Realizar:
IDP3 PIB4
IDP4 PIB3
Formas funcionales de los modeles de regresión
Modelos log-lineal (log-log):
Es la manera más sencilla de obtener una elasticidad. Es el mejor indicador de todos los indicadores.
Felipe Lemarie Jorge Salgado Juan C. Serrano
38. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
También denominado modelo de elasticidad constante, por que mide la elasticidad de Y con respecto a X.
Supongamos la función exponencial (Coub Douglas).
Yi 1 X i 2 e ui
dY
dY X
EYX Y *
dX dX Y
X
1 2 X i 1eu X i
2 i
EYX 2
1 X i eu 2 i
ln Yi ln 1 ln 2 X i ui
ln Yi ln 2 X i ui
Linealizar es sacar los logaritmos a ambos lados.
Consideremos la información de la tabla 6.3;
GSE=135.2642, GBD=65.25941, GBP=61.19171, GCP=160.5416 (Ejer-6.3)
*Generalmente expresar una variable con tres letras*
*ese log es el logaritmo naperiano (base e) ya no se trabaja con el logaritmo decimal*
LGSE=LOG(GSE)
LGBD=LOS(GBD)
LGBP=LOG(GBP)
LGCP=LOG(GCP)
Vamos a ver la elasticidad de los tres primeros cuando el gasto total aumenta
EQ01: LGSE C LGCP
Dependent Variable: LGBD
Method: Least Squares
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000
R-squared 0.984969 Mean dependent var 6.407036
Adjusted R-squared 0.984253 S.D. dependent var 0.106162
Felipe Lemarie Jorge Salgado Juan C. Serrano
39. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130
Durbin-Watson stat 2.363903 Prob(F-statistic) 0.000000
LGSE=0.130296 + 0.919989LGCP
(0.064914) (0.007681) error estándar
(1.591280) (119.7712) t de student
La intersección esta pasando cerca del origen, no en el origen, pero como yo necesito que exista la
intersección para que se cumplan los MCO yo no le hago caso a la t de student de la regresión.
Cuando los gastos de consumo personal total aumenta en un 1% (no el logaritmo de los gastos), entonces los
gastos en servicios (GSE) aumenta en 0.92%. Si el signo es negativo el GSE disminuye.
EQ02= LGBD C LGCP
Dependent Variable: LGBD
Method: Least Squares
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000
R-squared 0.984969 Mean dependent var 6.407036
Adjusted R-squared 0.984253 S.D. dependent var 0.106162
S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130
Durbin-Watson stat 2.363903 Prob(F-statistic) 0.000000
LGBD= -9.697098 + 1.905633LGCP
(0.434127) (0.051370) error estándar
-22.33702 37.09622 t de student
La intersección pasa lejos del origen, por que la t de student es alta 22.33702 (nada mas no hay otra
explicación que dar)
Si los gastos totales aumenta en 1% los gastos en bienes duraderos (GBD) se incrementaran en 1.91%
(aprox)
EQ03= LGBP C LGCP
Felipe Lemarie Jorge Salgado Juan C. Serrano
40. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
LGBP = 0.780076 + 0.767695 LGCP
(0.077143) (0.009128) error estándar
10.11202 84.10016 t de student
Si los gastos totales aumentan en 1% los gastos en bienes perecederos se incrementaran en 0.77% (aprox)
Modelo log-lin:
También denominado semilog por que solamente una variable aparece en forma logarítmica, mide la tasa de
crecimiento instantáneo de variables.
Yt Yo (1 r ) t
ln Yt ln Yo t log(1 r )
1 lnY0 2 ln 1 r
ln Yt 1 2t ut
2 mide el cambio relativo de Y(%) debido a un cambio de t, se conoce como la semielasticidad de Y
respecto a t.
Modelo de tendencia lineal:
En lugar de estimar el modelo anterior, algunas veces se estima el siguiente.
Yt 1 2t ut
Que se denomina modelo de tendencia lineal, la variable de tiempo (t) se conoce como la variable de
tendencia, que puede ser creciente o decreciente.
Mide el cambio de Y en valores absolutos por una unidad de tiempo.
En el examen necesitamos las cifras de view/ estimation out put
Modelo lin-log control de lectura
Ejemplo: consideremos la información de la tabla 6.3, (Ejer. 6.3).
EQ 4 : LGSE C t
LGSE: 7.788347 + 0.007466t
(0.002289) (0.000167)
3402.198 44.71844
La tasa de crecimiento instantáneo de los gastos en servicios es de 0.747%
EQ 5 : LGBD C t
LGBD= 6.221691+0.015445t
(0.0007597) (0.000554)
Felipe Lemarie Jorge Salgado Juan C. Serrano
41. PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR
APUNTES DE ECONOMETRÍA I
ECONOMISTA LINCOLN MAIGUASHCA
818.9877 27.87711
La tasa de crecimiento instantáneo de los gastos en bienes duraderos es de 1.54%.
(Las cifras q me debe poner es del view stimation output cifras decimales q se deben declarar)
EQ 6 : LGBP C t
LGBP=7.192967+0.006229t
(0.002077) (0.000151)
3463.080 41.11945
La tasa de crecimiento instantáneo de los gastos en bienes perecederos es de 0.623%
EQ 7 : LGCP C t
LGCP= 8.353433+0.008114t
(0.002342) (0.000171)
3566.568 47.50231
La tasa de crecimiento instantáneo de los gastos en consumo personal total es de 0.81%
EQ 9 : GBD c t
GBD= 496.0818 + 9.442095t
(5.540763) (0.404102)
Los gastos en bienes duraderos han aumentado en 9.44 dólares trimestrales
19.79 equivale al 0.747%
EQ10 : GBP c t
GBP=1327.086 + 8.952273
(3.55064) (0.244693)
395.5467 36.58567
Los gastos en bienes perecederos han aumentado en 8.95 dólares trimestralmente
EQ11: GCP c t
Felipe Lemarie Jorge Salgado Juan C. Serrano