Este documento presenta un análisis estadístico de datos de apuestas deportivas para predecir los resultados de los partidos. Se estiman modelos lineales de probabilidad y probit para predecir la probabilidad de que gane el equipo favorito. Los resultados muestran que la diferencia de puntos predicha (spread) es estadísticamente significativa y aumenta la probabilidad de victoria del equipo favorito. El modelo probit estima una probabilidad mayor que el modelo lineal cuando spread es 10. Finalmente, se analizan datos de préstamos para detectar posible discrimin
Los avatares para el juego dramático en entornos virtuales
practica del laboratoria
1. TRABAJO
Integrantes
AlexJavier FloresLoja
Paola Sanchez
C17.1 La variable favwines una variable binaria si el equipofavorecidopor la diferenciade
puntos (spread) predichapor Las Vegas gana. Un modelode probabilidadlineal para estimar si
el equipofavorecidogana esP(favwin= 1|spread) = β0 + β1spread.Explique porqué, si la
diferenciade puntos (spread) incorpora toda la información relevante,se esperaβ0 = 0.5.
Porque quiere decirde que el equipofavorecidogane,esde 50%,si noexistieraunfavorito,la
variable seríamenora 0.5
ii) Estime el modelode la parte i) mediante MCO.Pruebe H0: β0 = .5 frente a una alternativa de
dos colas. Use los erroresestándar usualesy losrobustos a la heterocedasticidad.
. reg favwin spread
Source | SS df MS Number of obs = 553
-------------+---------------------------------- F(1, 551) = 68.57
Model | 11.0636261 1 11.0636261 Prob > F = 0.0000
Residual | 88.9038241 551 .161349953 R-squared = 0.1107
-------------+---------------------------------- Adj R-squared = 0.1091
Total | 99.9674503 552 .181100453 Root MSE = .40168
------------------------------------------------------------------------------
favwin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
spread | .0193655 .0023386 8.28 0.000 .0147718 .0239593
_cons | .5769492 .0282345 20.43 0.000 .5214888 .6324097
------------------------------------------------------------------------------
Al momento de realizar la estimación la variable spread se muestra significativa.
. reg favwin spread, r
Linear regression Number of obs = 553
F(1, 551) = 101.54
Prob > F = 0.0000
R-squared = 0.1107
2. Root MSE = .40168
------------------------------------------------------------------------------
| Robust
favwin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
spread | .0193655 .0019218 10.08 0.000 .0155905 .0231405
_cons | .5769492 .0316568 18.23 0.000 .5147664 .6391321
------------------------------------------------------------------------------
iii) ¿La variable spreades estadísticamente significativa?¿Cuál esla probabilidadestimadasde
que el equipogane cuando spread= 10?
. reg favwin spread
Source | SS df MS Number of obs = 553
-------------+---------------------------------- F(1, 551) = 68.57
Model | 11.0636261 1 11.0636261 Prob > F = 0.0000
Residual | 88.9038241 551 .161349953 R-squared = 0.1107
-------------+---------------------------------- Adj R-squared = 0.1091
Total | 99.9674503 552 .181100453 Root MSE = .40168
------------------------------------------------------------------------------
favwin | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
spread | .0193655 .0023386 8.28 0.000 .0147718 .0239593
_cons | .5769492 .0282345 20.43 0.000 .5214888 .6324097
------------------------------------------------------------------------------
Cuando spread es =10
. mfx, at( spread=10 )
Marginal effects after regress
y = Fitted values (predict)
= .77060438
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
spread | .0193655 .00234 8.28 0.000 .014782 .023949 10
------------------------------------------------------------------------------
3. La variable spread es estadísticamente significativa y la probabilidad marginal estimada
de que que el equipo gane cuando la variable spread es = 10, es de 77%.
iv) Ahora estime un modelo probit para P( favwin 1spread ). Intérprete ypruebe la
hipótesis nula de que el intercepto es cero. [Sugerencia:recuerde que (0) .5.]
. probit favwin spread
Iteration 0: log likelihood = -302.74988
Iteration 1: log likelihood = -264.91454
Iteration 2: log likelihood = -263.56319
Iteration 3: log likelihood = -263.56219
Iteration 4: log likelihood = -263.56219
Probit regression Number of obs = 553
LR chi2(1) = 78.38
Prob > chi2 = 0.0000
Log likelihood = -263.56219 Pseudo R2 = 0.1294
------------------------------------------------------------------------------
favwin | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
spread | .092463 .0121811 7.59 0.000 .0685885 .1163374
_cons | -.0105926 .1037469 -0.10 0.919 -.2139329 .1927476
------------------------------------------------------------------------------
Podríamos manifestar que el z estadístico de spread de es de -0.10 por lo tanto la
hipótesis nula de Bo =0.5 se rechaza
v) Use el modelo probit para estimar la probabilidad de que el equipo favorito gane
cuando spread 10. Compare esto con la estimación del MPL de la parte iii).
Estimación del MPL
. mfx, at( spread=10 )
Marginal effects after regress
y = Fitted values (predict)
= .77060438
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
spread | .0193655 .00234 8.28 0.000 .014782 .023949 10
------------------------------------------------------------------------------
Modelo Probabilidad
. mfx, at( spread=10 )
Marginal effects after probit
y = Pr(favwin) (predict)
4. = .81965134
------------------------------------------------------------------------------
variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X
---------+--------------------------------------------------------------------
spread | .0242918 .00271 8.95 0.000 .018971 .029613 10
------------------------------------------------------------------------------
Al momento de realizar un modelo probit donde la variable spread= 10, nos muestra una
probabilidad de 81% en comparación de un modelo MPL con un 77% de probabilidad,
con una diferencia 4 puntos porcentuales de probabilidad de que el qeuipo favorito spread
cuando es =10 gane.
C17.2Use los datosenLOANAPP.RAWparaeste ejercicio;veatambiénel ejercicioen
computadoraC7.8.
i) Estime un modeloprobit de approve sobre white.Encuentre la probabilidadde que se
apruebe un préstamo tanto para blancos como para no blancos. ¿Cómo se compara esto
con las estimacionesde probabilidadlineal?
5. Segúnel modelolineal laprobabilidadde que losblancostenganprestamosaprobadosesde 0.20
Así mismo,aplicandounmodelonolinealcomoesprobit,nosdauna posibilidad parablancosde
0.78 más alto que enun modelolineal,esdecir,aunmayorcoeficiente mayoreslaprobabilidad
que tengapréstamosaprobadoslosblancos. De lacual enlos dosmodelosefectuadoslavariable
esmuy significativa.
ii) Ahora agregue las variableshrat, obrat, loanprc, unem,male,married, dep,sch,
cosign,chist, pubrec, mortlat1, mortlat2 y vr al modeloprobit. ¿Hay alguna evidencia
Estadísticamente significativade discriminacióncontra losno blancos?
Se podría decir que hay una posible discriminación, ya que según el coeficiente nos indica que al
aumentarlacantidadde préstamosaprobados,estosseríanparalosblancosconuna posibilidadde
0.57 , esdecir,segúnel modeloconjuntamente conlasdemás variablesexistemásposibilidadhacia
los blancos de tener prestamos aprobados.
iii) Estime el modelode la parte ii) mediante logit.Compare el coeficiente de white res-
pecto a la estimaciónprobit.
6. Segúnel modelo logitlaposibilidad de que losblancostenganprestamos aprobadosesde 0.95
Así mismo,aplicandounmodelo probitnosdaunaposibilidad parablancosde 0.52 más bajoque
enun modelo logitenel cual determianmosque tieneunmayorefecto enel modelologita
comparaxionel modeloprobit
iv) Use la ecuación(17.17) para estimar las dimensionesde losefectosdiscriminativos
para probit y logit.