1. Bondad de ajuste y capacidad predictiva del modelo dicotómico
Luz M. Ferrada B.
R2 de McFadden: Se obtiene a partir de la función de verosimilitud del modelo,
comparando el valor que toma dicha función en su punto máximo (es decir, en el estimador
MV) con el valor que tomaría si en el modelo la única variable explicativa fuera el término
constante.
ln LSR
R2 =1−
ln LCR
• lnLSR es el logaritmo de la función de verosimilitud del modelo sin restringir,
• lnLCR es el logaritmo de la función de verosimilitud del modelo restringido
(restricción= todos los parámetros, excepto el término constante, son nulos.
• La medida esta acotada entre 0 y 1.
• Si ambas funciones de verosimilitud son iguales, el estadístico tomará valor cero. En
ese caso el modelo estimado no aportaría ninguna ventaja frente a un modelo sin
variables explicativas.
Akaike (AIC), Schwarz (SC) y Hannan – Quinn (H-Q)
Estos criterios miden la bondad de ajuste considerando los grados de libertad de los
modelos, esto es, realizan una corrección al estadístico LR de acuerdo al número de
parámetros del modelo y al tamaño de la muestra. Se definen como:
2k 2 ln L
AIC = −
n n
k * ln n 2 ln L
SC = −
n n
2 * k * ln(ln n ) 2 ln L
H −Q = −
n n
-1-
2. • lnL es el logaritmo de la función de verosimilitud,
• k el número de parámetros que se estiman y
• n el tamaño de la muestra.
Sirven para comparar la bondad de ajuste de distintos modelos con las mismas
variables dependientes. Es preferible la estimación con menor valor de AIC, AC o H-Q, es
decir, con mayor valor del logaritmo de la función de verosimilitud.
Análisis del número de estimaciones erróneas
Probabilidades Estimadas: número de errores obtenidos en las predicciones del modelo.
n ∧ ∧ ∧ ∧ ∧
∑ ( yi − y i ) 2 , donde y i = 1 si Ρi ≥ 0,5 y y i = 0 si Ρi ≤ 0,5 .
i =1
Contraste de Hosmer-Lemeshow (H-L)
Si p es el valor que asume la función ajustada para un sujeto cualquiera, de modo
que se puede calcular p1, p2, p3.....pn a partir del modelo ajustado, luego ordenar de menor a
mayor y dividir en grupos, en este caso en deciles, cada uno con mi observaciones, el
estadígrafo H-L se calcula como:
H−L=
j
(y j − (m j p j ))2 ≈ χ 2− 2
∑ m j p(1 − p j )
j =1
j
Donde p j corresponde al promedio de las probabilidades estimadas en el grupo j, yi al
número de observaciones iguales a 1 en el grupo j.
pj = ∑
ˆ
pi
= ∑i∈ j
[1 − F (− x′βˆ )]
i
i∈ j mj mj
yi =∑ i∈ j
yi
-2-
3. De este modo, el estadístico H-L es mayor conforme aumenta la diferencia entre el
número de valores iguales a 1 observados y la probabilidad acumulada de que ello
acontezca. H-L se distribuye como una χ 2 con J-2 grados de libertad.
Análisis de significación individual de las variables explicativas
Dadas las propiedades estadísticas de los estimadores máximo-verosímiles y su
distribución asintótica normal, se puede plantear el siguiente contraste de hipótesis sobre un
coeficiente de regresión individual:
Η 0 : βk = 0
Η1 : β k ≠ 0
βk
ˆ
El estadístico de contraste es: ≈ N (0,1)
sβ
ˆ
k
Análisis de significación conjunta de las variables explicativas.
Contraste de la razón de verosimilitud o LR statistic,
LR = −2 ln(λ ) = −2(ln LCR − ln LSR )
LR se distribuye según una χ 2 con un número de grados de libertad igual al de
restricciones.
-3-