SlideShare ist ein Scribd-Unternehmen logo
1 von 3
Downloaden Sie, um offline zu lesen
Bondad de ajuste y capacidad predictiva del modelo dicotómico

                                                                         Luz M. Ferrada B.



R2 de McFadden: Se obtiene a partir de la función de verosimilitud del modelo,
comparando el valor que toma dicha función en su punto máximo (es decir, en el estimador
MV) con el valor que tomaría si en el modelo la única variable explicativa fuera el término
constante.

          ln LSR
R2 =1−
          ln LCR


   • lnLSR es el logaritmo de la función de verosimilitud del modelo sin restringir,
   • lnLCR es el logaritmo de la función de verosimilitud del modelo restringido
        (restricción= todos los parámetros, excepto el término constante, son nulos.
   • La medida esta acotada entre 0 y 1.
   • Si ambas funciones de verosimilitud son iguales, el estadístico tomará valor cero. En
        ese caso el modelo estimado no aportaría ninguna ventaja frente a un modelo sin
        variables explicativas.


Akaike (AIC), Schwarz (SC) y Hannan – Quinn (H-Q)

Estos criterios miden la bondad de ajuste considerando los grados de libertad de los
modelos, esto es, realizan una corrección al estadístico LR de acuerdo al número de
parámetros del modelo y al tamaño de la muestra. Se definen como:

      2k 2 ln L
AIC =      −
       n        n
     k * ln n 2 ln L
SC =          −
        n          n
         2 * k * ln(ln n ) 2 ln L
H −Q =                    −
                 n            n




                                            -1-
• lnL es el logaritmo de la función de verosimilitud,
       • k el número de parámetros que se estiman y
       • n el tamaño de la muestra.

          Sirven para comparar la bondad de ajuste de distintos modelos con las mismas
variables dependientes. Es preferible la estimación con menor valor de AIC, AC o H-Q, es
decir, con mayor valor del logaritmo de la función de verosimilitud.


Análisis del número de estimaciones erróneas

Probabilidades Estimadas: número de errores obtenidos en las predicciones del modelo.

 n          ∧                     ∧              ∧          ∧         ∧
∑ ( yi − y i ) 2 , donde y i = 1 si Ρi ≥ 0,5 y y i = 0 si Ρi ≤ 0,5 .
i =1



Contraste de Hosmer-Lemeshow (H-L)

          Si p es el valor que asume la función ajustada para un sujeto cualquiera, de modo
que se puede calcular p1, p2, p3.....pn a partir del modelo ajustado, luego ordenar de menor a
mayor y dividir en grupos, en este caso en deciles, cada uno con mi observaciones, el
estadígrafo H-L se calcula como:


H−L=
             j
               (y j − (m j p j ))2    ≈ χ 2− 2
          ∑ m j p(1 − p j )
          j =1
                                          j




Donde p j corresponde al promedio de las probabilidades estimadas en el grupo j, yi al
número de observaciones iguales a 1 en el grupo j.


 pj =    ∑
                    ˆ
                    pi
                              = ∑i∈ j
                                        [1 − F (− x′βˆ )]
                                                     i
             i∈ j        mj                              mj
yi     =∑  i∈ j
                  yi




                                                                -2-
De este modo, el estadístico H-L es mayor conforme aumenta la diferencia entre el
número de valores iguales a 1 observados y la probabilidad acumulada de que ello
acontezca. H-L se distribuye como una χ 2 con J-2 grados de libertad.


Análisis de significación individual de las variables explicativas

       Dadas las propiedades estadísticas de los estimadores máximo-verosímiles y su
distribución asintótica normal, se puede plantear el siguiente contraste de hipótesis sobre un
coeficiente de regresión individual:

        Η 0 : βk = 0
        Η1 : β k ≠ 0


                                   βk
                                   ˆ
El estadístico de contraste es:             ≈ N (0,1)
                                   sβ
                                    ˆ
                                        k


Análisis de significación conjunta de las variables explicativas.

       Contraste       de     la            razón       de   verosimilitud   o   LR   statistic,
LR = −2 ln(λ ) = −2(ln LCR − ln LSR )


       LR se distribuye según una χ 2 con un número de grados de libertad igual al de
restricciones.




                                                    -3-

Weitere ähnliche Inhalte

Was ist angesagt?

AEP19. Presentación 2: Teoría de las Probabilidades
AEP19. Presentación 2: Teoría de las ProbabilidadesAEP19. Presentación 2: Teoría de las Probabilidades
AEP19. Presentación 2: Teoría de las ProbabilidadesFrancisco Sandoval
 
Diferencia entre una función y una relación
Diferencia entre una función y una relaciónDiferencia entre una función y una relación
Diferencia entre una función y una relaciónNazth Dleon
 
Discontinuidad de limites 2.1
Discontinuidad de limites 2.1Discontinuidad de limites 2.1
Discontinuidad de limites 2.1lotus123456789
 
funcion constante, par , impar
funcion constante, par , imparfuncion constante, par , impar
funcion constante, par , imparDiana Marisol
 
Clase4 Test de hipótesis en el modelo de regresión
Clase4 Test de hipótesis en el modelo de regresiónClase4 Test de hipótesis en el modelo de regresión
Clase4 Test de hipótesis en el modelo de regresiónNerys Ramírez Mordán
 
3 regresion lineal multiple estimacion y propiedades
3 regresion lineal multiple estimacion y propiedades3 regresion lineal multiple estimacion y propiedades
3 regresion lineal multiple estimacion y propiedadesjeider1624
 
AEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatoriasAEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatoriasFrancisco Sandoval
 
Polinomios, polinomios algebraicas
Polinomios, polinomios algebraicasPolinomios, polinomios algebraicas
Polinomios, polinomios algebraicasErvin de la Cruz
 
Las funciones matemáticas
Las funciones matemáticasLas funciones matemáticas
Las funciones matemáticaseduarderic
 
Presentación de Funciones Matemáticas
Presentación de Funciones MatemáticasPresentación de Funciones Matemáticas
Presentación de Funciones MatemáticasOteroOscar
 
AEP19. Presentación 3: Variables aleatorias
AEP19. Presentación 3:  Variables aleatoriasAEP19. Presentación 3:  Variables aleatorias
AEP19. Presentación 3: Variables aleatoriasFrancisco Sandoval
 

Was ist angesagt? (20)

La derivada
La derivadaLa derivada
La derivada
 
AEP19. Presentación 2: Teoría de las Probabilidades
AEP19. Presentación 2: Teoría de las ProbabilidadesAEP19. Presentación 2: Teoría de las Probabilidades
AEP19. Presentación 2: Teoría de las Probabilidades
 
Funciones
FuncionesFunciones
Funciones
 
Diferencia entre una función y una relación
Diferencia entre una función y una relaciónDiferencia entre una función y una relación
Diferencia entre una función y una relación
 
Discontinuidad de limites 2.1
Discontinuidad de limites 2.1Discontinuidad de limites 2.1
Discontinuidad de limites 2.1
 
9 funciones
9 funciones9 funciones
9 funciones
 
Matemáticas UNEFA
Matemáticas UNEFA Matemáticas UNEFA
Matemáticas UNEFA
 
funcion constante, par , impar
funcion constante, par , imparfuncion constante, par , impar
funcion constante, par , impar
 
Clase4 Test de hipótesis en el modelo de regresión
Clase4 Test de hipótesis en el modelo de regresiónClase4 Test de hipótesis en el modelo de regresión
Clase4 Test de hipótesis en el modelo de regresión
 
3 regresion lineal multiple estimacion y propiedades
3 regresion lineal multiple estimacion y propiedades3 regresion lineal multiple estimacion y propiedades
3 regresion lineal multiple estimacion y propiedades
 
3 variables aleatorias
3 variables aleatorias3 variables aleatorias
3 variables aleatorias
 
AEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatoriasAEP19. Presentación 4: Funciones de variables aleatorias
AEP19. Presentación 4: Funciones de variables aleatorias
 
Matematicas2014
Matematicas2014Matematicas2014
Matematicas2014
 
Matematicas2014
Matematicas2014Matematicas2014
Matematicas2014
 
Calculo
CalculoCalculo
Calculo
 
Funciones Reales
Funciones RealesFunciones Reales
Funciones Reales
 
Polinomios, polinomios algebraicas
Polinomios, polinomios algebraicasPolinomios, polinomios algebraicas
Polinomios, polinomios algebraicas
 
Las funciones matemáticas
Las funciones matemáticasLas funciones matemáticas
Las funciones matemáticas
 
Presentación de Funciones Matemáticas
Presentación de Funciones MatemáticasPresentación de Funciones Matemáticas
Presentación de Funciones Matemáticas
 
AEP19. Presentación 3: Variables aleatorias
AEP19. Presentación 3:  Variables aleatoriasAEP19. Presentación 3:  Variables aleatorias
AEP19. Presentación 3: Variables aleatorias
 

Andere mochten auch (8)

2 pess n20
2 pess n202 pess n20
2 pess n20
 
Métodos de regresión logística
Métodos de regresión logísticaMétodos de regresión logística
Métodos de regresión logística
 
Logit
LogitLogit
Logit
 
Model probit
Model probitModel probit
Model probit
 
Odds ratios y Riesgos relativos
Odds ratios y Riesgos relativosOdds ratios y Riesgos relativos
Odds ratios y Riesgos relativos
 
Modelos Probit Y Logit
Modelos Probit Y LogitModelos Probit Y Logit
Modelos Probit Y Logit
 
Odds ratio
Odds ratioOdds ratio
Odds ratio
 
Medidas de asociación
Medidas de asociaciónMedidas de asociación
Medidas de asociación
 

Ähnlich wie Criterios logit

3 analisis multivariable
3 analisis multivariable3 analisis multivariable
3 analisis multivariableCarmen Mejia
 
Analisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealAnalisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealmikewanda4
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 
Diseño completamente aleatorizado
Diseño completamente aleatorizadoDiseño completamente aleatorizado
Diseño completamente aleatorizadon3n4
 
Estimación de parámetros
Estimación de parámetrosEstimación de parámetros
Estimación de parámetrosGudalupe Valdez
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.pptssuserd9e9ec1
 
RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2FELIX Castro Garcia
 
1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresionSociedadIncluyente
 
Guia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una mediaGuia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una mediaITS CONSULTORIAS S.A.C
 
2.2 variables bidimensionales
2.2 variables bidimensionales2.2 variables bidimensionales
2.2 variables bidimensionalesConsuelo Valle
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptxgloria Esparraga
 

Ähnlich wie Criterios logit (20)

Estimacionpuntual1
Estimacionpuntual1Estimacionpuntual1
Estimacionpuntual1
 
3 analisis multivariable
3 analisis multivariable3 analisis multivariable
3 analisis multivariable
 
Analisis de regresion y correlacion lineal
Analisis de regresion y correlacion linealAnalisis de regresion y correlacion lineal
Analisis de regresion y correlacion lineal
 
Correlación lineal
Correlación linealCorrelación lineal
Correlación lineal
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Regresion
RegresionRegresion
Regresion
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Diseño completamente aleatorizado
Diseño completamente aleatorizadoDiseño completamente aleatorizado
Diseño completamente aleatorizado
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Estimación de parámetros
Estimación de parámetrosEstimación de parámetros
Estimación de parámetros
 
2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt2-el modelo de regresion lineal-2.ppt
2-el modelo de regresion lineal-2.ppt
 
RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2RESUMEN DE ESTADISTICA II INIDAD 2
RESUMEN DE ESTADISTICA II INIDAD 2
 
1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion
 
Guia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una mediaGuia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una media
 
2.2 variables bidimensionales
2.2 variables bidimensionales2.2 variables bidimensionales
2.2 variables bidimensionales
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx
 
Clase03 entendiendo las relaciones
Clase03   entendiendo las relacionesClase03   entendiendo las relaciones
Clase03 entendiendo las relaciones
 
EI2_MAMN_RLMultiple.ppt
EI2_MAMN_RLMultiple.pptEI2_MAMN_RLMultiple.ppt
EI2_MAMN_RLMultiple.ppt
 

Criterios logit

  • 1. Bondad de ajuste y capacidad predictiva del modelo dicotómico Luz M. Ferrada B. R2 de McFadden: Se obtiene a partir de la función de verosimilitud del modelo, comparando el valor que toma dicha función en su punto máximo (es decir, en el estimador MV) con el valor que tomaría si en el modelo la única variable explicativa fuera el término constante. ln LSR R2 =1− ln LCR • lnLSR es el logaritmo de la función de verosimilitud del modelo sin restringir, • lnLCR es el logaritmo de la función de verosimilitud del modelo restringido (restricción= todos los parámetros, excepto el término constante, son nulos. • La medida esta acotada entre 0 y 1. • Si ambas funciones de verosimilitud son iguales, el estadístico tomará valor cero. En ese caso el modelo estimado no aportaría ninguna ventaja frente a un modelo sin variables explicativas. Akaike (AIC), Schwarz (SC) y Hannan – Quinn (H-Q) Estos criterios miden la bondad de ajuste considerando los grados de libertad de los modelos, esto es, realizan una corrección al estadístico LR de acuerdo al número de parámetros del modelo y al tamaño de la muestra. Se definen como: 2k 2 ln L AIC = − n n k * ln n 2 ln L SC = − n n 2 * k * ln(ln n ) 2 ln L H −Q = − n n -1-
  • 2. • lnL es el logaritmo de la función de verosimilitud, • k el número de parámetros que se estiman y • n el tamaño de la muestra. Sirven para comparar la bondad de ajuste de distintos modelos con las mismas variables dependientes. Es preferible la estimación con menor valor de AIC, AC o H-Q, es decir, con mayor valor del logaritmo de la función de verosimilitud. Análisis del número de estimaciones erróneas Probabilidades Estimadas: número de errores obtenidos en las predicciones del modelo. n ∧ ∧ ∧ ∧ ∧ ∑ ( yi − y i ) 2 , donde y i = 1 si Ρi ≥ 0,5 y y i = 0 si Ρi ≤ 0,5 . i =1 Contraste de Hosmer-Lemeshow (H-L) Si p es el valor que asume la función ajustada para un sujeto cualquiera, de modo que se puede calcular p1, p2, p3.....pn a partir del modelo ajustado, luego ordenar de menor a mayor y dividir en grupos, en este caso en deciles, cada uno con mi observaciones, el estadígrafo H-L se calcula como: H−L= j (y j − (m j p j ))2 ≈ χ 2− 2 ∑ m j p(1 − p j ) j =1 j Donde p j corresponde al promedio de las probabilidades estimadas en el grupo j, yi al número de observaciones iguales a 1 en el grupo j. pj = ∑ ˆ pi = ∑i∈ j [1 − F (− x′βˆ )] i i∈ j mj mj yi =∑ i∈ j yi -2-
  • 3. De este modo, el estadístico H-L es mayor conforme aumenta la diferencia entre el número de valores iguales a 1 observados y la probabilidad acumulada de que ello acontezca. H-L se distribuye como una χ 2 con J-2 grados de libertad. Análisis de significación individual de las variables explicativas Dadas las propiedades estadísticas de los estimadores máximo-verosímiles y su distribución asintótica normal, se puede plantear el siguiente contraste de hipótesis sobre un coeficiente de regresión individual: Η 0 : βk = 0 Η1 : β k ≠ 0 βk ˆ El estadístico de contraste es: ≈ N (0,1) sβ ˆ k Análisis de significación conjunta de las variables explicativas. Contraste de la razón de verosimilitud o LR statistic, LR = −2 ln(λ ) = −2(ln LCR − ln LSR ) LR se distribuye según una χ 2 con un número de grados de libertad igual al de restricciones. -3-