SlideShare una empresa de Scribd logo
1 de 11
Descargar para leer sin conexión
Postestratificación y Regresiones
Multiniveles (MLR)
Rafael Labrador
Caracas, junio 2017
Caso de estudio: Forecasting Elections with
no representative polls. Gelman et al. (2014)
• La pregunta : “¿Es posible emular pronósticos electorales hechos con “buenas encuestas” usando
“malas encuestas”?”/1
• El método: Postestratificación y Postestimación = MRP (Multi-level Regression and
Poststretification)
• Las “buenas” encuestas: Pollster
• La “mala” encuesta: Xbox
• La conclusión: sí se puede
Gráfico: Resultados electorales estimados por el promedio de encuestas recogidas por Pollster.com vs las estimadas por el modelo propuesto. En la línea
horizontal se representan los resultados efectivamente arrojados por la elección.
/1: Se entiende por encuestas “buenas” aquellas que satisfacen los requisitos estadísticos de la teoría del muestro, asegurando su representatividad de la población
estudiada.
Primera parte: ¿Qué es la Post-
estratificación?
• ¿Qué es? Un método de estimación basado en la “estratificación” de una
muestra, es decir, su división en grupos.
• ¿Para qué se usa? Para obtener estimadores de calidad a partir de una
muestras no representativas.
• ¿En qué consiste? En un promedio ponderado de las estimaciones de la
variable de interés dentro de cada estrato.
– ¿Es igual a un promedio de los datos? No. La estimación asegura el cumplimiento del
supuesto de normalidad.
• ¿Qué se necesita? Los parámetros (pesos) poblacionales que definen a
los estratos.
(𝑦𝑗 ∗ 𝑤𝑗)𝑛
𝑗=1
𝑁𝑗
𝑛
𝑗=1
= 𝑦~𝑁(𝜇; 𝜎2)
Veamos un ejemplo (Gelman et al.
2014)
• Encuesta Xbox.
– Variables:
• Intención de voto, por Estado (explicada)
Explicativas
• Control Estado
• Resultado en elección pasada en el estado
• Nivel educativo
• Género
• Edad
• Raza
• Identificación del partido
• Ideología
• Último voto
Modelo bayesiano propuesto:
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Nivel.Educ
Género
Edad
Raza
IdPartido
Ideología
Últimovoto
Xbox
Censo
Pesos
(1) (2)
El siguiente paso: La Regresión Multi-Nivel
(MLR)
• En el caso anterior, se estimaban parámetros (hiperparámetros) a nivel estadal. Surge la pregunta ¿Cómo
incoporarlos a nivel individual? Para ello se usa la MLR.
• ¿Qué es? Un método de estimación que hace endógenos a los parámetros de la regresión.
• ¿Para qué se usa? Para incorporar información en bases de datos jerárquicos.
• ¿Qué ventaja suponen?
– Mantienen la varianza correspondiente a los grupos superiores
– Aíslan los efectos correspondientes a cada nivel
– Permiten controlar por la varianza (error) proveniente de cada nivel
– Corrigen sesgo de endogeneidad
• ¿Cuántos parámetros se estiman en las MLR?
– Tres (3), dependiendo del modelo:
1. Fixed Intercept and Random Slope
2. Random Intercept and Fixed Slope
3. Random Intercept and Slope
(1) Y (2) = mixed effects
• ¿Qué los distingue de los modelos tradicionales?
– Que los parámetros también se modelan (o simulan)
Veamos un ejemplo, (Woltman et. Al (2012))
• Se desea conocer la incidencia de el régimen alimenticio de los niños sobre su
índice académico, en una escuela.
• La base de datos (Jerárquica) viene dada por:
• 𝑋𝐼; 𝑋𝑗; 𝑋 𝐾 … 𝑋 𝑛 ∈ 𝑋 𝑐𝑜𝑛 𝑍 = 𝑛𝑖𝑣𝑒𝑙𝑒𝑠 𝑑𝑒 𝑎𝑔𝑟𝑒𝑔𝑎𝑐𝑖ó𝑛 𝑝𝑒𝑟𝑜 𝑦𝑖 ∈ 𝑍(𝑛 − 𝑛 − 1) únicamente.
• Por un lado, estimamos la variable de interés:
• Y por otro lado, estimamos los efectos asociados a los niveles superiores:
Niños (unidad estadística)
Salón
Escuela
Distrito Educativo
Municipio…Estado…
Índice Académico
Condicionado a que: 𝑈0𝑖~𝑁(𝜇; 𝛿)
¿Cómo se estiman los hiperparámetos?
• El recuadro rojo anterior hacía referencia a un término de error que sigue
una distribución normal.
• ¿Cómo se generan estos parámetros de la distribución?
– De simular la estimación del parámetro “n” veces, lo cual da lugar a una distribución de la cual se extraen la media y
la varianza.
– Por el mismo proceso, se le imputa un valor a cada observación a regresar.
• Por esta razón, los “hiperparámetros” siempre que sean tratados como
“random effects” deberán ser simulados, una vez estimada su
distribución.
• Entonces, el modelo final es un modelo, del modelo, del modelo, del
modelo … de los niveles superiores.
¿Y para la estimación bayesiana…?
Inf. Bayesiana : no tan oscura como parece
• ¿Qué es? Procesos estadísticos que modelan parámetros desconocidos
como variables aleatorias (Gellman, 2010)
• Características
– Toda inferencia parte de una distribución a priori (non informative) que luego es
adaptada por lo datos
– Todo lo que sea una proporción o media es estimable bayesianamente.
– La teoría descansa en el teorema de Bayes, que recoge la probabilidad condicionada.
• ¿Cómo son las estimaciones?
– Se estiman distribuciones de probabilidad, no valores puntuales.
– Se usan las simulaciones para obtener los parámetros de las distribuciones de las
perturbaciones.
• Beneficios
– Las simulaciones permiten controlar por la endogeneidad
Referencias
• Wei Wang, David Rothschild, Sharad Goel, Andrew Gelman, Forecasting elections with non-
representative polls, International Journal of Forecasting, Volume 31, Issue 3, July–
September 2015, Pages 980-991, ISSN 0169-2070,
https://doi.org/10.1016/j.ijforecast.2014.06.001 .
(http://www.sciencedirect.com/science/article/pii/S016920701400087)
• Woltman, Heather , Feldstain, Andrea , MacKay, J. Christine , Rocchi, Meredith
52-69
http://www.tqmp.org/RegularArticles/vol08-1/p052/
¡Gracias!

Más contenido relacionado

Similar a Postestratificación y regresiones multiniveles (mlr)

9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la InvestigacionEdison Coimbra G.
 
Estadistica silvia
Estadistica silviaEstadistica silvia
Estadistica silviaSilvi Guanga
 
Estadistica silvia
Estadistica silviaEstadistica silvia
Estadistica silviaSilvi Guanga
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Gina Mejía
 
Análisis de datos
Análisis de datosAnálisis de datos
Análisis de datoscaceli
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxLaalpacaARoxhzeeraFl
 
Redes sociales presentación 30 08 2010 carlos f. de angelis
Redes sociales presentación 30 08 2010 carlos f. de angelisRedes sociales presentación 30 08 2010 carlos f. de angelis
Redes sociales presentación 30 08 2010 carlos f. de angelisMario Sullivan
 
Análisis Cuantitativo: Estadística Descriptiva
Análisis Cuantitativo: Estadística DescriptivaAnálisis Cuantitativo: Estadística Descriptiva
Análisis Cuantitativo: Estadística DescriptivaHarold Gamero
 
Simulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelSimulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelAlvaro Gil
 
Cuestiones practicas de estadística
Cuestiones practicas de estadísticaCuestiones practicas de estadística
Cuestiones practicas de estadísticagrahbio14
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadisticaBk M
 

Similar a Postestratificación y regresiones multiniveles (mlr) (20)

9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion9.Análisis de los datos. Los 10 pasos de la Investigacion
9.Análisis de los datos. Los 10 pasos de la Investigacion
 
Datamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias BiológicasDatamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias Biológicas
 
Estadistica silvia
Estadistica silviaEstadistica silvia
Estadistica silvia
 
Estadistica silvia
Estadistica silviaEstadistica silvia
Estadistica silvia
 
Exposicion Tema Analisis De Datos
Exposicion Tema Analisis De DatosExposicion Tema Analisis De Datos
Exposicion Tema Analisis De Datos
 
9. Analisis de datos.pptx
9. Analisis de datos.pptx9. Analisis de datos.pptx
9. Analisis de datos.pptx
 
Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial Técnicas de Inteligencia Artificial
Técnicas de Inteligencia Artificial
 
Análisis de datos
Análisis de datosAnálisis de datos
Análisis de datos
 
ETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACIONETAPAS DEL PROCESO DE SIMULACION
ETAPAS DEL PROCESO DE SIMULACION
 
Métodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptxMétodos cuantitativos_2020_2 (2).pptx
Métodos cuantitativos_2020_2 (2).pptx
 
Inferencia estadística
Inferencia estadísticaInferencia estadística
Inferencia estadística
 
Presentación1 w
Presentación1 wPresentación1 w
Presentación1 w
 
Redes sociales presentación 30 08 2010 carlos f. de angelis
Redes sociales presentación 30 08 2010 carlos f. de angelisRedes sociales presentación 30 08 2010 carlos f. de angelis
Redes sociales presentación 30 08 2010 carlos f. de angelis
 
ALGORITMO GENETICO - II.pptx
ALGORITMO GENETICO - II.pptxALGORITMO GENETICO - II.pptx
ALGORITMO GENETICO - II.pptx
 
Análisis Cuantitativo: Estadística Descriptiva
Análisis Cuantitativo: Estadística DescriptivaAnálisis Cuantitativo: Estadística Descriptiva
Análisis Cuantitativo: Estadística Descriptiva
 
Rep1 estadística
Rep1 estadísticaRep1 estadística
Rep1 estadística
 
Simulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con PromodelSimulación: Teoría y aplicaciones con Promodel
Simulación: Teoría y aplicaciones con Promodel
 
Cuestiones practicas de estadística
Cuestiones practicas de estadísticaCuestiones practicas de estadística
Cuestiones practicas de estadística
 
Guia 1-estadistica
Guia 1-estadisticaGuia 1-estadistica
Guia 1-estadistica
 
Datos Cuantitativos
Datos CuantitativosDatos Cuantitativos
Datos Cuantitativos
 

Último

Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfJC Díaz Herrera
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfJC Díaz Herrera
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfMiguelGomez900779
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxCristianCastro978067
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfJC Díaz Herrera
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 

Último (20)

Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdfINFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
INFORME DE EVALUACIÓN DE LOS REQUERIMIENTOS.pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptxMÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
MÍNIMO COMÚN MÚLTIPLO, MÁXIMO COMÚN DIVISOR.pptx
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 

Postestratificación y regresiones multiniveles (mlr)

  • 1. Postestratificación y Regresiones Multiniveles (MLR) Rafael Labrador Caracas, junio 2017
  • 2. Caso de estudio: Forecasting Elections with no representative polls. Gelman et al. (2014) • La pregunta : “¿Es posible emular pronósticos electorales hechos con “buenas encuestas” usando “malas encuestas”?”/1 • El método: Postestratificación y Postestimación = MRP (Multi-level Regression and Poststretification) • Las “buenas” encuestas: Pollster • La “mala” encuesta: Xbox • La conclusión: sí se puede Gráfico: Resultados electorales estimados por el promedio de encuestas recogidas por Pollster.com vs las estimadas por el modelo propuesto. En la línea horizontal se representan los resultados efectivamente arrojados por la elección. /1: Se entiende por encuestas “buenas” aquellas que satisfacen los requisitos estadísticos de la teoría del muestro, asegurando su representatividad de la población estudiada.
  • 3. Primera parte: ¿Qué es la Post- estratificación? • ¿Qué es? Un método de estimación basado en la “estratificación” de una muestra, es decir, su división en grupos. • ¿Para qué se usa? Para obtener estimadores de calidad a partir de una muestras no representativas. • ¿En qué consiste? En un promedio ponderado de las estimaciones de la variable de interés dentro de cada estrato. – ¿Es igual a un promedio de los datos? No. La estimación asegura el cumplimiento del supuesto de normalidad. • ¿Qué se necesita? Los parámetros (pesos) poblacionales que definen a los estratos. (𝑦𝑗 ∗ 𝑤𝑗)𝑛 𝑗=1 𝑁𝑗 𝑛 𝑗=1 = 𝑦~𝑁(𝜇; 𝜎2)
  • 4. Veamos un ejemplo (Gelman et al. 2014) • Encuesta Xbox. – Variables: • Intención de voto, por Estado (explicada) Explicativas • Control Estado • Resultado en elección pasada en el estado • Nivel educativo • Género • Edad • Raza • Identificación del partido • Ideología • Último voto Modelo bayesiano propuesto: 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 Nivel.Educ Género Edad Raza IdPartido Ideología Últimovoto Xbox Censo Pesos (1) (2)
  • 5. El siguiente paso: La Regresión Multi-Nivel (MLR) • En el caso anterior, se estimaban parámetros (hiperparámetros) a nivel estadal. Surge la pregunta ¿Cómo incoporarlos a nivel individual? Para ello se usa la MLR. • ¿Qué es? Un método de estimación que hace endógenos a los parámetros de la regresión. • ¿Para qué se usa? Para incorporar información en bases de datos jerárquicos. • ¿Qué ventaja suponen? – Mantienen la varianza correspondiente a los grupos superiores – Aíslan los efectos correspondientes a cada nivel – Permiten controlar por la varianza (error) proveniente de cada nivel – Corrigen sesgo de endogeneidad • ¿Cuántos parámetros se estiman en las MLR? – Tres (3), dependiendo del modelo: 1. Fixed Intercept and Random Slope 2. Random Intercept and Fixed Slope 3. Random Intercept and Slope (1) Y (2) = mixed effects • ¿Qué los distingue de los modelos tradicionales? – Que los parámetros también se modelan (o simulan)
  • 6. Veamos un ejemplo, (Woltman et. Al (2012)) • Se desea conocer la incidencia de el régimen alimenticio de los niños sobre su índice académico, en una escuela. • La base de datos (Jerárquica) viene dada por: • 𝑋𝐼; 𝑋𝑗; 𝑋 𝐾 … 𝑋 𝑛 ∈ 𝑋 𝑐𝑜𝑛 𝑍 = 𝑛𝑖𝑣𝑒𝑙𝑒𝑠 𝑑𝑒 𝑎𝑔𝑟𝑒𝑔𝑎𝑐𝑖ó𝑛 𝑝𝑒𝑟𝑜 𝑦𝑖 ∈ 𝑍(𝑛 − 𝑛 − 1) únicamente. • Por un lado, estimamos la variable de interés: • Y por otro lado, estimamos los efectos asociados a los niveles superiores: Niños (unidad estadística) Salón Escuela Distrito Educativo Municipio…Estado… Índice Académico Condicionado a que: 𝑈0𝑖~𝑁(𝜇; 𝛿)
  • 7. ¿Cómo se estiman los hiperparámetos? • El recuadro rojo anterior hacía referencia a un término de error que sigue una distribución normal. • ¿Cómo se generan estos parámetros de la distribución? – De simular la estimación del parámetro “n” veces, lo cual da lugar a una distribución de la cual se extraen la media y la varianza. – Por el mismo proceso, se le imputa un valor a cada observación a regresar. • Por esta razón, los “hiperparámetros” siempre que sean tratados como “random effects” deberán ser simulados, una vez estimada su distribución. • Entonces, el modelo final es un modelo, del modelo, del modelo, del modelo … de los niveles superiores.
  • 8. ¿Y para la estimación bayesiana…?
  • 9. Inf. Bayesiana : no tan oscura como parece • ¿Qué es? Procesos estadísticos que modelan parámetros desconocidos como variables aleatorias (Gellman, 2010) • Características – Toda inferencia parte de una distribución a priori (non informative) que luego es adaptada por lo datos – Todo lo que sea una proporción o media es estimable bayesianamente. – La teoría descansa en el teorema de Bayes, que recoge la probabilidad condicionada. • ¿Cómo son las estimaciones? – Se estiman distribuciones de probabilidad, no valores puntuales. – Se usan las simulaciones para obtener los parámetros de las distribuciones de las perturbaciones. • Beneficios – Las simulaciones permiten controlar por la endogeneidad
  • 10. Referencias • Wei Wang, David Rothschild, Sharad Goel, Andrew Gelman, Forecasting elections with non- representative polls, International Journal of Forecasting, Volume 31, Issue 3, July– September 2015, Pages 980-991, ISSN 0169-2070, https://doi.org/10.1016/j.ijforecast.2014.06.001 . (http://www.sciencedirect.com/science/article/pii/S016920701400087) • Woltman, Heather , Feldstain, Andrea , MacKay, J. Christine , Rocchi, Meredith 52-69 http://www.tqmp.org/RegularArticles/vol08-1/p052/