SlideShare una empresa de Scribd logo
1 de 47
Descargar para leer sin conexión
Políticas basadas en la evidencia: el
l d l l ió lpapel de la evaluación y la
experimentación social
J é G í M t lJosé García Montalvo
Catedrático de Economía
Jornada IVALUA sobre evaluación y experimentación
26 de Septiembre de 2013
Introducción
“El diablo que hay en el mundo proviene
de la ignorancia y las buenasde la ignorancia, y las buenas
intenciones pueden hacer tanto daño
como las malas intenciones si falta elcomo las malas intenciones, si falta el
conocimiento”
Albert Camus La PlagaAlbert Camus, La Plaga
“Without data you are just one more personWithout data you are just one more person
with an opinion”
(Anonymous)
Resumen de la presentación
•Evaluación y causalidad
é•El método experimental
•Algunos ejemplos
•Conclusiones
Supuestos e inferencia estadística
• Siempre es necesario utilizar supuestos para
obtener cualquier resultado. La credibilidad del
resultado depende de lo apropiado de losresultado depende de lo apropiado de los
supuestos: no hay “free lunch”
• Cuanto más tiempo y dinero se invierte en el
di ñ t h f lt hdiseño menos supuestos hace falta hacer
• Muchas bases de datos no puede soportar una
inferencia causal decente
La esencia de la evaluación
• Evaluar supone medir lo que ha pasado frente a lo
que habría sucedido de no haber realizado unaq
actuación. La segunda situación es contrafactual:
un individuo no puede ser tratado y no tratado a
la vez. Grupo de comparación.
• Problema básico: datos faltantes.
• Evaluar supone también ser capaces de atribuir a
la actuación el efecto: causalidadla actuación el efecto: causalidad
Problemas básicos de los datos observacionales
•Endogeneidad
O– Omisión de variables correlacionadas con
variables explicativas incluidas
E d did– Errores de medida
– Simultaneidad: la relación entre instituciones
y desarrollo económicoy desarrollo económico
•Selección muestral
Selección muestral
• Elecciones presidenciales de 1936 en Estados
Unidos
• Lista muestral: familias con teléfono y dueños de
coches registrados
• Resultado de la encuesta: Landon (republicano)Resultado de la encuesta: Landon (republicano)
ganaría con el 57% de los votos frente a
Roosevelt (democrata)
• La estadística no falla Es el estadístico el que• La estadística no falla. Es el estadístico el que
puede equivocarse.
Nuevas soluciones
• En búsqueda de una fuente exógena de
variación
I ibl ( íti d L ) l áli i ó i– Imposible (crítica de Lucas): en el análisis económico
todas las variables se fijan simultáneamente. Shocks
en la función de utilidad, la productividad, etc.
cambian los parámetros de las formas reducidas. Los
datos son “sucios”. Es mejor la simulación utilizando
la estimación de “deep parameters”. DGEM y ciclosp p y
reales
– Construir experimentos o buscar experimentos
naturales o pseudo-experimentosnaturales o pseudo-experimentos
Experimentos randomizados
• E l tá d l í d l• Es el estándar en la mayoría de las
ciencias “duras”: análisis de nuevos
medicamentos procedimientos médicosmedicamentos, procedimientos médicos,
etc. FDA
• Basado en un grupo de control (al que seBasado en un grupo de control (al que se
administra placebo) y un grupo tratado.
Experimentos randomizados
• Algunos problemas:
– Pueden ser caros
– Dependiendo del objeto de estudio puede
ser imposible realizar un experimento
– En ocasiones existen problemas de tipo ético
Experimentos frente a estudios observacionales
•¿Podemos fiarnos de los resultados de
estudios que no utilizan el métodoestudios que no utilizan el método
experimental?
¿Afecta a la longevidad el hacerse un– ¿Afecta a la longevidad el hacerse un
chequeo medio anual?
– ¿Es efectiva la terapia de reemplazamiento– ¿Es efectiva la terapia de reemplazamiento
hormonal en mujeres con menopausia?
Experimentos randomizados
• La gran ventaja es que proporciona unos
resultados creíbles y difícilmente
i l bl i h idmanipulables si se han seguido
correctamente los protocolos
• La técnica estadística es muy simple y no• La técnica estadística es muy simple y no
manipulable: normalmente una diferencia
de medias (y su desviación estándar) esde medias (y su desviación estándar) es
suficiente.
Los criterios de la FDA
• Antes de la aprobación de un nuevo• Antes de la aprobación de un nuevo
principio activo es preciso probar, por
métodos experimentales:p
– que dicha molécula tiene efecto sobre el problema
que pretende resolver (tamaño de un tumor, recuento
vírico etc )vírico, etc.)
– que el procedimiento es más efectivo que los
existentes
– que no tiene efectos secundarios perjudiciales (o que
tiene efectos muy limitados)
Experimentos en ciencias sociales
• ¿Pueden hacerse experimentos
randomizados en ciencias sociales? Por
supuesto Algunos ejemplos:supuesto. Algunos ejemplos:
– El experimento Perry (1962) y el Abcedarium
– El efecto del tamaño de las clases sobre el
aprendizaje: STAR
– El efecto de los cheques escolares: PACES
(Colombia) o “School Choice Scholarship Foundation
Program” en Nueva York
– Reducción de la pobreza: PROGRESA (México).
– Programa “Moving to Opportunity” para familias quePrograma Moving to Opportunity para familias que
viven en barrios degradados de Baltimore, Boston,
Chicago, Los Angeles y Nueva York.
Experimentos en ciencias sociales
• En el campo de la evaluación educativa el Instituto
de Evaluación Educativa de Estados Unidos ha
realizado 175 experimentos randomizados desde
la aprobación de la ley Not Child Left Behind
(NCLB)
• What works clearinghouse es la base de datos queg q
contiene todos los resultados de estos
experimentos (como la FDA)
• NYT, 2 de septiembre de 2013: “Guesses andNYT, 2 de septiembre de 2013: Guesses and
Hype Give Way to Data in Study of Education”
Experimentos en ciencias sociales
• Andrew Delbanco (director of American studies at
Columbia): the tension between quantitative and
qualitative methodologies — or more accuratelyqualitative methodologies or, more accurately,
between methodology and non-methodology —
has been explored “for many centuries” under
different rubrics: “facts versus knowledge skilldifferent rubrics: facts versus knowledge, skill
versus wisdom …information versus insight.”
• “Education in the United States … has been
moving lately toward the first term [in these pairs]
and away from the second.”
Experimentos en ciencias sociales
• Por desgracia España es diferente también en
esto:
– Reformas educativas siguen polemizando sobre la– Reformas educativas siguen polemizando sobre la
asignatura de religión o educación para la ciudadanía
como si esto tuviera alguna relevancia
– Políticos siguen tozudamente haciendo caso omiso a
la evidencia existente e incluso desarrollando un
programa de gasto en ordenadores para todos losp g g p
estudiantes cuando no existe evidencia sobre la
eficacia del CAL (computer assisted learning)
Un ejemplo en detalle: STAR
• El experimento de reducción de tamañoEl experimento de reducción de tamaño
de las clases de Tennessee (STAR:
Student-Teacher Achievement Ratio)
– Experimento de cuatro años diseñado para evaluar el
efecto del aprendizaje en clases pequeñas
Coste: 12 millones de dólares– Coste: 12 millones de dólares
– Tres tratamientos:
 Clases tamaño normal (22-25 estudiantes)( )
 Clases pequeñas (13-17 alumnos)
 Clases tamaño normal y un profesor de apoyo.
STAR (cont.)
• Protocolo
– Los estudiantes que entran en la guardería en losLos estudiantes que entran en la guardería en los
colegios participantes son asignados aleatoriamente a
uno de los tres grupos
– Los estudiantes continuarán en el mismo grupo– Los estudiantes continuarán en el mismo grupo
durante los cuatro años
– En el primer año 6.400 estudiantes participaron en
108 clases pequeñas 101 clases normales y 99108 clases pequeñas, 101 clases normales y 99
clases con profesor de apoyo. En total (cuatro año):
11.200 estudiantes
STAR (cont.)
• La medida de resultados utilizada para comprobar
el efecto de los diferentes tratamientos es lael efecto de los diferentes tratamientos es la
puntuación de los alumnos en el test combinado
de matemáticas y lectura de Stanford (Stanford
Achievement Test)Achievement Test)
• Especificación
iiii uPapoyoñaClasePequeY  210 
STAR (cont.)
RegRegCursoCurso GG 11 22 33
ClaseClase
pequeñapequeña
13.90**13.90**
(2.45)(2.45)
29.78**29.78**
(2.83)(2.83)
19.39**19.39**
(2.71)(2.71)
15.59**15.59**
(2.40)(2.40)( )( ) ( )( ) ( )( ) ( )( )
Normal yNormal y
prof apoyoprof apoyo
0.310.31
(2 27)(2 27)
11.96**11.96**
(2 65)(2 65)
3.483.48
(2 54)(2 54)
--0.290.29
(2 27)(2 27)prof. apoyoprof. apoyo (2.27)(2.27) (2.65)(2.65) (2.54)(2.54) (2.27)(2.27)
ConstanteConstante 918**918** 1,039**1,039** 1,157**1,157** 1,228**1,228**
(1.63)(1.63) (1.78)(1.78) (1.82)(1.82) (1.68)(1.68)
NN 5,7865,786 6,3796,379 6,0496,049 5,9675,967,, ,, ,, ,,
STAR (cont.)
• Interpretación de los resultados:• Interpretación de los resultados:
– Para comparar entre cursos es necesario trasladar los
resultados de los tests en términos de desviaciones
estándar. El efecto de las clases pequeña es
reducido. Comparación con la mejora de la calidad
del profesorp
– Además, el efecto se concentra en los primeros años.
Continuar en una clase pequeña no produce mejoras
di i ladicionales.
La crítica de LaLonde
• Evaluación de programas de formación.
LaLonde (1986) tomó los datos delLaLonde (1986) tomó los datos del
National Supported Work Demonstration
(NSW) y comparó los resultados del( S ) y co pa ó os esu tados de
experimento randomizado con los
obtenidos por varias técnicas
éeconométricas habituales.
La crítica de LaLonde
•Heckman’s two steps model (no para
explicar)explicar)
•Supuesto de normalidad por todas
tpartes
La crítica de LaLonde
ControlControl HombresHombres MujeresMujeres
ExperimentalExperimental NSWNSW 886 (476)886 (476) 851 (317)851 (317)ExperimentalExperimental NSWNSW 886 (476)886 (476) 851 (317)851 (317)
Est 1 pasoEst 1 paso PSD1PSD1 --1 228(896)1 228(896) 2 097 (491)2 097 (491)Est. 1 pasoEst. 1 paso PSD1PSD1 1,228(896)1,228(896) 2,097 (491)2,097 (491)
CPS1CPS1 --805 (484)805 (484) 1,041 (505)1,041 (505)( )( ) , ( ), ( )
BietápicosBietápicos PSD1PSD1 --1,333(820)1,333(820) 1,129 (385)1,129 (385)
(Heckman)(Heckman)
CPS1CPS1 --22 (584)22 (584) 1,102 (323)1,102 (323)
La crítica de LaLonde
• L é d i l d• Los métodos no experimentales producen
resultados muy diferentes dependiendo del grupo
de control utilizado y de la especificación
ét i d t deconométrica adoptada.
• Los resultados de los métodos experimentales
pueden ser muy diferente de los resultados no
i t lexperimentales
• Incluso cuando los estimadores no experimentales
pasan los test convencionales pueden fracasar en
replicar los resultados experimentales.
¿Y si no podemos hacer un experimento randomizado?
• Experimentos naturales
• Quasi experimentos y métodos de• Quasi experimentos y métodos de
emparejamiento (selección en observables)
• Variables instrumentales (selección en no
b bl ) d ó lobservables). Randomización es el instrumento
perfecto
• RDD: “Regression discontinuity design”RDD: Regression discontinuity design
¿Por qué no se evalúa?
• Pritchett (2002): los promotores de las
intervenciones tienen interés en mostrarintervenciones tienen interés en mostrar
que los programas tienen un gran
impacto. Si se hiciera una evaluaciónpacto S se c e a u a e a uac ó
randomizada se revelaría el verdadero
impacto, donde no existe garantía de que
sea positivo ni importante.
¿Por qué no se evalúa correctamente?
•Dos teorías contrapuestas sobre la
utilidad de los experimentos:utilidad de los experimentos:
– la teoría de los paracaídas en la prevención
de un grave trauma relacionado con el retog
de la gravedad: “Parachute use to prevent death and major
trauma related to gravitational challenge: systematic review of randomised
controlled trials”
– Las medicinas y la seguridad alimenticia son
importantes para los políticos. La educación
no se consideran tan importante Por tanto lano se consideran tan importante. Por tanto la
evaluación correcta no importa desde un
punto de vista del ciclo político
La “teoría del paracaídas”
•La teoría del paracaídas aplicada a la
educación o la ayuda al desarrolloeducación o la ayuda al desarrollo
supone que:
las intervenciones y la ayuda al desarrollo no– las intervenciones y la ayuda al desarrollo no
tienen nunca efectos secundarios
indeseados.indeseados.
– los procedimientos alternativos son todos
igualmente eficientes o que no hayg q y
restricciones presupuestarias.
Efectos secundarios
• Maren (1997) señala que la lucha por el control de
la ayuda fue una de las causas del comienzo de lay
conflicto de Somalia entre los señores de la
guerra.
• Rajan y Subramaniam (2005) señalan que laj y ( ) q
ayuda al desarrollo reduce la competitividad
• El aumento de la proporción de ayuda sobre el PIB
reduce el nivel de democracia del país.reduce el nivel de democracia del país.
• Easterly (2006) cita un enorme listado de efectos
secundarios (White man’s burden). Muchos son
bastante sofisticados y difíciles de prever sin unbastante sofisticados y difíciles de prever sin un
estudio piloto de tipo experimental
¿Son todos los programas igualmente efectivos?
• No. Ejemplos en el caso de la educación y
desarrollo:desarrollo:
– un programa de eliminación de los parásitos
intestinales en niños cuesta $3.5 dólares para
conseguir un año adicional de asistencia a la escuela.
– la provisión de uniformes y libros gratis cuesta $99
dólares por año adicional de asistenciadólares por año adicional de asistencia.
– un programa de provisión de alimentos en las
escuelas cuesta $36 dólares por año adicional
i d id d i i l linducido de asistencia a la escuela.
¿Da lo mismo el método de evaluación de la ayuda?
• Glewwe, Kremer, Moulin y Zitzewitz (2004): El
efecto de los “flip charts” sobre el aprendizaje dep p j
los alumnos (Kenia).
• Dos tipos de evaluación:
– Con datos observacionalesCon datos observacionales
– Con datos experimentales
• ¿Qué es un “Flip chart”? Ayuda visual que contiene
una serie de cuadros (alrededor de 12) unidos poruna serie de cuadros (alrededor de 12) unidos por
un espiral.
¿Por qué usar “Flip charts”?
• Los libros de texto son muy escasos en las
escuelas de la Kenia rural. Además están escritos
en inglés (medio de instrucción en el país) y
muchos estudiantes tienen un dominio limitado de
dicho idioma.
• Los FC pueden promover el aprendizaje pues:
– Todos los estudiantes recuerdan gráficos y fotografías
más a menudo que haber leído palabrasás a e udo que abe e do pa ab as
– Los estilos de aprendizaje varían mucho entre
estudiantes: añadir ayudas visuales aumenta el
espectro de estudiantes a los que se puede enseñarespectro de estudiantes a los que se puede enseñar
efectivamente
– Las clases y presentaciones se benefician de tener
ayudas visuales suplementariasayudas visuales suplementarias
Flip charts: datos observacionales
• 100 colegios de un estudio sobre el efecto de la
provisión de libros de texto y becasp y
aleatoriamente en escuelas de Kenia.
• También se recogió información sobre materiales
docentes en las escuelas y, entre ellos, lay, ,
disponibilidad de “flip charts”
• Se dispone de información sobre el número de FC
de ciencias, matemáticas, salud-negocios en cadade ciencias, matemáticas, salud negocios en cada
escuela.
Flip charts: datos observacionales
• Para poder comparar con la intervención
experimental que se comentará posteriormenteexperimental que se comentará posteriormente
(distribución de 4 FC) el número de FC disponibles
en cada escuela se divide por 4 (bloques de FC
comparables)comparables)
• Resultados: los estudiantes que utilizaron los FC
aumentaron un 20% de una DE sus resultados
l ( 0% d l l 0escolares (un 10% es como pasar del percentil 50
al percentil 54). Tabla.
Flip charts: datos observacionales
• Si los resultados observacionales son correctos
entonces los FC son muy efectivos: el coste pory p
alumno de los cuatro FC (un set=$80) es solo el
10% del coste de los libros en las tres asignaturas
cubiertas por los FC (un libro de texto en Kenia
$ d $ )cuesta $3.3x3x80 estud.=$800) pero su impacto
es dos veces más grande que el efecto de proveer
libros de texto.
• Los FC serían, por tanto, 20 veces más efectivos
en términos de coste que los libros de texto.
Flip charts: datos experimentales
• La ONG International Christelijk Steunfonds (ICS)
proporcionó los FC.proporcionó los FC.
• La intervención consistía en 4 FC: dos sobre
ciencias (agricultura y ciencia en general), uno
sobre salud uno sobre matemáticas y un mapasobre salud, uno sobre matemáticas y un mapa
del este de África para geografía.
Flip charts: datos experimentales
• El diseño experimental consistió en la selección de
178 escuelas en Busia y Teso (Kenia) por la ONGy ( ) p
ICS
• Las escuelas elegidas tenían una media de
aprendizaje de los estudiantes similar a la mediap j
del distrito en su conjunto
• 89 escuelas fueron asignadas al grupo de control y
otras 89 al grupo tratado después de serotras 89 al grupo tratado después de ser
ordenadas por orden alfabético. De cada dos
escuelas consecutivas una se asignaba al grupo
tratado y otra al de control (sistemático)y ( )
Flip charts: datos experimentales
•Los resultados experimentales no
muestran ningún efecto significativomuestran ningún efecto significativo
de los “flip charts”:
Resultados agregados– Resultados agregados
– Resultados por asignatura
R lt d d i t– Resultados por grupos de asignaturas
¿Qué funciona?
•Usos de la ayuda al desarrollo muy
efectivos (en términos coste beneficio)efectivos (en términos coste-beneficio)
– Medicinas para acabar con los parásitos
intestinalesintestinales
– Suplemento como el hierro y la vitamina A
Subsidios a los fertilizantes– Subsidios a los fertilizantes
– Vacunación de los niños
P i ió d t bl– Provisión de agua potable
¿Qué funciona?
•Las anteriores son intervenciones
modestas frente a las grandesmodestas, frente a las grandes
promesas y el esquema utópico
(hacerlo todo a la vez) que tienen una(hacerlo todo a la vez), que tienen una
enorme incidencia sobre el bienestar
de las familias pobresde las familias pobres.
No es efectivo…
•“Flip charts”
•Dar libros (solo beneficia a los
estudiantes en el segmento superior
d l l )de la clase)
•Incentivos económicos para los
f ( b ñ dprofesores (acaban enseñando como
hacer tests)
Conclusiones
• Un evaluación creíble permitiría arrebatarle a la
política el protagonismo en ámbitos en los que no
debería tenerlodebería tenerlo
• Los programas pueden fallar y de eso también se
aprende. Tapar los fallos evitando la evaluación de
resultados o utilizando procedimiento noresultados o utilizando procedimiento no
adecuados hace una mal servicio a la comunidad
científica y a la ciudadanía en general
• La evaluación experimental puede dar resultadosLa evaluación experimental puede dar resultados
muy diferentes a los obtenidos por procedimientos
tradicionales
Conclusiones
• La evaluación experimental (randomizada) es
factible en el campo de las políticas sociales,factible en el campo de las políticas sociales,
educativas y de ayuda al desarrollo. Precisa de
recursos humanos y económicos pero no más que
la recolección de otros datos para otros tipos dela recolección de otros datos para otros tipos de
evaluación
Conclusiones
• Agencias y ONGs deben experimentar y buscar
intervenciones que funcionan verificándolo porq p
medio de las mejores técnicas de evaluación
científica disponibles y usando evaluadores
externos para evitar los intereses de los gestores
d lde los proyectos.
• Para aprender es necesario tener información.
Políticas basadas en la evidencia: el papel de la evaluación y la experimentación social

Más contenido relacionado

La actualidad más candente

Introducción a diseños de investigación
Introducción a diseños de investigaciónIntroducción a diseños de investigación
Introducción a diseños de investigaciónDaliaWonka
 
Diseño apropiado para la investigación
Diseño apropiado para la investigaciónDiseño apropiado para la investigación
Diseño apropiado para la investigaciónWilliam Matamoros
 
Diseño de Investigación
Diseño de InvestigaciónDiseño de Investigación
Diseño de Investigaciónramde21
 
Capítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística AplicadaCapítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística Aplicadaug-dipa
 
Sem 1 la investigación en las empresas
Sem 1 la investigación en las empresasSem 1 la investigación en las empresas
Sem 1 la investigación en las empresasAugusto Javes Sanchez
 
Metodologia De La Investigacion
Metodologia De La InvestigacionMetodologia De La Investigacion
Metodologia De La InvestigacionSaulen Taicho
 
Diseño de Investigación
Diseño de InvestigaciónDiseño de Investigación
Diseño de Investigaciónmariaha93
 
Investigacion Cuantitativa
Investigacion Cuantitativa Investigacion Cuantitativa
Investigacion Cuantitativa CONASIN PERU
 
Factores de validacion de la investigacion pwp
Factores de validacion de la investigacion pwpFactores de validacion de la investigacion pwp
Factores de validacion de la investigacion pwpMiyosOsorio
 
Construcción protocolo
Construcción protocoloConstrucción protocolo
Construcción protocoloEdwin Ortegate
 
INVESTIGACION CIENTIFICA EN EL POSTGRADO
INVESTIGACION CIENTIFICA EN EL POSTGRADOINVESTIGACION CIENTIFICA EN EL POSTGRADO
INVESTIGACION CIENTIFICA EN EL POSTGRADOCONASIN PERU
 
Experiencia de evaluación de un objeto de aprendizaje sobre estadística desc...
Experiencia de evaluación de un objeto de aprendizaje  sobre estadística desc...Experiencia de evaluación de un objeto de aprendizaje  sobre estadística desc...
Experiencia de evaluación de un objeto de aprendizaje sobre estadística desc...Joan Fernando Chipia Lobo
 
Pasos para elaborar un proyecto
Pasos para elaborar un proyectoPasos para elaborar un proyecto
Pasos para elaborar un proyectoTensor
 
Sesion 6-confiabilidad y validez de instrumentos de investigacion
Sesion 6-confiabilidad y validez de instrumentos de investigacionSesion 6-confiabilidad y validez de instrumentos de investigacion
Sesion 6-confiabilidad y validez de instrumentos de investigacionCarlos Garcia Saez
 
Confiabilidad y validez de instrumentos de investigacion
Confiabilidad y validez de instrumentos de  investigacionConfiabilidad y validez de instrumentos de  investigacion
Confiabilidad y validez de instrumentos de investigacionLuis_montenegro
 

La actualidad más candente (20)

Introducción a diseños de investigación
Introducción a diseños de investigaciónIntroducción a diseños de investigación
Introducción a diseños de investigación
 
Diseño apropiado para la investigación
Diseño apropiado para la investigaciónDiseño apropiado para la investigación
Diseño apropiado para la investigación
 
Diseño de Investigación
Diseño de InvestigaciónDiseño de Investigación
Diseño de Investigación
 
Capítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística AplicadaCapítulo 1 : Introducción a la Estadística Aplicada
Capítulo 1 : Introducción a la Estadística Aplicada
 
Diseno investigacion
Diseno investigacionDiseno investigacion
Diseno investigacion
 
Sem 1 la investigación en las empresas
Sem 1 la investigación en las empresasSem 1 la investigación en las empresas
Sem 1 la investigación en las empresas
 
Planteamiento del problema en la investigación cuantitativa
Planteamiento del problema en la investigación cuantitativaPlanteamiento del problema en la investigación cuantitativa
Planteamiento del problema en la investigación cuantitativa
 
Enfoque cuantitativo ITSF
Enfoque cuantitativo ITSFEnfoque cuantitativo ITSF
Enfoque cuantitativo ITSF
 
Metodologia De La Investigacion
Metodologia De La InvestigacionMetodologia De La Investigacion
Metodologia De La Investigacion
 
Diseño de Investigación
Diseño de InvestigaciónDiseño de Investigación
Diseño de Investigación
 
Capitulo 7.7 y 7.8 metodologia
Capitulo 7.7 y 7.8 metodologiaCapitulo 7.7 y 7.8 metodologia
Capitulo 7.7 y 7.8 metodologia
 
Tipo de-muestreo
Tipo de-muestreoTipo de-muestreo
Tipo de-muestreo
 
Investigacion Cuantitativa
Investigacion Cuantitativa Investigacion Cuantitativa
Investigacion Cuantitativa
 
Factores de validacion de la investigacion pwp
Factores de validacion de la investigacion pwpFactores de validacion de la investigacion pwp
Factores de validacion de la investigacion pwp
 
Construcción protocolo
Construcción protocoloConstrucción protocolo
Construcción protocolo
 
INVESTIGACION CIENTIFICA EN EL POSTGRADO
INVESTIGACION CIENTIFICA EN EL POSTGRADOINVESTIGACION CIENTIFICA EN EL POSTGRADO
INVESTIGACION CIENTIFICA EN EL POSTGRADO
 
Experiencia de evaluación de un objeto de aprendizaje sobre estadística desc...
Experiencia de evaluación de un objeto de aprendizaje  sobre estadística desc...Experiencia de evaluación de un objeto de aprendizaje  sobre estadística desc...
Experiencia de evaluación de un objeto de aprendizaje sobre estadística desc...
 
Pasos para elaborar un proyecto
Pasos para elaborar un proyectoPasos para elaborar un proyecto
Pasos para elaborar un proyecto
 
Sesion 6-confiabilidad y validez de instrumentos de investigacion
Sesion 6-confiabilidad y validez de instrumentos de investigacionSesion 6-confiabilidad y validez de instrumentos de investigacion
Sesion 6-confiabilidad y validez de instrumentos de investigacion
 
Confiabilidad y validez de instrumentos de investigacion
Confiabilidad y validez de instrumentos de  investigacionConfiabilidad y validez de instrumentos de  investigacion
Confiabilidad y validez de instrumentos de investigacion
 

Destacado

Phrasal verbs
Phrasal verbsPhrasal verbs
Phrasal verbsAKOM16
 
одноклеточные простейшие организмы
одноклеточные простейшие организмыодноклеточные простейшие организмы
одноклеточные простейшие организмыkrcentum
 
Silvia Barbero, From Waste To Taste, 27. 3. 2015
Silvia Barbero, From Waste To Taste, 27. 3. 2015Silvia Barbero, From Waste To Taste, 27. 3. 2015
Silvia Barbero, From Waste To Taste, 27. 3. 2015FEFA Faculty
 
drivers license
drivers licensedrivers license
drivers licenseMPHO KGASI
 
Exclusive Commission Structure - International Flights
Exclusive Commission Structure - International FlightsExclusive Commission Structure - International Flights
Exclusive Commission Structure - International FlightsGoWebBola.com
 
Digital Marketing - Can it be a game changer for real estate?
Digital Marketing - Can it be a game changer for real estate?Digital Marketing - Can it be a game changer for real estate?
Digital Marketing - Can it be a game changer for real estate?Olive e-Business
 
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...BananaIP Counsels
 
CANVAS Brochura Portuguese Low Resolution.pdf
CANVAS Brochura Portuguese Low Resolution.pdfCANVAS Brochura Portuguese Low Resolution.pdf
CANVAS Brochura Portuguese Low Resolution.pdfSergio Pripas
 
Dress shirts for mens | Mens Casual Shirts
Dress shirts for mens | Mens Casual ShirtsDress shirts for mens | Mens Casual Shirts
Dress shirts for mens | Mens Casual ShirtsAronwilliams
 
Theory pishrafteye modiriyate teylor(demo)(madsg.com)
Theory pishrafteye modiriyate teylor(demo)(madsg.com)Theory pishrafteye modiriyate teylor(demo)(madsg.com)
Theory pishrafteye modiriyate teylor(demo)(madsg.com)reyhaneh akbari
 

Destacado (18)

Phrasal verbs
Phrasal verbsPhrasal verbs
Phrasal verbs
 
одноклеточные простейшие организмы
одноклеточные простейшие организмыодноклеточные простейшие организмы
одноклеточные простейшие организмы
 
Silvia Barbero, From Waste To Taste, 27. 3. 2015
Silvia Barbero, From Waste To Taste, 27. 3. 2015Silvia Barbero, From Waste To Taste, 27. 3. 2015
Silvia Barbero, From Waste To Taste, 27. 3. 2015
 
drivers license
drivers licensedrivers license
drivers license
 
Resume
ResumeResume
Resume
 
Third Party Facilitators Training Program
Third Party Facilitators Training ProgramThird Party Facilitators Training Program
Third Party Facilitators Training Program
 
System of security controls
System of security controlsSystem of security controls
System of security controls
 
PsicologiaFMU
PsicologiaFMUPsicologiaFMU
PsicologiaFMU
 
Exclusive Commission Structure - International Flights
Exclusive Commission Structure - International FlightsExclusive Commission Structure - International Flights
Exclusive Commission Structure - International Flights
 
International Call
International CallInternational Call
International Call
 
Το Επιχειρησιακό Πρόγραμμα «Εκπαίδευση και Δια Βίου Μάθηση» με μία ματιά
Το Επιχειρησιακό Πρόγραμμα «Εκπαίδευση και Δια Βίου Μάθηση» με μία ματιά Το Επιχειρησιακό Πρόγραμμα «Εκπαίδευση και Δια Βίου Μάθηση» με μία ματιά
Το Επιχειρησιακό Πρόγραμμα «Εκπαίδευση και Δια Βίου Μάθηση» με μία ματιά
 
Digital Marketing - Can it be a game changer for real estate?
Digital Marketing - Can it be a game changer for real estate?Digital Marketing - Can it be a game changer for real estate?
Digital Marketing - Can it be a game changer for real estate?
 
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...
Presentation on IP Agreements for Start Ups by Dr Kalyan C Kankanala, Brain L...
 
CANVAS Brochura Portuguese Low Resolution.pdf
CANVAS Brochura Portuguese Low Resolution.pdfCANVAS Brochura Portuguese Low Resolution.pdf
CANVAS Brochura Portuguese Low Resolution.pdf
 
EKONOMIYA
EKONOMIYAEKONOMIYA
EKONOMIYA
 
Dress shirts for mens | Mens Casual Shirts
Dress shirts for mens | Mens Casual ShirtsDress shirts for mens | Mens Casual Shirts
Dress shirts for mens | Mens Casual Shirts
 
Theory pishrafteye modiriyate teylor(demo)(madsg.com)
Theory pishrafteye modiriyate teylor(demo)(madsg.com)Theory pishrafteye modiriyate teylor(demo)(madsg.com)
Theory pishrafteye modiriyate teylor(demo)(madsg.com)
 
Vianca isabel esto
Vianca isabel estoVianca isabel esto
Vianca isabel esto
 

Similar a Políticas basadas en la evidencia: el papel de la evaluación y la experimentación social

Sesion 3 metodología de la investigacion
Sesion 3 metodología de la investigacionSesion 3 metodología de la investigacion
Sesion 3 metodología de la investigacionAugusto Javes Sanchez
 
diseño de investigacion.pdf seminario de tesis
diseño de investigacion.pdf seminario de tesisdiseño de investigacion.pdf seminario de tesis
diseño de investigacion.pdf seminario de tesisJuanCarlosQuispeHuay4
 
Presentación clases fcc.pptx
Presentación clases fcc.pptxPresentación clases fcc.pptx
Presentación clases fcc.pptxMiguelon991
 
Aspectos teórico prácticos evaluacion programas.julio bejarano
Aspectos teórico prácticos evaluacion programas.julio bejaranoAspectos teórico prácticos evaluacion programas.julio bejarano
Aspectos teórico prácticos evaluacion programas.julio bejaranoJulioB
 
Tema 1.4 - Planteamiento cuantitativo del problema.pptx
Tema 1.4 - Planteamiento cuantitativo del problema.pptxTema 1.4 - Planteamiento cuantitativo del problema.pptx
Tema 1.4 - Planteamiento cuantitativo del problema.pptxYoverCalvo
 
Las ciencias sociales para las investigaciones educativas
Las ciencias sociales para las investigaciones educativasLas ciencias sociales para las investigaciones educativas
Las ciencias sociales para las investigaciones educativasEdwinRaxtun
 
Presentación del curso de met. de la inv
Presentación del curso de met. de la invPresentación del curso de met. de la inv
Presentación del curso de met. de la invMiguel Cantos
 
Tipos y diseños de investigación (1).pdf
Tipos y diseños de investigación (1).pdfTipos y diseños de investigación (1).pdf
Tipos y diseños de investigación (1).pdfjhonatansimpertiguel1
 
Ensayo un1 taller-de-investigacion-i
Ensayo un1 taller-de-investigacion-iEnsayo un1 taller-de-investigacion-i
Ensayo un1 taller-de-investigacion-ieleazarbautista35
 
Investigacion cuantitativa
Investigacion cuantitativaInvestigacion cuantitativa
Investigacion cuantitativaNombre Apellidos
 
11. tamaño de la muestra
11.  tamaño de la muestra11.  tamaño de la muestra
11. tamaño de la muestraYerko Bravo
 

Similar a Políticas basadas en la evidencia: el papel de la evaluación y la experimentación social (20)

Sesion 3 metodología de la investigacion
Sesion 3 metodología de la investigacionSesion 3 metodología de la investigacion
Sesion 3 metodología de la investigacion
 
diseño de investigacion.pdf seminario de tesis
diseño de investigacion.pdf seminario de tesisdiseño de investigacion.pdf seminario de tesis
diseño de investigacion.pdf seminario de tesis
 
Investigacion cuantitativa.
Investigacion cuantitativa. Investigacion cuantitativa.
Investigacion cuantitativa.
 
Metodos y tecnicas
Metodos y tecnicasMetodos y tecnicas
Metodos y tecnicas
 
Investigación
InvestigaciónInvestigación
Investigación
 
Presentación clases fcc.pptx
Presentación clases fcc.pptxPresentación clases fcc.pptx
Presentación clases fcc.pptx
 
Marco metodologico cuantitativo
Marco metodologico cuantitativoMarco metodologico cuantitativo
Marco metodologico cuantitativo
 
Aspectos teórico prácticos evaluacion programas.julio bejarano
Aspectos teórico prácticos evaluacion programas.julio bejaranoAspectos teórico prácticos evaluacion programas.julio bejarano
Aspectos teórico prácticos evaluacion programas.julio bejarano
 
Tema 1.4 - Planteamiento cuantitativo del problema.pptx
Tema 1.4 - Planteamiento cuantitativo del problema.pptxTema 1.4 - Planteamiento cuantitativo del problema.pptx
Tema 1.4 - Planteamiento cuantitativo del problema.pptx
 
UNIDAD 1 T.pptx
UNIDAD 1 T.pptxUNIDAD 1 T.pptx
UNIDAD 1 T.pptx
 
Las ciencias sociales para las investigaciones educativas
Las ciencias sociales para las investigaciones educativasLas ciencias sociales para las investigaciones educativas
Las ciencias sociales para las investigaciones educativas
 
EL PROTOCOLO
EL PROTOCOLOEL PROTOCOLO
EL PROTOCOLO
 
Presentación del curso de met. de la inv
Presentación del curso de met. de la invPresentación del curso de met. de la inv
Presentación del curso de met. de la inv
 
Op análisis cuanti
Op análisis  cuantiOp análisis  cuanti
Op análisis cuanti
 
Tipos y diseños de investigación (1).pdf
Tipos y diseños de investigación (1).pdfTipos y diseños de investigación (1).pdf
Tipos y diseños de investigación (1).pdf
 
Investigacion Evaluativa
Investigacion EvaluativaInvestigacion Evaluativa
Investigacion Evaluativa
 
Ensayo un1 taller-de-investigacion-i
Ensayo un1 taller-de-investigacion-iEnsayo un1 taller-de-investigacion-i
Ensayo un1 taller-de-investigacion-i
 
Investigacion cuantitativa
Investigacion cuantitativaInvestigacion cuantitativa
Investigacion cuantitativa
 
11. tamaño de la muestra
11.  tamaño de la muestra11.  tamaño de la muestra
11. tamaño de la muestra
 
Investigación cuantitativa
Investigación cuantitativaInvestigación cuantitativa
Investigación cuantitativa
 

Políticas basadas en la evidencia: el papel de la evaluación y la experimentación social

  • 1. Políticas basadas en la evidencia: el l d l l ió lpapel de la evaluación y la experimentación social J é G í M t lJosé García Montalvo Catedrático de Economía Jornada IVALUA sobre evaluación y experimentación 26 de Septiembre de 2013
  • 2. Introducción “El diablo que hay en el mundo proviene de la ignorancia y las buenasde la ignorancia, y las buenas intenciones pueden hacer tanto daño como las malas intenciones si falta elcomo las malas intenciones, si falta el conocimiento” Albert Camus La PlagaAlbert Camus, La Plaga “Without data you are just one more personWithout data you are just one more person with an opinion” (Anonymous)
  • 3. Resumen de la presentación •Evaluación y causalidad é•El método experimental •Algunos ejemplos •Conclusiones
  • 4. Supuestos e inferencia estadística • Siempre es necesario utilizar supuestos para obtener cualquier resultado. La credibilidad del resultado depende de lo apropiado de losresultado depende de lo apropiado de los supuestos: no hay “free lunch” • Cuanto más tiempo y dinero se invierte en el di ñ t h f lt hdiseño menos supuestos hace falta hacer • Muchas bases de datos no puede soportar una inferencia causal decente
  • 5. La esencia de la evaluación • Evaluar supone medir lo que ha pasado frente a lo que habría sucedido de no haber realizado unaq actuación. La segunda situación es contrafactual: un individuo no puede ser tratado y no tratado a la vez. Grupo de comparación. • Problema básico: datos faltantes. • Evaluar supone también ser capaces de atribuir a la actuación el efecto: causalidadla actuación el efecto: causalidad
  • 6. Problemas básicos de los datos observacionales •Endogeneidad O– Omisión de variables correlacionadas con variables explicativas incluidas E d did– Errores de medida – Simultaneidad: la relación entre instituciones y desarrollo económicoy desarrollo económico •Selección muestral
  • 7. Selección muestral • Elecciones presidenciales de 1936 en Estados Unidos • Lista muestral: familias con teléfono y dueños de coches registrados • Resultado de la encuesta: Landon (republicano)Resultado de la encuesta: Landon (republicano) ganaría con el 57% de los votos frente a Roosevelt (democrata) • La estadística no falla Es el estadístico el que• La estadística no falla. Es el estadístico el que puede equivocarse.
  • 8. Nuevas soluciones • En búsqueda de una fuente exógena de variación I ibl ( íti d L ) l áli i ó i– Imposible (crítica de Lucas): en el análisis económico todas las variables se fijan simultáneamente. Shocks en la función de utilidad, la productividad, etc. cambian los parámetros de las formas reducidas. Los datos son “sucios”. Es mejor la simulación utilizando la estimación de “deep parameters”. DGEM y ciclosp p y reales – Construir experimentos o buscar experimentos naturales o pseudo-experimentosnaturales o pseudo-experimentos
  • 9. Experimentos randomizados • E l tá d l í d l• Es el estándar en la mayoría de las ciencias “duras”: análisis de nuevos medicamentos procedimientos médicosmedicamentos, procedimientos médicos, etc. FDA • Basado en un grupo de control (al que seBasado en un grupo de control (al que se administra placebo) y un grupo tratado.
  • 10. Experimentos randomizados • Algunos problemas: – Pueden ser caros – Dependiendo del objeto de estudio puede ser imposible realizar un experimento – En ocasiones existen problemas de tipo ético
  • 11. Experimentos frente a estudios observacionales •¿Podemos fiarnos de los resultados de estudios que no utilizan el métodoestudios que no utilizan el método experimental? ¿Afecta a la longevidad el hacerse un– ¿Afecta a la longevidad el hacerse un chequeo medio anual? – ¿Es efectiva la terapia de reemplazamiento– ¿Es efectiva la terapia de reemplazamiento hormonal en mujeres con menopausia?
  • 12. Experimentos randomizados • La gran ventaja es que proporciona unos resultados creíbles y difícilmente i l bl i h idmanipulables si se han seguido correctamente los protocolos • La técnica estadística es muy simple y no• La técnica estadística es muy simple y no manipulable: normalmente una diferencia de medias (y su desviación estándar) esde medias (y su desviación estándar) es suficiente.
  • 13. Los criterios de la FDA • Antes de la aprobación de un nuevo• Antes de la aprobación de un nuevo principio activo es preciso probar, por métodos experimentales:p – que dicha molécula tiene efecto sobre el problema que pretende resolver (tamaño de un tumor, recuento vírico etc )vírico, etc.) – que el procedimiento es más efectivo que los existentes – que no tiene efectos secundarios perjudiciales (o que tiene efectos muy limitados)
  • 14. Experimentos en ciencias sociales • ¿Pueden hacerse experimentos randomizados en ciencias sociales? Por supuesto Algunos ejemplos:supuesto. Algunos ejemplos: – El experimento Perry (1962) y el Abcedarium – El efecto del tamaño de las clases sobre el aprendizaje: STAR – El efecto de los cheques escolares: PACES (Colombia) o “School Choice Scholarship Foundation Program” en Nueva York – Reducción de la pobreza: PROGRESA (México). – Programa “Moving to Opportunity” para familias quePrograma Moving to Opportunity para familias que viven en barrios degradados de Baltimore, Boston, Chicago, Los Angeles y Nueva York.
  • 15. Experimentos en ciencias sociales • En el campo de la evaluación educativa el Instituto de Evaluación Educativa de Estados Unidos ha realizado 175 experimentos randomizados desde la aprobación de la ley Not Child Left Behind (NCLB) • What works clearinghouse es la base de datos queg q contiene todos los resultados de estos experimentos (como la FDA) • NYT, 2 de septiembre de 2013: “Guesses andNYT, 2 de septiembre de 2013: Guesses and Hype Give Way to Data in Study of Education”
  • 16. Experimentos en ciencias sociales • Andrew Delbanco (director of American studies at Columbia): the tension between quantitative and qualitative methodologies — or more accuratelyqualitative methodologies or, more accurately, between methodology and non-methodology — has been explored “for many centuries” under different rubrics: “facts versus knowledge skilldifferent rubrics: facts versus knowledge, skill versus wisdom …information versus insight.” • “Education in the United States … has been moving lately toward the first term [in these pairs] and away from the second.”
  • 17. Experimentos en ciencias sociales • Por desgracia España es diferente también en esto: – Reformas educativas siguen polemizando sobre la– Reformas educativas siguen polemizando sobre la asignatura de religión o educación para la ciudadanía como si esto tuviera alguna relevancia – Políticos siguen tozudamente haciendo caso omiso a la evidencia existente e incluso desarrollando un programa de gasto en ordenadores para todos losp g g p estudiantes cuando no existe evidencia sobre la eficacia del CAL (computer assisted learning)
  • 18. Un ejemplo en detalle: STAR • El experimento de reducción de tamañoEl experimento de reducción de tamaño de las clases de Tennessee (STAR: Student-Teacher Achievement Ratio) – Experimento de cuatro años diseñado para evaluar el efecto del aprendizaje en clases pequeñas Coste: 12 millones de dólares– Coste: 12 millones de dólares – Tres tratamientos:  Clases tamaño normal (22-25 estudiantes)( )  Clases pequeñas (13-17 alumnos)  Clases tamaño normal y un profesor de apoyo.
  • 19. STAR (cont.) • Protocolo – Los estudiantes que entran en la guardería en losLos estudiantes que entran en la guardería en los colegios participantes son asignados aleatoriamente a uno de los tres grupos – Los estudiantes continuarán en el mismo grupo– Los estudiantes continuarán en el mismo grupo durante los cuatro años – En el primer año 6.400 estudiantes participaron en 108 clases pequeñas 101 clases normales y 99108 clases pequeñas, 101 clases normales y 99 clases con profesor de apoyo. En total (cuatro año): 11.200 estudiantes
  • 20. STAR (cont.) • La medida de resultados utilizada para comprobar el efecto de los diferentes tratamientos es lael efecto de los diferentes tratamientos es la puntuación de los alumnos en el test combinado de matemáticas y lectura de Stanford (Stanford Achievement Test)Achievement Test) • Especificación iiii uPapoyoñaClasePequeY  210 
  • 21. STAR (cont.) RegRegCursoCurso GG 11 22 33 ClaseClase pequeñapequeña 13.90**13.90** (2.45)(2.45) 29.78**29.78** (2.83)(2.83) 19.39**19.39** (2.71)(2.71) 15.59**15.59** (2.40)(2.40)( )( ) ( )( ) ( )( ) ( )( ) Normal yNormal y prof apoyoprof apoyo 0.310.31 (2 27)(2 27) 11.96**11.96** (2 65)(2 65) 3.483.48 (2 54)(2 54) --0.290.29 (2 27)(2 27)prof. apoyoprof. apoyo (2.27)(2.27) (2.65)(2.65) (2.54)(2.54) (2.27)(2.27) ConstanteConstante 918**918** 1,039**1,039** 1,157**1,157** 1,228**1,228** (1.63)(1.63) (1.78)(1.78) (1.82)(1.82) (1.68)(1.68) NN 5,7865,786 6,3796,379 6,0496,049 5,9675,967,, ,, ,, ,,
  • 22. STAR (cont.) • Interpretación de los resultados:• Interpretación de los resultados: – Para comparar entre cursos es necesario trasladar los resultados de los tests en términos de desviaciones estándar. El efecto de las clases pequeña es reducido. Comparación con la mejora de la calidad del profesorp – Además, el efecto se concentra en los primeros años. Continuar en una clase pequeña no produce mejoras di i ladicionales.
  • 23. La crítica de LaLonde • Evaluación de programas de formación. LaLonde (1986) tomó los datos delLaLonde (1986) tomó los datos del National Supported Work Demonstration (NSW) y comparó los resultados del( S ) y co pa ó os esu tados de experimento randomizado con los obtenidos por varias técnicas éeconométricas habituales.
  • 24. La crítica de LaLonde •Heckman’s two steps model (no para explicar)explicar) •Supuesto de normalidad por todas tpartes
  • 25. La crítica de LaLonde ControlControl HombresHombres MujeresMujeres ExperimentalExperimental NSWNSW 886 (476)886 (476) 851 (317)851 (317)ExperimentalExperimental NSWNSW 886 (476)886 (476) 851 (317)851 (317) Est 1 pasoEst 1 paso PSD1PSD1 --1 228(896)1 228(896) 2 097 (491)2 097 (491)Est. 1 pasoEst. 1 paso PSD1PSD1 1,228(896)1,228(896) 2,097 (491)2,097 (491) CPS1CPS1 --805 (484)805 (484) 1,041 (505)1,041 (505)( )( ) , ( ), ( ) BietápicosBietápicos PSD1PSD1 --1,333(820)1,333(820) 1,129 (385)1,129 (385) (Heckman)(Heckman) CPS1CPS1 --22 (584)22 (584) 1,102 (323)1,102 (323)
  • 26. La crítica de LaLonde • L é d i l d• Los métodos no experimentales producen resultados muy diferentes dependiendo del grupo de control utilizado y de la especificación ét i d t deconométrica adoptada. • Los resultados de los métodos experimentales pueden ser muy diferente de los resultados no i t lexperimentales • Incluso cuando los estimadores no experimentales pasan los test convencionales pueden fracasar en replicar los resultados experimentales.
  • 27. ¿Y si no podemos hacer un experimento randomizado? • Experimentos naturales • Quasi experimentos y métodos de• Quasi experimentos y métodos de emparejamiento (selección en observables) • Variables instrumentales (selección en no b bl ) d ó lobservables). Randomización es el instrumento perfecto • RDD: “Regression discontinuity design”RDD: Regression discontinuity design
  • 28. ¿Por qué no se evalúa? • Pritchett (2002): los promotores de las intervenciones tienen interés en mostrarintervenciones tienen interés en mostrar que los programas tienen un gran impacto. Si se hiciera una evaluaciónpacto S se c e a u a e a uac ó randomizada se revelaría el verdadero impacto, donde no existe garantía de que sea positivo ni importante.
  • 29. ¿Por qué no se evalúa correctamente? •Dos teorías contrapuestas sobre la utilidad de los experimentos:utilidad de los experimentos: – la teoría de los paracaídas en la prevención de un grave trauma relacionado con el retog de la gravedad: “Parachute use to prevent death and major trauma related to gravitational challenge: systematic review of randomised controlled trials” – Las medicinas y la seguridad alimenticia son importantes para los políticos. La educación no se consideran tan importante Por tanto lano se consideran tan importante. Por tanto la evaluación correcta no importa desde un punto de vista del ciclo político
  • 30. La “teoría del paracaídas” •La teoría del paracaídas aplicada a la educación o la ayuda al desarrolloeducación o la ayuda al desarrollo supone que: las intervenciones y la ayuda al desarrollo no– las intervenciones y la ayuda al desarrollo no tienen nunca efectos secundarios indeseados.indeseados. – los procedimientos alternativos son todos igualmente eficientes o que no hayg q y restricciones presupuestarias.
  • 31. Efectos secundarios • Maren (1997) señala que la lucha por el control de la ayuda fue una de las causas del comienzo de lay conflicto de Somalia entre los señores de la guerra. • Rajan y Subramaniam (2005) señalan que laj y ( ) q ayuda al desarrollo reduce la competitividad • El aumento de la proporción de ayuda sobre el PIB reduce el nivel de democracia del país.reduce el nivel de democracia del país. • Easterly (2006) cita un enorme listado de efectos secundarios (White man’s burden). Muchos son bastante sofisticados y difíciles de prever sin unbastante sofisticados y difíciles de prever sin un estudio piloto de tipo experimental
  • 32. ¿Son todos los programas igualmente efectivos? • No. Ejemplos en el caso de la educación y desarrollo:desarrollo: – un programa de eliminación de los parásitos intestinales en niños cuesta $3.5 dólares para conseguir un año adicional de asistencia a la escuela. – la provisión de uniformes y libros gratis cuesta $99 dólares por año adicional de asistenciadólares por año adicional de asistencia. – un programa de provisión de alimentos en las escuelas cuesta $36 dólares por año adicional i d id d i i l linducido de asistencia a la escuela.
  • 33. ¿Da lo mismo el método de evaluación de la ayuda? • Glewwe, Kremer, Moulin y Zitzewitz (2004): El efecto de los “flip charts” sobre el aprendizaje dep p j los alumnos (Kenia). • Dos tipos de evaluación: – Con datos observacionalesCon datos observacionales – Con datos experimentales • ¿Qué es un “Flip chart”? Ayuda visual que contiene una serie de cuadros (alrededor de 12) unidos poruna serie de cuadros (alrededor de 12) unidos por un espiral.
  • 34. ¿Por qué usar “Flip charts”? • Los libros de texto son muy escasos en las escuelas de la Kenia rural. Además están escritos en inglés (medio de instrucción en el país) y muchos estudiantes tienen un dominio limitado de dicho idioma. • Los FC pueden promover el aprendizaje pues: – Todos los estudiantes recuerdan gráficos y fotografías más a menudo que haber leído palabrasás a e udo que abe e do pa ab as – Los estilos de aprendizaje varían mucho entre estudiantes: añadir ayudas visuales aumenta el espectro de estudiantes a los que se puede enseñarespectro de estudiantes a los que se puede enseñar efectivamente – Las clases y presentaciones se benefician de tener ayudas visuales suplementariasayudas visuales suplementarias
  • 35. Flip charts: datos observacionales • 100 colegios de un estudio sobre el efecto de la provisión de libros de texto y becasp y aleatoriamente en escuelas de Kenia. • También se recogió información sobre materiales docentes en las escuelas y, entre ellos, lay, , disponibilidad de “flip charts” • Se dispone de información sobre el número de FC de ciencias, matemáticas, salud-negocios en cadade ciencias, matemáticas, salud negocios en cada escuela.
  • 36. Flip charts: datos observacionales • Para poder comparar con la intervención experimental que se comentará posteriormenteexperimental que se comentará posteriormente (distribución de 4 FC) el número de FC disponibles en cada escuela se divide por 4 (bloques de FC comparables)comparables) • Resultados: los estudiantes que utilizaron los FC aumentaron un 20% de una DE sus resultados l ( 0% d l l 0escolares (un 10% es como pasar del percentil 50 al percentil 54). Tabla.
  • 37. Flip charts: datos observacionales • Si los resultados observacionales son correctos entonces los FC son muy efectivos: el coste pory p alumno de los cuatro FC (un set=$80) es solo el 10% del coste de los libros en las tres asignaturas cubiertas por los FC (un libro de texto en Kenia $ d $ )cuesta $3.3x3x80 estud.=$800) pero su impacto es dos veces más grande que el efecto de proveer libros de texto. • Los FC serían, por tanto, 20 veces más efectivos en términos de coste que los libros de texto.
  • 38. Flip charts: datos experimentales • La ONG International Christelijk Steunfonds (ICS) proporcionó los FC.proporcionó los FC. • La intervención consistía en 4 FC: dos sobre ciencias (agricultura y ciencia en general), uno sobre salud uno sobre matemáticas y un mapasobre salud, uno sobre matemáticas y un mapa del este de África para geografía.
  • 39. Flip charts: datos experimentales • El diseño experimental consistió en la selección de 178 escuelas en Busia y Teso (Kenia) por la ONGy ( ) p ICS • Las escuelas elegidas tenían una media de aprendizaje de los estudiantes similar a la mediap j del distrito en su conjunto • 89 escuelas fueron asignadas al grupo de control y otras 89 al grupo tratado después de serotras 89 al grupo tratado después de ser ordenadas por orden alfabético. De cada dos escuelas consecutivas una se asignaba al grupo tratado y otra al de control (sistemático)y ( )
  • 40. Flip charts: datos experimentales •Los resultados experimentales no muestran ningún efecto significativomuestran ningún efecto significativo de los “flip charts”: Resultados agregados– Resultados agregados – Resultados por asignatura R lt d d i t– Resultados por grupos de asignaturas
  • 41. ¿Qué funciona? •Usos de la ayuda al desarrollo muy efectivos (en términos coste beneficio)efectivos (en términos coste-beneficio) – Medicinas para acabar con los parásitos intestinalesintestinales – Suplemento como el hierro y la vitamina A Subsidios a los fertilizantes– Subsidios a los fertilizantes – Vacunación de los niños P i ió d t bl– Provisión de agua potable
  • 42. ¿Qué funciona? •Las anteriores son intervenciones modestas frente a las grandesmodestas, frente a las grandes promesas y el esquema utópico (hacerlo todo a la vez) que tienen una(hacerlo todo a la vez), que tienen una enorme incidencia sobre el bienestar de las familias pobresde las familias pobres.
  • 43. No es efectivo… •“Flip charts” •Dar libros (solo beneficia a los estudiantes en el segmento superior d l l )de la clase) •Incentivos económicos para los f ( b ñ dprofesores (acaban enseñando como hacer tests)
  • 44. Conclusiones • Un evaluación creíble permitiría arrebatarle a la política el protagonismo en ámbitos en los que no debería tenerlodebería tenerlo • Los programas pueden fallar y de eso también se aprende. Tapar los fallos evitando la evaluación de resultados o utilizando procedimiento noresultados o utilizando procedimiento no adecuados hace una mal servicio a la comunidad científica y a la ciudadanía en general • La evaluación experimental puede dar resultadosLa evaluación experimental puede dar resultados muy diferentes a los obtenidos por procedimientos tradicionales
  • 45. Conclusiones • La evaluación experimental (randomizada) es factible en el campo de las políticas sociales,factible en el campo de las políticas sociales, educativas y de ayuda al desarrollo. Precisa de recursos humanos y económicos pero no más que la recolección de otros datos para otros tipos dela recolección de otros datos para otros tipos de evaluación
  • 46. Conclusiones • Agencias y ONGs deben experimentar y buscar intervenciones que funcionan verificándolo porq p medio de las mejores técnicas de evaluación científica disponibles y usando evaluadores externos para evitar los intereses de los gestores d lde los proyectos. • Para aprender es necesario tener información.