1. Integrantes:
Javier Martínez
Sonia Martínez
El Tigre, Marzo de 2014
VALIDEZ Y CONFIABILIDAD
UNIVERSIDAD YACAMBÚ
VICERECTORADO DE INVESTIGACIÓN Y
POSTGRADO
INSTITUTO DE INVESTIGACIÓN Y POSTGRADO
Prof. Leonardo Castillo
2. ¿QUÉ SIGNIFICA MEDIR?
• Medir es parte de nuestras vidas según Bostwick y
Kyte (2005).
De acuerdo a definiciones clásicas como:
• Stevens (1951), significa “asignar números o
valores a objetos y eventos de acuerdo a reglas”.
• Carmines y Zeller (1979), señalan que esta
definición es más apropiada para las ciencias
físicas que para las ciencias sociales, las cuales
trabajan con una serie de conceptos más
abstractos que no pueden verse directamente o
tratarse como productos o resultados.
3. MEDICIÓN
• Según el razonamiento hecho por Carmines y Zeller nos hace
sugerir que es más adecuado definir medición como el “proceso de
vincular conceptos abstractos con indicadores empíricos”, proceso
que se realiza mediante un plan explícito y organizado para clasificar
y frecuentemente cuantificar los datos que puedan suministrar
conductas observables relacionadas con las variables en estudio
LA RESPUESTA OBSERVABLE
• El centro de atención es por lo tanto la respuesta observable (bien
sea una respuesta marcada en un cuestionario, una conducta
grabada o una respuesta dada en una entrevista). Un instrumento de
medición adecuado va a ser aquél que registra datos observables
que verdaderamente representan los conceptos o variables (más
abstractas) que el investigador tiene en mente.
4. ¿QUÉ REQUISITOS
DEBE CUBRIR UN
INSTRUMENTO DE
MEDICIÓN?
ValidezConfiabilidad
Toda medición o
instrumento de
recolección de
datos debe reunir
dos requisitos
esenciales
5. CONFIABILIDAD
La confiabilidad de un instrumento de medición se refiere al
grado de precisión o exactitud de la medida, en el sentido
de que si aplicamos repetidamente el instrumento al mismo
sujeto u objeto produce iguales resultados. Es el caso de
una balanza o de un termómetro, los cuales serán
confiables si al pesarnos o medirnos la temperatura en dos
ocasiones seguidas, obtenemos los mismos datos.
Balanza Termómetro
6. VALIDEZ
La validez se refiere al grado en que un instrumento mide la
variable que pretende medir. Por ejemplo, un test de
inteligencia no será válido, si lo que mide es realmente
memoria y no inteligencia. Ciertas variables como el sexo, la
nacionalidad, son muy fáciles de observar o de preguntar y
obtener una respuesta válida. Pero cuando se trata de
diversas variables que se trabajan en ciencias sociales como
motivaciones, actitudes, sentimientos, emociones, entre otras,
la validez de un instrumento que pretenda medirlas se torna
más compleja, y por lo tanto, cabe preguntarse si ¿realmente
el instrumento estará midiendo lo que pretende medir?
7. LA VALIDEZ ES UN CONCEPTO DEL
CUAL PUEDEN TENERSE
DIFERENTES TIPOS DE EVIDENCIA:
Evidencia relacionada con el contenido: La
validez de contenido.
Evidencia relacionada con el criterio: La
validez de criterio.
Evidencia relacionada con el constructo. La
validez de constructo.
8. VALIDEZ DE CONTENIDO
Se refiere al grado en que un instrumento refleja un
dominio específico de contenido de lo que se mide.
Por ejemplo, una prueba de operaciones
aritméticas no tendrá validez de contenido si
explora suma y división y excluye problemas de
resta y multiplicación. Un instrumento de medición
debe contener representados a todos los ítems del
dominio de contenido de las variables a medir.
Se determina antes de la aplicación del
instrumento, mediante el Juicio de Expertos
9. VALIDEZ DE CONTENIDO
A pesar de que no se utiliza un índice de correlación para expresar la validez de
contenido, existen procedimientos para cuantificarlo. Algunos de estos
procedimientos son:
a)Cálculo de descriptivos: Consiste en calcular la media y la desviación típica de
todos los ítems.
b)Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de validez
basado en la valoración de un grupo de expertos de cada uno de los ítems del test
como innecesario, útil y esencial. El índice se calcula a través de la siguiente
fórmula:
ne- N/2
IVC= -----------------
N/2
Donde ne es el número de expertos que han valorado el ítem como esencial y N es
el número total de expertos que han evaluado el ítem.
El IVC oscila entre +1 y -1, siendo las puntuaciones positivas las que indican una
mejor validez de contenido. Un índice IVC = 0 indica que la mitad de los expertos
han evaluado el ítems como esencial.
10. VALIDEZ DE CRITERIO
Establece la validez de un instrumento de medición comparándola con algún criterio externo.
Entre más se relacionen los resultados del instrumento con el criterio, mayor será su validez.
Si el criterio se ajusta al futuro se habla de validez predictiva. Por ejemplo una prueba de
admisión en las universidades puede comparar sus resultados con el rendimiento futuro de los
estudiantes en la carrera.
Si el criterio se fija en el presente se habla de validez concurrente; es cuando los resultados
del instrumento correlacionan con el criterio en el mismo momento o punto de tiempo. Por
ejemplo una encuesta administrada un día antes de las votaciones para detectar preferencias
del electorado, correlaciona con los resultados finales de la elección.
11. VALIDEZ DE CONSTRUCTO
Es una variable medida que tiene lugar
dentro de una teoría o esquema teórico Ruiz
Bolívar (2001). Es probablemente la más
importante, sobre todo desde la perspectiva
científica, ya que se refiere al grado en que
una medición aportada por un instrumento se
relaciona consistentemente con otras
mediciones que han surgido de hipótesis y
construcción de teorías antecedentes.
12. 1
• Relación teórica entre los conceptos.
2
• Correlación de conceptos y análisis.
3
• Interpretación de la evidencia empírica de acuerdo con
el nivel en que clarifica la validez de un constructo de
una medición en particular.
LA VALIDEZ DE UN CONSTRUCTO INCLUYE TRES
ETAPAS:
VALIDEZ TOTAL = Validez de Contenido + Validez de Criterio
+ Validez de Constructo
13. RELACIÓN ENTRE LA
CONFIABILIDAD Y LA VALIDEZ
Un instrumento de medición puede ser
confiable pero no válido, puede medir
consistentemente un aspecto más no medir
lo que pretende medir el investigador. Por ello
es requisito que un instrumento de medición
demuestre ser confiable y válido.
La validez y la confiabilidad no se asumen, se
prueban.
14. FACTORES QUE PUEDEN AFECTAR
LA CONFIABILIDAD Y LA VALIDEZ
*La improvisación
*El no estar validados en el contexto donde se
aplican
*El instrumento es inadecuado o no es empático
*Las condiciones en que se aplica el instrumento
*El quinto factor se refiere a los aspectos
mecánicos
15. ¿CÓMO SE SABE SI UN INSTRUMENTO
ES CONFIABLE Y VALIDO?
En la práctica es casi imposible que una medición sea
perfecta, generalmente se tiene un grado de error. Desde
luego, se trata que este error sea el mínimo posible y para ello
hay formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos
utilizan fórmulas que producen “coeficientes de confiabilidad”,
los cuales pueden oscilar entre 0 y 1, donde 0 significa
confiabilidad nula y 1 representa el máximo de confiabilidad.
Entre más se acerque el coeficiente a 0 habrá mayor error en
la medición.
16. TÉCNICAS PARA EL CÁLCULO DE LA
CONFIABILIDAD
1.- Test - retest o Medida de Estabilidad.
2.- Test Paralelos o Método de Formas Alternativas.
3.- División por Mitades, Mitades Partidas (Split-halves).
4.- Coeficiente Alfa de Cronbach.
5.- Kuder – Richardson o Coeficiente KR-20.
17. MEDIDA DE ESTABILIDAD
(CONFIABILIDAD POR TEST-RETEST).
Un mismo instrumento es aplicado dos o más
veces a un mismo grupo de personas. Si la
correlación entre los resultados de las diferentes
aplicaciones es altamente positiva, el instrumento
se considera confiable. Desde luego, el período de
tiempo entre las mediciones es un factor a
considerar. Si es muy largo, otros factores como
maduración o cambio de condiciones pueden
afectar la segunda medida. Si es muy corto, las
personas pueden recordar cómo contestaron la
primera vez y aparecer como más consistentes la
segunda vez.
18. Calcular la correlación entre ambas aplicaciones
usando el coeficiente de Pearson.
n
yy
n
xx
n
yx
yx
rxy
2222
*
..
2222
*
..
yynxxn
yxyxn
rxy
CÁLCULO DE LA MEDIDA DE
ESTABILIDAD (CONFIABILIDAD POR
TEST-RETEST).
19. LIMITACIONES DE LA TÉCNICA DE TEST
RE-TEST O MEDIDA DE ESTABILIDAD
El período de tiempo (corto o largo), entre
las mediciones puede confundir la
interpretación del Coeficiente de
Confiabilidad obtenido mediante esta
técnica.
20. MEDIDAS PARALELAS O FORMAS
EQUIVALENTES DE MEDIR.
En este procedimiento no se aplica el mismo
instrumento de medición sino dos o más versiones
equivalentes de éste. Las versiones deben ser
similares en contenido, instrucciones, duración,
entre otros. Por ejemplo cuando un profesor
administra 2 ó más modalidades de examen en su
grupo de alumnos. El instrumento es confiable si la
correlación entre los resultados de las dos o más
pruebas administradas es significativamente
positiva.
21. LIMITACIONES DE LA TÉCNICA DE LOS
TEST PARALELOS O MÉTODO DE
FORMAS ALTERNATIVAS.
1.- Dificultad para obtener dos pruebas
realmente paralelas.
2.- Efecto que el primer instrumento
tiene sobre los puntajes del segundo.
3.- Implica un doble trabajo de
construcción de instrumentos.
4.- Confiable sólo si correlación entre los
resultados de ambas aplicaciones es
positiva.
22. MÉTODO DE MITADES DIVIDIDAS (SPLIT-
HALVES)
Aquí se administra un solo instrumento, una sola
vez, pero se dividen las preguntas o los ítems (Por
ejemplo los ítems pares con respecto a los
impares, o la primera mitad con respecto a la
segunda mitad). Si correlacionan los resultados de
las dos partes, se considera el instrumento
confiable. Ahora bien, la confiabilidad varía de
acuerdo al número de ítems de la prueba. Cuantos
más ítems mayor es la confiabilidad.
23. 1° Se calcula el Índice de Correlación (Pearson)
2° Corrección de r con la ecuación de Spearman –
Brown
2222
nn
ABn
r
r
r
R
1
2
CÁLCULO DEL MÉTODO DE MITADES
DIVIDIDAS (SPLIT-HALVES)
24. LIMITACIONES DE LA TÉCNICA DE
DIVISIÓN POR MITADES O
MITADES PARTIDAS
1.- Confiabilidad varía de acuerdo con el número de
ítems que incluya el instrumento de medición.
2.- Demasiados ítems provocarán cansancio en el
respondiente.
3.- Riesgo que el contenido de las mitades sea
diferente.
25. COEFICIENTE ALFA DE CRONBACH
Requiere sólo una aplicación del instrumento de
medición.
Produce valores que oscilan entre cero (0) y uno
(1).
No es necesario dividir en mitades los ítems del
instrumento.
Se aplica la medición y se calcula el coeficiente.
26. CÁLCULO DEL COEFICIENTE ALFA DE
CRONBACH
Su fórmula estadística es la siguiente:
2
2
1
1 T
i
S
S
K
K
K: El número de ítems
Si2 : Sumatoria de Varianzas de los Items
ST2 : Varianza de la suma de los Items
α: Coeficiente de Alfa de Cronbach
27. TÉCNICA KUDER – RICHARDSON O
COEFICIENTE KR-20.
Permite calcular la confiabilidad con una sola
aplicación del instrumento.
No requiere el diseño de pruebas paralelas.
Es aplicable sólo en instrumentos con ítems
dicotómicos, que puedan ser codificados con 1 – 0
(correcto – incorrecto, presente – ausente, a favor –
en contra, entre otros) .
28. La fórmula para calcular la confiabilidad de un instrumento
de n ítems o KR20 será:
K=número de ítems del instrumento.
p=personas que responden afirmativamente a cada ítem.
q=personas que responden negativamente a caca ítem.
St2= varianza total del instrumento
xi=Puntaje total de cada encuestado.
2
2
.
*
1 st
qpst
k
k
rtt
n
xx
st
i
2__
2
CÁLCULO DE LA TÉCNICA KUDER –
RICHARDSON O COEFICIENTE KR-20.
29. REFERENCIAS BIBLIOGRÁFICAS.
Hernández, R.; Fernández, R. y Batista, P. (2006). Metodología de la
Investigación. Cuarta Edición. Editorial McGraw Hill Interamericana.
Hurtado, J. (1998). Metodología de la Investigación Holística. 2ª Ed., Caracas,
Venezuela.
Kerlinger, F. (1979). Enfoque Conceptual de la Investigación del
Comportamiento. México, D.F. Nueva Editorial Interamericana.
30. “La Verdad es relativa y sólo tiene
validez para aquel que la juzga”