2. Están relacionados los hábitos de lectura con el sexo del lector? ¿Están relacionadas las calificaciones obtenidas con el número de faltas? ¿Es independiente la opinión sobre la política exterior de la política partidista? ¿Es independiente el sexo de una persona de su preferencia en colores? ¿Está relacionado el sexo con tener una educación universitaria?
3. ¿Son independientes el tamaño de una familia y el nivel de educación de los padres? ¿Está relacionado el desempleo con el incremento de la criminalidad? ¿El precio está asociado con la calidad de un producto electrodoméstico? ¿El estado nutricional esta asociado con el desempeño académico? ¿Están relacionadas las enfermedades del corazón con el tabaquismo?
4.
5.
6. Prueba de Independencia, Se usa para analizar la frecuencia de dos variables con categorías múltiples para determinar si las dos variables son independientes o no. Por ejemplo: ¿El tipo de refresco preferido por un consumidor es independiente de su grupo etáreo? ¿El estado nutricional esta asociado con el desempeño académico?
7. ¿determinar si la región geográfica es independiente del tipo de inversión financiera? La prueba Chi cuadrado de independencia es particularmente útil para analizar datos de variables cualitativas nominales.
8. Los datos de variables cualitativa o categóricas representan atributos o categorías y se organizan en tablas llamadas tablas de contingencia o tablas de clasificación cruzada. Tabla de contingencia Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma:
9. Donde: O i j : es el número de sujetos que tienen las características A i y B j a la vez. R i : (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos que poseen la característica A i . C j :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos que poseen la característica B j . n : representa el total de observaciones tomadas.
10. Formulación de hipótesis: Hipótesis nula (H 0 ) : Las variables X e Y son independientes, ( X e Y no están relacionadas) Hipótesis alternativa (H 1 ) : Las variables X e Y no son independientes, (X e Y están relacionadas) La pregunta es: ¿Existirá o no relación entre las variables A y B?, es decir, si A y B son o no independientes.
11. Pruebas de Independencia La estadistica Ji-Cuadrado esta dado por: donde Oij : es la frecuencia observada de la celda que está en la fila i, columna j, es la frecuencia esperada de la celda (i, j).
12. La frecuencia esperada es aquella que debe ocurrir para que la hipótesis nula sea aceptada. La prueba estadística se distribuye como una Ji-Cuadrado con ( r-1)*(c-1) grados de libertad. La hipótesis Nula se rechaza si , o equivalentemente si el “p-value” es menor que (prefijado)
13. Ejemplo: Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según su nivel de ingresos (alto, medio o bajo) y el tipo de colegio a la que envían sus hijos. La siguiente tabla muestra los resultados obtenidos: ¿A un nivel de significancia del 1% hay razón para creer que el ingreso y el tipo de colegio no son variables independientes?
18. Solución: Las hipótesis a plantearse son las siguientes: Ho: No hay relación entre el ingreso y el tipo de colegio H1: Si hay relación entre el ingreso y el tipo de colegio. Interpretación: Como el “P-value” es menor que 0.01 se puede concluir que hay relación entre el nivel de ingreso y el tipo de colegio.
19. El uso de bebida ordenado con alimentos en un restaurante ¿es independiente de la edad del consumidor? Se toma una muestra aleatoria de 309 clientes del restaurante de donde resulta el siguiente cuadro de valores observados. Utilice alfa = 0.01 para determinar si las dos variedades son independientes.º Ejemplo
20. Solución 1.- Planteamiento de hipótesis Ho : El tipo de bebida preferida es independiente de la edad H1 : El tipo de bebida preferida esta relacionada con la edad 2.- Estadístico de Prueba 3.- Nivel de significación: = 0.01
21.
22.
23. Decisión Las dos variables, bebida preferida y edad, no son independientes. El tipo de bebida que un cliente ordena con alimentos está relacionada con la edad y depende de está.
24.
25. Ejemplo Con el fin de probar la efectividad de una vacuna contra cierta enfermedad, se realizo un experimento observando a 200 personas, 110 de ellas vacunadas y las otras 90 sin vacunar. Presentan los datos evidencia suficiente como para indicar que la proporción de personas vacunadas que contrajeron la enfermedad no es la misma que la proporción de personas que no se vacunaron y que contrajeron la enfermedad Los resultados obtenidos se muestran en el siguiente cuadro. Datos
26. Resultados: 1.- Planteamiento de hipótesis Ho: P 1 = P 2 H1 : P 1 diferente de P 2 donde: P1 = Proporción de vacunados que contraen la enfermedad P2 = Proporción de no vacunados que contraen la enfermedad
28. Decisión Como p-valor =0.286 es mayor que 0.05 (alfa) podemos indicar que no existe suficiente evidencia para aceptar que hay diferencias entre las proporciones P 1 y P 2
29. Prueba de Bondad de Ajuste Los procedimientos de prueba de hipótesis que se han presentado en capítulos anteriores están diseñados para problemas en los que se conoce la población o o distribución de probabilidad, y la hipótesis involucra los parámetros de la distribución. A menudo se encuentra otra clase de hipótesis: no se sabe cuál es la distribución de la población, y se desea probar la hipótesis de que una distribución en particular será un modelo satisfactorio de la población. Por ejemplo: Probar la hipótesis de que la población tiene comportamiento normal, Poisson,.exponencial etc.
30. El procedimiento general para realizar la prueba es: 1.- Formulación de la hipótesis Ho: Los datos de la muestra se ajustan a la distribución teórica escogida H1: Los datos de la muestra no se ajustan a la distribución teórica escogida 2.- Fijar el nivel de significación 3.- La estadística de prueba donde: Ei = npi Oi = observado p = número de parámetros estimados a partir de la muestra K = número de categorías o clases pi = probabilidad 4.- Determinar la región crítica: rechazar Ho si: caso contrario no se rechaza 5.- Decisión y conclusión Nota: si alguna frecuencia esperada es menor que 5, se debe eliminar esa clase, Y sumar la frecuencia observada a una clase contigua.
31.
32. Ejemplo: Los siguientes porcentajes provienen de una encuesta nacional sobre las edades de compradores de música pregrabada. Una encuesta local produjo los valores y la evidencia de los datos observados, ¿indica que debemos rechazar la distribución de la encuesta nacional para compradores locales de música pregrabada? Utilice alfa=0.01
33.
34.
35. Solución: Ho : La variable edad tiene comportamiento normal H1 : La variable edad no tiene comportamiento normal Resultados Como p-valor es 0.025 es menor que 0.05, rechazamos la hipótesis nula. Es decir, la variable edad no tiene comportamiento normal.