3. Distribución t de Student
W.S. Gosset (principios del siglo XX).
N 30 y no se conoce.
Además, al utilizar la distribución t, suponemos
que la población es normal o aproximadamente
normal.
6. Si de una población Normal con media y
desviación estándar se extrae una muestra de
tamaño n, entonces el estadístico:
x
t
s
n
se distribuye como una t de Student con n-1
grados de libertad.
7. Ejemplo
Los tiempos de sobrevivencia (en años) de 12
personas que se han sometido a un transplante de
corazón son los siguientes:
3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3
10.4 0 11.5
Hallar un intervalo de confianza del 99 por ciento
para el promedio de vida
de todas las personas que se han sometido a un
transplante de corazón.
9. Prueba de hipotesis (varianza desconocida)
Caso I Caso II Caso III
Ho : = 0 Ho : = 0 Ho : = o
Ha : < 0 Ha : ≠ 0 Ha : > 0
x o
Prueba Estadística t
s
n
Si tcal < -t entonces Si |tcal |>t /2 entonces Si tcal >t entonces
se rechaza Ho se rechaza Ho se rechaza Ho
10. Usando los datos del Ejemplo anterior, un cardiocirujano afirma
que el tiempo de vida promedio de las personas sometidas a
transplante de corazón es mayor que 4 años. ¿A qué conclusión
se llegará después de hacer la prueba de hipótesis?
Solución:
La hipótesis nula es H0: = 4 (el tiempo de vida promedio de
todas las personas que se han sometido a transplante de corazón
es de 4 años) y la hipótesis alterna es Ha: > 4 (el tiempo de vida
promedio es mayor que 4 años).
X 5 .4 4 1 .4
t 1 . 19
s/ n 4 . 1 / 12 1 . 18
Es menor que 3.106 por lo tanto no se rechaza la hipótesis nula y
se concluye de que no hay evidencia de que el tiempo promedio
de vida después del transplante haya aumentado de 4 años.
Notar que el extremo inferior del intervalo de confianza de un solo
lado al 99% es 1.575 mucho menor que 4.
11. Prueba t de Student para grupos
correlacionados e independientes
12. Comparando medias de dos poblaciones
usando muestras pareadas
En este caso se trata de comparar dos métodos o tratamientos,
pero se quiere que las unidades experimentales donde se
aplican los tratamientos sean las mismas, ó lo más parecidas
posibles, para evitar influencia de otros factores en la
comparación
Sea Xi el valor del tratamiento I y Yi el valor del tratamiento
II en el i-ésimo sujeto. Consideremos di = Xi - Yi la diferencia
de los tratamientos en el i-ésimo sujeto.
Las inferencias que se hacen son acerca del promedio
poblacional d de las di. Si d = 0, entonces significa que no hay
diferencia entre los dos tratamientos.
13. Intervalo de Confianza
Un intervalo de confianza del 100(1- )% para la
diferencia poblacional d
dada una muestra de tamaño n es de la forma
( d - t(n-1, /2) sd/ n , d + t(n-1, /2) sd/ n )
donde d , es la media de las diferencias muestrales di
2
y (di d ) es la desviación estándar.
i
sd
n 1
14. Pruebas de Hipótesis
Caso I Caso II Caso III
Ho : d = 0 Ho : d = 0 Ho : d =0
Ha : d < 0 Ha : d 0 Ha : d >0
Prueba Estadística:
d
t= se distribuye con una t de Student con n-1 gl.
sd
n
Decisión:
Si t<-t entonces Si | t |>t /2 entonces Si Tcal >t entonces
se rechaza Ho se rechaza Ho se rechaza Ho
15. Ejemplo
Un médico desea investigar si una droga tiene el efecto de
bajar la presión sanguínea en los usuarios. El médico eligió al
azar 15 pacientes mujeres y les tomó la presión, luego les
recetó la medicina por un período de 6 meses, y al final del
mismo nuevamente les tomó la presión. Los resultados son
como siguen:
Sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 70 80 72 76 76 76 72 78 82 64 74 92 74 68 84
Desp. 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74
16. Solución
Solución:
Sea d que representa la media poblacional de
las diferencias. Luego:
Ho: d = 0 (La droga no tiene ningún efecto)
Ha: d > 0 (La droga tiene efecto, la presión
antes de usar la droga era mayor
que después de usarla).
17. Ejemplo (Cont.)
Las diferencias son: -2, -8, -10, -6, -18, -10, -4, -26, -18, 8, 0, -32, 0, 4,
-10.
El promedio de las diferencias es -8.8
La desviación estándar de las diferencias es 10,98
La desviación estándar de las medias muestrales es 2.83
8 .8 0
t 3 . 109
2 . 83
El valor crítico de t con 14 grados de libertad (n-1) y α=0.05 es
2.145, el valor calculado es superior, por lo tanto se rechaza la
hipótesis nula y se acepta la alterna, el medicamento es efectivo para
reducir la presión arterial
19. EJERCICIO
En capítulos anteriores usted aprendió a hacer
inferencias acerca de una o dos medias, ahora
aprenderemos a hacer lo mismo respecto de tres o
más medias, supongamos para ello a tres grupos
tomados al azar de 6 bachilleres graduados en
diferentes colegios que se presentan a una prueba de
admisión en la Universidad X, los bachilleres del
colegio A han obtenido las notas: 20, 20, 18, 13, 19 y
18; los bachilleres del colegio B tienen: 18, 15, 12,
09, 14 y 16, por último, los bachilleres del colegio C
tienen como resultado: 13, 15, 20, 18, 20 y 16.
Queremos, en base a esos datos saber cuál es el
colegio cuyos bachilleres obtienen mejores resultados
en los exámenes de ingreso a la universidad.
20. Una primera aproximación para saberlo es obtener la
media de cada colegio, fácilmente podemos ver que
los estudiantes del colegio A tienen una media de 18,
xA = (20+20+18+13+19+18)/6=18
los del colegio B tienen una media de 14
xB = (18+15+12+09+14+16)/6=14
y los del colegio C un promedio de 17
xC = (13+15+20+18+20+16)/6=17.
21. La varianza entre las medias es:
=[(18-16,33)2+(17-16,33)2+(14-16,33)2]/(3-1) [1]
=4.33
La varianza dentro de los grupos es:
=[(20-18)2+(20-18)2+(18-18)2+(13-18)2+(19-18)2+(18-
18)2+(18-14)2+(15-14)2+(12-14)2+(9-14)2+(14-14)2+(16-
14)2+(13-17)2+(15-17)2+(20-17)2+(18-17)2+(20-
17)2+(16-17)2]/[(6-1)+(6-1)+(6-1)] [2]
=(4+4+0+25+1+0+16+1+4+25+0+4+16+4+9+1+9+1)/15
=124/15=8.27
22. La suma de las varianzas dentro de los grupos es 8,27
y la varianza de las medias es 4.33, para comparar
estos valores dividimos el producto de 6 por la
varianza entre las medias para la varianza dentro de
los grupos y obtenemos F=3,15
A esta cantidad la llamaremos coeficiente F en honor
de Sir Ronald Fisher quien elaboró una tabla, que nos
da la probabilidad de que la hipótesis nula sea
verdadera, para utilizarla debemos observar los
grados de libertad del numerador, que serían el
número de colegios menos uno (2), y los grados de
libertad del denominador (3 colegios por 6-1
bachilleres de cada colegio, o sea 15).
23. En la tabla buscamos en el extremo superior
grados de libertad en el numerador, bajo la
columna 2 y tratamos de encontrar la
intersección con la fila donde dice grados de
libertad del denominador, en este caso la fila con
el numero 15.
El valor que hemos encontrado en la tabla, 3.68,
es superior al valor que hemos calculado, 3,15 lo
que nos indica que la probabilidad de que Ho sea
verdadera es superior a 0.05 (5%).
25. 2
Distribución ji-cuadrado
-Nunca adopta valores menores de 0
-Es asimétrica positiva
-Es en realidad una familia de curvas, en función de los
llamados “grados de libertad”. Es decir, hay una
distribución chi-cuadrado con 1 gl, una distribución chi-
cuadrado con 2 gl, etc. (Nota: Los grados de libertad
son siempre números positivos.)
-A medida que aumentan los grados de libertad, la distribución se
hace más y más simétrica.
26.
27. Usos de la Ji-Cuadrado
a) Para hacer inferencias acerca de la varianza
poblacional. Es decir, para calcular Intervalos de
Confianza y Prueba de hipótesis para la varianza
poblacional.
b) Para hacer pruebas de Bondad de Ajuste. O sea,
para probar si un conjunto de datos sigue una
distribución pre-determinada.
c) Para hacer análisis de tablas de contingencia.
28. Por ejemplo, se divide un grupo de estudiantes en
buenos y malos alumnos y se constató si tenían
interés en problemas políticos, con nivel de
significación del 1% ¿Se puede decir de los resultados
que se muestran en la tabla a continuación si el
interés por la política es independiente del hecho de
ser o no buen estudiante?
Sin interés político Con interés Político
Buen estudiante 100 20
Mal estudiante 20 60
29. Sin interés Con interés
político Político
Buen 100 20 120
estudiante
Mal 20 60 80
estudiante
120 80 200
30. Sin interés Con interés
político Político
Buen 100 (72) 20 (48) 120
estudiante
Mal 20 (48) 60 (32) 80
estudiante
120 80 200
31. De acuerdo al cuadro anterior
(100-72)2/72+(20-48)2/48+(20-48)2/48+(60-
32)2/32=7,84+39,2+39,2+13,07=99,31
Al consultar el valor crítico correspondiente
de 2 encontramos
20,95,(2-1)(2-1)= 20,95,1=3,84
Como el valor encontrado supera al valor
crítico rechazamos la hipótesis nula
(independencia entre las variables) y
aceptamos la alterna, el interés político y el
rendimiento académico no son
independientes.