Este documento presenta una introducción a la estadística. Define la estadística como la ciencia de recopilar, organizar, presentar, analizar e interpretar información para ayudar a tomar mejores decisiones. Explica que la estadística se ha utilizado desde la antigüedad para registrar datos demográficos y que es una herramienta útil para comprender y analizar grandes cantidades de información numérica. Finalmente, distingue entre estadística descriptiva e inferencial, y presenta algunos conceptos básicos como
3. Estadística
``Ciencia de recopilar, organizar, presentar,
analizar e interpretar información para ayudar
a tomar decisiones más efectivas
La estadística es tan vieja como la historia:
registrada(viejo testamento, los censos, Babilonia,
Egipto y Roma registraron datos de su población, en
la edad media se registró la propiedad de la tierra,
en el sigo XVI debido a la peste, Enrique VII empezó
a registrar sus muertos a partir de ahí se hicieron
proyecciones.
4. ESTADÍSTICA
• Se deben separar los hechos de las
opiniones y luego organizar los primeros en
forma apropiada y analizar la información
• Estadística: herramienta para entender la
información
¿porqué la estadística se necesita en área tan
importantes?
– La información numérica está en toda partes
– Toma de decisiones
– Ayuda a entender cómo se toman las decisiones
y a comprender como estas nos afectan
5. Al tomar decisiones necesita
• Determinar si la información existente
es adecuada o necesita adicional
• Recopilar información adicional
• Resumir la información en forma útil
y organizada
• Analizar la información disponible
• Sacar conclusiones y deducciones
además de evaluar el riesgo de una
conclusión incorrecta.
6. La Estadística
• Importancia:
– Para saber como presentar la información
adecuadamente
– Para saber como obtener conclusiones sobre
poblaciones grandes basándose en la
información obtenida en las muestras
– Para saber como mejorar los procesos
– Para obtener pronósticos confiables
– Para analizar datos científicamente.
– Mejorar la calidad
7. La Estadística
Tipos
• Descriptiva: conjunto de métodos para
organizar, resumir y presentar datos de
manera informativa.
• Inferencial: conjunto de métodos utilizados
para determinar algún atributo medible acerca
de una población con base en una muestra
8. La Estadística
• Población
Llamado también universo es la totalidad de
elementos o cosas que se toman en
consideración
• Muestra
Es una porción representativa de la población
que se selecciona para su análisis.
• Parámetro: es una medida de resumen que
describe una característica de la población
• Estadístico: es una característica de la muestra
9. VARIABLES
• Las variables son las características de las
unidades de análisis que pueden asumir
diferentes valores en cada una de ellas.
• Unidad de análisis: son los entes acerca de los
que se analizan sus cualidades.
• Categorías de una variable son los valores que
pueden asumir
10. Propiedades de las variables
• Mutuamente excluyente: cada categoría
excluye a los demás
• Colectivamente Exhaustivos: todo individuo
tiene alguna categoría que le corresponda.
11. La Estadística
UNA VARIABLE ES ALEATORIA CUANDO TOMA DIFERENTES
VALORES COMO RESULTADO DE UN EXPERIMENTO
Tipos de Variables
Cualitativas Cuantitativas
• Marca de pc Discretas: número limitado de
• Estado civil valores (hijos en la familia)
• Color de cabello Continuas: surgen de proceso
de medición(intervalo)
Niveles de medición: nominal,Ordinal, de intervalo y de Razón
Variables : dependiente e independiente
12. Codificación numérica
Código Máximo nivel de Educación Formal
Alcanzado
1 Ninguno
2 Primario incompleto
3 Primario completo
4 Secundario incompleto
5 Secundario completo
6 Universitario Incompleto
7 Universitario completo
8 Post grado
13. Ejemplos: intervalo y
proporcionales
Codificación Puntaje de prueba significado
1 Menos de 70 Retraso significativo
2 De 70 a 85 Retraso leve
3 De 85 a 100 Normal
4 De 100 a 115 Normal superior
5 Más de 115 excepcional
Tiempo de reacción ante un estímulo visual en segundos
Menos de 5
Desde 5 hasta menos de 6
Desde 6 hasta menos de 7
Desde 7 hasta menos de 8
Desde 8 hasta menos de 9
Desde 9 hasta menos de 10
Más de 10
14. Matriz de conceptualización y
operacionalización de las variables
Hipótesis Variables Conceptualización Operacionalizació
n
Fuente
‘’A
mayor
motiva
ción
menor
ausenti
smo
escolar
’
Independiente:
motivación
Es el estado
cognitivo que
refleja el grado
que un
estudiante
atribuye al
comportamiento
en el aula de
clases
Cuestionario
sobre la
motivación y
estado de
animo del
estudiante
(encuesta)
primaria
Dependiente:
ausentismo
laboral
El grado en el
cual un
estudiante no se
presenta a clases
Revisión de
los registros
de asistencia
secundaria
15. Asignación n°1
Elabore una hipótesis de trabajo y complete la matriz.
Con esta hipótesis, presente un ejemplo de
codificadores.
Hipótesi
s
Variables Conceptualización Operacionaliza
ción
Fuente
16. TIPOS DE ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
conjunto de métodos para
organizar, resumir y presentar
datos de manera informativa.
17. PORCENTAJES
• PARA CALCULAR UN PORCENTAJE SE
UTILIZA LA REGLA DE TRES O LA
SIGUIENTE FÓRMULA:
Ejemplo: Se tomó una muestra de 100 estudiantes de
diferentes áreas de estudio, 30 de administración, 25
de ingeniería, 15 de inglés, 13 de farmacia y 17 de
turismo. ¿Cuál es el porcentaje de estudiantes por
área de estudio?
18. Porcentajes
Respuesta:
Área de estudio Cantidad de
estudiantes(x)
calculo %
administración 30 (30/100)*100 30%
ingeniería 25 (30/100)*100 25%
inglés 15 (30/100)*100 15%
Farmacia 13 (30/100)*100 13%
turismo 17 (30/100)*100 17%
total 100 100%
19. Variaciones Porcentuales
Ejemplo: en el año 2009 la matrícula en
administración era de 234 estudiantes,
para el año 2012, la matricula fue 335
estudiantes.¿Cuál fue la variación
porcentual?
20. Asignación n2
La biblioteca de una Universidad ha realizado una
revisión de los servicios que utilizaron los afiliados
a la biblioteca en una semana, obteniendo los
siguientes resultados: libros de referencia 84,
publicaciones periódicas 156 y consultas 110.
Con estos datos indique los porcentajes de los
servicios utilizados.
La semana siguiente las consultas fueron 145,
calcule el incremento porcentual
23. Representaciones Gráficas
• Gráficas de barras
Se puede utilizar para cualquiera de los
niveles de medición(nominal. ordinal, de
intervalo o de razón), aunque se puede
utilizar para representar una variable, es
más efectiva con dos variables o más, ya
que podemos comparar las variables entre
sí y a lo largo del tiempo.
24. 39
90
30
81
0
240
0
40
24 22
2
88
25
14 6 7 2
54 64
144
60
110
4
382
0
50
100
150
200
250
300
350
400
U.P U.T.P UDELAS Total
Técnicos Lienciatura Postgrados Maestría Doctorados Totales
Gráfico Nº4
Oferta Educativa a Nivel Superior por Universidad, por Técnico, Licenciatura, Postgrado
y Maestría. I sem 2005
26. Gráfico nº1
Distribución Porcentual de la Oferta Educativa de las Universidades
Públicas. I sem. 2005.
Técnicos;
64; 17%
Licenciatura
; 144; 37%
Postgrados;
60; 16%
Maestría;
110; 29%
Doctorados;
4; 1%
Técnicos Licenciatura Postgrados Maestría Doctorados
27. Otros Gráficos
Utilidades por acción de operaciones, dividendos y utilidades retenidas
de una compañía generadora de energía eléctrica
5.5
6.2 6.48
6.09
7.02
7.35
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6
Años
Utilidadesporacción($)
28. Asignación n3(hasta el 10 de
marzo para entregar)
Elabore dos gráficas, una para el problema 1 y para el
problema 2, elabore un breve informe
1.El presupuesto de un funcionamiento de una
universidad privada en miles de dólares, fue:
2005(534),2006(536.5),2007(636.3),2008(645.2),
2009(635.45),2010(701),2011(711.2)y2012(812.25)
2.La American Healt Association reportó la siguiente
división de sus gastos en porcentajes, entre los que
tenemos: investigación 32.3, educación de salud pública
23.5, servicio a la comunidad 12.6, recaudación de fondos
12.1, capacitación profesional y educativa 10.6 y
administración y general 8.6.
30. Medidas de Ubicación
• Medidas de Ubicación
• Es un valor que se utiliza para describir el centro
de un conjunto de datos
– Media Aritmética
– Datos no agrupados
• Suma de todos los valores de las observaciones
dividiéndolas entre el total de las observaciones
– Poblacional: μ=ΣX/Ν
– Muestral: X= ΣX/n
– Datos agrupados
• X=ΣfM/n
31. Medidas de Ubicación
Media Ponderada
– Se calcula multiplicando cada observaciones
por su ponderación correspondiente
• Xw= w1x1+w2x2+w3x3+….wnxn
w1+w2+w3+…wn
Media Geométrica
• GM=V(x1)(x2)(x3)…(xn)
• GM=vvalor al final del período
valor al inicio del perído
n
n
32. Medidas de Ubicación
• Mediana
– Mide la observación central del conjunto
• Datos no agrupados
• Mdn=(n+1)/2
• Datos agrupados
• M=((n+1)/2-(F+1))w + Lm
fm
Donde
F=suma de todas las frecuencias de clases sin incluir la clase
de la mediana
Lm=limite inferior de la mediana
fm= frecuencia de la clase de la mediana
W=ancho del intervalo de clase
33. Medidas de Ubicación
• Moda
– Valor que más se repite
– Datos agrupados
– Mo=Lmo+(d1/(d1+d2))w
Donde
Lmo=limite inferior de la clase modal
d1=frec. De la clase modal menos la frec. De clase que
se encuentra inmediatamente menor que ella
d2=frec. De la clase modal menos la frec. De clase que
se encuentra inmediatamente mayor que ella
W=ancho del intervalo de clase modal
34. Medidas de posición
• Cuartiles = (X/4)(n+1)
• Deciles = (X/10)(n+1)
• Percentiles = (X/100)(n+1)
35. Medidas de dispersión
• Rango: es la diferencia entre un valor alto
y el más bajo
– Rango=valor más alto-Valor más bajo
– Características
• Sólo se utilizan dos valores para calcularlo
• Tienen mucha influencia los valores extremos
• Rango intercuartil
– Rango modificado=Q3-Q1
– Q3=tercer cuartil Q1=primer cuartil
36. Medidas de dispersión
• Varianza=es la media de las desviaciones
cuadradas de la media aritmética
– Población=σ2=Σ(x-μ)2/N
– Muestra= S2= Σ(x-X)2/n-1
– Características
• Todas las desviaciones se utilizan en el cálculo
• No tienen influencia indebida en las observaciones
Desviación estándar
Raíz de la varianza
37. Medidas de dispersión
• Datos Agrupados
• Varianza=es la media de las desviaciones
cuadradas de la media aritmética
– Población=σ2=Σf(M-μ)2/N
– Muestra= S2= Σf(M-X)2/n-1
– Donde
• f=frecuencia de cada una de las clases
• M=punto medio
• μ o X=media de la población o muestra
38. Medidas de dispersión
• Coeficiente de Variación
• CV= (σ/ μ )x 100
• Teorema de Chebyshev: establece que sin importar la
forma de la distribución por lo menos 1-1/k2 de las
observaciones estarán dentro de K desviaciones
estándar de la media donde K es mayor que 1
• Regla empírica: para una distribución en forma de
campana, alrededor del 68% de los valores estará
dentro de una desviación estándar de la media, 95 entre
dos y casi todas entre tres
39. Ejemplo
Las calificaciones de una materia en un
curso regular fueron las siguientes: 98,
67,91,52, 89, 81, 76, 90, 58, 100
Calcule:
La media
Mediana
Moda
Varianza muestral
Desviación muestral
43. Asignación n4(10 de marzo)
Ud aplicó una prueba final, tomó una
muestra y obtuvo los siguientes
resultados: 98, 67,58, 100, 100, 91,
89,88,69,88, 95, 88, 91, 99, 100
Utilizando el análisis de datos de excel,
calcule: media, mediana, moda, varianza
y desviación.
44. Diseño de Experimentos
Fases del diseño experimental
• Objetivo
• Lo que se medirá
• Tamaño de la muestra
• Conducción del experimento
• Análisis de los datos
46. TIPOS DE MUESTREO
PROBABILISTICOS O
ALEATORIO
• Aleatorio simple
• Sistemático
• Estratificado
• De racimo o
conglomerados
NO PROBABILISTICOS
• Accidental
• Por conveniencia
• Bola de nieve
• Por cuotas
47. MUESTREO
TAMAÑO DE LA MUESTRA
El tamaño de la muestra depende de tres
factores que son:
•Nivel de confianza deseado
•Margen de error tolerable
•La viabilidad de la población que estudia
48. MUESTREO
TAMAÑO DE LA MUESTRA de proporciones
Para poblaciones infinitas o desconocidas
n´= Z2pq
E2
Donde Z es el valor crítico correspondiente a la distribución de Gauss
Valor de Z Probabilidad
± 1.645 90%
± 1.96 95%
± 2.58 99%
p es la prevalencia esperada al parámetro a evaluar, si es desconocido es
0.5. y q = 1-p
E es el error tolerable que se prevee cometer, lo estima el investigador
49. MUESTREO
TAMAÑO DE LA MUESTRA
Para poblaciones finitas o conocidas
si ya se tiene n´, entonces
n= . n´ .
1+ (n´-1)
N
Si no se ha calculado n´, entonces
50. Ejemplo
Se debe seleccionar el tamaño de la muestra de una
población de 1200 estudiantes. Se asume un 95% de
confianza y un error del 3%.
n=565
51. Tamaño de la muestra para la
media
Para estimar la población de debe establecer un piloto que
permita estimar la desviación, el cual debe ser mayor de 30,
ejemplo si tenemos 1200 estudiantes, se debe seleccionar por lo
menos 30, para calcular la desviación estándar
Si la población es infinita o desconocida
Si la población es finita o conocida
53. Asignación 5
• Se debe seleccionar el tamaño de la
muestra, para una población de:
• 1200
• 600
• 98
55. Estimaciones
• Estimador Puntual: estadístico que se
calcula a partir de la información de la
muestra y se utiliza para estimar el
parámetro de la población
• Intervalo de Confianza: rango de valores
creado a partir de los datos de la muestra, de
modo que el parámetro poblacional es
probable que ocurra dentro de ese rango de
probabilidad específica. Esta última se
llama nivel de confianza
56. Pasos
• Determinar la media de la población o la
muestra mediante una afirmación
– El Dr. Patton es profesor de Español. Hace poco
contó el número de palabras con faltas ortográficas
en un grupo de ensayos de sus estudiantes. Para
su clase de 40 alumnos el número medio de
palabras con faltas ortográficas fue 6.05 y la
desviación estándar 2.44 por ensayo. Elabore un
intervalo de confianza de 95%, para el número
medio de palabras con faltas ortográficas en la
población de ensayos de estudiantes.
57. Pasos
• ¿Cuál es el rango de valores razonables
para la media de la población?
Ẋ
6.5+1.96( 2.44 )= 7.26
ⱱ40
6.5-1.96( 2.44 )= 5.74
ⱱ40
60. Pasos
Significancia de los resultados
Se acepta que el 95% de los estudiantes se
encuentran con errores ortográficos entre
5.74 y 7.26 errores, por lo que la hipótesis
del Prof. Patton se acepta.
Importante:
Cuando se desconoce la media de la
población y la desviación de la población se
toma la de la muestra.
61. Asignación 6(17 de marzo)
Usted tomó una muestra que refleja el
número de ausencias de 30 estudiantes,
obteniendo los siguientes resultados:
0,4,1,2,3,0,0,0,1,1,2,0,0,0,0,2,3,4,5,3,1,1,1
,3,4,0,0,0,2,4.
Calcule la media y la desviación estándar de
la muestra
Desarrolle un intervalo de confianza del
95% para la media de la población
62. PRUEBA DE HIPÓTESIS
Procedimiento basado en las
evidencias de la muestra y la
teoría de la probabilidad para
determinar si la hipótesis es una
afirmación razonable.
Tipos de Error y el nivel de significación
1.Error tipo 1 : α Rechazar Ho cuando Ho es cierto, se utiliza para comprobación de una hipótesis
2.Error tipo 2 : ß Aceptar Ho cuando Ho es falsa, mide la potencia de una muestra
63. Prueba de Hipótesis
Prueba de Hipótesis: es una suposición
sobre los parámetros de la población
La suposición que se desea probar se conoce como hipótesis nula y
se simboliza como Ho
Ejemplo : supongamos que se desea probar que la media de la
población es igual a 500
Entonces Ho: µ=500
Si en un problema usáramos un valor hipotético de una media de la
población, el valor sería µHo=valor hipotético de la media de la
población
64. Prueba de Hipótesis
A un 95% de confianza
REGIÓN DE LA PRUEBA O TEST
Región de
aceptación
α/2=0.025 α/2=0.025
95% del área
Región de rechazo Región de rechazo
μ
La región de
prueba puede
dividirse en
dos: región
de rechazo o
región de
aceptación
En α se
rechaza Ho y
en la región de
aceptación se
acepta Ho.
65. Prueba de Hipótesis
Si los resultados de la muestra no respalda la Ho, se
debe concluir que se cumple una cosa: siempre que se
rechaza la hipótesis Ho, la conclusión es que
aceptamos la hipótesis alternativa o Hi.
Interpretación del nivel de significancia
El propósito de la prueba de hipótesis no es cuestionar
el valor calculado del estadístico de la muestra, sino
hacer un juicio respecto a la diferencia entre ese
estadístico y un parámetro hipotético de la población.
66. Prueba de Hipótesis
Prueba de dos colas Prueba de una colas
Región de
aceptación
α/2=0.025 α/2=0.025
95% del área
Región de rechazo Región de rechazo
Cuando hay alternativa, existe desigualdad y la prueba es de una cola
α=0.05
95% del área
Región de rechazo
Hi:μ≠Mo (dos colas)
Hi:μ>Mo (una cola)
Hi:μ<Mo (una cola)
67. Valores Críticos de Z o Zo
TABLA DE VALORES CRÍTICOS PARA Z
NIVEL DE
SIGNIFICANCIA
99% 95% 90%
VALOR Z A UNA
COLA
±2.33 ±1.645 ±1.23
VALOR Z A DOS
COLAS
±2.58 ±1.96 ±1.645
68. Pasos a seguir para llevar a cabo una
prueba de hipótesis
• Formular la hipótesis nula y alternativa
• Especificar el nivel de significancia α
• Seleccionar el estadístico de prueba a partir de la
muestra(valor Z)
• Establecer el valor o valores críticos del estadístico de
prueba según el tamaño de la muestra
• determinar el valor real del estadístico de prueba (valor
empírico) o Zo
• Tomar la decisión final que consiste en comparar los
valores reales del estadístico de prueba con su valor
crítico o críticos.
• Regla de decisión
69. Regla de Decisión
Rechazar Ho si Z calculada o empírica cae en la
región de rechazo (región crítica) o aceptar Ho si no
cae
Si Zc>Zo Rechaza Ho
En el caso de muestras pequeñas, es decir menos de
30 se le llama to y la regla se aplica igual y los
valores críticos se obtienen en la tabla t student.
•
70. PRUEBA DE HIPÓTESIS
PRUEBA DE HIPÓTESIS PARA UNA POBLACIÓN
MUESTRAS GRANDES n≥30
Prueba para la media μ
Hipótesis nula Ho:μ=Mo Mo= valor constante
Hipótesis alternativa Hi:μ≠Mo (dos colas)
Hi:μ>Mo (una cola)
Hi:μ<Mo (una cola)
71. Estadístico de prueba empírico
EJEMPLO: se realizó una encuesta a 30 estudiantes sobre el tiempo
en horas, que dedican a chatear por sus móviles por semana, los
resultados son los siguientes:
2,6,7,10,24,1,0,5,5,4,12,20,18,15,8,2,1,2,5,4,6,6,5,7,1,0,0,5,2,3.
La hipótesis nula y alternativa son: el promedio de los
estudiantes chatea diez horas o más por semana.
Hi: µ>4 95% de confianza
Ho: µ≤4
73. respuesta
La hipotesis es de una cola por lo tanto el
valor crítico de Z ó Zo=
Y Zc=-3.06
Por lo tanto Si Zc>Zo Rechaza Ho
1.98 > 1.645 se rechaza Ho y acepta Hi
74. Cuando hay alternativa, existe desigualdad y la prueba es de una cola
α=0.05
95% del área
Región de rechazo
Zc=1.645
Zo=1.98
Zo cae en la
región de
rechazo
76. PRUEBA Z
EL RESULTADO DE L PROBABILIDAD ES
0.04619322
REGLA DE DECISIÓN
SI P<ALFA SE RECHAZA Ho
P> ALFA SE ACEPTA Ho
En este caso como es de una sola cola alfa es
0.05
Entonces 0.046 < alfa se rechaza Ho, se
acepta Ha
77. Muestras Pequeñas(n<30)
Prueba para μ
Ho: μ=Mo
Ha:μ≠Mo (dos colas)
Ha:μ>Mo (una cola)
Ha:μ<Mo (una cola)
ESTADÍSTICO DE PRUEBA EMPÍRICO tc=X-Mo
Sx
Regla de decisión Rechazar Ho si
tc>to
78. Ejemplo:
Supóngase que se desea decidir en base a una
muestra aleatoria de 5 ejemplares si el contenido de
grasas de cierto tipo de helado es menor de 12%,
considerando que el nivel de significancia es de 1%. La
muestra arrojó
una media de 11.3% y una desviación de 0.38%.
n=5
X=11.3
S=0.38 Ho:μ>12% Sx=S/√Sx
0.38/√5 =0.17
Ha: μ<12%
tc=X’-Mo 11.3-12 -4.12
Sx 0.17
tc=-4.12 to=3.747
-4.12>3.747 se rechaza Ho por lo tanto el contenido de
grasas es menor del 12% no se toma en cuenta los signos
79. To=valor crítico de t
• Se calculan los grados de libertad
gl=n-1 5-1=4 con una significancia de 1%,
la probabilidad es 99%
Se busca en la tabla to=3.747
80. asignación 7(17 de marzo)
Se realizó un muestreo de 30 evaluaciones
docentes de una Universidad para comprobar la hipótesis
que el promedio de los docentes son buenos o excelentes.
La escala de evaluación es la siguiente muy deficiente(1),
deficiente(2), regular(3), bueno(4) y muy bueno(5)
Nivel de confianza: 0.05
Los resultados obtenidos en la muestra fueron:
4.8 1.7 5 4.3 5
4.3 5 3.6 3 4.4
3.9 5 3.8 4.2 4.3
3.3 3.9 3.9 4.8 5
5 4.2 4.9 4.7 5
4.2 4.8 5 4.7 5
82. Muestras pequeñas independientes
pasos
• Formular la hipótesis nula y alternativa
Ho: μ2-μ1=0 dos colas
Hi: μ2-μ1≠0
Ho: μ2>μ1 una cola
Hi: μ2<μ2
Los promedios de las evaluaciones de la de
la muestra 2 son mayores que los promedios de la muestra 1
• Seleccionar el nivel de significancia =0.05
83. pasos
• Determinar el estadístico de prueba:
distribución z para muestras grandes,
prueba de hipótesis para las muestras de
dos poblaciones.
• Formular la regla de decisión
Zc>Zo se rechaza Ho
84. cálculos
Varianza de la distribución de las diferencias
de las muestras
S2
Ẋ1-Ẋ2
ESTADÍSTICO DE PRUEBA
Z=
85. ejemplo
Se desea comparar dos tipos aprendizajes, el tradicional vs el
significativo. Se tomó las muestras a dos poblaciones y se planteó la
hipótesis: el promedio de las evaluaciones con aprendizaje significativo
son mayores que el promedio de las evaluaciones de aprendizaje
tradicional. 0.05 de confianza.
Hipótesis
Hi:µ1<µ2
Ho:µ1>µ2
Zc=
Zc=139.2 es mayor que Zo que es 1.645 se rechaza
Ho y se comprueba Ha
87. Muestras pequeñas
• Para determinar los grados de libertad la
formula es: gl=(n1+n2)-2
Ejemplo
Un centro de estudio realiza una evaluación las
ausencias turno diurno y nocturno en una semana.
Diurno: 5 10 6 4 7
Nocturno 8 5 8 10
Hi: µ1< µ2
Ho: µ1> µ2
88. Análisis de Varianza
Distribución F o Fisher:
Se utiliza para probar si dos o más
muestras provienen de poblaciones que
tienen varianzas iguales y se aplica
cuando se desea comparar de manera
simultanea varias medias poblacionales,
llamada análisis de varianza(ANOVA).
89. Ejemplo
El Profesor James Bruner pidió a los estudiantes en su clase de
mercadotecnia que calificaran su desempeño como: excelente,
bueno, aceptable o deficiente. Un estudiante de último año
reunió las calificaciones y aseguró a los estudiantes que el
Profesor Bruner no las recibiría, sino hasta después de enviar
las notas del curso a la oficina de registro.
La calificación que un estudiante ´dio al Profesor se cotejó con
su calificación de curso, que podía variar de 0 a 100. La
información de la muestra se reporta a continuación. ¿EXISTE
ALGUNA DIFERENCIA EN LA CALIFICACIÓN MEDIA DE LOS
ESTUDIANTES DE CADA UNA DE LAS CUARO CATEGORÍAS
DE CALIFICACIÓN?. Utilice el nivel de significancia de 0.01.
91. Paso n°1
formular la hipótesis nula y la hipótesis
alternativa
Se debe formular la hipótesis nula de manera
estadística.
Ho: las calificaciones medias son las mismas
para las cuatro categorías
Ha: las calificaciones medias no son las
mismas para las cuatro categorías
Estadísticamente sería:
Ho: µ1= µ2= µ3= µ4
Ha: no todas las calificaciones de las medias
son iguales
92. Paso n°2
seleccionar el nivel de significancia
• Los niveles de significancia más comunes
son: 0.01, que corresponde al 99% de
probabilidad,0.05, que corresponde al
95% de probabilidad y 0.10, que
corresponde al 90% de probabilidad.
• Para este ejemplo se seleccionó 0.01 de
significancia
93. Paso n°3
Determinar el Estadístico de
Prueba
• Tenemos:
• Prueba Z
• T student
• Análisis de varianza(distribución F)
• Regresión y correlación
• Ji cuadrada
En este caso escogeremos la distribución F
94. Paso n°4
Formule la Regla de Decisión
• Para formular la regla de decisión se
necesita el valor crítico de F.
• Si el valor de F calculado es mayor que el
valor crítico de F, se rechaza Ho, por lo
tanto se acepta Ha.
Veamos……………………..
96. decisión
• Si F=8.99 y el valor crítico de F=3.16
Entonces F› valor crítico de F, por lo tanto
se rechaza Ho y se acepta Ha.
Ha:no todas las calificaciones de las medias
son iguales
Si la probabilidad es mayor que el nivel de
significancia se rechaza Ho
• p ‹alfa se rechaza Ho
• si p›alfa se acepta Ho
97. decisión
El nivel de significancia es 0.05, y la probabilidad 0.0007, entonces, p
‹alfa se rechaza Ho y se acepta Ha.
Existen diferencias en las medias de las evaluaciones
98. Regresión lineal y correlación
Análisis de Correlación: grupos y técnicas
para medir la asociación entre dos variables
Variable dependiente: la que predice o calcula
Variable Independiente: la que proporciona
las bases para el calculo, variable predictiva.
Coeficiente de correlación: medida de la
magnitud de la asociación entre dos variables.
Mientras más de aproxima a +1 y -1 existe más
correlación
99. Regresión lineal y correlación
• Coeficiente de determinación: es el
procentaje de la variación total en la variable
dependiente Y, que se explica, o contabiliza,
por la variación de la variable independiente
X. conforme aumenta el r2, el error estándar
de determinación disminuye.
• Prueba de significancia del coeficiente de
correlación
• Ho: Bi=0 la regresión no es significativa
• Hi: Bi≠0 la regresión es significativa
100. Regresión lineal y correlación
• Elegir el nivel de significancia
• alfa=0.05
• elegir el valor probable p=0.0001
• aplicar el criterio de decisión
• p ‹alfa se rechaza Ho
• si p›alfa se acepta Ho
• hay suficiente evidencia estadística para
rechazar Ho es decir la regresión es
significativa
105. Análisis
La los coeficientes deben ser próximos a uno, sobre el 70%, por lo
tanto el error típico es elevado, sin embargo como existe
significancia se puede realizar proyecciones.
106. Análisis
La ecuación sería Y=-5.0945+0.098y, es decir si la calificación
obtuvo 71 la ecuación quedaría así Y=-5.0945+0.098(71)=
1.863797747 , es decir evaluó entre deficiente y regular, pero si
obtuvo 91, la evaluación sería 3.823885896 , es decir entre buena
y excelente.
Coeficientes Errortípico Estadísticot Probabilidad Inferior95% Superior95%
Intercepción -5.09451518 1.431065335 -3.55994591 0.001962601 -8.079665153 -2.10936521
calificaciones 0.09800441 0.018809687 5.21031582 4.24631E-05 0.058768089 0.13724073
107. Estimación por intervalo
Inferior 95% Superior 95%
-8.079665153 -2.10936521
0.058768089 0.13724073
Esta información indica que el 95% de la regresión de las
observaciones de las calificaciones obtenidas se encuentran ente
los límites -8.079665 y el 95% de la regresión de las
observaciones de las evaluación del docente se encuentra entre
0.0587 y 0.1372
108. Ji cuadrada
Una medida de la discrepancia existente entre las
frecuencias observadas y esperadas es suministrada por el
estadístico X2
109. Ji cuadrada estadístico de
prueba
2
𝑥2
= ∑
(𝑓0−𝑓𝑒)
𝑓𝑒
Pasos
Formular la hipótesis
Seleccionar el nivel de significancia
Seleccionar estadístico de prueba
Formular regla de decisión
Calcular el valor de la ji cuadrada y tomar una decisión
110. ejemplo
La directora de un centro escolar está preocupada por el ausentismo
entre los docentes y decide hacer un muestreo de los registros,
para determinar si el ausentismo se distribuye de manera uniforme
entre la semana laboral de 6 días. La hipótesis nula a probar, es
que el ausentismo laboral se distribuye de manera uniforme durante
la semana. Los resultados de la muestra son
días N° de ausencias o
frecuencias observadas
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
total 60
111. solución
• Pasos
• Formular la hipótesis: existen diferencias
entre las frecuencias esperadas y las
frecuencias observadas
• Seleccionar el nivel de significancia=0.05
• Seleccionar estadístico de prueba: ji
cuadrada
• Calcular las frecuencias esperadas
60/6(días)=10
113. solución
• Como es una muestra pequeña se calcula
los grados de libertas gl=n-1 =6-1=5
• El valor crítico de ji cuadrada es 15.09
114. Regla de decisión
•El valor calculado de ji cuadrado es menor
que el valor crítico por lo que no se rechaza
Ho.
Conclusiones: el ausentismo laboral se
distribuye de manera uniforme durante la
semana. Las diferencias se deben a errores
de muestreo
115. Proyecto final
• Formule una hipótesis sobre un tema que usted seleccione
• Recopile la información(fuente primaria o secundaria)
• Escoja el estadístico de prueba(estimación por intervalo,
distribución z, distribución t, distribución F, ji cuadrada,
regresión)
• Realice los cálculos(pueden se manuales o utilizando la
computadora)
• Aplique la regla de decisión
• Presente sus conclusiones
Presentar un informe en word escrito y el ppt por correo o en la
latina learning site. Tiempo estimado para sustentar máximo
20 minutos por grupo