ESTADISTICA UNIDAD II

Instituto tecnológico superior de la
          sierra negra de Ajalpan



         Ingeniería en administración

                Cuarto semestre


                   Estadística II

          Ing. José Guadalupe Rodríguez Ramos




         Elizabeth Paniagua Tegchi


  Unidad II   Pruebas de la bondad del
       ajuste y análisis de Varianza



16 de febrero de 2012
2.1Análisis Ji-Cuadrada
En estadística la distribución x2(de Pearson), llamado chi-cuadrado o ji cuadrado es una
distribución de probabilidad continua con un parámetro K que presenta los grados libertad de
la variable aleatoria. X=Z21+…Z2k
Donde Z son variables aleatorias normales independientemente de media cero y varianza uno.
En realidadla distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen
todas las muestras posibles de una población normal y cada muestra se le calcula su varianza,
se obtendrá la distribución muestral de varianzas.
Además de aplicarse a la distribución multinominal, la prueba chi-cuadrado puede-ser
empleada para determinar de qué forma distribuciones teóricas tales como la normal, de
Poisson, etc., se ajustan a distribuciones empíricas, es decir, aquellas que se obtienen de los
datos muéstrales
Ji-cuadrado, será la estadística de prueba utilizada para la toma de decisiones de la hipótesis nula.
Por lo tanto ji-cuadrada es, como la distribución t, una familia completa de distribuciones;
hay una distribución diferente para cada valor de los grados de libertad (g.l.= n – 1).




Esta distribución está sesgada positivamente, pero a medida que aumentan los grados
de libertad, la distribución se hace más simétrica y se aproxima a la normal. Por otra
parte, al ser una distribución de probabilidad, el área total bajo la curva es 1.
Así como en el caso de la distribución normal, que sirvió para estandarizar medias
muéstrales, la distribuciónx2 cumple la misma misión para las varianzas.
2.1.1 Prueba de independencia
Cuando comparamos dos situaciones podemos esperar que sean ya bien dependientes
o independientes esto quiere decir que pueden o no estar relacionados sus datos
debido a muchos factores que pueden influir en ellos o bien, un problema no tenga
relación con otro.

La prueba de independencia trata sobre esto, ya que su objetivo es determinar si
alguna situación es afectada por otra, basándose en datos estadísticos y valores
probabilístico obtenidos de la fabulación de datos o de pronósticos por medio de
fórmulas y tablas, para esto se basa en un nivel de significancia en un caso y en el otro
a comparar, valiéndonos de tablas de contingencia para obtener frecuencias
esperadas y poder aplicarlas, para así obtener datos comparativos que son
determinantes en la decisión de independencia.

Distribución ji-cuadrada nos permite también comparar dos atributos o característicaspara
determinar si hay alguna relación entre ellos. Consideremos, por ejemplo, que un
especialista en marketing quisiera determinar si hay alguna conexión entre los niveles de
renta de los consumidores y su preferencia por el producto que él vende. Este
procedimiento implicaría comparar dos atributos: rentas y preferencias.

La comparación de dos atributos para determinar si son independientes se realiza de la
misma forma que antes: analizando la diferencia entre frecuencias observadas reales y
frecuencias esperadas.




            2.1.2 Prueba de la bondad del ajuste

Una hipótesis estadística se define como una afirmación o conjetura acerca de la distribución
f(x,q) de una o más variables aleatorias. Igualmente se planteó que la distribución podía tener
uno o más parámetros desconocidos, que denotamos por q y que la hipótesis se relaciona con
este parámetro o conjunto de parámetros. En otros casos, se desconoce por completo la forma
de la distribución y la hipótesis entonces se relaciona con una distribución específica f(x,q)
que podamos asignarle al conjunto de datos de la muestra. El primer problema, relacionado
con los parámetros de una distribución conocida o supuesta y el problema de verificar si el
conjunto de datos se puede ajustar o afirmar que proviene de una determinada distribución.

Las pruebas estadísticas que tratan este problema reciben el nombre general de “Pruebas de
Bondad de Ajuste”.
La prueba Chi - Cuadrado y la prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la
categoría de lo que en estadística se denominan pruebas de “Bondad de Ajuste” y miden, como
el nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir de la
muestra y la distribución teórica que se supone debe seguir esa muestra. Ambas pruebas
están basadas en la hipótesis nula de que no hay diferencias significativas entre la
distribución muestral y la teórica. Ambas pruebas están basadas en las siguientes hipótesis:

H0: f(x,q) = f0(x,q)

H1: f(x,q) ¹ f0(x,q)

Donde f0(x,q) es la distribución que se supone sigue la muestra aleatoria. La hipótesis
alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Si se
desea examinar otra distribución específica, deberá realizarse de nuevo la otra prueba
suponiendo que la hipótesis nula es esta nueva distribución. Al especificar la hipótesis nula, el
conjunto de parámetros definidos por q puede ser conocido o desconocido. En caso de que los
parámetros sean desconocidos, es necesario estimarlos mediante alguno de los métodos de
estimación analizados con anterioridad.

Prueba Ji2 de la Bondad del Ajuste

Se parte de una muestra aleatoria de tamaño N, proveniente de una población cuya
distribución de probabilidad es desconocida.

         Las N observaciones se acomodan en un Histograma de frecuencia con k intervalos de
          clase. Sea Oi la i-ésima frecuencia de clase.

          De la distribución de probabilidad propuesta se calcula la frecuencia esperada Ei en el
          i-ésimo intervalo de clase

         El estadístico de prueba es            k
                                                       (Oi    Ei )2
                                           χ2
                                                 i 1         Ei
         El cual tiene una distribución Ji2 con k-p-1 grados de libertad si la población sigue la
          distribución propuesta. (donde p es el número de parámetros de la población)

         La aproximación mejora a medida que N es más grande

         La hipótesis debe rechazarse si el valor del estadístico de prueba es:
x2>x21-α, k-p-1




                     2.1.3 Tablas de contingencia


En estadística las tablas de contingencia se emplean para registrar y analizar la relación
entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales).

Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y B,
admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las
frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de
contingencia


Las tablas en las que las frecuencias observadas ocupan una sola fila, es una tabla de
clasificaciónsimple. Puesto que el número de columnas es k, también se llama tabla 1 X k
(léase uno por k).

Entendiéndose estas ideas se llega a las tablas de clasificación doble o tablas hXk en las que las
frecuencias observadas ocupan h filas y k columnas. Tales tablas se llaman a menudo tablas de
contingencias.

Correspondiéndose con cada frecuencia observada en una tabla de contingencia hX k, hay una
frecuencia teórica o esperada que se calcula bajo una hipótesis según las reglas de
probabilidad.


Estas frecuencias que ocupan las casillas de una tabla de contingencia se llaman frecuencias
elementales. La frecuencia total de cada fila o columna es la llamada frecuenciamarginal.
Para estudiar el acuerdo entre las frecuencias observadas y esperadas, se calcula el estadístico




Donde la suma se extiende a todas las casillas de la tabla de contingencia, los símbolos xi Y
npirepresentan respectivamente las frecuencias observadas y esperadas en la casilla j. Esta
suma que esanáloga, contiene hktérminos. La suma de todas las frecuencias observadas se
denota por n yes igual a la suma de todas las frecuencias esperadas.
Una tabla de contingencia es una herramienta que nos permite poner a prueba si dos
criterios de clasificación de una misma muestra son independientes o no, por ejemplo:


Población                        Criterio 1              Criterio 2

Ingenieros recién egresados       Salario inicial         Institución de origen

Estudiantes                       Nivel Socioeconómico    Promedio académico

Número de fallas en un proceso    Maquinaria utilizada    Turno

Estudiantes                       Calif. en Materia 1     Calif. en Materia 2

Fallas en un transformador        Tipo de falla           Ubicación

Etc...




                              2.2 Análisis de varianza
EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola variable numérica
medida en los elementos de la muestra para probar la hipótesis nula de igualdad de medias
poblaciones. Esta variable puede ser de intervalo o de escala de razón.

Esta variable algunas veces recibe el nombre de variable dependiente, en especial en
programas de computadora que ejecutan ANOVA.

La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se
estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las
hipótesis nulas y alternativa en ANOVA son:

H0: 1 = 2 = 3 =... = c

H1: No todas las poblaciones tienen la misma media.

En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan
estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral
apropiada para determinar si el estadístico muestral contradice la suposición de que la
hipótesis nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza.


Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) en el
que la variable analizada va a depender de un sólo factor de tal manera que las causas de su
variabilidad son englobadas en una componente aleatoria que se denomina error
experimental.

El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o
más medias, que es necesario porque cuando se quiere comparar más de dos medias es
incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos:

En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de
hipótesis, la probabilidad de encontrar alguno significativo por azar aumentaría. En cada
contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay
una probabilidad . Si se realizan m contrastes independientes, la probabilidad de que, en la
hipótesis nula, ningún estadístico supere el valor crítico es (1 - ) m, por lo tanto, la
probabilidad de que alguno lo supere es 1 - (1 - )m, que para valores de próximos a 0 es
aproximadamente igual a m. Una primera solución, denominada método de Bonferroni,
consiste en bajar el valor de , usando en su lugar /m, aunque resulta un método muy
conservador.

Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la
misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la
hipótesis nula es que todas las muestras provienen de la misma población y, sin embargo,
para cada comparación, la estimación de la varianza necesaria para el contraste es distinta,
pues se ha hecho en base a muestras distintas.




2.2.1 Inferencia sobre una varianza de población
(Anova)

Los analistas investigan la variabilidad de una población, en lugar de su media o proporción.

Esto es debido a que la uniformidad de la producción muchas veces es crítica en la práctica
industrial.

La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis está
diseñada para determinar si la varianza de una población es igual a algún valor
predeterminado.

La desviación estándar de una colección de datos se usa para describir la variabilidad en esa
colección y se puede definir como la diferencia estándar entre los elementos de una colección
de datos y su media.

La varianza de un conjunto de datos se define como el cuadrado de su desviación estándar; y
la varianza muestral se utiliza para probar la hipótesis nula que se refiere a la variabilidad y es
útil para entender el procedimiento de análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algún
valor previamente especificado. Como el aspecto de interés, por lo general es si la varianza de
la población es mayor que este valor, siempre se aplica una de una cola.

Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una población
que se investiga; y a partir de esos datos, se calcula el estadístico de prueba.

Para este cálculo se utiliza la siguiente ecuación:

(n - 1) s2

Donde:

* n-1 = Grados de libertad para la prueba de tamaño n.

* s2 = Varianza muestral.

* 2 = Varianza poblacional si y solo si suponemos que la hipótesis nula es cierta.




2.2.2 Inferencia sobre la varianza de dos
Poblaciones (Anova).
Es importante comparar dos poblaciones para ver si una es más variable que la otra en alguna
medida específica. La hipótesis nula es que las dos poblaciones tienen la misma varianza, y la
hipótesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras
aleatorias de cada población y se calculan las varianzas muéstrales.

Si las varianzas poblacionales son iguales, dicha razón es 1 y podríamos afirmar que las dos
poblaciones tienen una distribución homogénea; es decir, los datos se encuentran igualmente
dispersos.

Asícomo se realiza inferencia sobre la estimación y prueba de hipótesis de la diferencia de
medias o proporciones muéstrales en el caso de dos poblaciones, así también podemos
plantear el estudio de la razón de las varianzas de dos poblaciones definiendo al parámetro

como                    y su estimador                . Este estudio lo haremos tomando en
cuenta el intervalo de confianza y la prueba de hipótesis.
BIBLIOFRAFIA

Probabilidad Y Estadística, Murray R. Spiegel Ph.D.,
McGraw-Hill,México,1976.

Probabilidad Y Estadística, Mario F. Triola,Addision
Wesley,Novena Edición.


Probabilidad Y Estadística,Walpole Miers,Cuarta
Edición,MCGRAW-HILL.

Probabilidad Y Estadística Para Ingeniería Y Ciencias,
Jay L. Devore, Séptima Edición.

Recomendados

Estadistica ad von
Estadistica adEstadistica ad
Estadistica adJAVIER RUIZ
1.1K views10 Folien
pruebas no paraemtricas von
pruebas no paraemtricas pruebas no paraemtricas
pruebas no paraemtricas jimmynter
930 views20 Folien
9. Regression von
9. Regression9. Regression
9. RegressionRazif Shahril
4.6K views30 Folien
Application of Regression Analysis: Model Building and Validation von
Application of Regression Analysis: Model Building and Validation  Application of Regression Analysis: Model Building and Validation
Application of Regression Analysis: Model Building and Validation Kalaivanan Murthy
770 views32 Folien
Luận án: Ứng dụng phẫu thuật nội soi điều trị thoát vị bẹn trực tiếp von
Luận án: Ứng dụng phẫu thuật nội soi điều trị thoát vị bẹn trực tiếpLuận án: Ứng dụng phẫu thuật nội soi điều trị thoát vị bẹn trực tiếp
Luận án: Ứng dụng phẫu thuật nội soi điều trị thoát vị bẹn trực tiếpDịch vụ viết bài trọn gói ZALO 0909232620
157 views151 Folien
Testing a claim about a proportion von
Testing a claim about a proportion  Testing a claim about a proportion
Testing a claim about a proportion Long Beach City College
569 views14 Folien

Más contenido relacionado

Was ist angesagt?

Probability 4.2 von
Probability 4.2Probability 4.2
Probability 4.2herbison
1.4K views19 Folien
Teoría programación lineal von
Teoría programación linealTeoría programación lineal
Teoría programación linealAugusto Javes Sanchez
6.6K views7 Folien
Pruebas de hipotesis von
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis elizareal
29.9K views28 Folien
Modelos Probit Y Logit von
Modelos Probit Y LogitModelos Probit Y Logit
Modelos Probit Y Logitingenierlaupt
32.3K views13 Folien
Test for equal variances von
Test for equal variancesTest for equal variances
Test for equal variancesJohn Smith
21K views11 Folien
Nosferi - Perturbaciones no esfericas en el modelo lineal von
Nosferi - Perturbaciones no esfericas en el modelo linealNosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo linealMiguel Jerez
3.1K views24 Folien

Was ist angesagt?(19)

Probability 4.2 von herbison
Probability 4.2Probability 4.2
Probability 4.2
herbison1.4K views
Pruebas de hipotesis von elizareal
Pruebas de hipotesis Pruebas de hipotesis
Pruebas de hipotesis
elizareal29.9K views
Modelos Probit Y Logit von ingenierlaupt
Modelos Probit Y LogitModelos Probit Y Logit
Modelos Probit Y Logit
ingenierlaupt32.3K views
Test for equal variances von John Smith
Test for equal variancesTest for equal variances
Test for equal variances
John Smith21K views
Nosferi - Perturbaciones no esfericas en el modelo lineal von Miguel Jerez
Nosferi - Perturbaciones no esfericas en el modelo linealNosferi - Perturbaciones no esfericas en el modelo lineal
Nosferi - Perturbaciones no esfericas en el modelo lineal
Miguel Jerez3.1K views
Diseño completamente al azar von lordgusti
Diseño completamente al azarDiseño completamente al azar
Diseño completamente al azar
lordgusti9.2K views
Mann Whitney U Test And Chi Squared von guest2137aa
Mann Whitney U Test And Chi SquaredMann Whitney U Test And Chi Squared
Mann Whitney U Test And Chi Squared
guest2137aa15K views
X cuadrada von 119977Aang
X cuadradaX cuadrada
X cuadrada
119977Aang11.4K views
LEYES DE LA PROBABILIDAD.pptx von WilberOrtiz10
LEYES DE LA PROBABILIDAD.pptxLEYES DE LA PROBABILIDAD.pptx
LEYES DE LA PROBABILIDAD.pptx
WilberOrtiz10222 views

Destacado

Informatica album de fotos maviael martìnez ramos ramos von
Informatica album de fotos maviael martìnez ramos  ramosInformatica album de fotos maviael martìnez ramos  ramos
Informatica album de fotos maviael martìnez ramos ramosMaviael Martínez Ramos
276 views7 Folien
La protección jurídica del software von
La protección jurídica del softwareLa protección jurídica del software
La protección jurídica del softwaremariellyfloresgiron
199 views8 Folien
Pantallas plasma jose arango von
Pantallas plasma jose arangoPantallas plasma jose arango
Pantallas plasma jose arangokerro26
186 views4 Folien
Hernandez ginama dificultadaprendizaje von
Hernandez ginama dificultadaprendizajeHernandez ginama dificultadaprendizaje
Hernandez ginama dificultadaprendizajeGinita1904
468 views9 Folien
Teoradelarelatividad von
TeoradelarelatividadTeoradelarelatividad
Teoradelarelatividadcreacionesdanae
57 views5 Folien
Hoy quiero felicitarte von
Hoy quiero felicitarteHoy quiero felicitarte
Hoy quiero felicitartecreacionesdanae
166 views15 Folien

Destacado(20)

Pantallas plasma jose arango von kerro26
Pantallas plasma jose arangoPantallas plasma jose arango
Pantallas plasma jose arango
kerro26186 views
Hernandez ginama dificultadaprendizaje von Ginita1904
Hernandez ginama dificultadaprendizajeHernandez ginama dificultadaprendizaje
Hernandez ginama dificultadaprendizaje
Ginita1904468 views
Presentacion esic von Mude Pg
Presentacion esicPresentacion esic
Presentacion esic
Mude Pg174 views
Trabajo colaborativo ecologia_wiki 3 von chila68
Trabajo colaborativo ecologia_wiki 3Trabajo colaborativo ecologia_wiki 3
Trabajo colaborativo ecologia_wiki 3
chila68479 views
Encicloabierta von mauro1993
EncicloabiertaEncicloabierta
Encicloabierta
mauro1993142 views
El verbo (i) von manolitru
El verbo (i)El verbo (i)
El verbo (i)
manolitru1.2K views
Servicio social comunitario von Alfonso Cota
Servicio social comunitarioServicio social comunitario
Servicio social comunitario
Alfonso Cota609 views
La revoluciion china von javyulloa
La revoluciion chinaLa revoluciion china
La revoluciion china
javyulloa204 views

Similar a ESTADISTICA UNIDAD II

Estadística II (II Bimestre) von
Estadística II (II Bimestre)Estadística II (II Bimestre)
Estadística II (II Bimestre)Videoconferencias UTPL
9.5K views55 Folien
Jose borges tarea presentacion ppt dist de prob von
Jose borges tarea presentacion ppt dist de probJose borges tarea presentacion ppt dist de prob
Jose borges tarea presentacion ppt dist de probJose Ramon Borges Yepez
657 views25 Folien
Investigacion hipotesis (ji) rest 1 von
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1guest0e7a0f7
1 view52 Folien
Investigacion hipotesis (ji) rest 1 von
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1guest0e7a0f7
1.2K views52 Folien
Pruebas no parametricas von
Pruebas no parametricasPruebas no parametricas
Pruebas no parametricasPatricia Avalos
431 views10 Folien
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada) von
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)Ana
13.1K views59 Folien

Similar a ESTADISTICA UNIDAD II(20)

Investigacion hipotesis (ji) rest 1 von guest0e7a0f7
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1
guest0e7a0f71 view
Investigacion hipotesis (ji) rest 1 von guest0e7a0f7
Investigacion hipotesis (ji) rest 1Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1
guest0e7a0f71.2K views
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada) von Ana
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)
5 Planteamiento de Hipotesis en mas de 2 Poblaciones (ji cuadrada)
Ana13.1K views
Planteamiento de hipotesis en mas de dos poblaciones (ji cuadrada) von guest8a3c19
Planteamiento de hipotesis en mas de dos poblaciones (ji cuadrada)Planteamiento de hipotesis en mas de dos poblaciones (ji cuadrada)
Planteamiento de hipotesis en mas de dos poblaciones (ji cuadrada)
guest8a3c194.8K views
Planteamiento de Hipótesis para dos poblaciones (WORD) von HOTELES2
Planteamiento de Hipótesis para dos poblaciones (WORD)Planteamiento de Hipótesis para dos poblaciones (WORD)
Planteamiento de Hipótesis para dos poblaciones (WORD)
HOTELES229K views
Presentación Distribución de Probabilidad von Carlosdbarradasm
Presentación Distribución de ProbabilidadPresentación Distribución de Probabilidad
Presentación Distribución de Probabilidad
Carlosdbarradasm4K views
Estadistica chi cuadrado von PABLITO Pablo
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadrado
PABLITO Pablo45.2K views

Más de Lucia Flores Garcia

Cuestinarios von
CuestinariosCuestinarios
CuestinariosLucia Flores Garcia
457 views10 Folien
Unidad 5 von
Unidad 5Unidad 5
Unidad 5Lucia Flores Garcia
200 views28 Folien
RESUMEN UNIDAD 4 von
RESUMEN UNIDAD 4RESUMEN UNIDAD 4
RESUMEN UNIDAD 4Lucia Flores Garcia
2.5K views48 Folien
Matriz von
MatrizMatriz
MatrizLucia Flores Garcia
104 views1 Folie
Investigacion unidadii von
Investigacion unidadiiInvestigacion unidadii
Investigacion unidadiiLucia Flores Garcia
148 views9 Folien
Investigacion unidad II von
Investigacion unidad IIInvestigacion unidad II
Investigacion unidad IILucia Flores Garcia
188 views9 Folien

Más de Lucia Flores Garcia(17)

Instituto tecnológico superior de la sierra negra de ajalp an von Lucia Flores Garcia
Instituto tecnológico superior de la sierra negra de ajalp anInstituto tecnológico superior de la sierra negra de ajalp an
Instituto tecnológico superior de la sierra negra de ajalp an
Instituto tecnológico superior de la sierra negra de ajalp an von Lucia Flores Garcia
Instituto tecnológico superior de la sierra negra de ajalp anInstituto tecnológico superior de la sierra negra de ajalp an
Instituto tecnológico superior de la sierra negra de ajalp an

Último

0 - Organología - Presentación.pptx von
0 - Organología - Presentación.pptx0 - Organología - Presentación.pptx
0 - Organología - Presentación.pptxVICENTEJIMENEZAYALA
130 views10 Folien
Mujeres privadas de libertad en Bolivia 2022 von
Mujeres privadas de libertad en Bolivia 2022Mujeres privadas de libertad en Bolivia 2022
Mujeres privadas de libertad en Bolivia 2022LuisFernando672460
119 views170 Folien
S1_CPL.pdf von
S1_CPL.pdfS1_CPL.pdf
S1_CPL.pdfConecta13
55 views80 Folien
Tema 2 Aparato digestivo 2023.pdf von
Tema 2 Aparato digestivo 2023.pdfTema 2 Aparato digestivo 2023.pdf
Tema 2 Aparato digestivo 2023.pdfIES Vicent Andres Estelles
46 views91 Folien
Ác. nucleicos 2023.pdf von
Ác. nucleicos 2023.pdfÁc. nucleicos 2023.pdf
Ác. nucleicos 2023.pdfIES Vicent Andres Estelles
52 views56 Folien
Muestra Anual de Literatura Clásica y Latín.pptx von
Muestra Anual de Literatura Clásica y Latín.pptxMuestra Anual de Literatura Clásica y Latín.pptx
Muestra Anual de Literatura Clásica y Latín.pptxMaría Roxana
117 views19 Folien

Último(20)

Muestra Anual de Literatura Clásica y Latín.pptx von María Roxana
Muestra Anual de Literatura Clásica y Latín.pptxMuestra Anual de Literatura Clásica y Latín.pptx
Muestra Anual de Literatura Clásica y Latín.pptx
María Roxana117 views
Castelo de San Diego (A Coruña) von Agrela Elvixeo
Castelo de San Diego (A Coruña)Castelo de San Diego (A Coruña)
Castelo de San Diego (A Coruña)
Agrela Elvixeo175 views
Concepto de determinación de necesidades.pdf von LauraJuarez87
Concepto de determinación de necesidades.pdfConcepto de determinación de necesidades.pdf
Concepto de determinación de necesidades.pdf
LauraJuarez8772 views
Meta 1.1 Identificar el contenido històrico de la Lengua de Señas. von IvanLechuga
Meta 1.1 Identificar el contenido històrico de la Lengua de Señas.Meta 1.1 Identificar el contenido històrico de la Lengua de Señas.
Meta 1.1 Identificar el contenido històrico de la Lengua de Señas.
IvanLechuga61 views
Presentación de Proyecto Creativo Doodle Azul.pdf von LauraJuarez87
Presentación de Proyecto Creativo Doodle Azul.pdfPresentación de Proyecto Creativo Doodle Azul.pdf
Presentación de Proyecto Creativo Doodle Azul.pdf
LauraJuarez8764 views
Fase 4- Estudio de la geometría analítica.pptx von blogdealgebraunad
Fase 4- Estudio de la geometría analítica.pptxFase 4- Estudio de la geometría analítica.pptx
Fase 4- Estudio de la geometría analítica.pptx

ESTADISTICA UNIDAD II

  • 1. Instituto tecnológico superior de la sierra negra de Ajalpan Ingeniería en administración Cuarto semestre Estadística II Ing. José Guadalupe Rodríguez Ramos Elizabeth Paniagua Tegchi Unidad II Pruebas de la bondad del ajuste y análisis de Varianza 16 de febrero de 2012
  • 2. 2.1Análisis Ji-Cuadrada En estadística la distribución x2(de Pearson), llamado chi-cuadrado o ji cuadrado es una distribución de probabilidad continua con un parámetro K que presenta los grados libertad de la variable aleatoria. X=Z21+…Z2k Donde Z son variables aleatorias normales independientemente de media cero y varianza uno. En realidadla distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las muestras posibles de una población normal y cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas. Además de aplicarse a la distribución multinominal, la prueba chi-cuadrado puede-ser empleada para determinar de qué forma distribuciones teóricas tales como la normal, de Poisson, etc., se ajustan a distribuciones empíricas, es decir, aquellas que se obtienen de los datos muéstrales Ji-cuadrado, será la estadística de prueba utilizada para la toma de decisiones de la hipótesis nula. Por lo tanto ji-cuadrada es, como la distribución t, una familia completa de distribuciones; hay una distribución diferente para cada valor de los grados de libertad (g.l.= n – 1). Esta distribución está sesgada positivamente, pero a medida que aumentan los grados de libertad, la distribución se hace más simétrica y se aproxima a la normal. Por otra parte, al ser una distribución de probabilidad, el área total bajo la curva es 1. Así como en el caso de la distribución normal, que sirvió para estandarizar medias muéstrales, la distribuciónx2 cumple la misma misión para las varianzas.
  • 3. 2.1.1 Prueba de independencia Cuando comparamos dos situaciones podemos esperar que sean ya bien dependientes o independientes esto quiere decir que pueden o no estar relacionados sus datos debido a muchos factores que pueden influir en ellos o bien, un problema no tenga relación con otro. La prueba de independencia trata sobre esto, ya que su objetivo es determinar si alguna situación es afectada por otra, basándose en datos estadísticos y valores probabilístico obtenidos de la fabulación de datos o de pronósticos por medio de fórmulas y tablas, para esto se basa en un nivel de significancia en un caso y en el otro a comparar, valiéndonos de tablas de contingencia para obtener frecuencias esperadas y poder aplicarlas, para así obtener datos comparativos que son determinantes en la decisión de independencia. Distribución ji-cuadrada nos permite también comparar dos atributos o característicaspara determinar si hay alguna relación entre ellos. Consideremos, por ejemplo, que un especialista en marketing quisiera determinar si hay alguna conexión entre los niveles de renta de los consumidores y su preferencia por el producto que él vende. Este procedimiento implicaría comparar dos atributos: rentas y preferencias. La comparación de dos atributos para determinar si son independientes se realiza de la misma forma que antes: analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas. 2.1.2 Prueba de la bondad del ajuste Una hipótesis estadística se define como una afirmación o conjetura acerca de la distribución f(x,q) de una o más variables aleatorias. Igualmente se planteó que la distribución podía tener uno o más parámetros desconocidos, que denotamos por q y que la hipótesis se relaciona con este parámetro o conjunto de parámetros. En otros casos, se desconoce por completo la forma de la distribución y la hipótesis entonces se relaciona con una distribución específica f(x,q) que podamos asignarle al conjunto de datos de la muestra. El primer problema, relacionado con los parámetros de una distribución conocida o supuesta y el problema de verificar si el conjunto de datos se puede ajustar o afirmar que proviene de una determinada distribución. Las pruebas estadísticas que tratan este problema reciben el nombre general de “Pruebas de Bondad de Ajuste”.
  • 4. La prueba Chi - Cuadrado y la prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que en estadística se denominan pruebas de “Bondad de Ajuste” y miden, como el nombre lo indica, el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están basadas en la hipótesis nula de que no hay diferencias significativas entre la distribución muestral y la teórica. Ambas pruebas están basadas en las siguientes hipótesis: H0: f(x,q) = f0(x,q) H1: f(x,q) ¹ f0(x,q) Donde f0(x,q) es la distribución que se supone sigue la muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Si se desea examinar otra distribución específica, deberá realizarse de nuevo la otra prueba suponiendo que la hipótesis nula es esta nueva distribución. Al especificar la hipótesis nula, el conjunto de parámetros definidos por q puede ser conocido o desconocido. En caso de que los parámetros sean desconocidos, es necesario estimarlos mediante alguno de los métodos de estimación analizados con anterioridad. Prueba Ji2 de la Bondad del Ajuste Se parte de una muestra aleatoria de tamaño N, proveniente de una población cuya distribución de probabilidad es desconocida.  Las N observaciones se acomodan en un Histograma de frecuencia con k intervalos de clase. Sea Oi la i-ésima frecuencia de clase.  De la distribución de probabilidad propuesta se calcula la frecuencia esperada Ei en el i-ésimo intervalo de clase  El estadístico de prueba es k (Oi Ei )2 χ2 i 1 Ei  El cual tiene una distribución Ji2 con k-p-1 grados de libertad si la población sigue la distribución propuesta. (donde p es el número de parámetros de la población)  La aproximación mejora a medida que N es más grande  La hipótesis debe rechazarse si el valor del estadístico de prueba es:
  • 5. x2>x21-α, k-p-1 2.1.3 Tablas de contingencia En estadística las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables, habitualmente de naturaleza cualitativa (nominales u ordinales). Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y B, admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de contingencia Las tablas en las que las frecuencias observadas ocupan una sola fila, es una tabla de clasificaciónsimple. Puesto que el número de columnas es k, también se llama tabla 1 X k (léase uno por k). Entendiéndose estas ideas se llega a las tablas de clasificación doble o tablas hXk en las que las frecuencias observadas ocupan h filas y k columnas. Tales tablas se llaman a menudo tablas de contingencias. Correspondiéndose con cada frecuencia observada en una tabla de contingencia hX k, hay una frecuencia teórica o esperada que se calcula bajo una hipótesis según las reglas de probabilidad. Estas frecuencias que ocupan las casillas de una tabla de contingencia se llaman frecuencias elementales. La frecuencia total de cada fila o columna es la llamada frecuenciamarginal. Para estudiar el acuerdo entre las frecuencias observadas y esperadas, se calcula el estadístico Donde la suma se extiende a todas las casillas de la tabla de contingencia, los símbolos xi Y npirepresentan respectivamente las frecuencias observadas y esperadas en la casilla j. Esta suma que esanáloga, contiene hktérminos. La suma de todas las frecuencias observadas se denota por n yes igual a la suma de todas las frecuencias esperadas.
  • 6. Una tabla de contingencia es una herramienta que nos permite poner a prueba si dos criterios de clasificación de una misma muestra son independientes o no, por ejemplo: Población Criterio 1 Criterio 2 Ingenieros recién egresados Salario inicial Institución de origen Estudiantes Nivel Socioeconómico Promedio académico Número de fallas en un proceso Maquinaria utilizada Turno Estudiantes Calif. en Materia 1 Calif. en Materia 2 Fallas en un transformador Tipo de falla Ubicación Etc... 2.2 Análisis de varianza EL procedimiento de análisis de varianza, o ANOVA, utiliza una sola variable numérica medida en los elementos de la muestra para probar la hipótesis nula de igualdad de medias poblaciones. Esta variable puede ser de intervalo o de escala de razón. Esta variable algunas veces recibe el nombre de variable dependiente, en especial en programas de computadora que ejecutan ANOVA. La hipótesis nula que se prueba en el ANOVA es que la mayoría de las poblaciones que se estudian (al menos tres) tienen el mismo valor de la media para la variable dependiente. Las hipótesis nulas y alternativa en ANOVA son: H0: 1 = 2 = 3 =... = c H1: No todas las poblaciones tienen la misma media. En la prueba ANOVA, se reúne evidencia muestral de cada población bajo estudio y se usan estos datos para calcular un estadístico muestral. Después se consulta la distribución muestral apropiada para determinar si el estadístico muestral contradice la suposición de que la hipótesis nula es cierta. Si es así, se rechaza; de lo contrario no se rechaza. Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) en el que la variable analizada va a depender de un sólo factor de tal manera que las causas de su
  • 7. variabilidad son englobadas en una componente aleatoria que se denomina error experimental. El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias, que es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos: En primer lugar, y como se realizarían simultánea e independientemente varios contrastes de hipótesis, la probabilidad de encontrar alguno significativo por azar aumentaría. En cada contraste se rechaza la H0 si la t supera el nivel crítico, para lo que, en la hipótesis nula, hay una probabilidad . Si se realizan m contrastes independientes, la probabilidad de que, en la hipótesis nula, ningún estadístico supere el valor crítico es (1 - ) m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - )m, que para valores de próximos a 0 es aproximadamente igual a m. Una primera solución, denominada método de Bonferroni, consiste en bajar el valor de , usando en su lugar /m, aunque resulta un método muy conservador. Por otro lado, en cada comparación la hipótesis nula es que las dos muestras provienen de la misma población, por lo tanto, cuando se hayan realizado todas las comparaciones, la hipótesis nula es que todas las muestras provienen de la misma población y, sin embargo, para cada comparación, la estimación de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas. 2.2.1 Inferencia sobre una varianza de población (Anova) Los analistas investigan la variabilidad de una población, en lugar de su media o proporción. Esto es debido a que la uniformidad de la producción muchas veces es crítica en la práctica industrial. La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis está diseñada para determinar si la varianza de una población es igual a algún valor predeterminado. La desviación estándar de una colección de datos se usa para describir la variabilidad en esa colección y se puede definir como la diferencia estándar entre los elementos de una colección de datos y su media. La varianza de un conjunto de datos se define como el cuadrado de su desviación estándar; y la varianza muestral se utiliza para probar la hipótesis nula que se refiere a la variabilidad y es útil para entender el procedimiento de análisis de la varianza.
  • 8. La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algún valor previamente especificado. Como el aspecto de interés, por lo general es si la varianza de la población es mayor que este valor, siempre se aplica una de una cola. Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una población que se investiga; y a partir de esos datos, se calcula el estadístico de prueba. Para este cálculo se utiliza la siguiente ecuación: (n - 1) s2 Donde: * n-1 = Grados de libertad para la prueba de tamaño n. * s2 = Varianza muestral. * 2 = Varianza poblacional si y solo si suponemos que la hipótesis nula es cierta. 2.2.2 Inferencia sobre la varianza de dos Poblaciones (Anova). Es importante comparar dos poblaciones para ver si una es más variable que la otra en alguna medida específica. La hipótesis nula es que las dos poblaciones tienen la misma varianza, y la hipótesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de cada población y se calculan las varianzas muéstrales. Si las varianzas poblacionales son iguales, dicha razón es 1 y podríamos afirmar que las dos poblaciones tienen una distribución homogénea; es decir, los datos se encuentran igualmente dispersos. Asícomo se realiza inferencia sobre la estimación y prueba de hipótesis de la diferencia de medias o proporciones muéstrales en el caso de dos poblaciones, así también podemos plantear el estudio de la razón de las varianzas de dos poblaciones definiendo al parámetro como y su estimador . Este estudio lo haremos tomando en cuenta el intervalo de confianza y la prueba de hipótesis.
  • 9. BIBLIOFRAFIA Probabilidad Y Estadística, Murray R. Spiegel Ph.D., McGraw-Hill,México,1976. Probabilidad Y Estadística, Mario F. Triola,Addision Wesley,Novena Edición. Probabilidad Y Estadística,Walpole Miers,Cuarta Edición,MCGRAW-HILL. Probabilidad Y Estadística Para Ingeniería Y Ciencias, Jay L. Devore, Séptima Edición.