2. Introducción
En esta última presentación les
mostraré como determinamos la
media aritmética, desviación
estándar, varianza y desviación
media.
También les mostraré como se hace
un histograma, una gráfica de ojiva y
por último gráfica caja de bigotes.
3. Datos agrupados
En las tres presentaciones anteriores
se llevaron a cabo una seria de pasos
obteniendo los intervalos aparentes y
reales, las marcas de clase y las
frecuencias;
absoluta, acumulada, relativa y
relativa acumulada.
El resultado de este proceso fue la
siguiente tabla.
4. Datos agrupados
Clases o categorias intervalos Marcas de clase Frecuencias
Limite inferior Limite superior Xi Fi Fai Fri Frai
1.4065 1.4307 1.4186 9 9 0.03 0.03
1.4307 1.4549 1.4428 35 44 0.11666667 0.14666667
1.4549 1.4792 1.4671 56 100 0.18666667 0.33333333
1.4792 1.5034 1.4913 70 170 0.23333333 0.56666667
1.5034 1.5276 1.5155 69 239 0.23 0.79666667
1.5276 1.5518 1.5397 35 274 0.11666667 0.91333333
1.5518 1.5761 1.5639 17 291 0.05666667 0.97
1.5761 1.6003 1.5882 6 297 0.02 0.99
1.6003 1.6245 1.6124 3 300 0.01 1
La última frecuencia relativa acumulada debe ser igual a uno.
5. Datos agrupados
El siguiente paso: Determinar la
media aritmética de los datos.
Para este paso agregaremos una
columna más en las que se
multipliquen la marca de clase por la
frecuencia absoluta: FiXi.
En este punto es donde se pierde algo
de exactitud en los cálculos.
6. Datos agrupados
Siguiente paso: Determinar la media
aritmética de los datos.
En este punto es donde se pierde algo
de exactitud en los cálculos.
Se multiplica la frecuencia absoluta
por la marca de clase es como si
sumáramos todos los datos pero
considerando que todos los valores
dentro de cada intervalo son iguales a
su marca de clase.
7. Datos agrupados
Esta pérdida de exactitud es
suficientemente pequeña como para
permitirnos usar los resultados con
confianza.
Si calculamos la media aritmética sin
agrupar datos, sumando uno por uno
y dividiendo entre 300 es: 1.497414.
Vamos a compararlo con el resultado
que obtengamos mediante el
procedimiento de datos agrupados.
9. Datos agrupados
Determinar la desviación media de los
datos.
La media aritmética nos indica el
punto medio de los datos, es una
medida de tendencia central.
Existen otras medidas de tendencia
central como la mediana y la moda.
10. Datos agrupados
Determinar la desviación media de los
datos.
Para estudiar un conjunto de datos no
es suficiente con conocer su
tendencia central
Se necesita determinar la dispersión
de los datos, es decir, que tanto se
alejan de la media aritmética.
Un valor que nos indica esta
dispersión es la desviación media de
los datos.
11. Datos agrupados
Esta desviación media es el promedio de las
distancias de cada dato respecto a la media
aunque en datos agrupados, ya vimos que
se usa en la marca de clase para
representar todos los datos dentro de un
intervalo
El procedimiento es: xi x fi
12. Datos agrupados
xi x fi Diferencia absoluta entre
cada marca de clase y la media por
la frecuencia absoluta
13. Datos agrupados
Para los dos primeros intervalos es:
|Xi-X|Fi =
|1.41861.49741407|*9=0.70922667
|Xi-X|Fi =
|1.44281.49741407|*35=1.91032593
En la tabla siguiente se incluye la
columna:
15. Datos agrupados
El siguiente paso: Determinar la
varianza y la desviación estándar de
los datos: s2 y s
El tema de media, varianza y
desviación estándar de una muestra y
una población.
El procedimiento está dado por:
2
xi x fi
16. Datos agrupados
Determinar la varianza y la desviación
estándar de los datos: s2 y s
2
xi x fi El cuadrado dela diferencia
de cada marca de clase y la media por
la frecuencia absoluta
17. Datos agrupados
Decimotercer paso: Determinar la varianza y la
desviación estándar de los datos: s2 y s
Para los primeros dos intervalos:
(Xi-X)^2*Fi= (1.4186- 1.49741407)^2*9
=0.055889163
(Xi-X)^2*Fi=(1.4428-
1.49741407)^2*35=0.104267004
Agregamos una columna más a la tabla.
19. Datos agrupados
En la siguiente diapositiva podemos
ver la tabla completa.
En posteriores presentaciones
abordaremos el tema de la
representación gráfica de los datos.
Además es necesario contextualizar la
información para interpretar las tablas
y gráficas obtenidas en estas cuatro
presentaciones.