1. MEDIDAS DE RESUMEN
MEDIDAS DE TENDENCIA CENTRAL: Expresan el valor al cual tienden los datos .
- Media Aritmética ( X A )
- Media Armónica ( X H )
- Media Geométrica ( X G )
MEDIDAS DE POSICION: Expresan un lugar en la distribución empírica de una variable.
- Mediana (Me)
- Moda (Mo)
- Cuartil (Qr)
- Decil (Dr)
- Percentil (Pr)
MEDIDAS DE DISPERSION: expresan el grado de alejamiento de los datos respecto a una medida de tendencia
central.
- Rango (R)
- Rango intercuartil
- Varianza ( X )
2
- Desviación estándar ( X )
- Coeficiente de Variación (Cv)
3. Medidas de Tendencia Central
La mayoría de los levantamientos de encuestas
mantienen una tendencia bien definida a agruparse o
aglomerarse alrededor de cierto punto central.
Siempre se puede obtener un valor típico que representa
o describe a todos los demás datos de la muestra.
2-2008 3
4. Media Aritmética
Es la medida de tendencia central más
utilizada, también se le conoce con el
nombre de Promedio.
Para calcular la media aritmética, se
suman todos los datos de la muestra y el
resultado se divide entre el total de datos.
2-2008
4
7. Media Aritmética para datos no
agrupados
b) DATOS NO AGRUPADOS EN TABLAS
El símbolo que representa a la media aritmética
es una letra X con una barra sobre ella.
n
x i
X i 1
n
La letra x significa uno de los datos de la muestra y la i es el
conteo de los datos específicos
2-2008
7
8. Media Aritmética
La fórmula en su esquema de desarrollo
se presenta de la siguiente manera:
x1 x2 x3 x4 ... xn
X
n
2-2008
8
9. Ejemplo
Los sueldos semanales de 5 trabajadores de
una obra de construcción civil son los
siguientes : 500, 550, 600, 700 y 800 nuevos
soles . Por lo tanto el sueldo promedio de los
5 trabajadores es :
10. Desarrollo
DATOS:
500, 550, 600 , 700, 800
5
x i
XA i 1
5
500 550 600 700 800
XA
5
3150
XA El sueldo promedio semanal que recibe
5 cada trabajador de construcción civil
es aproximadamente 630 nuevos soles.
X A 630
10
11. Media Geométrica
Es la raíz enésima del producto de los n valores de una
serie. Esto es, dado los n valores X 1 , , X n
X G n X1 ,, X n
La media geométrica o promedio geométrico se usa
cuando hay que promediar razones, proporciones o
tasas de crecimiento.
12. Ejemplo de Media geométrica
La producción anual de baterías de una fabrica, ha tenido el
siguiente crecimiento:
1990 a 1991 la producción aumento de 800 a 1000 baterías. (25%)
1991 a 1992 la producción aumento de 1000 a 15000 baterias (50%)
1992 a 1993 la producción aumento de 1500 a 3300 (120%)
Cada año fue el aumento fue de 25%, 50% y 120%,
respectivamente. ¿Cuál fue el aumento promedio anual de la
producción?
R: 53,1%
13. Media Armónica
La media armónica se designa por X H
n
XH n
1
i 1 xi
La media armonica de un conjunto de valores X1 ,, X n
Es el inverso de la media aritmetica de los inversos de
los valores considerados.
14. Ejemplo de media armónica.
Un equipo de trabajadores textiles tienen que
producir 180 metros de casimir; de los cuales
elaboran los primeros 90 metros con una
productividad de 15 metros diarios , y los 90 metros
restantes lo hacen a razon de 20 metros por día
¿Cuál es la productividad diaria durante todo el
trabajo ?
R: 17,14 metros diarios.
16. Ejemplo
En una muestra de presupuestos familiares, se ha obtenido la
siguiente información respecto al número de hijos de 21 familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2 3
La variable es el numero de Hijos por familias, es decir
Xi= Nº de hijos/ familia, donde los 21 valores de la variable
serian X1, X2 ... X21
21
Xi 44
i 1
21
Xi 44
X i 1
2.095
21 21
17. b) DATOS AGRUPADOS EN TABLAS
Los datos se pueden presentar o agrupar en tablas sin
intervalos y en tablas con intervalos , en ambos casos se
usa la Media Aritmética Pondera.
Tablas sin Intervalo (Ejemplo)
w
y f i i Nº hijos
Nº de
Xi*fi
Y i 1 familias
Xi
fi
n 0 1 0
w
yi fi 44
1
2
5
7
5
14
Y i 1
2.095
n 21 3 7 21
Redondeando por se variable discreta, se 4 1 4
tiene que el número de hijos promedio por TOTAL 21 44
familia es = 2
18. TABLAS CON INTERVALOS
El calculo de la media es a partir del uso de la “marca de
clase” Yi para representar el valor de cada elemento
incluido en su respectivo intervalo.
Marca Nº de
Nº de Nº de
de trabajadores
Trabajadores empresas
clase ponderados w
(Y i-1 - Y i] yi fi yifi y f i i
23 26 24,5 5 122,5 Y i 1
26 29 27,5 40 1100 n
2685.00
29 32 30,5 27 823,5
29.8
32 35 33,5 11 368,5 90
35 38 36,5 3 109,5 El número promedio de
trabajadores por empresa es
38 41 39,5 3 118,5
30
41 44 42,5 1 42,5
total 90 2685
19. Observación:
Para un mismo conjunto de datos se obtiene
valores ligeramente diferentes para su media; hay
que tener presente que toda agrupación de
intervalos siempre produce sesgos, y ésta es una
característica del trabajo estadístico. Los
estadígrafos no son valores exactos, pero si son
representativos de una realidad.
20. MEDIANA (Me)
Para un conjunto de datos ORDENADOS de mayor a
menor, la mitad de los valores serán menores o iguales a
la MEDIANA mientras que la mitad restante será
mayor o igual a la MEDIANA
50% 50%
X mín X máx
Me
La mediana divide una distribución de
frecuencia en 2 mitades
21. Para datos no agrupados
El número de horas de trabajo acumulado en
tres semanas de 9 trabajadores es: 154-125-
120-150-150-40-136-120-150
40-120-120-125-136-150-150-150-154
El número de horas de trabajo acumulado en
tres semanas de 10 ptrabajadores es: 154-150-
125-120-150-150-40-136-120-150
40-120-120-125-136-150-150-150-150-154
xn xn1
Me 143
2
22. PARA DATOS AGRUPADOS SIN INTERVAOS
Es aquel valor de la variable cuya frecuencia absoluta
acumulada es inmediatamente mayor a la mitad de las
observaciones
El número de hijos en 80
familias se distribuye de la
Nº de hijos fi Fi
siguiente forma:
0 5 5
1 8
2 10
N 80
3 12 40
2 2
4 15
5 13
6 10
7 7 Me = 4 hijos
80
23. PARA DATOS AGRUPADOS EN INTERVALOS
Para calcular la mediana se usa la siguiente fórmula:
n
2 Fj 1
Me Li c *
Fj Fj 1
Donde:
Li = Límite inferior del intervalo que contiene a la mediana
Fj-1 = Frecuencia absoluta acumulada inferior a n/2
Fj = Frecuencia absoluta acumulada superior a n/2
n = número de observaciones
c = Amplitud del intervalo que contiene a la mediana
24. Ejemplo : Una empresa de transportes recibió en
un día 58 paquetes , cuyos pesos en kg. son:
n
2 Fj 1
Me Li C
Fj Fj 1
PESO DE NUMERO Fi
LOS DE
PAQUETES PAQUETES 58
fi 22
Me 39,5 5 2 41.25
42 22
29.5 – 34.5 8 8
34.5 – 39.5 14 22
39.5 – 44.5 20 42 El 50% de los paquetes tienen
44.5 – 49.5 12 54 pesos menores e iguales a 41,25
49.5 – 54.5 4 58
kg. y el 50% de los paquetes
restantes pesan más de 41,25kg.
TOTAL 58
25. MODA
Se refiere al valor de la variable que más se
repite en una distribución de frecuencia, o el
valor que está representado por el mayor
número de observaciones
En un gráfico de barra o histograma la moda
corresponde al valor en que la distribución
alcanza el máximo
26. MODA PARA DATOS AGRUPADOS
Nº de hijos fi
0 5
1 8
2 10 La Moda son 4 hijos
3 12
4 15
5 13
6 10
7 7
80
27. Si la distribución es un histograma existe la
Intervalo (CLASE) MODAL
10
Frecuencia
5
0
150 155 160 165 170 175 180 185 190
Altura (cm)
la MODA es la marca de clase del
intervalo que contiene la mayor frecuencia
28. Dependiendo del número de modas que tenga la
distribución de frecuencias se hablará de una
distribución ...
Un Máximo = Unimodal
Dos Máximos = Bimodal
Más de 2 máximos = Multimodal
29. b) Moda para datos agrupados en tablas:
Para calcular la moda se usa la siguiente fórmula:
d1
Mo Li c
d1 d 2 i
Donde:
Li = Límite inferior del intervalo que contiene a la moda.
fj = Mayor frecuencia absoluta simple
fi+1 = Frecuencia absoluta inmediata superior
d1= fj – fi-1
d2= fj – fi+1
c = Amplitud del intervalo que contiene a la mediana
30. A
B
Agrupando en 6 clases Agrupando en 5 clases
Intervalos Frecuencias Intervalos Frecuencias
13.5 - 16.5 2 12.5 - 16.5 2
16.5 - 19.5 9 16.5 - 20.5 13
19.5 - 22.5 13 20.5 - 24.5 16
22.5 - 25.5 9 24.5 - 28.5 11
25.5 - 28.5 9 28.5 - 32.5 1
28.5 - 31.5 1 TOTAL 43
TOTAL 43
Clase Modal = 19.5-22.5 Clase Modal = 20.5-24.5
Moda = ? Moda = ?
En el caso de frecuencias agrupadas, la
MODA varía según la forma de agrupar
31. Cuartil : Divide al conjunto de observaciones en
cuatro partes iguales
Para calcular el Cuartil-r se usa la siguiente fórmula:
nr
Fj 1
Qr Li c * 4
Fj Fj 1
Donde:
Li = Límite inferior del intervalo que contiene al cuartil
Fj-1 = Frecuencia absoluta acumulada inferior a nr/4
Fj = Frecuencia absoluta acumulada superior a nr/4
n = número de observaciones
c = Amplitud del intervalo que contiene al cuartil
32. Decil : Divide al conjunto de observaciones en diez
partes iguales
Para calcular el Decil-r se usa la siguiente fórmula:
nr
Fj 1
Dr Li c * 10
Fj Fj 1
Donde:
Li = Límite inferior del intervalo que contiene al decil-r
Fj-1 = Frecuencia absoluta acumulada inferior a nr/10
Fj = Frecuencia absoluta acumulada superior a nr/10
n = número de observaciones
c = Amplitud del intervalo que contiene al decil-ril
33. Percentil : Divide al conjunto de observaciones en
cien partes iguales
Para calcular el Percentil-r se usa la siguiente
fórmula:
nr
Fj 1
Pr Li c * 100
Fj Fj 1
Donde:
Li = Límite inferior del intervalo que contiene al percentil-r
Fj-1 = Frecuencia absoluta acumulada inferior a nr/100
Fj = Frecuencia absoluta acumulada superior a nr/100
n = número de observaciones
c = Amplitud del intervalo que contiene al percentil-r
35. MEDIDAS DE POSICIÓN
LOS CUANTILES
Son valores que dividen a la distribución en partes
iguales, es decir, en intervalos que comprenden el
mismo número de observaciones. Los que más se
utilizan son: los CUARTILES, DECILES Y PERCENTILES.
Los CUARTILES son 3 valores que dividen a la distribución en 4
partes iguales, cada una de las cuales contienen el 25% de las
observaciones.
Los DECILES (PERCENTILES) son 9 (99) valores que dividen a la
distribución en 10 (100) partes iguales, cada una de las cuales
contiene el 10% (1%) de las observaciones.
37. Ejemplo:
Se tiene los siguientes costos de producción de cierto
producto: 50, 60, 80, 120
Desarrollo:
El rango de los costos es igual a 120 – 50 = 70.
El 100% de los costos se encuentran distribuidos a una
distancia de 70 nuevos soles
38. Varianza
Varianza para datos no agrupados
w
( yi y ) 2
S2 i 1
n 1
Varianza para datos agrupados
w
(y i y ) fi
2
S2 i 1
n 1
39. Desviación estándar
Desviación estándar para datos no agrupados
w
( yi y ) 2
S i 1
n 1
Desviación estándar para datos agrupados
w
(y i y ) fi
2
S i 1
n 1
40. Desviación Estándar para
datos no agrupados
1 w
S
n 1 i 1
( yi y ) 2
1 n 2
yi n y
2
S
n 1 i 1
Representa la dispersión promedio de cada uno de los datos con respecto a
la media aritmética, así:
podemos tener dos muestras que tienen la misma media, pero que tienen
diferente Desviación Estándar
41. Desviación Estándar
para datos agrupados
1 w
S
n 1 i 1
( yi y ) 2 f i
1 n 2
yi fi n y
2
S
n 1 i 1
Representa la dispersión promedio de cada uno de los datos con respecto a
la media aritmética, así:
podemos tener dos muestras que tienen la misma media, pero que tienen
diferente Desviación Estándar
42. El Coeficiente de Variación
S
CV 100%
x
Nos permite la comparación entre distintas variables y poblaciones.
Mide el grado de homogeneidad o heterogeneidad en una o más poblaciones.
Su principal característica es estar desprovisto de unidades.
El valor se puede expresar en términos porcentuales
43. Ejemplo:
Suponga que se desea determinar la varianza,
desviación estándar y coeficiente de variabilidad de los
ingresos mensuales por venta de 6tiendas elegidas
aleatoriamente:
200, 500, 800, 900, 1200, 400
Determine :
Varianza =
Desviación estándar =
Promedio =
Coeficiente de variabilidad=
44. Ejemplo:
Suponga que se desea determinar la varianza,
desviación estándar y coeficiente de variabilidad de los
ingresos mensuales por venta de 5 tiendas elegidas
aleatoriamente:
200, 500, 800, 900, 1200, 400
Verifique las medidas:
Varianza = 147000
Desviación estándar= 383,4057903
Promedio =720
Coeficiente de variabilidad= 53,2508042
45. El Coeficiente de Variación
S
CV 100%
x
Nos permite la comparación entre distintas variables y poblaciones.
Mide el grado de homogeneidad o heterogeneidad en una o más poblaciones.
Su principal característica es estar desprovisto de unidades.
El valor se puede expresar en términos porcentuales
47. Asimetría o Sesgo
Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su mitad
derecha.
En las distribuciones simétricas
media y mediana coinciden. Si sólo
hay una moda también coincide
La asimetría es positiva o negativa
en función de a qué lado se
encuentra la cola de la distribución.
La media tiende a desplazarse hacia
las valores extremos (colas).
Las discrepancias entre las medidas
de centralización son indicación de
asimetría.
48. Asimetría : Mide la deformación horizontal
respecto a su promedio o valor central
Si el As>o : tiene asimetría positiva. La distribución
extiende la cola hacia los valores grandes de la variable.
Si el As<o : tiene asimetría negativa. La distribución
extiende la cola hacia los valores pequeños de la
variable.
Si el As o : se trata de una distribución simétrica.
Coeficientes de karl Pearson
49. Coeficientes de Asimetria
Coeficientes de karl Coeficiente de Arthur
Pearson Boeley
y Mo
As Q3 2Q2 Q1
s
As
As
3 y Me Q3 Q1
s
50. Apuntamiento o Kurtosis 160
La Kurtosis nos indica el grado de apuntamiento 140
(aplastamiento) de una distribución con respecto a la 120
distribución normal o gaussiana. Es adimensional.
100
Platicúrtica: curtosis < 0 80
Frecuencia
60
Mesocúrtica: curtosis = 0
40
45 48 51 54 57 60 63 66 69 72 75 78 81 84
Leptocúrtica: curtosis > 0 Platicúrtica
400
300
Los gráficos que veis poseen la 300
200
misma media y desviación típica,
pero con diferente grado de 200
100
apuntamiento.
Frecuencia
En el curso serán de especial 100
Frecuencia
0
interés las mesocúrticas y 27
32
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
99
simétricas (parecidas a la normal). 0
Mesocúrtica
3 27 37 47 57 67 77 87 97 108
16 32 42 52 62 72 82 92 102 138
Leptocúrtica
51. Kurtosis: mide el grado de elevación o
apuntamiento de una distribución
Leptokurtica, Si k>0,263, es decir, es más apuntada que
la normal
Mesocrática, Si k= 0,263, es decir es tan apuntada como
la normal
Platikurtica, Si k< 0,263, es decir, es menos apuntada que
la normal
Q3 Q1
K
2 P90 P10