1. Alumno: Juan Luis Torres Grijalva
MEDIDAS DE
DISPERSIÓN O DE
VARIABILIDAD
2. Medidas de Dispersión
Estas medidas nos permiten analizar
la DISPERSIÓN o VARIABILIDAD
de las distribuciones que queremos
analizar
¿Qué tan separados están nuestros datos?
¿Qué tan "desparramados" están los datos?
3. Algunas medidas de variabilidad son:
Rango
Rango intercuartilico
Varianza
Desviación estándar
Coeficiente de variación
4. RANGO
Una alternativa como medida de dispersión es el RANGO
Corresponde a la diferencia entre el mayor y el menor de
nuestras observaciones
Claramente influenciado por valores extremos
Estimador “grueso”
Por esta razón no es una buena medida de
dispersión.
RECORRIDO INTERCUARTILICO O AMPLITUD INTERCUARTILICA
Rq = Q3 - Q1
5. DESVIACIÓN MEDIA
Es una medida de variabilidad que se obtiene promediando
los valores absolutos de las desviaciones de los datos con
respecto al promedio.
Ejemplo: Halle la Desviación Media de los siguientes datos:
2, 3, 6, 8, 11
2
-4
3
-3
6
0
X = 6
8
11
2
5
7. Varianza
Es una medida de variabilidad cuyo valor nos indicará si
los datos están concentrados o dispersos con respecto al
promedio y se define como el promedio de los cuadrados
de las desviaciones de cada valor con respecto a la media.
Ejemplo: Halle la Varianza de los siguientes datos: 2, 3, 6,
8, 11
2
-42
3
-32
6
02
X = 6
8
11
22
52
8. VARIANZA POBLACIONAL
Cuantifica la cantidad de variabilidad o dispersión en
relación a la media (o promedio) de las observaciones.
PARA DATOS NO TABULADOS
N
∑( x − µ )
i
σ2 =
N
2
i =1
N
σ2 =
∑x
2
i
i =1
N
− µ2
VARIANZA MUESTRAL
n
S =
2
( xi − X ) 2
∑
i =1
n
n
S2 =
∑x
i =1
n
i
2
−X2
9. VARIANZA POBLACIONAL para Datos
Agrupados en tabla de Frecuencia
k
σ2 =
∑( x
i
i=
1
− µ) ni
k
2
N
σ2 =
∑( x )
2
i
i=
1
ni
N
− µ2
VARIANZA MUESTRAL para Datos
Agrupados en tabla de Frecuencia
k
S2 =
∑( x
i=
1
i
− X ) ni
k
2
n
S2 =
∑( x )
i=
1
i
n
2
ni
−X 2
10. DESVIACIÓN ESTÁNDAR
La desviación estándar se define como la raíz
cuadrada de la varianza
σ =+ σ
2
En la práctica, la desviación estándar se utiliza con más
frecuencia que la varianza
Una de las razones es que se expresa en las mismas
unidades de medida de la variable.
11. COEFICIENTE DE VARIACIÓN
Se define como el cuociente entre LA DESVIACIÓN
ESTÁNDAR y LA MEDIA:
S
CV =
X
Como el coeficiente de variación no tiene unidad de
medida , permite comparar variabilidad entre
distribuciones.
12. APLICACIONES DEL COEFICIENTE DE
VARIACIÓN
1.- Comparar variabilidad de dos distribuciones de una
misma variable con unidades de medida distintas.
Ejemplo: comparar la estatura de los estadounidenses ,
en pulgadas con la estatura de los chilenos en cm.
13. 2.- Comparar variabilidad de dos distribuciones de
variables distintas.
Ejemplo: comparar la estatura en cm y el peso en kg.
de los 20 niños seleccionados de gimnasia artística:
Estatura (X)
X =128, 5
S X =8, 4
Peso (Y)
Y =36,4
S Y =4,9
Comparar la variabilidad de estas dos
distribuciones.
14. 3.- Comparar la variabilidad de distribuciones
con promedios distintos.
Peso de Corderos: s=40 k ; X = 98 k
Peso de Toros: s=50 k; X = 400 k
Peso de Elefantes: s=120 k; X = 1500 k
¿Qué grupo presenta la menor dispersión?
15. MEDIDAS DE DISPERSIÓN
Partimos de una muestra de tamaño
n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8
• RANGO O RECORRIDO: R = Max-Min =
8-2=6
• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 = 7 -3 = 4
• VARIANZA
1 n
1 7
2
2
S 2 = ∑ ( x i − X ) = ∑ ( x j − X ) n j = 3.87
n i =1
15 j=1
16. • CUASIVARIANZA:
1 n
1 7
2
( x i − x ) = ∑( x j − x ) 2 n j =
S2 =
∑
n- 1 i =1
14 j=1
• DESVIACIÓN TÍPICA:
S = s2
= 1.97
• CUASIDESVIACIÓN TÍPICA:
S= s
2
= 2.04
4.14
17. • DESVIACIÓN MEDIA:
1 n
1 7
Dm = ∑ x i − X = ∑ x j − X ⋅ n j = 1.73
n i =1
15 j=1
• COEFICIENTE DE VARIACIÓN DE PEARSON:
S
CV =
X
= 0.394
• COEFICIENTE DE VARIACIÓN MEDIA:
Dm
CVm =
M e = 0.347
18. Distribución de frecuencia de la altura (cm) de los estudiantes de
la generación 2008
157 – 162
162 – 167
167 – 172
172 – 177
Frecuencia
Absoluta
7
8
9
30
177 – 182
182 – 187
TOTAL
25
14
93
50
Frecuencia relativa
Altura
(cm)
60
40
30
20
10
0
149.5
154.5
159.5
164.5
169.5
174.5
179.5
184.5
189.5
Altura (cm)
Calcule la VARIANZA
POBLACIONAL y la
DESVIACIÓN
ESTÁNDAR
19. MEDIDAS DE ASIMETRÍA
Mide el grado de deformación horizontal de la distribución
de Frecuencias y se define:
3( X − Me )
Sk =
S
Sk
( X − Mo )
=
S
Q1 + Q3 − 2Me
Sk =
Q3 − Q1
I. Sk es la mas usada.
II. Sk se usa cuando la distribución es unimodal.
III. Sk, llamada también media asimétrica, se usa cuando existen intervalos
extremos abiertos ilimitados y no es posible calcular el promedio y
consecuentemente la varianza.
Si es una Distribución Asimétrica Sk = o o tiende a cero.
Si es una Distribución Asimétrica Positiva o sesgada a la derecha S k > 0
Si es una Distribución Asimétrica Negativa o sesgda a la izquierda S k < 0
20. Propiedades del Coeficiente de
Asimetría (Continuación)
Valor del Coef. Asimetría
Calificación
(-0.05≤Sk<0) ó (0<Sk≤0.05)
Casi simétrica
(-0.3≤Sk<-0.05) ó (0.05<Sk≤0.3
Ligeramente asimétrica
(-0.6≤Sk< -0.3) ó (0.3 < Sk≤0.6)
Moderadamente
(Sk<-0.6) ó (Sk>0.6)
Muy asimétrica
21. Renta familiar
A
B
Longitud de piezas
Gasto en transporte
Longitud de piezas
Tiempo entre accidentes
Tamaño de partículas
22. MEDIDAS DE KURTOSIS
Mide el grado de deformación vertical de la distribución de
Frecuencias y se define:
Q3 − Q1
K=
2( P90 − P )
10
Si 0,2630 < K < 0,5 es una Distribución Leptokúrtica ( picuda o
puntiaguda).
Si K< 0,2630 es una Distribución Mesokúrtica (moderada o normal).
Si 0 < K < 0,2630 es una Distribución Platikúrtica (achatada o plana).
1.No tiene unidad de medida.
2.Se aplica a distribuciones unimodales con un valor del
coeficiente de asimetría entre –0.3 y 0.3.
3.Su valor debe encontrarse en el intervalo 0 á 0.5.
23. DIAGRAMA DE CAJA (BOX-PLOT)
Se construye del siguiente modo:
•Con los datos ordenados se obtienen los tres cuartiles
•Se dibuja un rectángulo cuyos extremos son Q1 y Q3 y se indica la posición de
la mediana mediante una línea.
•Se calculan los límites de admisión ( los valores que queden fuera se
consideran atípicos)
LI = Q 1 − 1 '5 ( Q
LS = Q
3
− Q1)
3
+ 1 '5 ( Q
3
− Q1)
•Se dibuja una línea desde cada extremo del rectángulo hasta el valor más alejado
no atípico.
•Se marcan todos los datos considerados como atípicos.
24. DIAGRAMA DE CAJA (BOXPLOT)
Media
Dato menor no atípico
Mediana
Dato mayor
no atípico
Box-and-Whisker Plot
Dato atípico
150
160
170
180
190
200
Altura
Dato atípico
Q1
Q3