2. Un brevísimo resumen sobre
estadísticos
Centralización
Indican valores con respecto a los que los datos parecen
agruparse.
• Media, mediana y moda
Posición
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
• Cuartiles, quintiles, deciles y percentiles.
Dispersión
Indican la mayor o menor concentración de los datos con respecto
a las medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza, …
3. Se define como la suma de todos los valores numéricos (que adopta la variable
estudiada) divididos por el número total de valores observados
Media de 2,2,3,7 es (2+2+3+7)/4=3,5
-Conveniente cuando los datos se concentran simétricamente con respecto a
ese valor.
-Muy sensible a valores extremos. En estos casos es más conveniente calcular
la mediana
-En distribuciones a partir de intervalos de clase no se puede estimar si existen
intervalos abiertos
a)Media aritrmética:
Datos sin agrupar Datos agrupados
X= ∑x X= ∑ fx
N N
b)Media Ponderada:
Xw= ∑ wx
∑ w
MEDIA
5. Mediana: de un conjunto de valores ordenados en magnitud es el valor central
o la media de los dos valores centrales. Es un valor que divide a las
observaciones en dos grupos con el mismo número de individuos .
Mediana de nº observaciones impar: N/2 + 0,5:
Ejemplo: 1,2,4,5,6,6,8
nº observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la
posición 4ª: 1,2,4,5,6,6,8 ;luego la mediana es 5
Mediana de nº observaciones par es el valor medio de los valores que
ocupan las posiciones N/2 y N/2 +1
Ejemplo: 1,2,4,5,6,6,8,9
Nº observaciones par, 8; hay que buscar los valores que ocupan las
posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que
ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de
esos dos valores
1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Altura mediana
6. - No es sensible a valores extremos.
-Es conveniente cuando los datos son asimétricos.
EJEMPLO
-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7
MEDIANA
8. La moda: se define como el valor que tiene una mayor frecuencia en un
conjunto de datos (es decir, aquel que más se repite).
Para datos agrupados en intervalos
Mo= Li + c. D1
D1+D2
D1: fi-fi-1
D2: fi- fi+1
Peso M. Clase Fr. Fr. ac.
40 < 50 45 5 5
50 < 60 55 10 15
60 < 70 65 21 36
70 < 80 75 11 47
80 < 90 85 5 52
90 < 100 95 3 55
100 < 110 115 3 58
58
Intervalo modal
24,65
1011
11
1060Mo
9. Estadísticos de posición
Cuartiles: Dividen a la muestra en 4 grupos homogéneos.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75
Quintiles: 4 valores que dividen a una muestra en 5 grupos
homogéneos
Quintil 2= Decil 2= Percentil 20
Deciles: 9 valores que dividen a una muestra en 10 grupos
homogéneos
Decil 5= mediana= cuartil segundo= percentil 50
Percentil de orden k = cuantil de orden k/100
Percentil 50= mediana= cuartil segundo= decil quinto,
El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
11. Medidas de dispersión
Las medidas de dispersión indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersión/ concentración de
los datos en torno a las medidas de tendencia central
Existen dos tipos de medidas de dispersión: ABSOLUTAS Y RELATIVAS
ABSOLUTAS
Mediana Rango
Rango intercuartílico
Rango entre percentiles
Media Desviación media
Varianza
Desviación típica
RELATIVAS
Mediana Coeficiente variación intercuartílica
Media Coeficiente variación de Pearson
12. Amplitud o Rango:
Diferencia entre observaciones extremas.
1, 2, 3,4,4,8. El rango es 8-1=7
Es muy sensible a los valores extremos.
Rango entre percentiles („interquartile range‟):
Es la distancia entre percentil 90 y percentil 10.
• Rango entre percentiles = P90 – P10
Parecida al rango, pero eliminando las
observaciones más extremas inferiores y superiores.
No es tan sensible a valores extremos
Rango intercuartílico:
Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = Q3 - Q1
Parecida al rango, pero eliminando las
observaciones más extremas inferiores y superiores.
Es el menos sensible a valores extremos.
150 160 170 180 190
0.000.010.020.030.040.05
150 160 170 180 190
25% 25% 25% 25%
Mín. P25 P50 P75 Máx.
Rango intercuartílico
Rango
Dispersión absoluta: mediana
13. Dispersión absoluta: media
Varianza S2 :
•Mide el promedio de las desviaciones (al cuadrado) de las observaciones con
respecto a la media.
•Es sensible a valores extremos (alejados de la media).
•Sus unidades son el cuadrado de las de la variable. De interpretación difícil para
un principiante.
Desviación media:
•Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto
a la media.
•Es la menos sensible a valores extremos (alejados de la media).
•Viene expresada en las mismas unidades de la variable.
•Desviación típica
Es la raíz cuadrada de la varianza
•Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores
extremos (alejados de la media).
14. Dispersión relativa: mediana
100*
13
me
QQ
Vq
Es la razón entre el rango intercuartílico y la mediana.
Mide el rango intercuartílico en forma de“qué tamaño tiene con respecto a
la mediana”
Es frecuente mostrarla en porcentajes
Si la mediana es 80 y el rango intercuartílico es de 5 entonces
Vq=5/80*100=6,25%
Es una cantidad adimensional (independiente de las unidades de medida).
Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos
presentan más dispersión en edad que en peso.