1. ESTADÍSTICA
1-Definición de estadística...................................................................................................................2
2-Diferentes formas de recogida de información.................................................................................2
3-Recuento de datos. Frecuencias y porcentajes..................................................................................2
3.1 Datos sin agrupar....................................................................................................................3
3.2 Datos agrupados.....................................................................................................................3
4-Medidas de centralización.................................................................................................................4
4.1 Media......................................................................................................................................4
4.2 Media ponderada....................................................................................................................5
4.3 Moda.......................................................................................................................................5
4.4 Mediana..................................................................................................................................6
5-Medidas de posición..........................................................................................................................6
5.1 Cuartiles..................................................................................................................................6
5.2 Deciles....................................................................................................................................6
5.3 Percentiles..............................................................................................................................6
6-Medidas de dispersión.......................................................................................................................6
6.1 Rango o recorrido...................................................................................................................7
6.2 Desviación media...................................................................................................................7
6.3 Varianza..................................................................................................................................7
6.4 Desviación típica....................................................................................................................8
6.5 Intervalo típico.......................................................................................................................8
6.6 Coeficiente de variación.........................................................................................................8
7-Gráficos estadísticos.........................................................................................................................8
7.1 Diagrama de barras.................................................................................................................8
7.2 Diagrama de sectores..............................................................................................................9
7.3 Histograma.............................................................................................................................9
1
2. ESTADÍSTICA
1- Definición de estadística.
Estadística es la ciencia que se encarga de recoger y ordenar datos referidos a diversos
fenómenos para después analizarlos e interpretarlos.
Algunos términos utilizados frecuentemente son:
• Población: conjunto de todos los elementos que son objeto de estudio.
• Muestra: parte de la población que se estudia y que permite deducir características de la
población. Puede ser:
– Aleatoria: los elementos se escogen al azar (por ejemplo mediante algún sorteo).
– Proporcional: cada parte de la población está representada de acuerdo con su
importancia en ella.
• Individuo: es cada uno de los elementos que forman la muestra. Al número de
individuos se le llama tamaño de la muestra.
• Variable estadística: propiedad o característica que se quiere estudiar. Hay dos tipos:
– Cualitativas: los valores son cualidades, no números, por ejemplo, sexo,
nacionalidad, etc.
– Cuantitativas: los valores son números, por ejemplo, notas de clase, número de
calzado, altura, peso, etc. Hay dos tipos:
∗ Discreta: sólo pueden tomar valores aislados. Ejemplo: número de hermanos.
∗ Continua: puede tomar todos los valores de un intervalo. Ejemplo: altura.
2- Diferentes formas de recogida de información.
Los pasos para realizar un estudio estadístico son:
• Elaboración de la encuesta: las preguntas y posibles respuestas deben ser claras.
• Recogida de datos: se realiza la encuesta y se anotan los resultados. En lugar de una
encuesta, los datos pueden conseguirse de otras formas como:
– Búsqueda en anuarios, archivos, etc. Ejemplo: nº de nacimientos en una
población.
– Por observación. Ejemplo: nº de personas que cogen un medio de transporte
durante un intervalo de tiempo, a veces se les ve en el metro.
– Por experimentación. Ejemplo: lanzamiento de dados, monedas, etc. un número
determinado de veces.
• Organización, clasificación y recuento de las respuestas.
• Elaboración de tablas con los resultados.
• Elaboración de gráficos con los resultados.
• Conclusiones del estudio realizado.
3- Recuento de datos. Frecuencias y porcentajes.
Una vez se han recogido los datos correspondientes a una experiencia estadística, hay que
elaborar tablas donde aparezcan los datos ordenados. Esto es determinar los valores que toma la
variable que se está estudiando y contar las veces que aparece cada valor.
2
3. El número total de datos se representa por N y es el tamaño de la muestra. Un determinado dato
se representa por ix donde i indica el número de orden, así 1x hace referencia al dato 1º.
El recuento de datos nos da la siguiente información:
• Frecuencia absoluta de un dato: número de veces que se repite. Se representa por if ,
donde i indica el número de orden. La suma es el total del número de datos. Es decir:
Nfff n =+++ ...21
• Frecuencia relativa de un dato: cociente entre la frecuencia absoluta y el número total
de datos. Se representa por ih , donde i indica el número de orden y la suma es 1.
N
f
h i
i = .
• Frecuencia absoluta acumulada de un dato: suma de la frecuencia absoluta y de las de
los datos menores que él: ii Ffff =+++ ...21
• Porcentaje: si se multiplica la frecuencia relativa por 100 obtenemos el porcentaje, y la
suma total es 100.
3.1 Datos sin agrupar.
Ejemplo: nº de hermanos (contándote a ti).
Encuesta: 1, 1, 2, 3, 2, 3, 2, 1, 2, 2, 2, 4, 3, 2, 2, 1, 3, 4, 2, 2.
Recuento:
Nº Hermanos 1 2 3 4
Recuento 4 10 4 2
Tabla de frecuencias:
Datos (nº de
hermanos) ix
Frecuencia
absoluta if
Frecuencia
relativa ih
Frecuencia
acumulada iF
Porcentaje %
1 4 2,0
5
1
20
4
== 4 20%
2 10 5,0
2
1
20
10
== 4+10=14 50%
3 4 2,0
5
1
20
4
== 4+10+4=18 40%
4 2 1,0
10
1
20
2
== 4+10+4+2=20 10%
Suma = 20 Suma = 1 Suma = 100%
3.2 Datos agrupados.
Si la variable estadística es continua o los datos muy numerosos, conviene agruparlos en
intervalos o clases que tengan la misma amplitud. El valor que representa a todo el intervalo es
el punto medio de cada uno y se llama marca de clase.
Ejemplo: altura en cm. De un grupo de alumnos.
Encuesta: 149, 154, 153, 155, 154, 156, 152, 152, 160, 165, 170, 160, 158, 159, 150, 151,
152, 157, 158, 159.
Recuento:
Altura
14
9
15
0
15
1
15
2
15
3
15
4
15
5
15
6
15
7
15
8
15
9
16
0
16
1
16
2
16
3
16
4
16
5
16
6
16
7
16
8
16
9
170
Recuent
o
1 1 1 3 1 2 1 1 1 2 2 2 1 1
3
4. Tabla de frecuencias:
Datos (altura
en cm.)
Marca de
clase ix
Frecuencia
absoluta if
Frecuencia
relativa ih
Frecuencia
acumulada iF Porcentaje %
152148 <≤ x 150 3 15,0
20
3
= 3 15%
156152 <≤ x 154 7 35,0
20
7
= 3+7=10 35%
160156 <≤ x 158 6 3,0
20
6
= 3+7+6=16 30%
164160 <≤ x 162 2 1,0
20
2
= 3+7+6+2=18 10%
168164 <≤ x 166 1 05,0
20
1
= 3+7+6+2+1=19 5 %
172168 <≤ x 170 1 05,0
20
1
= 3+7+6+2+1+1=20 5 %
Suma = 20 Suma = 1 Suma = 100%
Cálculo de la marca:
Amplitud: 152-148 = 4; Marca de clase: 150
2
148152
148 =
−
+
4- Medidas de centralización.
Resumen la información.
4.1 Media.
Sólo para datos cuantitativos (edad, notas, etc.). Se representa por x y es el cociente de
dividir la suma total de los datos por su frecuencia, entre el número total de datos. Cada dato
hay que contarlo tantas veces como aparezca, esas veces que aparece, es la frecuencia.
∑
∑
=
=
⋅
=
⋅++⋅+⋅
= n
i
i
n
i
ii
nn
f
fx
N
fxfxfx
x
1
12211 ...
Ejemplo:
Datos (nº
de hermanos)
ix
Frecuencia
absoluta if ii fx ⋅
1 4 4
2 10 20
3 4 12
4 2 8
Suma = 20 Suma = 44
2,2
20
44
20
812204
20
244310241
==
+++
=
⋅+⋅+⋅+⋅
=x
4
5. 4.2 Media ponderada.
Sólo para datos cuantitativos (edad, notas, etc.). Se representa por px y es el cociente de
dividir la suma total de los datos por su peso, entre la suma de los pesos.
∑
∑
=
=
⋅
=
++
⋅++⋅+⋅
= n
i
i
n
i
ii
n
nn
p
p
px
pp
pxpxpx
x
1
1
1
2211
...
...
Ejemplo: en la asignatura de Matemáticas se valoran los siguientes aspectos con los
siguientes pesos:
– Contenidos con peso 5.
– Expresión con peso 3.
– Trabajo en casa, esfuerzo y comportamiento con peso 2.
Un alumno ha obtenido las siguientes notas, calcula la media final:
– Contenidos: 7
– Expresión con peso: 9
– Trabajo en casa, esfuerzo y comportamiento: 2
1,7
10
22445
235
213859
=
++
=
++
⋅+⋅+⋅
=px
Ejemplo: en la asignatura de Matemáticas se valoran los siguientes aspectos con los
siguientes pesos:
– Examen con peso 80%.
– Trabajo en casa, esfuerzo y comportamiento con peso 20%.
Un alumno ha obtenido las siguientes notas, calcula la media final:
– Examen: 4
– Trabajo en casa, esfuerzo y comportamiento: 10
2,522,320,01080,04
100
2010
100
804
100
2010804
=+=⋅+⋅=
⋅
+
⋅
=
⋅+⋅
=px
4.3 Moda.
Es el valor que más se repite, es decir el de mayor frecuencia, y se representa por Mo. Si
los datos son agrupados, la clase modal es la clase de mayor frecuencia.
Ejemplo:
Datos (nº de hermanos)
ix Frecuencia absoluta if
1 4
2 10
3 4
4 2
Suma = 20
Mo = 2 hermanos.
Ejemplo:
Datos (altura en cm.) Marca de clase ix Frecuencia absoluta if
5
6. 152148 <≤ x 150 3
156152 <≤ x 154 7
160156 <≤ x 158 6
164160 <≤ x 162 2
168164 <≤ x 166 1
172168 <≤ x 170 1
Clase modal = 156152 <≤ x cm de altura.
4.4 Mediana.
Sólo para datos cuantitativos (edad, notas, etc.). Se representa por Me y es el valor central
de los datos, ordenados de menor a mayor:
– Si el número de datos es par hacemos la media de los dos valores centrales.
– Si el número de datos es impar, la mediana es el valor central.
Ejemplo:
Datos: 7, 12, 3, 9, 15, 6, 8.
Ordenados: 3, 6, 7, 8, 9, 12, 15.
8=Me
Ejemplo:
Datos: 3,5; 8; 4; 7,5; 4,5; 6,5;
Ordenados: 3,5; 4; 4,5; 6,5; 7,5; 8.
5,5
2
11
2
5,65,4
==
+
=Me
Ejemplo: nº de hermanos (contándote a ti).
Encuesta: 1, 1, 2, 3, 2, 3, 2, 1, 2, 2, 2, 4, 3, 2, 2, 1, 3, 4, 2, 2.
Ordenados: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4.
2
2
22
=
+
=Me
5- Medidas de posición.
Indican la situación de los elementos de la distribución. Para calcular estas medidas es
necesario que los datos estén ordenados de menor a mayor.
5.1 Cuartiles.
Los cuartiles determinan los valores de las posiciones correspondientes al 25 %, 50% y 75
%. Se denotan 1C , 2C que coincide con la Me y 3C .
5.2 Deciles.
Los deciles determinan los valores de las posiciones correspondientes al 10 %, 20%, … y
90 %. Se denotan 1D , 2D , …, 9D .
5.3 Percentiles.
Los percenties determinan los valores de las posiciones correspondientes al 1 %, 2%, …,
99 %. Se denotan 1P , 2P , …, 99P .
6- Medidas de dispersión.
Dan una idea del alejamiento de los datos respecto de las medidas de centralización.
6
7. 6.1 Rango o recorrido.
Sólo para datos cuantitativos (edad, notas, etc.). Se representa por Rg y es la diferencia
entre el mayor y el menor valor de la variable.
Ejemplo:
Datos: 7, 12, 3, 9, 15, 6, 8.
Ordenados: 3, 6, 7, 8, 9, 12, 15.
12315 =−=Rg
Ejemplo:
Datos: 3,5; 8; 4; 7,5; 4,5; 6,5;
Ordenados: 3,5; 4; 4,5; 6,5; 7,5; 8.
5,45,38 =−=Rg
6.2 Desviación media.
Sólo para datos cuantitativos (edad, notas, etc.).
Desviación de cada dato con respecto a la media es la diferencia: xxi −
La desviación media es la media aritmética pero del valor absoluto de la desviación de
cada dato. Se representa por DM:
∑
∑
=
=
⋅−
=
⋅−++⋅−+⋅−
= n
i
i
n
i
ii
nn
f
fxx
N
fxxfxxfxx
DM
1
12211 ...
Ejemplo:
Datos (nº
de hermanos)
ix
Frecuencia
absoluta if ii fx ⋅ xxi − xxi − ii fxx ⋅−
1 4 4 2,12,21 −=− 1,2 8,442,1 =⋅
2 10 20 2,02,22 −=− 0,2 2102,0 =⋅
3 4 12 8,02,23 =− 0,8 2,348,0 =⋅
4 2 8 8,12,24 =− 1,8 6,328,1 =⋅
Suma = 20 Suma = 44 Suma = 13,6
68,0
20
6,13
20
22,2442,23102,2242,21
==
⋅−+⋅−+⋅−+⋅−
=DM
6.3 Varianza.
Sólo para datos cuantitativos (edad, notas, etc.).
Es el promedio de los cuadrados de las distancias de los datos a la media. Se representa por
Var o por s2
.
2
1
1
2
2
2
2
2
21
2
12
x
f
fx
x
N
fx...fxfx
Vars n
i
i
n
i
ii
nn
−
⋅
=−
⋅++⋅+⋅
==
∑
∑
=
=
Otra expresión muy utilizada es:
7
8. ( )
∑
∑
∑
∑
=
=
=
=
⋅−
=−
⋅
== n
i
i
n
i
ii
n
i
i
n
i
ii
f
fxx
x
f
fx
Vars
1
1
2
2
1
1
2
2
Demostración:
( ) ( ) ( )
=−
⋅
=−+
⋅
=
⋅⋅
−
⋅
+
⋅
=
=
⋅⋅
−
⋅
+
⋅
=
⋅⋅−⋅+⋅
=
=
⋅⋅−⋅+⋅
=
⋅⋅−+
=
⋅−
==
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑
∑ ∑∑
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
=
= ==
=
=
=
=
=
=
2
1
1
2
22
1
1
2
1
1
1
1
2
1
1
2
1
1
1
1
2
1
1
2
1
1 11
22
1
1
22
1
1
22
1
1
2
2
2
2
22
22
x
f
fx
xx
f
fx
f
fxx
f
fx
f
fx
f
xfx
f
fx
f
fx
f
xfxfxfx
f
xfxfxfx
f
fxxxx
f
fxx
Vars
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
n
i
ii
n
i
iii
n
i
i
n
i
iiiii
n
i
i
n
i
iii
n
i
i
n
i
ii
6.4 Desviación típica.
Sólo para datos cuantitativos (edad, notas, etc.).
Es la raíz cuadrada de la varianza. Se representa por σ o s.
( )
∑
∑
∑
∑
=
=
=
=
⋅−
=−
⋅
=−
⋅++⋅+⋅
=== n
i
i
n
i
ii
n
i
i
n
i
ii
nn
f
fxx
x
f
fx
x
N
fxfxfx
Vars
1
1
2
2
1
1
2
2
2
2
2
21
2
1 ...
σ
6.5 Intervalo típico.
Sólo para datos cuantitativos (edad, notas, etc.).
[ ]σσ +− xx ,
6.6 Coeficiente de variación.
x
s
x
CV ==
σ
que en forma de porcentaje es 100⋅=
x
CV
σ
Dados dos conjuntos de datos aquel que tenga un CV mayor es el más disperso o
heterogéneo. Un CV mayor del 30 % indica que la media es poco representativa como medida
de promedio, debiéndose optar por la mediana o la moda.
7- Gráficos estadísticos.
7.1 Diagrama de barras.
Es una representación en ejes coordenados. En el eje horizontal representamos los valores
de la variable estadística (por ejemplo: mujer, hombre, edad, número de hermanos). En el eje
8
9. vertical representamos las frecuencias absolutas. Para cada valor de la variable trazamos una
barra vertical cuya altura coincida con su frecuencia.
Ejemplo:
Datos (nº
de hermanos)
ix
Frecuencia
absoluta if
1 4
2 10
3 4
4 2 0
2
4
6
8
10
12
1 2 3 4
Nº de hermanos
Frecuencia
7.2 Diagrama de sectores.
Es una representación de la información en un círculo dividido en tantos sectores como
valores y proporcionales a la frecuencia. El ángulo de un sector circular se obtiene con una
simple regla de tres:
º360º360º
º360ºº360º
⋅=⋅=⇒=⇒
→
→
i
iii
h
N
f
x
N
x
f
x
Nf
Datos (nº de
hermanos)
ix
Frecuencia
absoluta if
Grados
1 4 º72º360
20
4
=⋅
2 10 º180º360
20
10
=⋅
3 4 º72º360
20
4
=⋅
4 2 º36º360
20
2
=⋅
7.3 Histograma.
Es una representación para datos agrupados. En el eje horizontal se dibujan los extremos
de las clases. Las bases de los rectángulos se corresponden con la amplitud de los intervalos. Si
la amplitud de todos los intervalos es la misma, las alturas coinciden con las frecuencias
absolutas.
El polígono de frecuencias se dibuja uniendo los puntos medios de las bases superiores de
los rectángulos (frecuencias correspondientes a cada valor). El polígono de frecuencias
acumuladas se dibuja de la misma manera pero utilizando la frecuencia acumulada de cada
valor.
Ejemplo:
Datos (altura
en cm.)
Marca de
clase ix
Frecuencia
absoluta if
152148 <≤ x 150 3
156152 <≤ x 154 7
160156 <≤ x 158 6
9
10. 164160 <≤ x 162 2
168164 <≤ x 166 1
172168 <≤ x 170 1
Suma = 20
10