2. ESTADÍSTICA DESCRIPTIVA
• Los orígenes de la estadística, aunque no se sabe con
exactitud cuándo se comenzó a utilizar, pueden estar
ligados al antiguo Egipto como a los censos chinos que
se realizaron hace unos 4.000 años, aproximadamente.
• Sin duda, fueron los romanos, maestros de la
romanos
organización política, quienes mejor supieron ocupar la
estadística. Cada cinco años realizaban un censo de la
población, cuyos datos de nacimientos, defunciones y
matrimonios eran esenciales para estudiar los avances
del imperio; sin olvidar los recuentos de ganancias y las
riquezas que dejaban las tierras.
3. ESTADÍSTICA DESCRIPTIVA
• Para poder comprender mejor este tipo de
estudio es importante que conozcas los
siguientes términos básicos:
Población: Es un conjunto de
personas, eventos o cosas de
las cuales se desea hacer un
estudio, y tienen una
característica en común.
4. ESTADÍSTICA DESCRIPTIVA
Muestra: Es un subconjunto cualquiera
de la población; es importante escoger la
muestra en forma aleatoria (al azar),
pues así se logra que sea representativa
y se puedan obtener conclusiones más a
fines acerca de las características de la
población.
5. ESTADÍSTICA DESCRIPTIVA
Todo estudio estadístico debe considerar
diferentes tipos de variables:
Variables
Variables cualitativas
Variables Cuantitativas
6. ESTADÍSTICA DESCRIPTIVA
Variables cualitativas:
Relacionadas con
características no numéricas
de un individuo (por ejemplo:
atributos de una persona,
nacionalidad, color de la piel,
sexo).
7. ESTADÍSTICA DESCRIPTIVA
Variables Cuantitativas: Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en discretas (aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad, número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
continuas (aquellas que pueden
tomar cualquier valor en un intervalo
real, ejemplo: alturas, la velocidad
de un vehículo puede ser 80,3 km/h,
94,57 km/h...etc.).
8. Estadística Descriptiva: Es la parte de la estadística que trata solamente de
describir y analizar un grupo dado sin sacar conclusiones o inferencias de un
grupo mayor, a partir de ella. La estadística descriptiva incluye las técnicas
que se relacionan con el resumen y la descripción de datos numéricos. Estos
datos pueden ser gráficos o pueden incluir análisis computacional.
Estadística Inferencial: Cuando una muestra es representativa de una
población se pueden deducir importantes conclusiones acerca de esta, a
partir de su análisis. La inferencia estadística comprende aquellas técnicas por
medio de las cuales se toma decisiones sobre una población estadística
basadas solo en la muestra observada. Debido a que dichas decisiones se
toman en condiciones de incertidumbre, entonces estas serán confiables con
cierto grado de probabilidad. Considerando que las características medidas
de una muestra se denominan estadísticas de la muestra, las características
medidas de una población estadística, o universo se llaman parámetros de la
población.
9. ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
10. ESTADÍSTICA DESCRIPTIVA
¿Para qué se construyen las tablas
de frecuencias ?
1. ORDENAR
2. AGRUPAR
3. RESUMIR información
11. ESTADÍSTICA DESCRIPTIVA
El formato general de una tabla estadística , llamada también
TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS es la siguiente:
Nombre de la Frecuencia
variable
Categorías o Frecuencias
Recorrido de la Observadas
variable
TOTAL n
12. ESTADÍSTICA DESCRIPTIVA
En la siguiente tabla se presenta el motivo de la
consulta médica, durante una semana.
Motivo Consulta Número de pacientes
Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
13. ESTADÍSTICA DESCRIPTIVA
TIPOS DE FRECUENCIAS
a) Frecuencia o Frecuencia Absoluta: Es el número de veces
que se presenta un valor o categoría de una variable. Se
representa por fi.
b) Frecuencia Relativa: La frecuencia relativa se puede expresar
en términos de porcentaje o de proporción y se representa por
fr. (Es la razón entre la frecuencia absoluta y el total de datos)
14. ESTADÍSTICA DESCRIPTIVA
Los siguientes datos corresponden a las notas obtenidas por
un curso de 24 alumnos en un trabajo de matemáticas:
3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0
5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0
3,2 6,0 4,2 5,0 5,6 5,0
Ordenemos estos datos en una tabla:
Anota en tu cuaderno una tabla de frecuencias que
considere
• Nombre de variable: Notas
• Frecuencia Absoluta
• Frecuencia relativa (ambas)
Si tu resultado es un decimal, usa 3 dígitos
después de la coma
17. ESTADÍSTICA DESCRIPTIVA
Hasta el momento sólo hemos trabajado con una pequeña
cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos
muchos datos?
Tabla de Frecuencias de datos agrupados
(tambien llamadas tabla de frecuencias con clase)
En ocasiones, el agrupar los datos en
intervalos, nos puede ayudar para realizar un
intervalos
mejor análisis de ellos.
18. ESTADÍSTICA DESCRIPTIVA
Definiciones:
•Rango: Diferencia entre el máximo y el mínimo
valor de una variable.
•Marca de clase: Representante de un intervalo, y
corresponde al promedio entre los extremos de éste.
•Tamaño de un intervalo: Es el cuociente entre el
valor del rango y la cantidad de intervalos que se
desea obtener. Se recomienda tomar como longitud
de los intervalos un valor entero que sea mayor o
igual al cuociente obtenido.
19. ESTADÍSTICA DESCRIPTIVA
Para estas tablas debemos considerar cada intervalo con límites
cerrado y abierto, o sea [ - [
La tabla siguiente la vamos a elaborar con:
frecuencias absolutas: estas frecuencias son las que se
obtienen directamente del conteo
frecuencias relativas: corresponden a los porcentajes de cada
frecuencia absoluta.
frecuencia absoluta acumulada: corresponde a la frecuencia
absoluta del intervalo más la suma de las frecuencias absolutas
de todos los valores anteriores.
frecuencia relativa acumulada: corresponde al porcentaje de la
frecuencia relativa del intervalo más la suma de las frecuencias
relativas de todos los valores anteriores.
20.
21. Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001
Nivel de Colesterol ¿Cuál es la variable de
(mg/100 ml) Cantidad de hombres interés?
80-120 13
120-160 15
160-200 44
200-240 29
¿Qué se mide?
240-280 9
Observa: El rango de cada intervalo es de 40.
23. ESTADÍSTICA DESCRIPTIVA
Estatura Mayor: 1,93 metros
Estatura Menor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.
Formaremos 6 intervalos. Para calcular el tamaño de intervalo de
cada uno dividimos 27 y 6, obteniendo finalmente 4,5 ≈ 5
Luego los intervalos de la tabla son:
Intervalo Marca de Clase Frecuencia Absoluta
1,65 – 1,69
1,70 – 1,74
1,75 – 1,79
1,80 – 1,84
1,85 – 1,89
1,90 – 1,94
24. ESTADÍSTICA DESCRIPTIVA
Representaciones Gráficas
Para hacer más clara y evidente la información que nos dan las tablas
se utilizan los gráficos. Existen múltiples tipos de gráficos, pero aquí
trataremos solamente de los usados más frecuentemente, que son:
gráfico de barras, gráfico de sectores o circular (pastel), histograma,
polígono de frecuencias, la ojiva y el pictograma.
25. Gráficos estadísticos GRÁFICOS
La información contenida en las tablas de
frecuencias resulta más accesible y fácil de
interpretar si se representan por medio de gráficos
estadísticos.
Diagrama de barras
Se usa fundamentalmente para representar distribuciones de frecuencias de una variable
cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series
cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean
absolutas o relativas (%), y el otro para la escala de clasificación utilizada.
26. GRÁFICOS
Histograma
Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y
sus
Áreas son iguales o proporcionales a sus frecuencias.
Este gráfico se usa para representar una distribución de frecuencias de una variable
cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y,
y en el eje X la variable
27. GRÁFICOS
Polígono de frecuencias
Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras,
o los puntos medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al
igual que el histograma, para representar distribuciones de frecuencias de variables
cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de
recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el
mismo gráfico más de una distribución.
28. GRÁFICOS
Diagrama de sectores o gráfico circular
Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias
relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace
corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase
en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le
corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría
con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
29. GRÁFICOS
Pictogramas Gráfico de líneas u ojiva
Los pictogramas son gráficos similares a los
En este tipo de gráfico, al igual que el
gráficos de barras, pero empleando un
histograma y el polígono de frecuencias el
dibujo en una determinada escala para
objetivo es representar distribuciones de
expresar la unidad de medida de los datos.
frecuencias de variables cuantitativas
Se utiliza un dibujo relacionado con el tema,
continuas, pero sólo para frecuencias
para representar cierta cantidad de
acumuladas.
frecuencias. Este tipo de gráfica atrae la
se representan los valores de los datos en dos
atención por los dibujos, pero la desventaja
ejes cartesianos ortogonales entre sí.
es que se lee en forma aproximada.
Se pueden usar para representar: una serie o
más series
33. MEDIDAS DE RESUMEN
Entre las medidas que permiten
resumir información proveniente de
una población, podemos
considerar las medidas de
posición, medidas de dispersión y
medidas de forma.
34. Medidas de Posición
Tienen por objeto, obtener un valor
que resuma en sí todas las
mediciones. La mayoría de ellas trata
de ubicar el centro de la distribución,
razón por la cual, se llaman
MEDIDAS DE TENDENCIA
CENTRAL; estas son: Media,
Mediana y Moda.
35. MEDIDAS DE TENDENCIA CENTRAL
Media aritmética o promedio: Es una de
las medidas de tendencia central de
mayor uso. La media muestral se
simboliza por X y la media poblacional
de denota por µ.
36. PROMEDIO PARA DATOS NO TABULADOS
Sea X una variable cuantitativa y x1, x2,…, xn una muestra
de tamaño "n" de valores de la variable, se define la media
n
aritmética de X como:
x1 + x2 + x3 + ..... + xn ∑x i
X= X = i=
1
n n
PROMEDIO PARA DATOS TABULADOS
Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los
valores y se divide entre el total de casos.
Sea X una variable estadística que toma los valores , con frecuencias absolutas ,
respectivamente, la media viene dada por:
n
x1 f 1 + x 2 f 2 + ... + x n f n
∑x
i =1
i ⋅ fi
x= =
f 1 + f 2 + ... + f n n
∑f
i =1
i
37. Ejemplo N°1
Consideremos la edad en años de ocho personas
10 18 25 32 12 5 7 7
En este ejemplo el promedio , media o media aritmética de la edad de
estas personas está dada por:
10 + 18 + 25 + 32 + 12 + 5 + 7 + 7
x=
8
Es decir la edad promedio de estas personas es de 14,5 años.
38. Mediana (Me)
Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un
valor tal que supera a no más del 50% de las observaciones y es superado
por no más del 50% de las observaciones, cuando estas han sido
ordenadas según magnitud.
MEDIANA PARA DATOS NO TABULADOS
Ejemplo: Consideremos la edad en años de ocho personas
10 18 25 32 12 5 7 7
Para calcular la mediana , previamente se deben ordenar las
observaciones. En este caso lo haremos en forma creciente:
5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana
corresponde al promedio de los datos centrales, por lo tanto la
mediana es 11.
39. MEDIANA PARA DATOS TABULADOS
En casos de datos agrupado es un poco más complejo
y requiere de la utilización de la siguiente fórmula
N
− Fi −1
M = Li + c ⋅ 2
fi
Li = límite inferior de la clase mediana
c = amplitud del intervalo
N = número total de datos
Fi −1 = frecuencia absoluta acumulada de la clase anterior a la mediana
f i = frecuencia absoluta de la clase mediana
40. Moda o Modo (Mo) para datos no tabulados
La moda se identifica al observar el valor que se presenta con más
frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.
Moda o Modo (Mo) para datos tabulados
Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal
(clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor
frecuencia se obtiene a partir de la siguiente expresión:
límite inferior de la clase modal.
amplitud de los intervalos.
diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
anterior.
diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
siguiente.
41. Cuantiles
La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que dividen los datos
de la distribución en partes iguales.
Los más usados son:
Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales.
( cuartil primero, cuartil segundo y cuartil tercero )
Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.
( quintil primero,... )
Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales.
( decil primero,...)
Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales.
( percentil primero,... )
El cálculo es análogo al de la mediana.