ESTADISTICA DESCRIPTIVALas 4 etapas de la estadística descriptiva
Recopilación de datos. Como en la mayoría de las ciencias cuantificables, el primer paso –y el más importante– es la recopilación de datos. ...
Organización de la información. ...
Presentación y tabulación. ...
Análisis de resultados.
La estadística descriptiva es aplicable en casi todas las áreas donde se recopilan datos cuantitativos. Puede brindar información acerca de productos, procesos o diversos aspectos del sistema de gestión de la calidad, como también en el ámbito de la dirección y organización de personas, la logística, etc.
Estadística descriptiva. La estadística descriptiva es una de las ramas de la estadística que se encarga de resumir o describir de forma medible las características específicas de una recolección de datos. ...
Estadística inferencial. ...
Estadística no paramétrica. ...
Estadística paramétrica. ...
Estadística matemática.
1. DESCRIPTIVA
UNIDAD III
ESTUDIO DE LOS
ESTADÍSTICOS EN
ESTADÍSTICA
DESCRIPTIVARENCIA
L
1
MEDIDAS DE CENTRALIZACIÓN
MEDIDAS DE DISPERSIÓN
2. Objetivo: Resumir la información más relevante de la muestra o población
en unos pocos números (parámetros).
C.1) Medidas de Centralización o Localización
• Indican valores con respecto a los que los datos parecen
agruparse.
• Media, mediana y moda
C.2) Medidas de Posición
• Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
C.3) Medidas de Dispersión o Variabilidad
• Indican la mayor o menor concentración de los datos con respecto
a las medidas de centralización.
• Rango, varianza, desviación típica, rango intercuartílico,
coeficiente de variación
C.4) Medidad de Forma
• Indican la forma en que se distribuyen los datos
• Coeficientes de asimetría y de apuntamiento o curtosis
3. 3
Presentaciones estadísticas y
representaciones gráficas
• Forma sencilla y clara de agrupar la información
• Pueden ser sencillas o complejas según la cantidad de datos
• Es importante el manejo lógico de la disposición
• Tablas:
• Gráficos:
Son los métodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la máxima
información con una rápida visualización , manejo de
estética y sencilléz operativa . Pueden ser de dos tipos:
• Permiten visualizar la información y sus relaciones
• Es una forma ilustrativa y clara de los datos
• Es una forma creativa y artística de presentación
4. 4
•Las descripciones numéricas de datos son importantes.
Dado un conjunto de n observaciones :
•La estadística descriptiva nos ayuda mediante el manejo de
medidas de tendencia central relativas a la posición de los
datos y medidas de dispersión relativas a la variabilidad de
los datos.
n
x
x
x ,.....,
, 2
1
Diferentes tipos de medidas
5. 5
•Las medidas descriptivas más comunes de
tendencia central o posición son: la media
aritmética y la mediana
•Existen otras medidas de tendencia central que en
ocasiones pueden resultar de interés tales como : la
moda, los cuartiles, los deciles, los percentiles, la
media armónica, la media geométrica y la media
ponderada.
Medidas de Tendencia Central
6. 6
Media Aritmética
•La media aritmética es simplemente el promedio
(también llamada media muestral ya que
generalmente se calcula en relación a una muestra).
•Se calcula de la siguiente forma: si las observaciones
de una muestra de tamaño n son x1, x2,…,xn
entonces:
n
x
n
x
x
x
X
n
i
i
n
1
2
1 ...
7. 7
Mediana
•La mediana se suele definir como el valor “más
intermedio o central ” una vez que los datos han sido
ordenados en forma creciente. Se suele denotar por
Me. La forma más general de calcular la mediana es la
siguiente:
1 2
2 ( 2) 1
2
n
n n
x si n es impar
Me x x
si n es par
8. 8
Moda
•La moda de un conjunto de observaciones es el valor
que más se repite, aquel cuya frecuencia absoluta es
máxima.
• Puede ser única, que haya más de una, o que no
exista.
•Cuando hay más de una , la distribución de los datos
se denomina acorde : bimodal , trimodal, polimodal,
etc.
9. 9
Nos brindan una idea muy clara de la “posición” de los
parámetros dentro de una distribución de datos.
Uso de : Media , Mediana y Moda
• La media tiene el uso más frecuente y sencillo ,
tales como : talla media del mexicano,
temperatura histórica promedio , etc.
• La mediana es representativa en poblaciones
heterogéneas , tales como : distribución de
salarios , peso medio, etc.
• La moda literalmente tiene que ver con “estar de
moda” o lo que más se lleva , tal como: número de
individuos por casa en México, cantidad de
usuarios de ciertos equipos celulares , etc.
10. 10
La forma de distribución de las observaciones puede variar , causando
desviaciones de estas mediciones centrales , por eso es conveniente el
empleo conjunto de la media y la mediana en una población o muestra.
Relación entre : Media,Mediana y Moda
La media se usa para distribuciones simétricas que
no tienen sesgo , mientras que la mediana es más
representativa cuando se tienen datos de
distribución sesgada.
11. 11
•Las medidas descriptivas más
comunes de dispersión son: el
rango, la varianza y la desviación
estándar .
•Existen otras medidas de
dispersión que en ocasiones
pueden resultar de interés tales
como : rango semi-intercuartilar ,
rango percentilar y coeficiente de
variación.
Medidas de Dispersión
12. 12
Rango
• El rango de la muestra es la medida de variabilidad más
sencilla entre todas las mencionadas
• Como valor se define como la diferencia entre la
observación más grande y la más pequeña :
• Indica el ancho, recorrido o amplitud de valores . Tiene
como sus límites el valor mayor y el menor en la
distribución de datos.
min
max x
x
r
13. 13
Varianza
• Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
• Se define como el promedio de las desviaciones respecto
a su media , elevadas al cuadrado :
n
x
x
s
n
i
i
1
2
2
)
(
n
x
x
s
n
i
i
1
2
2
)
(
14. 14
Desviación estándar
• Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
• Se define como la raíz cuadrada del promedio de las
desviaciones respecto a su media , elevadas al cuadrado ;
es decir la raíz cuadrada de la varianza :
n
x
x
n
i
i
1
2
)
(
15. 15
Utilidad de las medidas de dispersión
• Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero las de
dispersión nos detallan la variación de las observaciones en
cuanto a forma y extensión.
• Nos muestran claramente la distancia entre los datos y la
media aritmética, además de que dependen de todas las
observaciones.
• Son únicas de una serie de datos y por eso se denominan
absolutas , pero pierden sentido de comparación , para lo
cual hay que usar el coeficiente de variación (desviación
estándar sobre
la media en porcentaje) .