Código Civil de la República Bolivariana de Venezuela
Clase 2 Medidas Estadisticas.ppt
1. Dra. Lila Virginia Lugo García
Santa Ana de Coro, 2022
Pág 1
UNIVERSIDAD NACIONAL EXPERIMENTAL
“FRANCISCO DE MIRANDA”
DECANATO DE POSTGRADO
PROGRAMA MAESTRIA EN GESTIÓN Y PLANIFICACIÓN
DEPORTIVA
ESTADÍSTICA APLICADA
TEMA 2. SESIÓN DE CLASE SEMANA 2
2. Tema II: Medidas Estadísticas
Pág 2
Existen algunas medidas que facilitan la descripción de los datos y permiten realizar el
análisis del comportamiento de los mismos.
Entre las más importante se tienen las Medidas de Tendencia Central que permiten ver
la localización de los datos en el centro de la distribución, entre las más usuales se tiene:
la Media Aritmética, la Mediana y la Moda.
Pero existen algunas medidas que también son de Posición que se pueden ubicar en
cualquier punto de la distribución, como los Percentiles, Deciles o Cuartiles
Además se tienen las Medidas de Dispersión que representan la variabilidad de los
datos, es decir indican si los datos están unidos o dispersos. Entre ellos se tienen: Rango,
Desviación Media y la Desviación Típica o Estándar y la Varianza.
Otros estadísticos importantes son las Medidas de Apuntamiento que determina el
grado de concentración que presentan los valores de una variable alrededor de la zona
central de la distribución de frecuencias, entre ellas se tiene la Curtosis y la Simetría.
INTRODUCCIÓN
3. Tema II: Medidas Estadísticas
ESTRUCTURA DE LA SESIÓN DE CLASE
Medidas de Tendencia Central: Definiciones, ejemplos y ejercicios
Media Aritmética
Mediana
Moda
Medidas de Posición: Definición, ejemplos y ejercicios
Percentiles
Medidas de Dispersión: Definiciones, ejemplos y ejercicios
Rango
Desviación con respecto a la media
Desviación Típica y Varianza
Coeficiente de Variación de Pearson
Medidas de Apuntamiento: Definición, ejemplos y ejercicios
Curtosis
Simetría
Pág 3
4. Tipos de Medidas Estadísticas
MEDIDAS
Dispersión
RANGO, DESVIACIÓN MEDIA,
DESVIACIÓN ESTÁNDAR,
VARIANZA Y COEFICIENTE DE
VARIACIÓN
Apuntamiento
CURTOSIS Y
SIMETRÍA
De Posición
PERCENTIL, DECIL Y
CUARTIL
Tendencia
Central
MEDIA ARITMÉTICA,
MEDIANA, MODA, MEDIA
ARMÓNICA Y GEOMÉTRICA
Pág 4
Las medidas estadísticas se clasifican en tres grandes tipos: de posición donde están las
tendencia Central, de Dispersión y de Apuntamiento.
A continuación los estadísticos más resaltantes
5. Adaptado de: Johson R. y Kuby p (2004). Estadística Elemental. Lo esencial. 3ra Edición. Editorial Thomson. México D.F
Se les llama medidas de tendencia central porque en una distribución de datos
generalmente la acumulación más alta se encuentra en los valores intermedios, es
decir son valores numéricos que localizan en el centro de la distribución de los datos.
Medidas de Tendencia Central
Pág 5
TIPOS
- Media Aritmética
- Mediana
- Moda
- Media Geométrica
- Media Armónica
Media Aritmética es la medida de posición más usada, es el
también llamada promedio
Mediana es la medida de posición que se encuentra exactamente
en la mitad
Moda es la medida de posición que más se repite
6. Media Aritmética es el promedio y se calcula por medio de la suma de todos
los valores divido entre el número de datos
Medidas de Tendencia Central
Pág 6
Note que el promedio es de 7 años esto no significa que necesariamente todos los
niños tengan 7 años, de hecho en este ejemplo ninguno posee esa edad. Sin embargo
para efecto del cálculo del promedio es como si todos poseen 7 años
7. Pág 7
Cálculo de las Medidas de Tendencia Central
Datos No Agrupados
1) MEDIA ARITMÉTICA
Símbolo: para muestra o para la población
Fórmula:
Donde:
•N= total de datos
• es la sumatoria que significa que debemos sumar desde el primer valor (i=1) hasta el último (n)
Ejemplo:
Edades de un grupo de 12 estudiantes de 5to año de bachillerato
15,15,16,16,16,16,17,17,17,18,18,19
El promedio o media de la edad de este grupo es de 16,667
𝑋 =
15 + 15 + 16 + 16 + 16 + 16 + 17 + 17 + 17 + 18 + 18 + 19
12
𝑋 =
200
12
𝑋 = 16,667
8. Pág 8
Cálculo de las Medidas de Tendencia Central
1) MEDIA ARITMÉTICA
Símbolo: para muestra o para la población
Fórmula:
Donde:
•N o n = total de datos
• es la sumatoria significa que debemos multiplicar cada marca de clase por su frecuencia simple y
luego se suman
Ejemplo:
Edades de un grupo de 85 estudiantes que viven en la comunidad LVIII
La media aritmética o
promedio de la esas de los
estudiantes será:
Li Lf Xi fi Xi*fi
10 11 10,5 8 84,00
12 13 12,5 13 162,50
14 15 14,5 17 246,50
16 17 16,5 22 363,00
18 19 18,5 10 185,00
20 21 20,5 9 184,50
22 23 22,5 6 135,00
N=85 1360,50
Datos Agrupados
9. Medidas de Tendencia Central
2) Mediana es la medida de posición que se encuentra exactamente en la mitad de
los valores o de la distribución cuando los datos están ordenados
Pág 9
10. 2) MEDIANA
Símbolo: Me
Formula: Posición de la mediana en datos previamente ordenados en forma ascendente o
descendentes:
Donde:
•n= total de datos
Cálculo de las Medidas de Tendencia Central
Ejemplo:
Edades de un grupo de estudiantes de 5to año de bachillerato (los datos
deben estar ordenados)
Datos impares (valor central)
15,15,16,16,16,16,17,17,17,18,18
Me= 16
Datos Pares (Promedio de los valores central)
15,15,16,16,16,16,17,17,17,18,18,19
Me= 16,5
Pág 10
Datos No Agrupados
11. Cálculo de las Medidas de Tendencia Central
Pág 11
2) MEDIANA
Símbolo: Me
Fórmula:
Donde:
•n= total de datos,
•Lm= límite real (semi suma se limite inferior con el limite superior anterior, se suman y dividen entre dos)
•fi= frecuencia simple posterior a n/2
•Fi = frecuencia acumulada anterior a n/2,
•ci= amplitud de los limites de la clase
Ejemplo:
Edades de un grupo de 85 estudiantes que viven en la comunidad LVIII
Se ubica n/2= 42,5 en la frecuencia acumulada (de allí se toman los dos intervalos)
La mediana será:
42,5
Li Lf fi Fi
10 11 8 8
12 13 13 21
14 15 17 38
16 17 22 60
18 19 10 70
20 21 9 79
22 23 6 85
n=85
El limite real será: (16+15)/2=15,5
Datos Agrupados
12. 3) Moda es la medida de posición que más se repite los datos sean agrupados o
no agrupados
Medidas de Tendencia Central
Pág 12
Ejemplo 1: Si la variable es la estatura la moda será:
Ejemplo 2: Si la variable es la frecuencia de aparición, entonces la moda será:
13. 3) MODA
Símbolo: Mo
La moda es el dato que más se repite.
•Si hay dos datos que se repiten con la misma frecuencia se dice que la distribución
es bimodal. Análogamente si existen varios datos que se repiten la misma cantidad de
veces se dice que es multimodal.
•Si todos los datos se repiten el mismo número de veces, entonces no hay moda.
•Si ningún dato se repite, tampoco hay moda.
Cálculo de las Medidas de Tendencia Central
Ejemplo:
Edades de un grupo de estudiantes de 5to año de bachillerato (los datos
deben estar ordenados)
Una moda
15,15,16,16,16,16,17,17,17,18,18
Mo= 16
Dos modas (Bimodal)
15,15,16,16,16,16,17,17,17,17,18,18,19
Mo1= 16 y Mo2= 17
Pág 13
Datos No Agrupados
14. Cálculo de las Medidas de Tendencia Central
3) MODA
Símbolo: Mo
Fórmula:
Donde:
•Lm= límite real, (semi suma se limite inferior con el limite superior anterior, se suman y dividen entre dos)
•1= diferencia de la frecuencia simple máxima y la frecuencia anterior a ella
•2= diferencia de la frecuencia simple máxima y la frecuencia posterior a ella
•ci= amplitud de los limites de la clase
Pág 14
Ejemplo:
Edades de un grupo de 85 estudiantes que viven la comunidad LVIII
Se ubica la frecuencia máxima que en este caso es 22
Al calcular 1 y 2 queda:
1= 22-17= 5
2= 22-10= 12
El limite real será: (16+15)/2=15,5
Y la amplitud ci= 17-16=1
Li Lf fi Fi
10 11 8 8
12 13 13 21
14 15 17 38
16 17 22 60
18 19 10 70
20 21 9 79
22 23 6 85
n=85
Datos Agrupados
15. Medidas de Posición
4) PERCENTIL
El percentil es una medida de posición utilizada para comparar datos, es un número de va
desde 0 a 100 que indica el porcentaje de datos que son igual o menor que un determinado
valor. Es decir, hasta que valor llega en la distribución determinado porcentaje, por ejemplo
calcula cual es el valor que cubre el 30 % de la distribución de datos
Es importante aclarar que se tienen percentiles, deciles y cuartiles.
Los percentiles van de uno en uno, se tendrán 100 percentiles
Los deciles van de 10 en 10 , se tendrán 10 deciles
Los cuartiles de 25 en 25, se tendrán 4 cuartiles
Cabe mencionar que existe una equivalencia entre los percentiles, deciles y cuartiles. Es
decir, el percentil 50 es el mismo que el decil 5 y el cuartil 2 pero además es la Mediana, ya
que este es el dato que representa el 50% de la distribución. Las fórmulas que se utilizan se
trabajan de manera similar a la fórmula de mediana
Los percentiles son muy conocidos por su uso en los percentiles de crecimiento. Por
ejemplo, si el peso de un bebé está en el percentil 65, quiere decir que el 65% de los bebés
de la misma edad pesan más o menos lo mismo.
Pág 15
16. Medidas de Posición
Las fórmulas para cada una de estas medidas de posición son similares.
A continuaciones se presentan
Donde:
•n= total de datos,
•P= percentil solicitado
•Lm= límite real, (semi suma se limite inferior con el limite superior anterior)
•fi= frecuencia simple posterior a n.p/100
•Fi = frecuencia acumulada anterior a n.p/100
•ci= amplitud de los limites de la clase
Lo primero que se hace es ubicar en la frecuencia acumulada el resultado de n.p/100 (de
acuerdo a lo que se requiera) y los demás factores dependerán de dicho valor
PERCENTIL
Pág 16
17. Medidas de Posición
EJERCICIO:
De la siguiente tabla que representa las edades de un grupo de estudiantes en la
comunidad LVIII determinar: a) Percentil 15
Pág 17
Li Lf Xi fi Fi
10 11 10,5 8 8
12 13 12,5 13 21
14 15 14,5 17 38
16 17 16,5 22 60
18 19 18,5 10 70
20 21 20,5 9 79
22 23 22,5 6 85
85
PERCENTIL
Donde:
•n= total de datos =85
•p= percentil solicitado= 15
•n.p/100= 12,75
•Lm= límite real = (11+12)/2=11,5
•fi= frecuencia simple posterior a n.p/100= 8
•Fi = frecuencia acumulada anterior a n.p/100=13
•ci= amplitud de los limites de la clase=1
12,75
18. Las Medidas de Dispersión son los parámetros que indican la mayor o menor
concentración de los datos alrededor de los parámetros de centralización.
Hace referencia a valores que indican el movimiento de una variable en relación con otra
usualmente centralizada como la media aritmética.
Pág 18
Observe las siguientes gráficas
Note que en la primera los datos están más concentrados
que en la segunda que se encuentran más dispersos.
A este comportamiento de concentración de datos es lo
que se conoce como Dispersión
Además estas medidas al igual que las de tendencia central permiten conocer de manera
resumida una característica de la variable estudiada ya que ofrecen información del
comportamiento de la distribución, misma que puede ser utilizada para comparar e
interpretar y de ser necesario tomar decisiones.
Entre las medidas de dispersión las más importantes se encuentran: Rango, Desviación
respecto de la media, Desviación estándar, Coeficiente de Variación de Pearson y la
Varianza.
Medidas de Dispersión
19. 5) RANGO
Es recorrido estadístico, indica la separación general de lo datos, se determina
con la diferencia entre el valor máximo y el mínimo de un conjunto de elementos.
Símbolo: R
Formula: R= Vmáx - Vmín
Pág 19
Datos no agrupados
Ejemplo: Los siguientes datos
representan las edades de un grupo
de estudiantes de 5to año de
bachillerato
15,15,16,16,16,16,17,17,17,18,18
R= 18 -15= 3
Datos Agrupados
Ejemplo: La siguiente tabla representa las
edades de un grupo de 85 estudiantes que viven
en la comunidad LVIII
R= 23 – 10 = 13
Li Lf fi Fi
10 11 8 8
12 13 13 21
14 15 17 38
16 17 22 60
18 19 10 70
20 21 9 79
22 23 6 85
n=85
Medidas de Dispersión
20. Pág 20
Datos no agrupados
Ejemplo:
Edades de un grupo de estudiantes de
5to año de bachillerato
15,15,16,16,16,16,17,17,17,18,18, 19
La media aritmética es:
Xi | Xi- |
15 1,667
15 1,667
16 0,667
16 0,667
16 0,667
16 0,667
17 0,333
17 0,333
17 0,333
18 1,333
18 1,333
19 2,333
12
6) DESVIACIÓN RESPECTO A LA MEDIA
Símbolo: DM
Formula: (Datos no Agrupados) (Datos Agrupados)
Donde: Xi es el dato en especifico y es la media aritmética. Y fi la frecuencia simple
Medidas de Dispersión
Datos Agrupados
Ejemplo: La siguiente tabla representa las
edades de un grupo de 85 estudiantes que viven
en la comunidad LVIII
Li Lf Xi fi Xi. fi |Xi-X|.fi
10 11 10,5 8 84 44,048
12 13 12,5 13 162,5 45,578
14 15 14,5 17 246,5 25,602
16 17 16,5 22 363 10,868
18 19 18,5 10 185 24,94
20 21 20,5 9 184,5 40,446
22 23 22,5 6 135 38,964
N= 85 1360,5 230,446
21. Pág 21
Medidas de Dispersión
Ejemplo:
Si se tiene dos comunidades, en el grupo A la media de la edad es de 45 años
con desviación de 8 y en el grupo B la media es también de 45 años con
desviación de 12 Entonces en base a esto se puede decir que el grupo A los
datos están más concentrados que en el B, es decir estan menos dispersos del
promedio.
7) DESVIACIÓN TÍPICA O ESTANDAR y VARIANZA
Es la medida de dispersión más común por su confiabilidad, que indica la dispersión
de los datos con respecto a la media aritmética. Dicha medida cuantifica la
dispersión alrededor de la media, es decir es el promedio de la distancia que poseen
los datos con respecto a la media aritmética. Mientras mayor sea este valor mayor
será la dispersión de los datos.
Símbolo: S o (Desviación Estándar) y S2 o 2 (Varianza)
Formula: (Muestra) (Muestra)
(Población) (Población)
22. Pág 22
USO DE LA DESVIACIÓN ESTÁNDAR
Posee muchos usos, entre ellos uno de los más importantes es determinar la
confiabilidad de los datos.
La desviación estándar puede representar la diferencia al seleccionar
diferentes muestras, permitiendo distinguir la más adecuada.
Por ejemplo si dos encuestadores realizan la recogida de información en la
misma zona con los mismos habitantes, la desviación estándar indica cual del
conjunto de datos es más confiable, teniendo como criterio en cuenta que
mientras más pequeña sea la desviación más confiables son los datos.
Una aplicación de la desviación estándar es que determina los niveles de
confiabilidad en una distribución normal, que abordaremos más adelante.
Medidas de Dispersión
23. Pág 23
Ejemplo: La siguiente tabla representa las edades de un grupo de 85
estudiantes que viven en la comunidad LVIII
Se pide calcular desviación estándar y varianza
Desviación Estándar Varianza
Li Lf Xi fi |Xi-X|^2.fi
10 11 10,5 8 242,5283
12 13 12,5 13 159,7965
14 15 14,5 17 38,55661
16 17 16,5 22 5,368792
18 19 18,5 10 62,20036
20 21 20,5 9 181,7643
22 23 22,5 6 253,0322
N= 85 943,2471
Medidas de Dispersión
24. 8) COEFICIENTE DE VARIACION DE PEARSON (CV)
Pág 24
Medidas de Dispersión
El coeficiente de variación de Pearson mide la variación de los datos respecto a
la media, sin tener en cuenta las unidades en la que están. Dichos valores se
comprenden entre 0 y 1. Si el coeficiente es próximo al 0 entonces existe poca
variabilidad en los datos por tanto la muestra muy compacta. En cambio, si se
acerca a 1 entonces la muestra está dispersa. Se calcula como el cociente entre la
desviación estándar y media aritmética
o
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien en este
caso se habla del porcentaje de variación de Pearson
25. Pág 25
Ejemplo: La siguiente tabla representa las edades de un grupo de 85
estudiantes que viven en la comunidad LVIII
Determinar el Coeficiente de Variación de Pearson
Desviación Estándar
Media Aritmética
Coeficiente de Variación de Pearson
Es importante mencionar que dependiendo del estadístico o investigador el 20,810 %
puede ser muy alto, sin embargo en comparación con el 100% puede ser considerada no
tan alta. Dependerá de los criterios considerados en la distribución
Li Lf Xi fi
10 11 10,5 8
12 13 12,5 13
14 15 14,5 17
16 17 16,5 22
18 19 18,5 10
20 21 20,5 9
22 23 22,5 6
N= 85
Medidas de Dispersión
26. Pág 26
Medidas de Apuntamiento
9) SIMETRÍA
Los indicadores de SIMETRÍA o ASIMETRÍA indican si los valores de la distribución
se disponen simétricamente alrededor de la media, o bien si se decantan en mayor
medida hacia la derecha (asimetría derecha, o positiva) o hacia la izquierda
(asimetría izquierda o negativa), sin necesidad de representar gráficamente la
distribución de frecuencias.
Se puede tener presentar tres casos:
1) Asimetría negativa: la cola de la distribución se alarga para valores inferiores a
la media.
2) Simétrica: hay el mismo número de elementos a izquierda y derecha de la
media.
3) Asimetría positiva: la cola de la distribución se alarga (a la derecha) para
valores superiores a la media.
27. Pág 27
Medidas de Apuntamiento
CÁLCULO DE SIMETRÍA
Para calcular se debe:
1) Determinar el momento 2 y 3 (p=2 y p=3)
2) Se aplica la fórmula denominada Coeficiente de Asimetría de Fisher
3) Se analiza el resultado considerando los parámetros
Si g1>0 es Asimetría Positiva
Si g1=0 es Simétrica
Si g1<0 es Asimetría Negativa
MOMENTO
SIMETRÍA
28. Pág 28
Medidas de Apuntamiento
EJERCICIO:
La siguiente tabla representa las edades de un grupo de 85 estudiantes que
viven en la comunidad LVIII
Determinar la Simetría
Como el valor de g1 da
positivo la distribución
Asimétrica Positiva
MOMENTO
Li Lf Xi fi |Xi-X|^2.fi |Xi-X|^3.fi
10 11 10,5 8 242,528 -1335,361
12 13 12,5 13 159,796 -560,246
14 15 14,5 17 38,557 -58,066
16 17 16,5 22 5,369 2,652
18 19 18,5 10 62,200 155,128
20 21 20,5 9 181,764 816,849
22 23 22,5 6 253,032 1643,191
SUMA N= 85 943,247 664,147
SIMETRÍA
29. Pág 29
Medidas de Apuntamiento
10) CURTOSIS
Entre las medida de apuntamiento se tiene la Curtosis y la Simetría que se relacionan con la
forma de agrupación de los datos
La curtosis es una medida estadística que determina el grado de concentración que
presentan los valores de una variable alrededor de la zona central de la distribución de
frecuencias. Por medio del Coeficiente de Curtosis, podemos identificar dicha concentración
de valores.
Tipos de Curtosis
1) Se llama Leptocúrtica cuando existe una gran concentración en la zona central de
valores
2) Se llama Mesocúrtica, cuando la concentración en la zona central es normal
3) Se llama Platicútica cuando la concentración en la zona central es baja
30. Pág 30
Medidas de Apuntamiento
CÁLCULO DEL COEFICIENTE DE CURTOSIS
Para calcular se debe:
1) Determinar el momento 2 y momento 4 por medio de la fórmula (p=2 y p=4)
2) Se aplica la fórmula
3) Se analiza el resultado considerando los parámetros
Si g2>0 es Leptocúrtica
Si g2=0 es Mesocúrtica
Si g2<0 es Platicútica
MOMENTO
CURTOSIS O APUNTAMIENTO
31. Pág 31
Medidas de Apuntamiento
EJERCICIO:
La siguiente tabla representa las edades de un grupo de 85 estudiantes que
viven en la comunidad LVIII
Determinar la curtosis
1) Determinar el momento 2 y momento 4 por medio de la fórmula (p=2 y p=4)
2) Se aplica la fórmula
3) Se analiza el resultado considerando los parámetros
Si g2>0 es Leptocúrtica
Si g2=0 es Mesocúrtica
Si g2<0 es Platicútica
MOMENTO
CURTOSIS O APUNTAMIENTO
32. Pág 32
Medidas de Apuntamiento
EJERCICIO:
La siguiente tabla representa las edades de un grupo de 85 estudiantes que
viven en la comunidad LVIII
Determinar la Curtosis
CURTOSIS
Li Lf Xi fi |Xi-X|^2.fi |Xi-X|^4.fi
10 11 10,5 8 242,528 7352,496
12 13 12,5 13 159,796 1964,224
14 15 14,5 17 38,557 87,448
16 17 16,5 22 5,369 1,310
18 19 18,5 10 62,200 386,888
20 21 20,5 9 181,764 3670,919
22 23 22,5 6 253,032 10670,884
SUMA N= 85 943,247 24134,169
Como el valor de g2 da
negativo la distribución de
los datos es Platicúrtica
MOMENTO
33. 0
5
10
15
20
25
10.5 12.5 14.5 16.5 18.5 20.5 22.5
Edades de un grupo de estudiantes que viven
en la comunidad LVIII
Resumen de los resultados del Ejercicio
Pág 33
MEDIDAS DE
TENDENCIA
CENTRAL
Los valores se
concentran
alrededor de 16
MEDIDAS DE
DISPERSIÓN
MEDIDAS DE APUNTAMIENTO
Como el valor de g2 < 0 Platicúrtica
Como el valor de g1 > 0 Asimétrica Positiva
Se puede observar como los resultados de las medidas se visualizan
en el comportamiento de su gráfica, se nota que existe una marcada
dispersión de los datos. Además que la concentración de la zona
central es baja por eso es Platicúrtica y la distribución se alarga a la
derecha siendo Asimétrica Positiva
34. Paginas relacionadas con el manejo de EXCEL para
calculo de medidas de tendencia central y de dispersión para datos no
agrupados:
https://www.youtube.com/watch?v=b5eNyENGRw4
https://www.youtube.com/watch?v=11HQTBspowo
https://www.youtube.com/watch?v=Qbwr3-GkTng
Pág 34
Paginas relacionadas con el manejo de EXCEL para
calculo de medidas de tendencia central para datos agrupados:
https://www.youtube.com/watch?v=Hu1U4SrZ4FQ
Recomendación de videos