Este documento describe los conceptos y cálculos básicos relacionados con las medidas de tendencia central y dispersión en estadística descriptiva. Explica la tabla de distribución de frecuencia, intervalo de clase, media, mediana, moda y medidas de dispersión como desviación estándar y varianza. Además, proporciona ejemplos y fórmulas para calcular estas medidas para datos agrupados y no agrupados. Finalmente, incluye una bibliografía con enlaces a recursos adicionales sobre estadística descriptiva.
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
Presentacion(medidas de tendencia central)
1. REPUBLICA BOLIVARIANA DE VENEZUELA
I.U.P SANTIAGO MARIÑO
SEDE BARCELONA
ESTADISTICAS
SECCION C-V
MEDIDAS DE
TENDENCIA
CENTRAL
AUTOR:
LUIS BALDERRAMA
C.I: 25.061.895
2. TABLA DE DISTRIBUCION DE FRECUENCIA
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a
cada dato su frecuencia correspondiente.
Por ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la
tercera anotamos la frecuencia absoluta.
INTERVALO DE CLASE
Se emplean si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
3. MARCA DE CLASE
es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla con Intervalos de clase
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38,
41, 48, 15, 32, 13.
1º se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos de
queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
4. NUMERO DE CLASE
Es la clasificación de los datos de una muestra en grupos definidos, también se le llama clase:
Ii = [a;b[
donde a es el Límite inferior y b es el Límite superior.
A este intervalo de clase pertenecen los datos x que cumplen la condición:
a <= x <b
NÚMEROS DE INTERVALOS DE CLASE (k)
Para obtener un valor aproximado, podemos emplear la regla de ¨STURGES¨.
k = 1 + 3,3logN
donde N es el número de elementos de la muestra.
FRECUENCIA SIMPLE
Frecuencia simple absoluta: es el número de veces que aparece ese valor en el estudio. Se suele denotar por Fi a la frecuencia
absoluta del valor X = xi de la variable X. Dada una muestra de N elementos, la suma de todas las frecuencias absolutas debe dar
el total de la muestra estudiada N.
Frecuencia simple relativa: (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,
siendo el fi para todo
el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencia. Si multiplicamos la frecuencia relativa
por 100 obtendremos el porcentaje o tanto por ciento (pi)
FRECUENCIA ACUMULADA
Frecuencia absoluta acumulada: (Ni), se refiere al total de las frecuencias absolutas para todos los eventos iguales o
anteriores que un cierto valor, en una lista ordenada de eventos.
5. FRECUENCIA RELATIVA ACUMULADA
(Fi), es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.
MEDIDA DE TENDENCIA CENTRAL
La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.
es el símbolo de la media aritmética.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Ejercicio de media aritmética
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación
media.
6. EJERCICIO
MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me = 9.5
7. CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre
Li es el límite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
8. MODA
es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o
multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
9. Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
10. PROCEDIMIENTOS ESTADÍSTICOS REFERIDOS AL USO Y CÁLCULO DE LAS MEDIDAS DE CENTRALIZACIÓN
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas
de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la
información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la
información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del
patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos
se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que
presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de
valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de
reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.
MEDIDAS DE TENDENCIA CENTRAL
MEDIA: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos por el número de ellos. Se aplica
por ejemplo para resumir el número de pacientes promedio que se atiende en un turno. Otro ejemplo, es el número
promedio de controles prenatales que tiene una gestante.
MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la población exactamente en dos. Por
ejemplo el número mediana de hijos en el centro de salud “X” es dos hijos. Otro ejemplo es el número mediana de
atenciones por paciente en un consultorio.
11. MODA
Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola moda y una
distribución bimodal tiene dos. Útil como medida resumen para las variables nominales. Por ejemplo, el color del
uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirúrgico.
MEDIDAS DE DISPERSIÓN
DESVIACIÓN ESTÁNDAR: Llamada también desviación típica; es una medida que informa sobre la media de
distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.
LA VARIANZA: Es el valor de la desviación estándar al cuadrado; su utilidad radica en que su valor es requerido
para todos los procedimientos estadístico.
ERROR TÍPICO: Llamado también error estándar de la media. Se refiere a una medida d variabilidad de la media;
sirve para calcular cuan dispersa estaría la media de realizar un nuevo calculo.
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si
ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez
60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética
de la distribución.
La desviación típica S: es la raíz cuadrada de la varianza.
El rango: diferencia entre el valor de las observaciones mayor y el menor
El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
CV = 20,67/52,3 = 0,39