Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Tablas de frecuencia
1. Tabla de Frecuencia con
datos no agrupados
A partir de una tabla de frecuencias básica es posible dar respuesta a
múltiples preguntas, en cuanto a la estadística de una población.
A continuación hay varias preguntas organizadas en dos grupos, referidas
a las tablas de frecuencia. En el primer grupo, las respuestas se obtienen
directamente de la tabla; en el segundo, será necesario hacer ciertos
cálculos para poder dar la respuesta.
Grupo 1: ¿Cuántos niños no tiene caries?
¿ Qué género de películas es el más elegido?
¿Cuántas familias de clase media hay?
Grupo 2: ¿Cuántos tienen menos de tres caries?
¿Cuántas películas se alquilaron en el videoclub ese día?
¿Qué porcentaje de familias son de clase media?
2. Si queremos disponer de una información más completa, que nos permita
obtener las respuestas a las preguntas anteriores y además hacer más fácil
y detallado el análisis de los resultados, debemos ampliar la tabla básica
añadiéndole otras columnas; en concreto, las frecuencias absolutas
acumuladas y las frecuencias relativas, tanto ordinarias como
acumuladas.
n = número de la muestra o número total de datos.
xi= variable estadística, número de caries.
fi = frecuencia absoluta, número de veces que se repite la variable.
Fi = frecuencia absoluta acumulada. Vamos sumando los valores de la
frecuencia absoluta.
fr = frecuencia relativa. Cociente fi/n.
Fr = frecuencia relativa acumulada. Cociente Fi/n.
3. Ejemplo: Se ha observado el número de caries de 22 alumnos de una clase. Los
resultados son:
2,0,1,2,4,0,1,3,4,2,0,0,1,3,2,2,0,0,1,0,2,3
La tabla de frecuencia para datos no agrupados quedaría de la siguiente manera:
Frecuencia Frecuencia
Frecuencia
No. De caries Frecuencia Frecuencia Frecuencia relativa relativa
absoluta
(xi) absoluta (fi) relativa (fr) relativa en % acumulada acumulada en
acumulada (Fi)
(Fr) %
0 7 7 0,318 31,8% 0,318 31,8%
1 4 11 0,182 18,2% 0,5 50%
2 6 17 0,273 27,3% 0,773 77,3%
3 3 20 0,136 13,6% 0,909 90,9%
4 2 22 0,091 9,1% 1 100%
4. Analicemos las columnas añadidas
n= 22
Frecuencias absolutas acumuladas:
La frecuencia absoluta acumulada del valor "2 caries" (N3) es 17, indica
que hay 17 niños que tiene 2 caries o menos.
Frecuencias relativas ordinarias y acumuladas:
La frecuencia relativa ordinaria de " 3 caries" (f4) es 0,136 ó 13,6% e
indica que el 13,6 de los niños (0,136 de cada uno) tiene 3 caries.
(f = n/muestra)
La frecuencia relativa acumulada de (f4) es 0,909 ó 90,9% e indica que el
90,9% de los niños tiene 3 caries o menos.
5. Cuando la muestra es grande es frecuente encontrar muchos valores de la
variable y resulta poco práctico numerarlos todos, en estos casos resulta
conveniente agrupar los valores en intervalos consecutivos llamados
clases. Estos intervalos son de la forma ( Li, Ls), cuyo extremo Li es el
límite inferior de la clase y el extremo Ls es el límite superior de la clase.
Se recomienda que el número de clases, sean entre 5 y 20.
Para construir una distribución de frecuencias en clases seguimos el
siguiente procedimiento aplicado al ejemplo: Los puntajes de un
examen de ingreso a la universidad realizado por 40 alumnos son
los siguientes:
110,102,108,115,120,130,93,124,112,102,110,108,108,109,11090,9
5,98,104,124,130,97,125,136,140,104,108,96,106,107,103,92,122,
93,99,107,105,103,115,110.
6. Paso 1.
Determinamos el rango " R" de variación de los datos que se define
como: R = Xmáx - Xmin, donde el primero es el dato máximo y el
segundo es el dato mínimo.
Para el ejemplo
Xmáx = 140 y Xmin = 90 entonces R = 140 - 90 = 50.
Paso 2.
Determinamos el número de intervalos o clases k.
k = raíz (n) es decir raíz (40) = 6,32
que también se redondea al entero siguiente quedando K = 7
7. Paso 3. Calculamos la amplitud de clase (A), que corresponde a la
cantidad de datos que van en esa clase, dividiendo el rango R entre el
número de clases k:
A = R sustituyendo A = 50 se redondea a 8. k 7
Paso 4. Construimos los intervalos o clases, como la variable es
cuantitativa discreta los intervalos o clases son cerrados, es decir
de la forma (Li, Ls).
Para formar las clases comenzaremos con los límites inferiores:
* En la primer clase tomamos Li 1 = Xmin ( el dato más pequeño)
* Para las demás clases el límite inferior se obtiene sumando la Xmin con la
amplitud, es decir:
Li n = Li n 1 + A. Para nuestro ejemplo = 90 y A = 8
8. entonces las 7 clases quedan:
Clases Cálculos Límites inferiores
Li 1 = Xmin 90 90
Li 2 = Li 1 + A 90 + 8 = 98 98
Li 3 = Li 2 + A 98 + 8 = 106 106
Li 4 = Li 3 + A 106 + 8 = 114 114
Li 5 = Li 4 + A 114 + 8 = 122 122
Li 6 = Li 5 + A 122 + 8 = 130 130
Li 7 = Li 6 + A 130 + 8 = 138 138
Para obtener los límites superiores se toma el valor anterior al límite
inferior de la clase siguiente y se va sumando la amplitud A = 8
Clases Li Límites superiores Ls
Ls 1 = Xmin-1+A 90 97
Ls 2 = Ls 1 + A 98 Tomar el 105
Ls 3 = Ls 2 + A 106 valor 113
Ls 4 = Ls 3 + A 114 anterior a 98 121
Ls 5 = Ls 4 + A 122 y sumamos 129
Ls 6 = Ls 5 + A 130 la amplitud 8 137
138 145
9. Finalmente ya podemos elaborar las clases con sus respectivas
frecuencias, recordando que cada clase abarca todos los valores que van
desde el límite inferior hasta el superior.
Clases f
90 7
98 - 105 9
106 - 113 13
114 - 121 3
122 - 129 4
130 - 137 3
138 - 145 1
Total 40
Datos ordenados:
90 92 93 93 95 96 97 98 99 102 102 103 103 104 104 105 106 107
107 108 108 108 108 109 110 110 110 110 112 115 115 120 122
124 124 125 130 130 136 140
10. Punto Medio
P.M = (Li + Ls)
2
se suman los límites de clase y el resultado se divide entre dos. dos
Para nuestro ejemplo obtendríamos los siguientes puntos medios:
Clases Mi f
90 93,5 7
98 - 105 101,5 9
106 - 113 109,5 13
114_121 117,5 3
122 - 129 125,5 4
130 - 137 133,5 3
138 - 145 141,5 1
Total 40
11. Límite real inferior (LRi) y Límite real superior (LRs). Se resta 0.5 al Li
para que de cómo resultado el límite LRi y se suma 0.5 al Ls para que de
cómo resultado el LRs.
Li Ls LRi LRs
90 97 89,5 97,5
98 105 97,5 105,5
106 113 105,5 113,5
114 121 113,5 121,5
122 129 121,5 129,5
130 137 129,5 137,5
138 145 137,5 145,5
Si sacamos las frecuencias con estos datos, la tabla de frecuencia para
datos no agrupados quedaría de la siguiente manera:
fi Fi Fr FR Li Ls LRi LRs P.M
7 7 17,50% 17,50% 90 97 89,5 97,5 93,5
9 16 22,50% 40,00% 98 105 97,5 105,5 101,5
13 29 32,50% 72,50% 106 113 105,5 113,5 109,5
3 32 7,50% 80,00% 114 121 113,5 121,5 117,5
4 36 10,00% 90,00% 122 129 121,5 129,5 125,5
3 39 7,50% 97,50% 130 137 129,5 137,5 133,5
1 40 2,50% 100,00% 138 145 137,5 145,5 141,5
12. Este tipo de medidas nos permiten identificar y ubicar el punto (valor)
alrededor del cual se tienden a reunir los datos (“Punto central”).
Aplicadas a poblaciones se les denomina parámetros o valores estadísticos
de la población. Son los principales métodos utilizados para ubicar el
punto central.
Media aritmética
Este estadístico es muy importante. Puede adoptar el nombre de promedio.
Se calcula sumando todos los datos individuales y dividiéndolo por el
número de datos de la muestra.
Ej. X = {1, 5, 12, 9, 6, 5, 10} Media = (1+5+12+9+6+5+10) / 6 = 48 / 6 = 8
13. Mediana
La consideraremos el valor central de una distribución de frecuencias.
De esta forma la mediana nos divide la distribución en dos mitades.
Ej. X = {1, 5, 5, 6, 9, 10, 12} Mediana = 6
Pero cuando la cantidad de números es par, se suman los dos valores
centrales es decir 6, 9 y el resultado se divide entre dos.
Ej. X = {1, 5, 5, 6, 9, 10, 12, 13} Mediana = 15/2= 7.5
Moda
Es el dato que tiene máxima frecuencia. No tiene por qué ser única.
Ej. X = {1, 5, 12, 9, 6, 5, 10} Moda = 5
14. Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la
mediana media. Cuanto mayor sea ese valor, mayor será la
variabilidad, cuanto menor sea, más homogénea será a la
mediana media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos.
15. Desviación media o Promedio (D.m)
Ejemplo: (1, 2, 2, 3, 3, 3, 4) n= 7
Se resta la Media Aritmética a cada uno de los números de la Población.
Luego se toma el valor absoluto de cada uno de los resultados y se suman.
El resultado de la suma se divide entre el número total de datos (n).
1 2,57 -1,57 1,57
2 2,57 -0,57 0,57
2 2,57 -0,57 0,57
3 2,57 0,43 0,43
3 2,57 0,43 0,43
3 2,57 0,43 0,43
4 2,57 1,43 1,43
suma 5,43 Desviación Media o Promedio = 0.77
16. Varianza (V)
Una forma de asegurar las diferencias entre la media y los puntos de un valor
positivo, es elevándola al cuadrado. Al promedio de estas distancias al
cuadrado se le conoce como varianza. Varianza (S2 ó σ2).
Tomando los datos anteriores.
Se resta la Media Aritmética a cada uno de los números de la Población.
Luego se toma el valor absoluto de cada uno de los resultados y se elevan a la
2 (2 potencia).
Se suman los resultados y ese resultado se divide entre el número total de
datos.
1 2,57 -1,57 1,57 2,46
2 2,57 -0,57 0,57 0,32
2 2,57 -0,57 0,57 0,32
3 2,57 0,43 0,43 0,18
3 2,57 0,43 0,43 0,18
3 2,57 0,43 0,43 0,18
4 2,57 1,43 1,43 2,04
suma 5,71 Varianza = 0.81
17. Desviación típica o estándar
Es la Raíz Cuadrada de la Varianza
Tomando los datos anteriores
Raíz de 0.81 = 0.9 Desv. Típica = 0.9
Coeficiente de variación (C.v)
Equivale a la razón entre la media aritmética y la desviación típica o estándar.
El coeficiente de variación permite comparar la dispersión entre dos
poblaciones distintas e incluso, comparar la variación producto de dos
variables diferentes (que pueden provenir de una misma población). Estas
variables podrían tener unidades diferentes, por ejemplo, podremos determinar
si los datos tomados al medir el volumen de llenado de un embase de cierto
líquido varían más que los datos tomados al medir la temperatura del liquido
contenido en el embase al salir al consumidor. El volumen los mediremos en
centímetros cúbicos y la temperatura en grados centígrados. El coeficiente de
variación elimina la dimensionalidad de las variables y tiene en cuenta la
proporción existente entre una medida de tendencia y la desviación típica o
estándar.
18. Coeficiente de variación (C.v)
Es igual a la desviación típica/la media.
Tomando los datos de los ejercicios anteriores
Media = 2.57 Desv. Típica = 0.9
C.v = 0,35
Elaborado Por: Sandra Reyes F.
Instructor. Carlos Ramírez
Gracias…