2. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
PROGRAMA DE ESPACIO CURRICULAR
UNIDAD I: Estadística
Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e
Inferencial. Variable: concepto. Clasificación de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso común: de escolarización, de analfabetismo, de desgranamiento, de
retención.
UNIDAD II: Presentación de dat os est adísticos.
Partes funcionales y construcción de tablas estadísticas. Elementos
estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas
estadísticas. Técnicas de representaciones gráficas. Reglas de
construcción. Gráficos según los distintos tipos de variables.
UNIDAD III: Medidas de resumen.
Medidas de tendencia central. Media aritmética, mediana y moda.
Comparación de media, mediana y moda. Distribuciones simétricas y
asimétricas. Medidas de dispersión. Rango, variancia y desviación
estándar y desviación mediana. Coeficiente de variación. Medidas de
localización. Percentiles y rango percentil. Aplicaciones.
UNIDAD IV: Nociones element ales de probabilidad. Inferencia
estadística.
Experimentos aleatorios: conceptos básicos. Probabilidad clásica,
frecuencial y axiomática. Teorema de la suma y del producto de
probabilidades.
Tabla de contingencia. Cálculo de probabilidades.
Distribución de probabilidades de variables aleatorias discretas:
Uniforme y Binomial.
Cálculo de probabilidad en variables aleatorias continuas: distribución
normal y distribución normal estándar.
Población. Definición de muestra aleatoria. Diseños de muestreo.
Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos.
Muestreo por conglomerados. Concepto.
Estimación puntual y por Intervalos de confianza para muestras
grandes en el Muestreo al Azar Simple.
2
3. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
UN I DADES I y I I
INTRODUCCIÓN
La palabra Estadística proviene del latín status (estado).
Precisamente la primera aplicación de la estadística consistió en la
recopilación de datos y la construcción de gráficos para describir el estado
de un país. Con el correr del tiempo esta herramienta fue evolucionando
hasta que en la actualidad podríamos decir que no hay aspectos de la vida
cotidiana donde no se aplique la Estadística. Hogares, gobiernos y
negocios se apoyan en datos estadísticos para dirigir sus acciones.
El objetivo que se persigue con este módulo es proporcionar al
docente herramientas y técnicas para obtener datos, procesarlos para
obtener información que sirva para la interpretación correcta de
fenómenos que se producen en su ámbito de trabajo.
ESTADÍSTICA. CONCEPTOS.
La Estadíst ica es una colección de métodos para planear
experimentos, obtener datos, y después organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).
Otra definición considera a la Estadística como una disciplina
perteneciente a la Matemática Aplicada que se dedica al estudio
cuantitativo de fenómenos colectivos. Proporciona los métodos para:
· La recolección de datos
· Su ordenamiento, resumen y presentación,
· Su análisis e interpretación y
· Posterior enunciado de conclusiones.
Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadístico.
La primera etapa tiene como objetivo recolectar datos proveniente de
medición, conteo u observación efectuado sobre el material objeto de
estudio en base a un plan formulado según los principios del diseño
experimental y las técnicas de muestreo.
3
4. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
La segunda etapa consiste en ordenar los datos en tablas estadísticas,
presentarlos mediante gráficos y diagramas y resumirlos a través del
cálculo de promedios, porcentajes e índices.
En la tercera etapa se analizan los resultados obtenidos en la etapa
anterior, y comienzan a distinguirse las características del fenómeno, lo
que permite utilizar diferentes métodos para analizarlos e interpretarlos.
En la última etapa se debe concluir acerca del estudio realizado.
Si las conclusiones, se refieren exclusivamente a los datos de los que
se dispone (una parte de la población que se desea estudiar), se dice que
la Esta dísti ca es Descriptiva .
Si por el contrario, las conclusiones van más allá de los datos que se
dispone y se refieren a un conjunto mayor (población), del cual se
extrajeron, se dice que la Esta dí stica es Inf erencial ; las conclusiones
van de lo particular (muestra) a lo general (la población).Esta se basa en el
estudio de la teoría de probabilidades que nos permite medir el error de
nuestras afirmaciones.
Las est adísticas (en plural) se obtienen como resultado del trabajo
estadístico y están constituidas por porcentajes, promedios, tablas,
gráficos y otros elementos que describen un fenómeno y ayudan a su
comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol,
estadísticas de accidentes de tránsito, estadísticas universitarias, etc.).
Es necesario definir algunos conceptos importantes: por ejemplo
Población. Se define población como el conjunto de individuos u
objetos que comparten una característica común, en la
que el investigador está interesado.
Muestra. Es un subconjunto de la población. Debe ser
representativa, es decir se deben mantener las mismas
características de la población en estudio.
Una población puede ser finita o infinita.
Población finita Una población finita es aquella que puede ser
físicamente listada
Población infinita. Una población es infinita, cuando en la práctica
no puede ser físicamente listada
4
5. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Ejempl o. Una población puede ser definida como los alumnos de la
escuela San Francisco. Los alumnos pueden ser listados e
individualizados a través de los registros áulicos. Es un ejemplo de
pobl a ción f inita .
Personas portadoras de SIDA en Santiago del Estero,
constituyen un ejemplo de pobl a ción i nfinita .
Unidad de observación: es aquélla sobre la cual se efectúan las
mediciones u observaciones. La unidad de
observación puede ser una persona, una familia, una
planta, una parcela, etc.
Dat o: es el valor que se obtiene de la medición, observación o conteo
efectuada en la unidad de observación o unidad de
muestreo.
Por ejemplo si el objetivo de una investigación es el rendimiento
de los alumnos, la unidad de observación es el alumno.
El número de materias rendidas contadas en un alumno es el
dato.
El conjunto de datos obtenidos de cada unidad de observación
constituirá la base para el análisis estadístico del rendimiento de los
alumnos de la escuela San Francisco.
Va ri a bles. Concepto y ti pos.
Variable. Una variable es cualquier característica que varía de una
unidad de muestreo a otra en la población o en la
muestra
Ejempl o 1: Supóngase que interesa conocer la salud de los alumnos,
entonces la variable a observa r en cada alumno será el esta do de sa l ud,
el que podrá asumir dos valores: sano o enfermo.
Ejempl o 2: Si interesa saber el número de herma nos que posee
ca da a lumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,n
y se deberá contar cuantos hermanos posee cada alumno.
5
6. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada por
alumnos, se debe medir la variable altura la que, expresada en metros
podrá tener valores mayores a 1 metro.
En los tres ejemplos anteriores, el nombre de la variable y la forma
de obtener sus valores está resaltado en negrita. En el primer ejemplo, los
valores que puede asumir la variable son calidades, por lo que se dice que
la variable es cualitat iva. Las calidades o categorías pueden ser naturales
como al definir la variable sexo, o arbitrarias como la clasificación de
alturas en bajas, medianas y altas.
Por el contrario, en los otros dos ejemplos los valores que asumen
las variables pueden expresarse mediante números, por lo que las dos
últimas variables son cuant it ativas. En el caso de número de hermanos,
la variable toma sólo determinados valores en el intervalo que va de cero a
n por lo que se la denomina variable cuantitat iva discreta o
discontinua; cuando la variable toma los infinitos valores dentro del
intervalo se dice que la variable es cuantitat iv a continua
Otra forma de clasificación de las variables es mediante el empleo de
cuatro niveles de medición: nominal, ordinal, de intervalo y de razón.
Cuando se manejan datos reales el nivel de medición es importante ya que
orienta sobre el procedimiento estadístico a utilizar.
Un nivel de medición es nominal cuando los valores de variables
son nombres, etiquetas o categorías y no se puede establecer un orden
entre ellos.
Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de un
alumno. Aunque las ciudades pueden ser ordenadas según su tamaño,
densidad poblacional, grado de contaminación del aire, etc., en general, la
variable “lugar de nacimiento” no tiene un orden establecido
Con estos datos no es posible realizar cálculos. A veces se asignan
números a las diferentes categorías; a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numéricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada más que una
codificación y tales números no tienen significado computacional.
Un nivel de medición es ordinal cuando se puede establecer un
orden entre las categorías de la variable. Ejemplo: máximo nivel de
instrucción alcanzado por los padres de los alumnos: analfabeto, primario,
secundario, terciario, universitario.
6
7. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Lo único que podemos decir es que el nivel de instrucción
secundario es mayor que el primario y que el universitario es mayor que el
primario, secundario o terciario, pero no podemos decir cuanto mayor es
una categoría de la variable respecto a la otra.
Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.
Si bien se podría hacer la diferencia entre 21=1 y 43=1, este
resultado 1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.
Otro niv el de medición es el de int erv alo. En este nivel la
diferencia entre dos valores de datos tiene un significado. En este nivel no
hay un cero natural, donde nada de la cantidad esté presente. El valor del
cero es convencional
Ejempl o: La variable Temperatura está medida en escala de intervalo. Un
termómetro por ejemplo, mide la temperatura en grados que son del mismo
tamaño en cualquier punto de la escala. Aquí no existe un punto de partida
natural, el valor 0° es arbitrario y no representa la ausencia total de calor.
La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Se
pueden realizar operaciones de suma y resta pero no cociente entre valores.
Por último el nivel de medición de razón o cociente aunque se
parece al nivel de medición de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad está presente). Para
los valores en este nivel tanto las diferencias como los cocientes tienen
significado. En este nivel se pueden realizar todas las operaciones.
Ejemplo: Los precios de los libros de texto (0$ representa ningún costo y
un precio de $60 es dos veces más costoso que uno de $30).
7
8. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Datos
Variable Variable
Categórica o numérica o
cualitativa cuantitativa
Escala Escala Escala de Escala de
nominal ordinal intervalo razón
minal
Seri es de datos. Series si mples
El conjunto de valores de una variable constituye una serie de datos.
Se presentan a continuación series de datos referidas a los tres ejemplos
que se dieron para ilustrar tipos de variables:
Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Curso
de EGB1 de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).
Generalmente las variables se designan con las últimas letras del
abecedario en mayúscula por ej. X y los valores que toma la variable con x
minúscula; incluso se coloca x i donde el subíndice i indica el número de
individuo observado; de éste modo las 30 observaciones son:
x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,
S, S, S, S.
El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.
Ejempl o 2: Un maestro de la Escuela San Martín interroga a sus 30
alumnos de primer grado de EGB1 sobre el número de hermanos que
poseen.
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.
8
9. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .;
x30 =0.
Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Sección
Maternal de la Escuela San Francisco la que expresada en cm es la
siguiente:
xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,
74.
Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .;
x25 =74.
Los datos en brut o, t al cual fueron obt enidos, sin agrupar
const it uyen una serie simple.
Tablas y gráficos
Orga ni za ci ón de datos ca tegóricos o cua litativos.
Cuando la masa de datos obtenidos es muy grande y éstos están
desordenados, no dan información alguna; conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben
confeccionarse de tal modo que los datos resulten fáciles de ser leídos e
interpretados. Con los datos del ejemplo 1 se puede construir una tabla de
frecuencias.
Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa,
es una tabla que asocia cada categoría de la variable con el
número de veces que se repite la categoría.
Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, según
estado de salud. Año 2004.
i Categorías:xi Frecuencias: fi
(Estado de salud) (nº de alumnos)
1 Sano 24
2 Enfermo 6
Total 30
Fuente: Datos ficticios
9
10. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Frecuencia absoluta: Es el nº de veces que se repite cada categoría de la
variable. Se la simboliza con fi.
La suma de las frecuencias absolutas, es igual al nº total de observaciones,
2
å f i
en éste caso 30 ( = 1 =30). Nótese que “ i “ ahora se refiere a las
i
categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6.
La tabla de frecuencias, es la más sencilla de las tablas y es una
tabla de simple entrada pues los individuos se clasifican según una única
variable, estado de salud en el ejemplo
.
Los datos organizados en tabla de simple entrada para variable
cualit ativa, pueden presentarse mediante gráficos, que tiene la finalidad
de que la información entre por los ojos. El gráfico que puede usarse en
éste caso es el gráfico de barras.
Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,
según estado de salud. Año 2004.
30
25
Nº de alumnos
20
15
10
5
0
Sanos Enfermos
Estado de salud
Fuente: Datos ficticios
.
Para su construcción se utiliza el sistema de coordenadas
ortogonales. Sobre el eje horizontal se colocan las distintas categorías de la
variable en estudio (estado de salud) y sobre el eje vertical con una escala
adecuada, se representan las frecuencias. Se dibujan barras de ancho
1 0
11. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categoría. Es
conveniente que la separación entre las barras sea menor que el ancho de
las mismas.
El ancho de las barras debe elegirse teniendo en cuenta el espacio
disponible, el número de categorías de la variable a representar y la altura
que les corresponde, con el objeto de obtener un gráfico proporcionado.
Las barras pueden dibujarse en sentido vertical u horizontal.
Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,
según estado de salud. Año 2004
Estado de salud
Enfermos
Sanos
0 5 10 15 20 25 30
Nº de alumnos
Fuente: Datos ficticios
En algunos trabajos es necesario calcular frecuencias relativas.
Frecuencia relativa de una categoría es la proporción de veces que ocurre
dicha categoría.
Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la
suma de las frecuencias de todas las categorías. La suma en éste caso es
f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo å que
se denomina sumatoria, así
i = 2
å
i = 1
fi = f 1 + f 2 = 24 + 6 = 30
1 1
12. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
a la frecuencia relativa de la clase iésima se la simboliza con fri y se la
calcula de la siguiente manera:
f i
fr =
i
å f i
La suma de las frecuencias relativas es siempre igual a 1.
n
å fri = 1
i
=1
Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes.
En éste ejemplo sería:
Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, según
estado de salud. Año 2004.
i xi fi f ri Porcentajes:
(Estado de salud) %
1 Sano 24 24/30=0,80 80
2 Enfermo 6 6/30=0,20 20
Total 30 1.00 100
Fuente: Datos ficticios
Se pueden representar los datos de la tabla 2 mediante un gráfico de
barras, sólo que en el eje vertical van los porcentajes.
Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,
según estado de salud. Año 2004.
% 100
80
60
40
20
0
sanos enfermos
Estado de salud
Fuente: Datos ficticios
1 2
13. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Otro gráfico adecuado para representar series de frecuencias de
variable cualitativa es el gráfico de sectores circulares, llamado gráfico
de tortas o pie charts .
Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, según
sexo. Año 2004
Sexo fi f ri 360ºxf ri
(nº de
alumnos)
Varones 15 0,38 137º
Mujeres 25 0,62 223º
Total 40 1,00 360º
Fuente: Datos ficticios
Se elige un radio por ej 3cm (el valor del radio se elige según el espacio que
se disponga para el gráfico) y se grafica un círculo. La superficie de dicho
círculo representa el total de alumnos (40), en consecuencia, le
corresponde un ángulo de 360°. Se puede discriminar mediante sectores
circulares la porción que corresponde a las mujeres y a los varones. Los
grados correspondientes a los sectores se obtienen multiplicando la
frecuencia relativa por 360º.
Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,
según sexo. Año 2004
Varones
Mujeres
38%
62%
Fuente: Datos ficticios
1 3
14. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Va ri a bles cua ntitativa s.
Ejemplo: Nº de hermanos que tienen los alumnos de primer grado de
EGB1 de la escuela San Martín
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0
Para el caso de v ariables cuantitat ivas discretas, la tabla de
frecuencias se construye de la siguiente manera: se ubica el valor mayor y
el menor valor de la variable (en el ejemplo 2 del n° de hermanos por
alumno, el menor valor es cero y el valor mayor 6), se colocan todos los
valores correspondientes en la primera columna de la tabla, y luego se
cuentan las veces que se presentan dichos valores. La tabla resultante es:
Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martín
según Nº de hermanos
Xi fi Fi fr %
0 5 5 0,17 17
1 5 10 0,17 17
2 6 16 0,20 20
3 3 19 0,10 10
4 4 23 0,13 13
5 3 26 0,10 10
6 4 30 0,13 13
Total 30 1,0 100
Fuente: Datos ficticios
La diferencia que existe entre cada clase es constante e igual a 1.
Además de las frecuencias relativas (cuyo cálculo se explicó en
párrafos anteriores) aquí se puede calcular también las frecuencias
acumuladas Fi. La frecuencia acumulada de una clase se obtiene
sumándole a la frecuencia de la clase, la frecuencia de las clases
anteriores.
F (0)=5
F (1)=5+5=10
F (2)=5+5+6=16 = Fi (1)+6
La tabla de frecuencias para variables cuantitativas discretas se
representa mediante un gráfico de bastones. En la abscisa se colocan los
valores de la variable y se levanta para cada uno de ellos una línea de
altura igual a su frecuencia.
1 4
15. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 4. Alumnos de primer grado de EGB1 de la escuela San
Martín según Nº de hermanos
6
5
4
frecuencia
3
2
1
0
0 1 2 3 4 5 6
Número de hermanos
Fuente: Datos ficticios
Int erpretación:
El número 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos
El número 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos
El número 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos
Para el caso de variables cuantit ativas continuas como los datos
del ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de la
Escuela San Francisco) que fueron obtenidos por medición, se recomienda
construir intervalos de clase, cuya amplitud depende de la cantidad de
intervalos que se deseen construir y la cantidad de datos que posee la serie
simple. Es recomendable que los intervalos de clases sean iguales, es decir
que la amplitud de los mismos (a) sea constante. La técnica a emplear para
el agrupamiento de una serie simple de variable cuantitativa continua es
sencilla.
1 5
16. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,
78, 95, 99, 97, 84, 86, 78, 74
1. Se ubica el valor mayor que toma la variable (99 cm) y el valor menor
(70 cm).
2. Se obtiene la diferencia, la que se denomina Rango o amplitud de
variación y se designa con la letra R.
R = x - x = 99 - 70 = 29
max min
3.– El número de intervalos aproximado se puede calcular con la siguiente
fórmula:
log(n + 1)
n de intervalos =
°
log(2)
dónde n: n° de valores de la serie o tamaño de la muestra
log: logaritmo decimal
log( + 1
25 )
n °de int erv =
. = 4 7004 » 5 int ervalos
.
log( )
2
Cuando en la variable que se estudia existen intervalos predeterminados,
el número de clases o intervalos dependerá de la amplitud que se usa
habitualmente.
4. El rango se divide entre el nº de clases o intervalos de clases, 5 para
éste ejemplo, (se recomienda que el número de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
información y en el segundo no se cumple con el objetivo del
agrupamiento) obteniéndose una idea aproximada de la longitud o
amplitud del intervalo de clase.
Rango 29
a = = = 5 8 @ 6
.
n º de int ervalos 5
Éste valor de amplitud es orientativo, por lo que se decide tomar una
amplitud de intervalo 5 cm para facilitar el agrupamiento.
5. Se delimitan las clases buscando preferentemente valores enteros para
sus límites. Se debe elegir el límite inferior del 1er intervalo de tal manera
que contenga al menor valor de la serie (70 cm). La elección recae en el 70.
El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud.
1 6
17. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Li del 1er intervalo = 70
Ls del 1er intervalo = Li + a= 70 + 5 = 75
El límite inferior del 2do intervalo debe coincidir con el límite superior
del primer intervalo.
Li del 2do intervalo = 75
Ls del 2do intervalo Li + a= 75+ 5 = 80
El límite inferior del 3er intervalo debe coincidir con el límite
superior del 2do intervalo, y así sucesivamente, hasta que el límite superior
del último intervalo, contenga el valor observado más alto de la variable.
6. Una vez formadas las clases se procede al conteo, que consiste en
determinar el nº de observaciones (frecuencias) de cada clase. Una manera
sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas
cada valor de la variable en su clase correspondiente. De ésta manera
cuando se termine de pasar lista a la serie simple, el agrupamiento ha
sido efectuado.
Tabla 6. Alumnos de Sección maternal de la escuela San Francisco según
su altura.
Intervalo de clase xi fi fri
(altura en cm) (marca de clase)
70 a 75 72.5 4 0.16
75 a 80 77.5 5 0.20
80 a 85 82.5 4 0.16
85 a 90 87.5 5 0.20
90 a 95 92.5 1 0.04
95 a 100 97.5 6 0.24
Total 25 1.00
Fuente: Datos ficticios
Un problema que se puede presentar es el siguiente: si un valor de la
variable coincide con uno de los límites del intervalo, por ejemplo la altura
95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase?
La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se
elige un criterio se lo debe respetar hasta el final del agrupamiento. En
éste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera,
cuando aparezca por ejemplo un valor 85, debe ser anotado como
perteneciente al intervalo en el que el nº 85 se encuentra como límite
inferior. El intervalo de clase es cerrado en el límite inferior y abierto en el
superior. Esto se indica de la siguiente forma [75 80 los valores del
; )
intervalo van desde 75 a 79,9999.
1 7
18. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
7. Se agrega una tercera columna, titulada “marca de clase” o “punto
medio de clase” que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula así:
Li + Ls
1 1 70 + 75
x1 =
= = 72 5
,
2 2
Li + Ls 2 75 + 80
x 2 = 2 = = 77 5
,
2 2
También se puede calcular de la siguiente manera
x 2 = x + a = 72 5 + 5 = 77 5
1 , ,
Al efectuar el agrupamiento, se pierde detalle de la información ya
que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso
de ser necesario asignar un valor a cada uno de ellos, como es en el
cálculo de la media aritmética a partir de la tabla de frecuencias, se opta
por pensar que todos tienen igual valor, que es el correspondiente al punto
medio de clase.
Un gráfico adecuado para representar una serie de frecuencias de
variable cuantitativa continua es el hist ograma (gráfico nº 5). Su
construcción es fácil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias
(fi) y en el de las abscisas (horizontal), la variable según la cual se efectuó
la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada
clase) con bases materializadas por la amplitud de clases (5 cm). La altura
está dada por la frecuencia correspondiente a la clase. Cuando las clases
son iguales, el área del histograma es proporcional a la frecuencia total.
1 8
19. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco según
su altura
7
6
5
4
Nº alum.
3
2
1
0
70 75 80 85 90 95 100
Altura (cm)
Fuente: Datos ficticios
Otro gráfico adecuado para representar la serie de frecuencias de
variable cuantitativa continua es el polígono de frecuencias (gráfico 6).
Se emplea para su realización el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.
La construcción es sencilla, se marcan tantos puntos como pares de
valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la
tabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa
72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego se
unen los puntos mediante trazos rectos. Algunos autores, en su afán de
mantener la proporcionalidad entre la superficie y la frecuencia aconsejan
cerrar el polígono de frecuencias uniendo el primer punto con la marca de
clase inmediata anterior y el último punto con la inmediata superior; en
éstos dos casos la unión de los puntos se realiza con trazos cortados.
La principal ventaja de los polígonos de frecuencias consiste en que
ellos permiten dibujar en el mismo sistema de eje dos o más polígonos
correspondientes a series diferentes que tengan similar posición sobre el
eje de las x, así se puede compararlos, lo cual resulta engorroso efectuar
con los histogramas a causa de la superposición de las superficies de los
rectángulos.
1 9
20. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco según
su altura
7
6
Nº de alum nos
5
4
3
2
1
0
65 70 75 80 85 90 95 100 105
Altura(cm)
Fuente: Datos ficticios
Como cada miembro de una población presenta diversas
características, se puede necesitar clasificarlos de acuerdo a dos de ellas.
Cuando el número de individuos medidos es pequeño, se enumeran todos
los pares de observaciones, si alguno de ellos aparece dos veces, se lo
repite y la presentación suele hacerse de modo que una de las dos
variables esté ordenada.
Tabla 9. Alumnos de una escuela según su peso y altura.
Peso 39 40 41 42 43 43 44 45 50 52
(kg)
Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49
Fuente: Datos ficticios
Para representar estos datos que corresponden a dos variables
cuantitativas continuas se utilizan los g ráf icos de dispersión o scatter
plot , que se construye de la siguiente manera: se coloca una de las
variables en las abscisas o eje horizontal, por ejemplo la altura y la otra
variable, el peso, en el eje vertical, con sus escalas correspondientes, luego
se marcan tantos puntos como pares de valores (xi, yi) se tengan.
2 0
21. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 7. Alumnos de una escuela según su peso y altura
1,55
1,5
1,45
Al tura (m)
1,4
1,35
1,3
1,25
35 40 45 50 55
Peso (kg)
Fuente: Datos ficticios
Éste gráfico sirve para mostrar la relación entre las dos variables y
se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si
esto no ocurre puede utilizarse el gráfico lineal, que se construye de igual
manera que el anterior, con la única diferencia que se unen los puntos.
Éste gráfico, se suele emplear, especialmente, en los casos donde la
variable que se representa en el eje horizontal es el tiempo. De éste modo
se puede ver la evolución de la otra variable en el período considerado.
Pueden representar simultáneamente en el mismo gráfico dos o más
variables, como se observará al representar gráficamente los datos de la
tabla Nº 10
Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de
EGB1 de la Escuela San Martín según sexo
Meses N° de inasist.
Mujeres Varones
Marzo 3 4
Abril 5 7
Mayo 2 4
Junio 6 5
Julio 8 8
Agosto 4 5
Sept. 3 4
Octubre 4 3
Noviem. 5 2
Diciem. 1 6
Fuente: Datos ficticios
2 1
22. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A de
EGB1 de la Escuela San Martín según sexo
9
Mujeres
8 Varones
7
Nº de inas is tenc ias
6
5
4
3
2
1
0
M A M J J A S O N D
Meses
Fuente: Datos ficticios
Cuando los pares de valores son muy numerosos, las tablas se
presentan según lo muestra la tabla 11; en éste caso se dice que las tablas
son de doble entrada pues son dos las variables de clasificación.
Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia.
Ocupación Barrios Total
de la
Madre A B C
A. de casa 400 500 200 1100
Profesional 200 200 50 450
Empleada 300 400 100 800
Total 900 1100 350 2350
Fuente: Datos ficticios
En este ejemplo cada alumno se caracteriza según la variable
Ocupación de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).
2 2
23. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Los valores que se encuentran en la celda son frecuencias, es decir
representan la cantidad de alumnos que comparten las dos características.
Las partes de una tabla son:
La ma triz , formada por la primera fila, lleva los encabezamientos de las
columnas y / o la primera columna que titula a las filas.
El cuerpo constituido por celdas.
La información proporcionada por los valores de las celdas se completa
con la suministrada por los encabezamientos de las filas y columnas; en
las celdas se encuentra la frecuencia, es decir la cantidad de elementos o
individuos que poseen las dos características.
Por ejemplo el 100 de la última celda significa que en esa escuela hay
100 alumnos que viven en el Barrio C y cuyas madres son empleadas.
El gráfico que se utiliza para representar éste tipo de tablas es el
gráf ico de barra s compuesta s (gráfico 9) y el gráfi co de barra s
a grupa da s (gráfico 10).
Gráfi co de barra s compuesta s
La construcción del gráfico de barras compuestas es sencilla. Se
comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede
de la siguiente manera: se marca una barra de altura 900, en ella se indica
la subdivisión que corresponde a alumnos cuyas madres son amas de casa
con el valor 400; para marcar el nº de alumnos que es 200, se marca
400+200=600 en el eje vertical lo que queda corresponde nº de alumnos
cuyas madres son empleadas. De igual manera se procede con los barrios
B y C.
2 3
24. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Gráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia
1200
Empleada
Profesional
1000
Nº de alumnos A. de casa
800
600
400
200
0
A B C
Lu gar de r e sid en cia
Fuente: Datos ficticios
Gráfi co de barra s a grupa da s
Sirven para representar fenómenos similares a los que originan
barras compuestas. La diferencia con éstas estriba en que, para cada valor
de la variable independiente “x” en éste ejemplo lugar de residencia, se
dibujan grupo de barras . El número de barras en cada grupo es el del
número de categorías de la segunda variable, en este ejemplo ocupación de
las madres.
Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre y
lugar de residencia
600
A. de casa
Prof esional
500
Empleada
Nº de alumnos
400
300
200
100
0
A B C
Lu gar de r e sid en cia
Fuente: Datos fict ic ios
2 4
25. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Otro tipo de gráficos son los gráficos de figuras o pictogramas. Son
los más indicados para publicaciones de divulgación popular , por su fácil e
inmediata interpretación. Consisten en dibujos esquemáticos y
relacionados con el fenómeno a representar. Cada figura es equivalente a
una cantidad determinada, preferentemente entera, de unidades de la
variable dependiente y el número de unidades no su tamaño, es
proporcional a la magnitud a representar.
Cart ogramas: Se emplean cuando es importante señalar la
distribución geográfica de un determinado acontecimiento, razón por la
cual se construyen sobre planos o mapas.
Cart ogramas de señalización (Gráfico 11): Sirven para indicar la
distribución de una variable cualitativa sobre una base geográfica.
Mediante figuras, colores o diferentes rayados se señala que hay en
lugares determinados.
Gráfico 11. Qué es lo que caracteriza a cada provincia argentina.
Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005.
ISBN Nº987910126X
2 5
26. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
En este mapa, se observa lo que caracteriza a cada provincia
argentina. Por ejemplo en Santiago del Estero las aguas termales; en La
Pampa la producción de trigo, etc...
Cart ogramas de densidad: además de indicar que hay y dónde, de
ellos se puede obtener la información de cuánto hay. Mediante diferente
rayado o colores y también utilizando barras sobre la base geográfica, se
puede expresar la cuantía del fenómeno como así también su ubicación.
Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera de
los descriptos, sobre el mapa o plano.
Resumiendo: los datos se ordenan, clasifican y presentan en formas
de tablas. Las tablas pueden de ser de simple entrada(cuando los
individuos se clasifican según una variable), de doble entrada(cuando los
individuos se clasifican según dos características) y de triple o más
entradas (cuando se clasifican los datos según tres o más variables).Las
tablas se complican a medida que se agregan más variables, por lo tanto
es preferible varias tablas sencillas a una complicada.
Toda tabla debe llevar título, el cuál debe responder a las preguntas
¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?.
No se debe olvidar la fuente de datos que indica de donde proviene la
información.
Se debe incluir los totales.
En caso de expresar los datos en porcentajes, deben indicarse los
totales de los cuales provienen.
Con respecto a los gráficos, éstos constituyen una de las formas más
útiles de presentación de datos estadísticos. Su importancia reside en las
múltiples formas que pueden adoptar, lo que permite su aplicación a una
amplia gama de finalidades: didácticas, de investigación, etc. Sirven para
mostrar la relación entre una o más variables. La variedad de tipo de
representaciones gráficas exige una cautelosa elección de acuerdo a su
finalidad. La selección de la presentación gráfica debe, por lo tanto tener
los siguientes aspectos:
Tipo de análisis estadístico, características y número de los
fenómenos o variables a representar y público al que va dirigido.
2 6
27. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Recomendaciones para la construcción correcta de un gráfico.
Una vez elegido el tipo de gráfico adecuado, es conveniente no
descuidar las siguientes consideraciones:
· Decidir cuál de las variables es la independiente “x” y cuál la
dependiente “y”.
· La representación gráfica debe ser sencilla, simple y explicarse
por sí misma.
· Título se coloca encabezando el gráfico y debe responder a las
preguntas; qué, según, cuándo, dónde?.
· Fuente de datos. Se coloca al pie del gráfico.
· Escalas se elige de tal modo que no alteren la objetividad de la
representación, hecho éste muy utilizado para fines publicitarios
donde es común ver escalas construidas con el propósito de
alterar el fenómeno exagerando ventajas y enmascarando la
realidad, o lo que es peor aún eliminando la graduación de los
ejes, evitando de ésta forma todo patrón de comparación. Las
escalas deben construirse buscando obtener como resultado un
dibujo armónico y proporcionado.
· Debe nominarse los ejes de modo tal que no quede duda alguna
acerca de las variables que en ellos se representan.
· No olvidar el corte de ejes en caso de ser necesario. Éste debe
efectuarse entre el 0 y el valor mínimo a representar.
· Aclaración de las unidades de representación.
· Las referencias serán colocadas al pie o al costado del gráfico.
· En caso de usarse abreviaturas, éstas serán aclaradas con la
debida extensión, en el renglón siguiente al correspondiente a
las fuentes.
· En lo posible acompañar los gráficos con las tablas estadísticas
que lo originen.
· Si el tra ba jo lo requiere y es necesario expresar al gunos
va l ores en %, deben consignarse la s cifra s de la s cual es
provienen éstos porcenta jes.
2 7
28. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
ÍNDICES
El Índice es un indicador útil tanto para fijar situaciones como para
hacer un diagnóstico. Cuando interesa comparar los valores de una
característica de la educación (matrícula, asistencia de alumnos, número
de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos
valores entre sí o todos con uno de ellos se puede realizar un cociente cuyo
resultado se denomina Índice simple.
Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año
2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos y
la de 1994 es de 2000, el Indice será:
4000
I2004/1994= = 2
2000
Lo que indica que la matrícula en el año 2004 es el doble que la
matrícula de 10 años atrás, en esa escuela.
El valor que va en el denominador se llama ba se .
El Indice del año base es 1:
2000
I1994/1994= 2000 = 1
Con frecuencia se multiplica por 100 los índices con lo que entonces
los índices son los porcentajes correspondientes siendo 100 el porcentaje
del índice base.
Los Índices más comunes utiliz ados en educación son:
· Razón de alumnos mat riculados en las escuelas con respecto a la
población en edad escolar.
N °alumnos matriculad os
I=
Población en edad escolar
2 8
29. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Ejemplo: En el año 2001, en la localidad de La Banda según el INDEC, la
población en edad escolar fue de 88735 y los alumnos matriculados fue de
32613. La razón de alumnos matriculados es entonces en ese año de:
32613
I= = 0 37
.
88735
Es decir que solo el 37% del total de la población en edad escolar asiste a
la escuela.
· Alumnos por maestro en las escuelas primarias.
N °
alumnos
I=
N °maestros
Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel
docente informa que hay 40 maestros( Datos ficticios), la razón alumnos
por maestro es:
1000
I= = 25
40
Es decir que en esa escuela hay 25 alumnos por cada maestro.
· Porcentaje de población analfabeta de 15 años y más.
N °
analfabeto .de 15
s años y más
I= *
100
Población de 15 años y más
Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año
2001 el total de población de 15 años y más fue de 571546 personas. De
ellas, 31625 no tenían ninguna instrucción.
El Porcentaje de población analfabeta para la provincia es entonces,
31625
I= *
100 = 5 53
. %
571546
2 9
30. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
· Tasa de ausentismo de docent es
Es el porcentaje de ausentismo de docentes en un período de tiempo
determinado.
N º de días de ausencia de todos los docentes un período
en
Ta= * 100
N º de días de clase de todos los docentes en ese período
Ejemplo: Si en una escuela hay una planta docente de 115 personas y el
total de inasistencias de los docentes(por diversas causas) en el año es de
3101días, la Tasa de ausentismo se calcula como sigue(considere que los
días de clase en el año son 180):
3101
Ta= * 100 = 14 98
. %
115 * 180
· Tasa de desgranamiento
Es la proporción de alumnos ingresados al primer grado (o curso) que no
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido.
N º de alumnos que no cul aron sus estudios en el período establecid
min o
Td = * 100
N º de alumnos matriculad al inicio del período
os
Ejemplo: Si en el estudio de la cohorte 19741980 el número de alumnos
matriculados en la Argentina en la escuela primaria al inicio del período es
de 729048 y los que no culminaron sus estudios es de 337292 (Fuente:
Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. TroquilBs.As.
1996Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año 1999)
la Tasa de desgranamiento es: 337292
Td= 729048 = 0 46
.
Es decir que en ese período hay un desgranamiento del 46%.
El 46% de los alumnos matriculados al inicio del período no culminaron
sus estudios al final del mismo.
3 0
31. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
· Tasa de retención de la cohort e
Es la proporción de alumnos ingresados al primer grado (o curso) que
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el período establecido.
N º de alumnos que cul aron sus estudios en el período establecid
min o
Tr = *
100
N º de alumnos matriculad al inicio del período
os
Ejemplo: Si en el mismo período considerado en el ejercicio anterior
terminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasa
de retención será:
391756
= 0 5374
.
Tr= 729048
Es decir que la Tasa de retención es aproximadamente del 54%.
El 54% de los alumnos matriculados al inicio del período culminaron
sus estudios al final del mismo.
· Tasa de escolarización
Proporción de la población en edad escolar que está efectivamente
escolarizada
N º de alumnos matriculad
os
Ez = *
100
Población en edad escolar
Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001
según el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.
La Tasa de escolarización es:
237708
I= *
100 = 33 63
. %
706794
Es decir que el 33.63% de la población en edad escolar asiste a la escuela.
3 1
32. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
GUÍA DE EJERCITACIÓN
Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas
Variable Tipo
1 Religión
2 Nº de alumnos promocionados por
curso
3 Barrios
4 Nivel de educación alcanzado por el
tutor
5 Edad de los alumnos
6 Sexo
7 Nº de inasistencias mensuales
8 Altura de los alumnos
9 Lugar de nacimiento
10 Peso de los alumnos
11 Horas de estudio diario
12 Nº de materias que cursan
13 Nº de hermanos que tiene cada
alumno
14 Grado de satisfacción por la
asignatura
15 Superficie construída por escuela
16 Nº de escuelas por Departamento
17 Categorías de escuela
3 2
33. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Actividad 2
Los siguientes datos corresponden a Nº de inasistencias de los
alumnos de un curso correspondientes al primer cuatrimestre
xi : 8 5 3 4 2 5 4 4 10 6
6 7 5 5 3 9 7 2 6 4
9 4 5 0 8 6 5 1 1 4
5 7 2 7 6 4 9 4 5 3
a) ¿Que indica el subíndice i?
b) ¿Cuál es la variable que se estudia?. Clasifíquela.
c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
¿Cómo construye el mismo?
d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas,
porcentaje y porcentaje acumulado correspondiente a cada valor de
la variable.
e) Presente los resultados con el gráfico apropiado.
Actividad 3
En un curso de 50 alumnos de un establecimiento de la Capital del a
Pcia. De Sgo. Del Estero, se empleó la técnica de profundización de temas
por grupo en el desarrollo de contenidos teóricos. Se distribuyó un
cuestionario con la finalidad de determinar la actitud de los mismos ante
esta modalidad de estudio. Una de las preguntas estaba referida al grado
de conformidad sobre el desarrollo de los contenidos teóricos.
Los resultados obtenidos fueron los siguientes:
xi :
MC MD C I C MC D D MC MC
I MC I MC D MC MD C D C
MC D MC D MC D MD I C C
C MD MC I C MC MC D C MC
C MC D MD MC I D MC I MC
Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme
3 3
34. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
a) Indique el tamaño de la muestra
b) Ud. debe representar al establecimiento en una reunión de
profesores en la que participan distintos Colegios de la Capital.
¿Como presentaría la opinión del alumnado?
c) Que título colocaría a la presentación?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un gráfico de barras simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso de
respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos
Actividad 4
En un estudio realizado en el Instituto Santo Tomás de Aquino para
determinar la zona de influencia del mismo según el lugar de residencia de
los alumnos, los resultados obtenidos fueron los siguientes:
Alumnos del Instituto Santo Tomás de Aquino según el barrio en el que
residen.
Barrios Número de alumnos
Barrio Belgrano 300
Barrio Cabildo 150
Barrio Contreras 30
Barrio Ejército Argentino 20
Total 500
Fuente: Datos ficticios
a) ¿Que representa el número 500?
b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable
se trata.
c) Obtenga frecuencias relativas y los porcentajes correspondientes.
d) Determine si corresponde calcular frecuencias acumulada.
e) Realice gráfico de tortas.
f) ¿Qué otro gráfico puede emplear para representar estos datos?
3 4
35. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Actividad 5
Los siguientes datos corresponden a la edad de los tutores de alumnos que
concurren al EGB de un establecimiento escolar
xi :
44 30 45 48 31 45 33 35 54 44
45 47 38 56 29 43 43 62 60 30
52 36 45 31 31 32 34 32 54 55
55 46 61 39 43 38 47 45 38 37
63 49 34 48 34 64 44 47 36 60
50 52 37 41 29 37 49 37 39 56
39 46 46 31 60 29 53 40 41 58
Presentar los datos :
a) En una tabla con un número aproximado de intervalos de clase.
b) En una tabla con 5 intervalos
c) ¿Que gráficos utilizaría para representar los datos contenidos en
estas tablas?
d) Con la tabla presentada en el item b, realice un histograma.
e) Con la tabla presentada en el item a, realice un polígono de
frecuencias.
Actividad 6
Los siguientes datos corresponden a alumnos analfabetos por
Departamento en la Pcia. de Santiago del Estero, discriminados por sexo.
Año 2001
Departamento Total Sexo
Varones Mujeres
Capital 4587 2299 2288
Banda 4752 2461 2291
Río Hondo 3473 1960 1513
Robles 2116 1166 950
FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.
En base a los datos proporcionados en la tabla anterior realice:
a) Gráfico de barras simples que muestre el número total de alumnos
analfabetos por Departamento. ¿Que otro tipo de gráfico podría
utilizar en la representación?
b) Gráfico de tortas que muestre el número de alumnos analfabetos
discriminados por sexo para el Departamento Robles.
c) Realice un gráfico de barras agrupadas por Departamento
3 5
36. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
d) Realice un gráfico de barras porcentuales por Departamento
discriminando dentro de cada una de ellas los porcentajes de
varones y mujeres analfabetos.
Actividad 7
Utilice un gráfico lineal para mostrar la evolución de egresados del
Polimodal
Año Nº de
egresados
1980 233
1985 278
1990 321
1995 375
2000 391
FUENTE: Datos ficticios
Actividad 8
En base a los datos de la siguiente tabla:
Población en edad escolar, Nº de alumnos matriculados y Nº de maestros
correspondiente a cuatro lugares de la República Argentina.
Lugar Población en Nº de Nº de Nº de
edad escolar alumnos alumnos no maestros
matriculados matriculados
A 300000 248.000 7.000
B 150000 106.000 4.000
C 25000 24.000 1.200
D 160000 142.000 4.750
Fuente: Datos Ficticios
Calcular para cada lugar:
a) Proporción de alumnos matriculados
b) Nº de alumnos por maestro
c) Tasa de escolarización
d) Número de alumnos No matriculados
e) Porcentaje de alumnos No matriculados
3 6
37. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Actividad 9
Dada la siguiente tabla, calcule la retención y el desgranamiento de cada
cohorte y en base a los resultados realice el análisis correspondiente
Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3
ciclos escolares del período 19641980
Ciclo Escolar Alumnos matriculados
1er Grado 7º Grado
1964 1970 723.264 321.940
1969 1975 751.049 375.723
1974 1980 729.048 391.756
Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil
Bs.As.1996Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:
Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.
Año
a) Calcule la tasa de desgranamiento
b) Calcule la tasa de retención
c) Interprete los resultados obtenidos
Actividad 10
La siguiente tabla fue extraída del Censo Nacional de Población, Hogares y
Vivienda . 2001.
Población de 10 años y más de departamentos de Santiago del Estero, por
condición de alfabetismo y sexo. Año 2001.
Provincia Población Condición de alfabetismo
de 10 años Alfabetos Analfabetos
y más Total Varones Mujeres Total Varones Mujeres
Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685
Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288
Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291
Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513
Hondo
Copo 19.241 17.264 9.156 8.108 1.977 948 1.029
a) Calcular la tasa de analfabetismo de los distintos Departamentos que se
muestran en la Tabla.
b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que la
población total de Santiago del Estero, según el Censo del año 2001 es de
804.457 ?
3 7
39. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
UN I DA D I I I
MEDIDAS DE POSICIÓN Y DISPERSIÓN
INTRODUCCIÓN
En todo trabajo estadístico luego de recolectar los datos, ordenarlos,
agruparlos en tablas y presentarlos gráficamente, es preciso extraer alguna
información que caracterice a la población de la cual se los extrajo.
Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las
medidas de posición y variación más utilizadas para caracterizar a la
población en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultados a través del pensamiento crítico.
Los métodos de éste capítulo suelen denominarse métodos de
estadística descriptiva, porque su objetivo es resumir o describir las
características importantes de un conjunto de datos. Éstas características
se refieren al centro, variación, distribución, datos distantes y cambios a
través del tiempo.
1. Medida s de posición
Supongamos que una directora está preocupada por las notas
obtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá es
tener una idea de si las notas de una muestra de alumnos se ubican cerca
de la calificación cinco o cerca de la calificación nueve. Necesita resumir
los datos y calcular alguna medida que sirva para que, con un único valor
sencillo y representativo pueda establecer si los alumnos se posicionan
cerca de una calificación de 5 puntos o si por el contrario se posicionan
cerca de la calificación de nueve puntos; a estas medidas se las denominan
Medidas de Posición, y si además indican el centro de ése conjunto de
valores, se denominan Medidas de posición y tendencia central.
Se conocen varias formas de determinar el centro de un conjunto de
datos. A continuación, se indicarán tres que son las más comúnmente
utilizadas: media, mediana y modo.
3 9
40. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
1.1. Media aritmét ica
La media (aritmética) es la medida de posición y tendencia central más
empleada para describir los datos; constituye lo que la mayoría de la gente
denomina promedio. Es quizás la más conocida y usada.
La media aritmética en una serie simple de datos, se la obtiene al dividir la
suma de todos los valores de la variable entre la cantidad de valores
sumados. A la media aritmética se la representa con x :
a)Cálculo de las media aritmética en series simples
Ø Ejempl o 1
Se registró los días de inasistencias en un año, de una muestra de cinco
alumnos del primer ciclo del EGB y se desea averiguar cuál es el promedio
de inasistencias de esa muestra. La variable en estudios es:
X = nº de inasistencias de los alumnos
Los valores de la variable son:
xi : 0; 16; 12; 5; 7
5
0 + 16 + 12 + 5 + 7 x + x 2 + x + x + x
å x i
i
x = = 1 3 4 5
= =1
5 5 5 ,
y su fórmula de cálculo es la siguiente
n
å x i
i
=1
x =
n 2.1
En la fórmula se utiliza la letra griega å (sigma mayúscula) que indica
que los valores de la variable deben sumarse.
El símbolo n denota el tamaño de la muestra, que es el número de
alumnos observados.
Cuando los datos provienen de una muestra el símbolo de la media
aritmética es x (se denomina “x barra”); si se calcula la media aritmética
con los datos de toda la población se simboliza con
N
å x i
i
=1
m =
N 2.2
4 0
41. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
å denota la sumatoria del conjunto de valores.
xi expresan los diferentes valores que toma la variable.
n tamaño de la muestra, cantidad de valores observados
N tamaño de la población
Como nuestros datos constituyen una muestra para calcular la
media utilizamos la fórmula 2.1
5
å x i
i
=1 0 + 16 + 12 + 5 + 7 40
x = = = = 8
5 5 5
Int erpretación: Los alumnos tienen en promedio 8 inasistencias por año.
Algunas propiedades de la media aritmética
1La media aritmética es reproductora del total.
2 Si llamamos desvío a la diferencia entre un valor y la media aritmética
å (d i ) = å (x i - x ) = 0
x i d i = x - x
i
0 0 – 8 =8
5 5 8 =3
7 7 8 =1
12 12 – 8 = 4
16 16 – 8 = 8
Total 0
Una desventaja de la media es su sensibilidad a valores extremos, de modo
que un valor excepcional puede afectarla de una manera drástica, en este
caso no representa en forma adecuada al centro de dicho conjunto y tiende
a dirigirse a ese valor extremo.
Si por equivocación al pasar los datos en el ejemplo de las inasistencias de
los 5 alumnos colocamos 66 en vez de 16:
Ø Ejempl o 2
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7
4 1
42. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
La inasistencia promedio toma el valor 18, alejándose el promedio
hacia al valor extremo 66.
5
å x i
i
=1 0 + 66 + 12 + 5 + 7 90
x == = = = 18
5 5 5
La media aritmética no representa el centro del conjunto de datos.
Este problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.
La medi a aritmética se puede cal cula r cua ndo los val ores de
la s varia bles son cua ntitativos ta nto conti nuos como discretos.
1. 2 Mediana.
La mediana (de un conjunto de datos):es una medida de tendencia
central que divide a la serie ordenada de datos en dos partes iguales, de tal
forma que el 50% de los datos son menores o iguales a la mediana y el otro
50% mayores o iguales a ella. La mediana se designa con Me.
a) Cálculo de la mediana en series simples
Ø Ejempl o 3
Ø Se va n a consi derar dos ca sos: cua ndo el ta ma ño de la
muestra es i mpar y cua ndo n es par
Ø
Se desea determinar el valor mediano de las inasistencias de los alumnos
del ejemplo 2,
El tamaño de la muestra, “n” es impar.
X: inasistencias de alumnos
xi : 0; 66; 12; 5; 7
Para su cálculo debemos ordenar primero los datos en forma
ascendente o descendente.
Si el número de observaciones es impar, la mediana es el valor de la
variable que se localiza exactamente en la mitad de la lista.
En caso de que el número de observaciones fuera par, el valor de la
4 2
43. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
mediana se obtiene promediando los dos valores centrales.
Esos valores centrales se posicionan en el lugar
n + 1
2
Solución. Primero se ordenan los datos
0; 5; 7; 12; 66.
La muestra posee tamaño impar n = 5 y el valor mediano está posicionado
en el lugar
5 + 1 6
= = 3
2 2
, o sea que el valor de la mediana es el valor de la variable ubicado en el 3º
lugar.
0; 5; 7; 12; 66.
Me = 7 inasistencias
Int erpretación: el 50% de los alumnos tiene inasistencia menores o
iguales a 7.
Ø Ejempl o 4
En el caso de que n sea par
Supongamos que contamos las inasistencias de 6 alumnos.
X = inasistencias de alumnos
xi : 0; 66; 12; 5; 7;10
Solución. Primero se ordenan los datos
0; 5; 7; 10; 12; 66.
Las muestra posee tamaño par n = 6,
6 + 1 7
= = 3 5
,
Posición de los valores centrales 2 2
Los valores centrales ocupan el tercer y cuarto lugar, la mediana se
obtiene como el promedio de los dos valores centrales:
4 3
44. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
0; 5; 7; 10; 12; 66
7 + 10
Me = = 8 5 » 8
,
2
Int erpretación: el 50% de los alumnos tienen inasistencias menores o
iguales a 8.
Deben quedar claro dos conceptos:
Primero: La mediana no se ve influenciada por los valores extremos, ya
que en su cálculo interviene el orden y no la magnitud de los valores.
Segundo: la media aritmética es sensible a valores extremos.
La medi a na se puede determinar para va ria bles cua ntitati va s
continua s discreta s y para varia bles cua litati va s que se miden en
esca l a ordi nal.
1. 3. Modo.
El Modo es el valor de la variable que ocurre con mayor frecuencia.
Se designa frecuentemente como Mo.
Se debe hacer notar aquí que el Mo es un valor de variable y la
frecuencia de este valor sugiere su importancia estadística.
Cuando dos valores ocurren con la misma frecuencia y ésta es la
más alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.
Cuando más de dos valores ocurren con la misma frecuencia y ésta
es la más alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.
Cuando ningún valor se repite, se dice que no hay moda.
Ø Ejempl o 5 .
Calcule las modas para los siguientes conjuntos de datos:
Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6
Serie B: 4; 5; 3; 4; 6; 8; 5
Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99
Serie D: 1; 2; 3; 6; 7; 8; 9; 10
4 4
45. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Solución:
En l a seri e A. El número 4,5 es la moda pues es el valor que ocurre con
mayor frecuencia(2 veces).
En l a seri e B. Los números 4 y 5 son modas, ya que ambos ocurren con
la frecuencia más alta (2 veces).
En l a serie C. Los números 27 y 55 son modas, ya que ambos ocurren
con la frecuencia más alta (3 veces).
En l a seri e D. No hay moda, ya que ningún valor se repite.
En reali da d, l a moda no se utiliza mucho con da tos numéricos.
Sin embargo, entre l a s di stinta s medi da s de tendencia central que
consi dera mos, la moda es la úni ca que puede usarse cua ndo se trata
de va ri a bles cualitativa s nominal es.
Ø Ejempl o 6 .
Una encuesta efectuada a estudiantes mostró que el 84 tiene
aparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductor
de DVD. En tanto que el televisor es el aparato más frecuente, es posible
afirmar que la moda es el televisor.
No podemos calcular una media o mediana para datos como éstos,
cualitativos a nivel nominal.
3. Cálculo de las medidas de posición en series de frecuencias
Veremos como se calculan la medidas de posición y tendencia central
cuando los datos están agrupados en una serie de frecuencias.
3.1. Variables agrupadas en serie de frecuencias simple
3.1.a. Media aritmética.
Como en una serie de frecuencias, fi nos indica las veces que se repite el
valor de la variable, debemos considerarlas en el cálculo de la media
aritmética.
4 5
46. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
Ø Ejemplo 7
Una maestra esta interesada en conocer el número promedio de hermanos
de su alumnos. Para ello tomó de una muestra de 25 alumnos.
Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmiento
clasificados según el número de hermanos
Nº de hermanos Nº de alumnos
(x i) (fi)
0 1
1 9
2 7
3 5
4 3
Total 25
Fuente: Datos ficticios
Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve
veces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma
entre 25 que es el tamaño de la muestra.
xi: nº de hermanos
fi : número de alumnos que poseen xi hermanos
25
å x i
i
=1 0 + 1 + 1 + 2 + 3 + 4 + 4 50
... ... ... ...
x == = = = 2
25 25 25
Pero, este cálculo se podría realizar en forma más simple y es
obtener esa misma suma reemplazándola por la multiplicación. Utilizando
la frecuencia fi que indica las veces que se repite el valor de la variable xi.
x f 1 + x 2 f 2 + ... + x 5 f 5
i
x =
f 1 + f 2 + ... + f 5
ahora expresando literalmente la fórmula de la media aritmética tenemos
n
1
x = å x i f i
n i =1
Este promedio se conoce como media aritmética ponderada. Para
poder calcular la media aritmética ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna
4 6
47. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
auxiliar que facilitará el cálculo de la media.
Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmiento
clasificados según el número de hermanos
Nº de hermanos Nº de alumnos xi*fi
(xi) (fi)
0 1 0
1 9 9
2 7 14
3 5 15
4 3 12
Total 25 50
Fuente: Datos ficticios
x =
1 n
å x i f i .
= 1 50 = 2
25
n i =1
Podemos concluir diciendo que los alumnos de tercer año de
polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.
3.1.b. Mediana
Una maestra esta interesada en conocer la mediana del número de
hermanos de una muestra de 44 alumnos que concurren a una escuela
rural.
Tabla 3. Alumnos de una Escuela rural clasificados según el número de
hermanos
Nº de hermanos Nº de alumnos
(x i) (frecuencia, fi)
2 5
3 5
4 30
5 4
Total 44
Fuente: Datos ficticios
En esta serie de frecuencias de variable cuantitativa discreta, los
datos ya están ordenados, por lo que solo resta encontrar el valor central,
cuya posición se encuentra en el lugar
n + 1 44 + 1 45
= = = 22 5
,
2 2 2
4 7
48. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE
O sea el valor mediano será el promedio de los valores de la variable
ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes
pasos:
1.Calcular las frecuencias acumuladas correspondientes a cada valor de
la variable.
2.Calcular el orden de localización de la mediana efectuando el cociente
n + 1 44 + 1 45
= = = 22 5
,
2 2 2
donde n = tamaño de la muestra
Tabla 4. Alumnos de una Escuela rural clasificados según el número de
hermanos
Nº de hermanos Nº de alumnos Frecuencias
(x i) (frecuencia, fi) acumulada (Fi)
2 5 5
3 5 10
4 30 40
5 4 44
Total 44
Fuente: Datos ficticios
Como el valor de la mediana se encuentra entre la posición 22 y la
posición 23, se busca en la columna de frecuencias acumuladas, el menor
valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y
el menor valor que contiene a 23 (es 40), al que corresponde el valor de
variable 4.
Por lo que el valor mediano es el promedio de los dos valores
centrales.
4 + 4
Me = = 4
2
Int erpretación: el 50 % de los alumnos de escuelas rurales, tienen 4
hermanos o menos.
4 8