SlideShare ist ein Scribd-Unternehmen logo
1 von 17
Downloaden Sie, um offline zu lesen
1
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 1
1.1 Introducción
La ciencia matemática representa para el saber humano uno de sus principales pilares en la
construcción del conocimiento. Es difícil no encontrar alguna aplicación de las matemáticas
en el quehacer humano. Las matemáticas en ciencias sociales, al igual que en otras áreas
del saber científico representan una herramienta medular para adquirir y consolidar el
conocimiento. Peña [ ] nos señala tres razones que en buena medida justifican la
importancia de las matemáticas en las ciencias:
i) En primer lugar, las matemáticas obligan a definir claramente las variables de interés
en cada problema, a establecer hipótesis sobre su comportamiento y a definir las
relaciones entre ellas.
ii) En segundo lugar, el lenguaje matemático permite importar a las ciencias sociales
modelos de relación entre variables que han tenido éxito en otras ciencias, ofreciendo
nuevas posibilidades de explicación de los fenómenos sociales y enriqueciendo el
conjunto de modelos disponibles para investigar la realidad.
iii) En tercer lugar, la creciente disponibilidad de datos, debido a la difusión de
ordenadores y la automatización en todas las actividades humanas, permite contrastar
con mayor rigor los modelos sociales en la práctica mediante los métodos estadísticos
y generar predicciones y reglas de comportamiento verificables con los datos.
El lenguaje y formalidad existente en matemáticas permite indagar sobre posibles reglas
generales de comportamiento de los fenómenos objeto de estudio, dando lugar a posibles
predicciones con validez científica. Sin embargo debemos mencionar que el grado en que
se puede utilizar las matemáticas como herramienta de análisis, depende poderosamente de
que tan posible es medir las distintas variables de interés y entender las reglas que rigen las
relaciones entre ellas. El nivel en que la ciencia matemática se aplica en otras áreas, se
encuentra íntimamente relacionado a esto. Así, cualquier asunto que sea observable y
cuantificable, se traduce en conocimiento e información.
1.2 Definición.
Dentro de las ramas que conforman la ciencia matemática, la estadística es relevante por su
aplicación a una gran cantidad de disciplinas científicas y que además permite el
2
intercambio de resultados entre ellas, potenciando los estudios multidisciplinares. Ello se
debe en buena medida a la facilidad que permiten los equipos de cómputo de manejar
enormes volúmenes de información en tiempos razonables hoy día. Sin llegar a una
definición formal, podemos decir que la estadística es aquella ciencia que mediante la
recopilación, organización y análisis de datos, interpreta y comunica resultados para la
toma de decisiones o para explicar si las condiciones del fenómeno (aleatorio o
determinístico) estudiado, se pueden establecer como regulares o no. De acuerdo a Wayne
[3], el trabajo estadístico busca alcanzar uno o dos de los siguientes objetivos:
1 Describir cuantitativamente una serie de personas, lugares o cosas
2 Dar información de la que se pueda sacar conclusiones acerca de un grupo grande de
personas, lugares o cosas, por medio de la observación de sólo una pequeña parte del
conjunto total.
El trabajo estadístico al que se refiere el primer objetivo, es el que se conoce con el nombre
de estadística descriptiva y aquellas enfocadas en el segundo se denominan estadística
inferencial, que se basa en los fundamentos de la teoría de la probabilidad.
1.3 Terminología estadística básica
Antes de pasar al trabajo con los datos, conviene definir algunos términos fundamentales
que utilizaremos en esta parte del curso. Esto facilitará el entendimiento de conceptos y
técnicas que ocuparemos a medida que se vayan presentando.
 Entidad. Es el conjunto de personas, lugares, cosas etc., que son objeto de estudio.
Así por ejemplo, hombres y mujeres sin educación básica en un país. Población de
cierta especie de cactus que habita en el desierto de Sonora o pacientes con
enfermedad del corazón entre los 40 y 50 años. En términos generales entenderemos
por entidad, a un miembro individual del conjunto objeto de análisis.
 Variable. Es el conjunto de características atribuibles a las entidades estudiadas.
Por ejemplo, un químico fármaco-biólogo puede estar interesado en alguna
propiedad curativa del cactus de Sonora. Un médico podría estar buscando conocer
el nivel de colesterol en sus pacientes enfermos del corazón o al ministerio de
educación de algún país le interesa conocer el número de individuos analfabetas
para el diseño de políticas públicas. Cualquiera de estas características, en términos
generales presenta un valor diferente en cada entidad observada.
 Variable aleatoria. Si los valores que toma una variable son producto de factores
fortuitos de manera que no se pueda estimar con anticipación ninguno de ellos,
dicha variable se conoce como variable aleatoria (v.a.). Para la representación de
3
una v.a. utilizamos (aunque no son la únicas) letras mayúsculas como X, Y, y Z. Si
por ejemplo llamamos X al nivel de colesterol, los niveles individuales de colesterol
los denominamos, x1, x2,…,xn , donde los subíndices distinguen a un valor de otro y
n representa el número total de individuos de la v.a. Es importante mencionar que
las variables también se pueden distinguir según sean discretas o continuas o
cualitativas o cuantitativas.
 Variable continúa. Una variable continua es aquella que teóricamente puede tomar
cualquier valor en un intervalo definido. El peso de una persona es un ejemplo de
esto. En un intervalo definido teóricamente es posible encontrar un valor entre dos
conocidos por muy cercanos que estén entre ellos. Entre otros ejemplos podemos
mencionar, estatura, tiempo o temperatura.
 Variable Discreta. Cuando los valores que puede tomar una variable en un
intervalo definido están separados entre sí, la variable se denomina discreta.
Ejemplo de esto se puede mencionar el número de llamadas a un conmutador entre
las 9:00 am y las 12:00 pm, número de pacientes que arriban a un hospital en un día,
número de secuestros en un mes en la Ciudad de México, etc.
 Variable cuantitativa. Una variable se dice ser cuantitativa siempre que los valores
que puede asumir sean resultados exclusivamente de medidas numéricas. Algunos
ejemplos son, precipitación de la lluvia por mes, medida en milímetros en el Estado
de México, el coeficiente intelectual (CI) de un grupo de estudiantes, etc.
 Variable cualitativa. Existen situaciones en el trabajo estadístico en donde no es
posible obtener medidas numéricas, de manera que únicamente se puede clasificar
la información. Por ejemplo, la variable “género” sólo puede describirse como
masculino o femenino, la calificación de un servicio, recibe valores como excelente,
bueno, regular y malo u otros más específicos. Una variable cuyos valores sólo
aceptan categorías de clasificación se denomina variable cualitativa.
Es importante aclarar que a los valores numéricos de una variable cuantitativa, se le
conocen como datos de medición, puesto que se obtienen mediante algún proceso
de medición. En el caso de una variable cualitativa, nos referimos a ellos como
datos de conteo, puesto que en general es necesario contar el número de entidades
para clasificarlas en las categorías previamente definidas. En general nos referimos
a un dato de medida o conteo como una observación.
 Población. La población representa un conjunto de valores de una variable
aleatoria relacionada a un conjunto de entidades. También podemos hablar de
población cuando nos referimos a un conjunto de entidades. Una definición de
población podría consistir en el conjunto más grande de valores, de una variable,
objeto de interés de un estudio estadístico.
 Muestra. Una muestra consiste en una parte de la población. El tamaño de una
población puede ser muy grande, por ejemplo, la encuesta de población que Inegi
realiza cada diez años se lleva a cabo mediante una muestra de hogares, ya que
encuestar a los aproximadamente 28.6 millones de hogares [1 ] resultaría imposible.
4
1.4 El trabajo básico con los datos: Distribuciones de frecuencia.
El trabajo estadístico inicia con la obtención de los datos. Sin embargo estos por si mismos
no permiten la realización de análisis e interpretación de los mismos. Para facilitar los
cálculos es necesario extraer información y organizarla de manera conveniente. Lo anterior
puede dificultarse cuando hablamos de grandes volúmenes de información. Un instrumento
muy útil para el trabajo básico con datos voluminosos es la distribución de frecuencia. Esta
consiste en una representación de las categorías numéricas de la variable junto con el
número de entidades que se clasifican en cada categoría. Aquellas categorías que no se
traslapan y son contiguas se denominan intervalos de clase. Cada uno de estos intervalos
está definido por un límite inferior y uno superior. Estos límites especifican la magnitud de
valor que puede incluirse en un determinado intervalo de clase. La distribución de
frecuencia consiste en el conjunto de intervalos de clase contiguos (no traslapados) y se
puede representar en forma tabular o gráfica conocida como histograma.
Ejemplo 1.1 Los siguientes datos representan los puntajes del CI de 150 estudiantes de
tercer grado de un determinado sistema escolar [4]. Elaborar tabla de frecuencias e
histograma correspondiente.
88 91 104 113 125 101 114 105 101 88 126 118 100 111 125 109
119 91 106 120 129 120 109 104 112 101 113 100 106 105 121 128
93 89 124 96 105 95 91 106 93 88 89 100 115 98 108 88
99 120 101 108 118 118 113 114 109 91 104 109 110 113 119 119
106 106 97 104 105 122 112 124 108 121 96 97 99 101 116 118
102 127 121 116 100 95 89 103 115 113 129 91 85 108 103 116
108 98 108 114 102 96 99 108 114 121 107 122 100 116 111 113
109 104 113 118 110 129 124 105 93 115 120 97 112 94 113 122
114 106 105 115 98 112 103 92 125 107 115 118 128 92 85 126
118 114 125 121 122 117
Bibliografía
[1] Conapo. Series de información temática y continua de hogares en México 1980-2010
[2] Peña, Daniel. Las matemáticas en las ciencias sociales. Universidad Carlos III. www.encuentros-
multidiciplinares.org/Revistan°23/Daniel%20Peña%20Sanchez%20de%20Rivera.pdf Consultado el 10 enero
de 2014.
[3] Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-
Hill. México
[4] Ibid página 9
Bibliografía recomendada
5
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 2
2.1 Anexo a la Lección 1
La lección anterior fue una breve mirada a las matemáticas aplicadas en ciencia sociales.
En particular, hablamos de la estadística aplicada y repasamos algunas definiciones. Para
esta lección nos ocuparemos del trabajo con medidas descriptivas.
Retomemos los datos del ejercicio de la lección anterior. Una vez definida la distribución
de frecuencias, esta queda como sigue
Tabla 2.1
Distribución de frecuencia de los puntajes
del CI de 150 estudiantes de tercer grado
(intervalo de clase de tamaño 10)
Intervalo de clase Frecuencia
85-94 20
95-104 34
105-114 49
115-124 35
125-134 12
Total 150
Es importante aclarar que el tamaño del intervalo de clase es a criterio del investigador, que
depende del grado de detalle que se requiera. En ocasiones es conveniente tener los datos
de una distribución de frecuencia, en forma acumulada. Regresando a nuestro ejemplo
podría interesarnos el número de estudiantes con puntajes por debajo de 105. Entonces
utilizando los mismos criterios para obtener la distribución de frecuencias de la tabla 2.1, la
diferencia será que además de registrar la frecuencia para cada intervalo de clase sumamos
las correspondientes a los anteriores. La tabla 2.2 muestra la distribución de frecuencia
acumulada.
6
Tabla 2.2
Distribución de frecuencia acumulada de los puntajes
del CI de 150 estudiantes de tercer grado
Intervalo de clase Frecuencia
85-94 20
95-104 54
105-114 103
115-124 138
125-134 150
De esta manera, los datos en la Tabla 2.2, permiten conocer el número de observaciones
que son menores o iguales a cualquier límite superior de clase. Otra herramienta derivada
de los resultados de la distribución de frecuencia es la llamada distribución de frecuencia
relativa. Esta muestra la proporción o porcentaje de los valores que se incluyen en los
distintos intervalos de clase. La proporción de un determinado intervalo de clase se obtiene
dividiendo la frecuencia correspondiente, entre el número total de observaciones. Así
mismo, podemos construir a partir de la frecuencia relativa, el acumulado de las
proporciones o porcentajes, esto es, una distribución de frecuencia relativa acumulada. La
tabla 2.3 registra los resultados de la distribución de frecuencia relativa y relativa
acumulada.
Tabla 2.3
Intervalo de clase Frecuencia Frecuencia
relativa relativa acumulada
85-94 0.13 0.13
95-104 0.23 0.36
105-114 0.33 0.69
115-124 0.23 0.92
125-134 0.08 1
Total 1
7
El resultado de los datos de la Tabla 2.1 se muestra a continuación por medio de un gráfico
conocido como histograma. Se emplea para representar una distribución de frecuencias o
una distribución de frecuencia relativa.
Gráfica 2.1
0
10
20
30
40
50
60
85-94 95-104 105-114 115-124 125-134
FRECUENCIA
PUNTAJE CI
Histograma de los puntajes del CI en estudiantes de tercer grado
8
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 3
3.1 Introducción
Para los diversos propósitos del análisis estadístico, los histogramas de frecuencia no
revelan toda la información contenida en los datos, por lo tanto no son adecuados para
hacer inferencias. Esto se debe a que no se encuentran bien definidos ya que se pueden
construir muchos histogramas semejantes con el mismo conjunto de datos. Es frecuente que
el análisis necesite de un valor que represente los datos. Podemos describir los datos de
acuerdo a las medidas descriptivas que indican, por ejemplo, la tendencia central y la
extensión de la variabilidad de los datos. Las cantidades que definiremos son medidas
numéricas descriptivas de un conjunto de datos. Nos interesan números que describan la
distribución de frecuencias de cualquier cúmulo de mediciones. En esta lección nos
ocuparemos de dos de ellos: las medidas de tendencia central y las medidas de dispersión
o de variabilidad.
3.2 La media
La medida de tendencia central más utilizada en estadística es la media aritmética. Como es
el único tipo de media a estudiar, en adelante nos referiremos a ella únicamente como
media.
3.2.1 Definición
La media de un conjunto de n mediciones 1 2, ,..., ny y y se determina mediante la ecuación
1
n
i
i
y
y
n



[3.1]
El símbolo y , que leemos “y barra”, se conoce como media muestral. En la práctica, por lo
general, no es posible medir el valor de la media de una población, ésta es una constante
desconocida que estimamos a partir de la muestra. Designaremos la media poblacional con
 . Si nos referimos a una población finita de tamaño N , denotamos a  por
9
1
N
i
i
y
N
 


[3.2]
Sin embargo, sólo indica el centro de la distribución de los datos; en sí no proporciona una
descripción adecuada de un conjunto de observaciones. Teóricamente se pueden tener
distribuciones de frecuencias distintas pero con la misma media. La diferencia radica en la
variabilidad o dispersión de las medidas a cada lado de la media (gráfica 3.1).
Gráfica 3.1
3.3 La varianza
Para tener una descripción más adecuada es necesario definir medidas de la variabilidad de
los datos. La más común de estas medidas empleada en el trabajo estadístico aplicado es la
varianza. Es una función de las desviaciones (o distancias) de las observaciones respecto de
la media.
3.3.1 Definición
La varianza de un conjunto de n mediciones 1 2, ,..., ny y y es la suma de los cuadrados de
las desviaciones entre las observaciones y su media, dividida entre 1n  . La varianza
muestral se denota por
2
2 1
( )
1
n
i
i
y y
s
n





[3.3]
La varianza de la población correspondiente se expresa mediante el símbolo 2
 y se define
para una población finita de tamaño N por
10
2
2 1
( )
N
i
i
y
N

 



[3.4]
Es importante notar que en la definición de varianza muestral, dividimos por 1n  en lugar
de n . Daremos una idea intuitiva en el anexo a esta lección. Podemos decir que 2
s como se
define en la ecuación [3.3] refleja un “mejor” estimador de la verdadera varianza
poblacional, 2
 . No obstante lo anterior, podemos considerar a 2
s como casi el promedio
de los cuadrados de las desviaciones de los valores observados de la media. A mayor
varianza de una muestra, mayor será el grado de variación dentro del conjunto. La varianza
es útil para comparar dos muestras, pero es necesario utilizar la desviación estándar para
interpretar la variación en un solo conjunto.
3.3.2 Definición
La desviación estándar de un conjunto de mediciones es la raíz cuadrada positiva de la
varianza, esto es
2
1
( )
1
n
i
i
y y
s
n





[3.5]
La desviación estándar de la población se denota  . Aunque la desviación estándar tiene
una estrecha relación con la varianza, se utiliza para dar una idea con buena exactitud de la
variación de los datos, en un conjunto de observaciones. Terminamos este apartado
señalando que las ecuaciones [3.2] y [3.4] representan la media y varianza de una población
finita de tamaño N , pero al ser estas desconocidas en la práctica utilizaremos las
definiciones de media y varianza muestrales, de las ecuaciones [3.1] y [3.3].
Bibliografía
Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México.
Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill.
México
11
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 4
4.1 Anexo a la Lección 3
Empezaremos esta lección con dos sencillos ejemplos para ilustrar lo expuesto en el
apartado anterior e introducir otras medidas de tendencia central y dispersión.
Posteriormente retomaremos el ejemplo 1.1 en donde las estimaciones se harán por medio
de la hoja de cálculo Excel©.
Ejemplo 4.1 [2]
Hay 180 estudiantes de primer año de un colegio rural. Con el fin de obtener información
acerca de la costumbre que tienen los estudiantes de ver televisión, un consejero de
orientación desea seleccionar una muestra aleatoria de diez estudiantes. Sea X , la variable
aleatoria que nos interesa, el número de horas que los estudiantes pasaron viendo televisión
durante la semana anterior a la entrevista. Supongamos que los diez estudiantes de la
muestra informaron que vieron televisión de acuerdo al siguiente número de horas
 24,25,22,20,15,25,17,16,15,17 [4.1]
La media de horas gastadas en mirar televisión durante la semana anterior para la muestra
de diez estudiantes es
24 25 22 20 15 25 17 16 15 17
19.6
10
x
        
  [4.2]
La varianza de la muestra y su correspondiente desviación estándar se calculan a
continuación
2 2 2 2
2 (24 19.6) (25 19.6) ... (15 19.6) (17 19.6)
16.93
10 1
16.93 4.11
s
s
       
 

 
[4.3]
Ejemplo 4.2 [2]
Es importante destacar que la media como medida de tendencia central puede ser
influenciada de manera considerable por un solo valor extremo y por lo tanto dar una idea
12
sesgada de los datos. Para exponer esto, considérese que diez estudiantes tiene puntajes de
 91,95,95,94,92,93,98,97,96,0 en una prueba, realizamos el cálculo de la media
91 95 95 94 92 93 98 97 96 0
85.1
10
x
        
  [4.4]
La varianza de la muestra y su correspondiente desviación estándar se calculan a
continuación
2 2 2 2
2 (91 85.1) (95 85.1) ... (96 85.1) (0 85.1)
898.76
10 1
898.76 29.97
s
s
       
 

 
[4.5]
Observamos que [4.4] difiere de las calificaciones de los diez alumnos de la muestra. Como
alternativa al resultado en [4.4] utilizaremos otra medida de tendencia central conocida
como mediana.
4.2 Otras medidas de tendencia central
4.2.1 La mediana
La mediana es el valor que se encuentra en la mitad de una muestra, siempre que los datos
hayan sido ordenados de acuerdo a su magnitud. Si el número de observaciones en una
muestra es impar, la mediana es el valor ubicado exactamente en la mitad de los valores de
la muestra ordenada. Encontremos la mediana para nuestros ejemplos 4.1 y 4.2. Primero
ordenamos los datos.
Ejemplo 4.1
 15,15,16,17, ,22,24,25,2517,20 [4.6]
La mediana será, 18.5, el promedio entre 17 y 20. No parece tan lejana de la media 19.6.
Para el caso del ejemplo 4.2, al ordenar los datos
 0,91,92,93, ,95,96,97,9894,95 [4.7]
La mediana en este caso será, 94.5, el promedio entre 94 y 95. Podemos observar que la
mediana es tal vez más representativa de la muestra que la media. Tal vez el investigador
prefiera el valor de la mediana como valor de tendencia central. Los datos atípicos son la
causa de esto, como es el caso de la calificación 0. Otra medida de tendencia central es la
moda, que puede en algunos casos indicar una tendencia.
4.2.2 La moda
La moda es el valor que aparece con mayor frecuencia en un grupo de datos.
13
Veamos los datos del ejemplo 4.1
 24,25,22,20,15,25,17,16,15,17
Hay más de una moda en este caso, 15, 17 y 25. Si se quiere utilizar como medida de
tendencia central, probablemente 17 debería ser nuestra elección, pues es más cercana a la
media y mediana. Descartamos 15 y 25, debido a que se encuentran en los límites inferior y
superior de los datos, respectivamente perdiéndose un poco la idea de una medida de
tendencia central.
Veamos los datos del ejemplo 4.2
 91,95,95,94,92,93,98,97,96,0
Aquí la moda es única, 95. Difiere poco de la mediana, que para estos datos es 94.5. En este
caso parecen ser más representativos de la muestra que la media. Es importante aclarar que
la moda de un grupo de datos puede no existir, ser única o haber más de una.
4.3 Otras medidas de variabilidad
4.3.1 El rango
La medida más simple de variabilidad es el rango, que es la diferencia entre el valor
máximo y el mínimo en un conjunto de datos.
En el caso del ejemplo 4.1, el rango es 25-15=10. Para el ejemplo 4.2 es 98-0=98.
El rango como medida de variabilidad, es limitado. Al tomar en cuenta únicamente los
valores extremos de un conjunto de datos, no informa adecuadamente el cómo varían los
valores alrededor de la media. Por otro lado el rango de una muestra depende de su tamaño.
Las muestras pequeñas tienden a tener rangos pequeños y las grandes, rangos grandes.
Bibliografía
[1] Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México.
Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill.
México.
[2] Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-
Hill. México.
[3] Ibid.
14
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 5
5.1 Introducción
Muchas distribuciones de datos en la práctica tiene la apariencia semejante a una campana.
De suceder esto, es posible aproximarlas mediante una distribución de frecuencias que tiene
tal forma conocida como distribución normal 1
. Cuando poseemos evidencia de tal
comportamiento (en posteriores lecciones volveremos a este asunto), los datos muestran
características de variación bien definidas, conocida como Regla empírica.
5.2 Regla empírica
En una distribución de medidas con un comportamiento aproximadamente normal (forma
de campana de Gauss), se puede deducir qué, en el intervalo cuyos puntos extremos son:
   contiene alrededor del 68% de los datos
 2  contiene alrededor del 95% de los datos
 3  contiene alrededor del 99% de los datos
Una vez conocida la distribución de frecuencias de una serie de datos, se pueden establecer
probabilidades respecto al conjunto de observaciones. Tales probabilidades se pueden
asociar con las áreas de un histograma de frecuencias. En consecuencia, las probabilidades
de la regla empírica constituyen áreas bajo la curva normal. (ver Gráfico 5.1).
Figura 5.1
1
De todas las distribuciones de variable continua conocidas, quizá la más importante en estadística es la
distribución normal. La función de distribución normal se publicó por vez primera en 1733 por A. Demoivre.
Cerca de 1820, Karl Friedrich Gauss buscando la determinación matemática de la forma y tamaño del globo
terráqueo, desarrolló varias herramientas en el tratamiento con datos de las observaciones existentes. Una de
ellas es la curva de distribución de errores, que en su honor, también se conoce como campana de Gauss.
15
Un ejemplo puede ilustrar lo anterior. Regresemos al ejemplo 1.1, recordemos que los datos
representan los puntajes del CI de 150 estudiantes de tercer grado de un determinado
sistema escolar. Utilizando la hoja de cálculo Excel©, obtenemos las medidas de tendencia
central y dispersión de los datos (Tabla 5.1) y el histograma respectivo (Gráfico 5.2)
Tabla 5.1
Media 108.43
Mediana 108.50
Moda 113
Desviación estándar 11.14
Varianza de la muestra 124.21
Curtosis -0.83
Rango 44
Mínimo 85
Máximo 129
Cuenta 150
Gráfica 5.2
De la tabla 5.1 y de acuerdo a la Regla empírica, suponiendo que los datos tienen un
comportamiento normal, esperamos que el 68% de los datos este entre 97.29 y 119.57.
Dicho de otra manera, la probabilidad de que el valor de una calificación del CI, elegida al
azar, este entre 97.29 y 119.57, es de 68%. Excel muestra entre otras medidas la curtosis.
En específico, la ayuda de Excel© da la siguiente descripción:
Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la elevación o el
achatamiento relativo de una distribución, comparada con la distribución normal. Una
curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis
negativa indica una distribución relativamente plana.
Bibliografía
[1] Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México.
Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill.
México.
[2] Microsoft Excel© 2010.
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
10
20
30
40
50
95 105 115 125 y
mayor...
Frecuencia
Clase
Histograma
Frecuencia
% acumulado
16
División de Ciencias Sociales y Humanidades
Tronco Divisional
Casa abierta al tiempo
UNIVERSIDAD AUTÓNOMA METROPOLITANA
Taller de Matemáticas Aplicadas a las Ciencias Sociales
Lección 6
6.1 Introducción
17

Weitere ähnliche Inhalte

Was ist angesagt?

Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosCristina Rios
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadísticaJuliocesar5559
 
Cómo realizar "paso a paso" un contraste de hipótesis con SPSS para Windows
Cómo realizar "paso a paso" un contraste de hipótesis con  SPSS para WindowsCómo realizar "paso a paso" un contraste de hipótesis con  SPSS para Windows
Cómo realizar "paso a paso" un contraste de hipótesis con SPSS para WindowsJairo Acosta Solano
 
Organizacion de datos estadisticos
Organizacion de datos estadisticosOrganizacion de datos estadisticos
Organizacion de datos estadisticosJose Marquez M
 
1 descriptiva
1 descriptiva1 descriptiva
1 descriptivadaomil
 
Bioestadistica - Distribuciones de frecuencias
Bioestadistica - Distribuciones de frecuenciasBioestadistica - Distribuciones de frecuencias
Bioestadistica - Distribuciones de frecuenciasDavid Poleo
 
Capitulo 1. estadistica ciencia y datos
Capitulo 1. estadistica  ciencia y datosCapitulo 1. estadistica  ciencia y datos
Capitulo 1. estadistica ciencia y datosDeysi Lorena Ruiz Cruz
 
08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación570727
 

Was ist angesagt? (15)

Exposicion maria
Exposicion mariaExposicion maria
Exposicion maria
 
Estadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicosEstadística inferencial, conceptos basicos
Estadística inferencial, conceptos basicos
 
Términos básicos en estadística
Términos básicos en estadísticaTérminos básicos en estadística
Términos básicos en estadística
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 
Cómo realizar "paso a paso" un contraste de hipótesis con SPSS para Windows
Cómo realizar "paso a paso" un contraste de hipótesis con  SPSS para WindowsCómo realizar "paso a paso" un contraste de hipótesis con  SPSS para Windows
Cómo realizar "paso a paso" un contraste de hipótesis con SPSS para Windows
 
Exposicion estadistica inferencial spss enviar hoy
Exposicion estadistica inferencial spss enviar hoyExposicion estadistica inferencial spss enviar hoy
Exposicion estadistica inferencial spss enviar hoy
 
Organizacion de datos estadisticos
Organizacion de datos estadisticosOrganizacion de datos estadisticos
Organizacion de datos estadisticos
 
1 descriptiva
1 descriptiva1 descriptiva
1 descriptiva
 
Bioestadistica - Distribuciones de frecuencias
Bioestadistica - Distribuciones de frecuenciasBioestadistica - Distribuciones de frecuencias
Bioestadistica - Distribuciones de frecuencias
 
34. estadistica descriptiva
34. estadistica descriptiva34. estadistica descriptiva
34. estadistica descriptiva
 
Capitulo 1. estadistica ciencia y datos
Capitulo 1. estadistica  ciencia y datosCapitulo 1. estadistica  ciencia y datos
Capitulo 1. estadistica ciencia y datos
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Trabajo estadistica
Trabajo  estadisticaTrabajo  estadistica
Trabajo estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación08 01-2021 2.1. conceptos de estadística y su clasificación
08 01-2021 2.1. conceptos de estadística y su clasificación
 

Andere mochten auch

Manual Auto Cuidado Del Adulto Mayor
Manual Auto Cuidado Del Adulto MayorManual Auto Cuidado Del Adulto Mayor
Manual Auto Cuidado Del Adulto MayorDaniel Gutierrez
 
Que Es Una Red FíSica
Que Es Una Red FíSicaQue Es Una Red FíSica
Que Es Una Red FíSicaismael
 
Software maliciós i fraus en linea
Software maliciós i fraus en lineaSoftware maliciós i fraus en linea
Software maliciós i fraus en lineaquedamosenmicama
 
21010102204
2101010220421010102204
21010102204alex013
 
Problemas 2 pautas
Problemas 2 pautasProblemas 2 pautas
Problemas 2 pautasjoromaya
 
21010102204
2101010220421010102204
21010102204alex013
 
Ponencia sobre UdE CEP Motilla
Ponencia sobre UdE CEP MotillaPonencia sobre UdE CEP Motilla
Ponencia sobre UdE CEP MotillaDomingo Terencio
 
Manejar equipos de transporte
Manejar equipos de transporteManejar equipos de transporte
Manejar equipos de transportealex013
 
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...ismael
 
Energia- sandoval- benitez
Energia- sandoval- benitezEnergia- sandoval- benitez
Energia- sandoval- benitezLlano
 
Revista Spanish Way May Jun2011
Revista Spanish Way May Jun2011Revista Spanish Way May Jun2011
Revista Spanish Way May Jun2011Spanish Way
 
Sesion3
Sesion3Sesion3
Sesion3dezeya
 
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposició
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposicióAndrea juan josep_e.p.c._sobrrexplotació infantil_power exposició
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposicióSole Mulero Alzina
 
C:\Fakepath\PresentacióN1
C:\Fakepath\PresentacióN1C:\Fakepath\PresentacióN1
C:\Fakepath\PresentacióN1clase4diana
 

Andere mochten auch (20)

Manual Auto Cuidado Del Adulto Mayor
Manual Auto Cuidado Del Adulto MayorManual Auto Cuidado Del Adulto Mayor
Manual Auto Cuidado Del Adulto Mayor
 
Examen
ExamenExamen
Examen
 
Que Es Una Red FíSica
Que Es Una Red FíSicaQue Es Una Red FíSica
Que Es Una Red FíSica
 
Software maliciós i fraus en linea
Software maliciós i fraus en lineaSoftware maliciós i fraus en linea
Software maliciós i fraus en linea
 
21010102204
2101010220421010102204
21010102204
 
Problemas 2 pautas
Problemas 2 pautasProblemas 2 pautas
Problemas 2 pautas
 
21010102204
2101010220421010102204
21010102204
 
My Rubric
My RubricMy Rubric
My Rubric
 
Ponencia sobre UdE CEP Motilla
Ponencia sobre UdE CEP MotillaPonencia sobre UdE CEP Motilla
Ponencia sobre UdE CEP Motilla
 
Manejar equipos de transporte
Manejar equipos de transporteManejar equipos de transporte
Manejar equipos de transporte
 
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...
Los niños y las niñas disfrutaron y manifestaron las diferentes actividades c...
 
Energia- sandoval- benitez
Energia- sandoval- benitezEnergia- sandoval- benitez
Energia- sandoval- benitez
 
Revista Spanish Way May Jun2011
Revista Spanish Way May Jun2011Revista Spanish Way May Jun2011
Revista Spanish Way May Jun2011
 
Sesion3
Sesion3Sesion3
Sesion3
 
El Polaco
El PolacoEl Polaco
El Polaco
 
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposició
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposicióAndrea juan josep_e.p.c._sobrrexplotació infantil_power exposició
Andrea juan josep_e.p.c._sobrrexplotació infantil_power exposició
 
Jorge luis borges
Jorge luis borgesJorge luis borges
Jorge luis borges
 
Dia de la familia
Dia de la familiaDia de la familia
Dia de la familia
 
Pacie - Bloque 0
Pacie - Bloque 0Pacie - Bloque 0
Pacie - Bloque 0
 
C:\Fakepath\PresentacióN1
C:\Fakepath\PresentacióN1C:\Fakepath\PresentacióN1
C:\Fakepath\PresentacióN1
 

Ähnlich wie Introducción a la estadistica

Investigacion estadisitica
Investigacion estadisiticaInvestigacion estadisitica
Investigacion estadisiticaEdinsonGomez11
 
Estadística Descriptiva.pdf
Estadística Descriptiva.pdfEstadística Descriptiva.pdf
Estadística Descriptiva.pdfMaximo Moreno
 
34. estadistica descriptiva regre lineal
34. estadistica descriptiva regre lineal34. estadistica descriptiva regre lineal
34. estadistica descriptiva regre linealBruceP2
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptivaJose Lopez
 
Grupo 1 proyeccto final 1er parcial 4tosemestre
Grupo 1 proyeccto final 1er parcial 4tosemestreGrupo 1 proyeccto final 1er parcial 4tosemestre
Grupo 1 proyeccto final 1er parcial 4tosemestreMariuxi Badaraco Moreira
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en EstadísticaRafael Brito
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfMrsKyojuro
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfValeriaGonzalezHerna1
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEmmanuelEcheverry1
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEmmanuelEcheverry1
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxSamuelLndooCorrea
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxSamuelLndooCorrea
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfGabrielCastillolvare
 

Ähnlich wie Introducción a la estadistica (20)

Investigacion estadisitica
Investigacion estadisiticaInvestigacion estadisitica
Investigacion estadisitica
 
Estadística
Estadística Estadística
Estadística
 
Estadística Descriptiva.pdf
Estadística Descriptiva.pdfEstadística Descriptiva.pdf
Estadística Descriptiva.pdf
 
34. estadistica descriptiva regre lineal
34. estadistica descriptiva regre lineal34. estadistica descriptiva regre lineal
34. estadistica descriptiva regre lineal
 
Unidad i ii iii iv
Unidad i ii iii ivUnidad i ii iii iv
Unidad i ii iii iv
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
34. estadistica descriptiva
34. estadistica descriptiva34. estadistica descriptiva
34. estadistica descriptiva
 
Unidad i ii iii iv
Unidad i ii iii ivUnidad i ii iii iv
Unidad i ii iii iv
 
Grupo 1 proyeccto final 1er parcial 4tosemestre
Grupo 1 proyeccto final 1er parcial 4tosemestreGrupo 1 proyeccto final 1er parcial 4tosemestre
Grupo 1 proyeccto final 1er parcial 4tosemestre
 
Grupo n 1 de estadistica
Grupo n 1 de estadisticaGrupo n 1 de estadistica
Grupo n 1 de estadistica
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Términos Básicos en Estadística
Términos Básicos en EstadísticaTérminos Básicos en Estadística
Términos Básicos en Estadística
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
 
Metodos estadisticos
Metodos estadisticosMetodos estadisticos
Metodos estadisticos
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS. 11-2.pdf
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docx
 
Blog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docxBlog Excel avanzado y métodos estadísticos.docx
Blog Excel avanzado y métodos estadísticos.docx
 
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdfBlog_Excel_avanzado_y_metodos_estadisticos.pdf
Blog_Excel_avanzado_y_metodos_estadisticos.pdf
 

Kürzlich hochgeladen

La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxMartín Ramírez
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)veganet
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 

Kürzlich hochgeladen (20)

La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
 
PPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptxPPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptx
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 

Introducción a la estadistica

  • 1. 1 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 1 1.1 Introducción La ciencia matemática representa para el saber humano uno de sus principales pilares en la construcción del conocimiento. Es difícil no encontrar alguna aplicación de las matemáticas en el quehacer humano. Las matemáticas en ciencias sociales, al igual que en otras áreas del saber científico representan una herramienta medular para adquirir y consolidar el conocimiento. Peña [ ] nos señala tres razones que en buena medida justifican la importancia de las matemáticas en las ciencias: i) En primer lugar, las matemáticas obligan a definir claramente las variables de interés en cada problema, a establecer hipótesis sobre su comportamiento y a definir las relaciones entre ellas. ii) En segundo lugar, el lenguaje matemático permite importar a las ciencias sociales modelos de relación entre variables que han tenido éxito en otras ciencias, ofreciendo nuevas posibilidades de explicación de los fenómenos sociales y enriqueciendo el conjunto de modelos disponibles para investigar la realidad. iii) En tercer lugar, la creciente disponibilidad de datos, debido a la difusión de ordenadores y la automatización en todas las actividades humanas, permite contrastar con mayor rigor los modelos sociales en la práctica mediante los métodos estadísticos y generar predicciones y reglas de comportamiento verificables con los datos. El lenguaje y formalidad existente en matemáticas permite indagar sobre posibles reglas generales de comportamiento de los fenómenos objeto de estudio, dando lugar a posibles predicciones con validez científica. Sin embargo debemos mencionar que el grado en que se puede utilizar las matemáticas como herramienta de análisis, depende poderosamente de que tan posible es medir las distintas variables de interés y entender las reglas que rigen las relaciones entre ellas. El nivel en que la ciencia matemática se aplica en otras áreas, se encuentra íntimamente relacionado a esto. Así, cualquier asunto que sea observable y cuantificable, se traduce en conocimiento e información. 1.2 Definición. Dentro de las ramas que conforman la ciencia matemática, la estadística es relevante por su aplicación a una gran cantidad de disciplinas científicas y que además permite el
  • 2. 2 intercambio de resultados entre ellas, potenciando los estudios multidisciplinares. Ello se debe en buena medida a la facilidad que permiten los equipos de cómputo de manejar enormes volúmenes de información en tiempos razonables hoy día. Sin llegar a una definición formal, podemos decir que la estadística es aquella ciencia que mediante la recopilación, organización y análisis de datos, interpreta y comunica resultados para la toma de decisiones o para explicar si las condiciones del fenómeno (aleatorio o determinístico) estudiado, se pueden establecer como regulares o no. De acuerdo a Wayne [3], el trabajo estadístico busca alcanzar uno o dos de los siguientes objetivos: 1 Describir cuantitativamente una serie de personas, lugares o cosas 2 Dar información de la que se pueda sacar conclusiones acerca de un grupo grande de personas, lugares o cosas, por medio de la observación de sólo una pequeña parte del conjunto total. El trabajo estadístico al que se refiere el primer objetivo, es el que se conoce con el nombre de estadística descriptiva y aquellas enfocadas en el segundo se denominan estadística inferencial, que se basa en los fundamentos de la teoría de la probabilidad. 1.3 Terminología estadística básica Antes de pasar al trabajo con los datos, conviene definir algunos términos fundamentales que utilizaremos en esta parte del curso. Esto facilitará el entendimiento de conceptos y técnicas que ocuparemos a medida que se vayan presentando.  Entidad. Es el conjunto de personas, lugares, cosas etc., que son objeto de estudio. Así por ejemplo, hombres y mujeres sin educación básica en un país. Población de cierta especie de cactus que habita en el desierto de Sonora o pacientes con enfermedad del corazón entre los 40 y 50 años. En términos generales entenderemos por entidad, a un miembro individual del conjunto objeto de análisis.  Variable. Es el conjunto de características atribuibles a las entidades estudiadas. Por ejemplo, un químico fármaco-biólogo puede estar interesado en alguna propiedad curativa del cactus de Sonora. Un médico podría estar buscando conocer el nivel de colesterol en sus pacientes enfermos del corazón o al ministerio de educación de algún país le interesa conocer el número de individuos analfabetas para el diseño de políticas públicas. Cualquiera de estas características, en términos generales presenta un valor diferente en cada entidad observada.  Variable aleatoria. Si los valores que toma una variable son producto de factores fortuitos de manera que no se pueda estimar con anticipación ninguno de ellos, dicha variable se conoce como variable aleatoria (v.a.). Para la representación de
  • 3. 3 una v.a. utilizamos (aunque no son la únicas) letras mayúsculas como X, Y, y Z. Si por ejemplo llamamos X al nivel de colesterol, los niveles individuales de colesterol los denominamos, x1, x2,…,xn , donde los subíndices distinguen a un valor de otro y n representa el número total de individuos de la v.a. Es importante mencionar que las variables también se pueden distinguir según sean discretas o continuas o cualitativas o cuantitativas.  Variable continúa. Una variable continua es aquella que teóricamente puede tomar cualquier valor en un intervalo definido. El peso de una persona es un ejemplo de esto. En un intervalo definido teóricamente es posible encontrar un valor entre dos conocidos por muy cercanos que estén entre ellos. Entre otros ejemplos podemos mencionar, estatura, tiempo o temperatura.  Variable Discreta. Cuando los valores que puede tomar una variable en un intervalo definido están separados entre sí, la variable se denomina discreta. Ejemplo de esto se puede mencionar el número de llamadas a un conmutador entre las 9:00 am y las 12:00 pm, número de pacientes que arriban a un hospital en un día, número de secuestros en un mes en la Ciudad de México, etc.  Variable cuantitativa. Una variable se dice ser cuantitativa siempre que los valores que puede asumir sean resultados exclusivamente de medidas numéricas. Algunos ejemplos son, precipitación de la lluvia por mes, medida en milímetros en el Estado de México, el coeficiente intelectual (CI) de un grupo de estudiantes, etc.  Variable cualitativa. Existen situaciones en el trabajo estadístico en donde no es posible obtener medidas numéricas, de manera que únicamente se puede clasificar la información. Por ejemplo, la variable “género” sólo puede describirse como masculino o femenino, la calificación de un servicio, recibe valores como excelente, bueno, regular y malo u otros más específicos. Una variable cuyos valores sólo aceptan categorías de clasificación se denomina variable cualitativa. Es importante aclarar que a los valores numéricos de una variable cuantitativa, se le conocen como datos de medición, puesto que se obtienen mediante algún proceso de medición. En el caso de una variable cualitativa, nos referimos a ellos como datos de conteo, puesto que en general es necesario contar el número de entidades para clasificarlas en las categorías previamente definidas. En general nos referimos a un dato de medida o conteo como una observación.  Población. La población representa un conjunto de valores de una variable aleatoria relacionada a un conjunto de entidades. También podemos hablar de población cuando nos referimos a un conjunto de entidades. Una definición de población podría consistir en el conjunto más grande de valores, de una variable, objeto de interés de un estudio estadístico.  Muestra. Una muestra consiste en una parte de la población. El tamaño de una población puede ser muy grande, por ejemplo, la encuesta de población que Inegi realiza cada diez años se lleva a cabo mediante una muestra de hogares, ya que encuestar a los aproximadamente 28.6 millones de hogares [1 ] resultaría imposible.
  • 4. 4 1.4 El trabajo básico con los datos: Distribuciones de frecuencia. El trabajo estadístico inicia con la obtención de los datos. Sin embargo estos por si mismos no permiten la realización de análisis e interpretación de los mismos. Para facilitar los cálculos es necesario extraer información y organizarla de manera conveniente. Lo anterior puede dificultarse cuando hablamos de grandes volúmenes de información. Un instrumento muy útil para el trabajo básico con datos voluminosos es la distribución de frecuencia. Esta consiste en una representación de las categorías numéricas de la variable junto con el número de entidades que se clasifican en cada categoría. Aquellas categorías que no se traslapan y son contiguas se denominan intervalos de clase. Cada uno de estos intervalos está definido por un límite inferior y uno superior. Estos límites especifican la magnitud de valor que puede incluirse en un determinado intervalo de clase. La distribución de frecuencia consiste en el conjunto de intervalos de clase contiguos (no traslapados) y se puede representar en forma tabular o gráfica conocida como histograma. Ejemplo 1.1 Los siguientes datos representan los puntajes del CI de 150 estudiantes de tercer grado de un determinado sistema escolar [4]. Elaborar tabla de frecuencias e histograma correspondiente. 88 91 104 113 125 101 114 105 101 88 126 118 100 111 125 109 119 91 106 120 129 120 109 104 112 101 113 100 106 105 121 128 93 89 124 96 105 95 91 106 93 88 89 100 115 98 108 88 99 120 101 108 118 118 113 114 109 91 104 109 110 113 119 119 106 106 97 104 105 122 112 124 108 121 96 97 99 101 116 118 102 127 121 116 100 95 89 103 115 113 129 91 85 108 103 116 108 98 108 114 102 96 99 108 114 121 107 122 100 116 111 113 109 104 113 118 110 129 124 105 93 115 120 97 112 94 113 122 114 106 105 115 98 112 103 92 125 107 115 118 128 92 85 126 118 114 125 121 122 117 Bibliografía [1] Conapo. Series de información temática y continua de hogares en México 1980-2010 [2] Peña, Daniel. Las matemáticas en las ciencias sociales. Universidad Carlos III. www.encuentros- multidiciplinares.org/Revistan°23/Daniel%20Peña%20Sanchez%20de%20Rivera.pdf Consultado el 10 enero de 2014. [3] Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw- Hill. México [4] Ibid página 9 Bibliografía recomendada
  • 5. 5 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 2 2.1 Anexo a la Lección 1 La lección anterior fue una breve mirada a las matemáticas aplicadas en ciencia sociales. En particular, hablamos de la estadística aplicada y repasamos algunas definiciones. Para esta lección nos ocuparemos del trabajo con medidas descriptivas. Retomemos los datos del ejercicio de la lección anterior. Una vez definida la distribución de frecuencias, esta queda como sigue Tabla 2.1 Distribución de frecuencia de los puntajes del CI de 150 estudiantes de tercer grado (intervalo de clase de tamaño 10) Intervalo de clase Frecuencia 85-94 20 95-104 34 105-114 49 115-124 35 125-134 12 Total 150 Es importante aclarar que el tamaño del intervalo de clase es a criterio del investigador, que depende del grado de detalle que se requiera. En ocasiones es conveniente tener los datos de una distribución de frecuencia, en forma acumulada. Regresando a nuestro ejemplo podría interesarnos el número de estudiantes con puntajes por debajo de 105. Entonces utilizando los mismos criterios para obtener la distribución de frecuencias de la tabla 2.1, la diferencia será que además de registrar la frecuencia para cada intervalo de clase sumamos las correspondientes a los anteriores. La tabla 2.2 muestra la distribución de frecuencia acumulada.
  • 6. 6 Tabla 2.2 Distribución de frecuencia acumulada de los puntajes del CI de 150 estudiantes de tercer grado Intervalo de clase Frecuencia 85-94 20 95-104 54 105-114 103 115-124 138 125-134 150 De esta manera, los datos en la Tabla 2.2, permiten conocer el número de observaciones que son menores o iguales a cualquier límite superior de clase. Otra herramienta derivada de los resultados de la distribución de frecuencia es la llamada distribución de frecuencia relativa. Esta muestra la proporción o porcentaje de los valores que se incluyen en los distintos intervalos de clase. La proporción de un determinado intervalo de clase se obtiene dividiendo la frecuencia correspondiente, entre el número total de observaciones. Así mismo, podemos construir a partir de la frecuencia relativa, el acumulado de las proporciones o porcentajes, esto es, una distribución de frecuencia relativa acumulada. La tabla 2.3 registra los resultados de la distribución de frecuencia relativa y relativa acumulada. Tabla 2.3 Intervalo de clase Frecuencia Frecuencia relativa relativa acumulada 85-94 0.13 0.13 95-104 0.23 0.36 105-114 0.33 0.69 115-124 0.23 0.92 125-134 0.08 1 Total 1
  • 7. 7 El resultado de los datos de la Tabla 2.1 se muestra a continuación por medio de un gráfico conocido como histograma. Se emplea para representar una distribución de frecuencias o una distribución de frecuencia relativa. Gráfica 2.1 0 10 20 30 40 50 60 85-94 95-104 105-114 115-124 125-134 FRECUENCIA PUNTAJE CI Histograma de los puntajes del CI en estudiantes de tercer grado
  • 8. 8 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 3 3.1 Introducción Para los diversos propósitos del análisis estadístico, los histogramas de frecuencia no revelan toda la información contenida en los datos, por lo tanto no son adecuados para hacer inferencias. Esto se debe a que no se encuentran bien definidos ya que se pueden construir muchos histogramas semejantes con el mismo conjunto de datos. Es frecuente que el análisis necesite de un valor que represente los datos. Podemos describir los datos de acuerdo a las medidas descriptivas que indican, por ejemplo, la tendencia central y la extensión de la variabilidad de los datos. Las cantidades que definiremos son medidas numéricas descriptivas de un conjunto de datos. Nos interesan números que describan la distribución de frecuencias de cualquier cúmulo de mediciones. En esta lección nos ocuparemos de dos de ellos: las medidas de tendencia central y las medidas de dispersión o de variabilidad. 3.2 La media La medida de tendencia central más utilizada en estadística es la media aritmética. Como es el único tipo de media a estudiar, en adelante nos referiremos a ella únicamente como media. 3.2.1 Definición La media de un conjunto de n mediciones 1 2, ,..., ny y y se determina mediante la ecuación 1 n i i y y n    [3.1] El símbolo y , que leemos “y barra”, se conoce como media muestral. En la práctica, por lo general, no es posible medir el valor de la media de una población, ésta es una constante desconocida que estimamos a partir de la muestra. Designaremos la media poblacional con  . Si nos referimos a una población finita de tamaño N , denotamos a  por
  • 9. 9 1 N i i y N     [3.2] Sin embargo, sólo indica el centro de la distribución de los datos; en sí no proporciona una descripción adecuada de un conjunto de observaciones. Teóricamente se pueden tener distribuciones de frecuencias distintas pero con la misma media. La diferencia radica en la variabilidad o dispersión de las medidas a cada lado de la media (gráfica 3.1). Gráfica 3.1 3.3 La varianza Para tener una descripción más adecuada es necesario definir medidas de la variabilidad de los datos. La más común de estas medidas empleada en el trabajo estadístico aplicado es la varianza. Es una función de las desviaciones (o distancias) de las observaciones respecto de la media. 3.3.1 Definición La varianza de un conjunto de n mediciones 1 2, ,..., ny y y es la suma de los cuadrados de las desviaciones entre las observaciones y su media, dividida entre 1n  . La varianza muestral se denota por 2 2 1 ( ) 1 n i i y y s n      [3.3] La varianza de la población correspondiente se expresa mediante el símbolo 2  y se define para una población finita de tamaño N por
  • 10. 10 2 2 1 ( ) N i i y N       [3.4] Es importante notar que en la definición de varianza muestral, dividimos por 1n  en lugar de n . Daremos una idea intuitiva en el anexo a esta lección. Podemos decir que 2 s como se define en la ecuación [3.3] refleja un “mejor” estimador de la verdadera varianza poblacional, 2  . No obstante lo anterior, podemos considerar a 2 s como casi el promedio de los cuadrados de las desviaciones de los valores observados de la media. A mayor varianza de una muestra, mayor será el grado de variación dentro del conjunto. La varianza es útil para comparar dos muestras, pero es necesario utilizar la desviación estándar para interpretar la variación en un solo conjunto. 3.3.2 Definición La desviación estándar de un conjunto de mediciones es la raíz cuadrada positiva de la varianza, esto es 2 1 ( ) 1 n i i y y s n      [3.5] La desviación estándar de la población se denota  . Aunque la desviación estándar tiene una estrecha relación con la varianza, se utiliza para dar una idea con buena exactitud de la variación de los datos, en un conjunto de observaciones. Terminamos este apartado señalando que las ecuaciones [3.2] y [3.4] representan la media y varianza de una población finita de tamaño N , pero al ser estas desconocidas en la práctica utilizaremos las definiciones de media y varianza muestrales, de las ecuaciones [3.1] y [3.3]. Bibliografía Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México. Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill. México
  • 11. 11 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 4 4.1 Anexo a la Lección 3 Empezaremos esta lección con dos sencillos ejemplos para ilustrar lo expuesto en el apartado anterior e introducir otras medidas de tendencia central y dispersión. Posteriormente retomaremos el ejemplo 1.1 en donde las estimaciones se harán por medio de la hoja de cálculo Excel©. Ejemplo 4.1 [2] Hay 180 estudiantes de primer año de un colegio rural. Con el fin de obtener información acerca de la costumbre que tienen los estudiantes de ver televisión, un consejero de orientación desea seleccionar una muestra aleatoria de diez estudiantes. Sea X , la variable aleatoria que nos interesa, el número de horas que los estudiantes pasaron viendo televisión durante la semana anterior a la entrevista. Supongamos que los diez estudiantes de la muestra informaron que vieron televisión de acuerdo al siguiente número de horas  24,25,22,20,15,25,17,16,15,17 [4.1] La media de horas gastadas en mirar televisión durante la semana anterior para la muestra de diez estudiantes es 24 25 22 20 15 25 17 16 15 17 19.6 10 x            [4.2] La varianza de la muestra y su correspondiente desviación estándar se calculan a continuación 2 2 2 2 2 (24 19.6) (25 19.6) ... (15 19.6) (17 19.6) 16.93 10 1 16.93 4.11 s s              [4.3] Ejemplo 4.2 [2] Es importante destacar que la media como medida de tendencia central puede ser influenciada de manera considerable por un solo valor extremo y por lo tanto dar una idea
  • 12. 12 sesgada de los datos. Para exponer esto, considérese que diez estudiantes tiene puntajes de  91,95,95,94,92,93,98,97,96,0 en una prueba, realizamos el cálculo de la media 91 95 95 94 92 93 98 97 96 0 85.1 10 x            [4.4] La varianza de la muestra y su correspondiente desviación estándar se calculan a continuación 2 2 2 2 2 (91 85.1) (95 85.1) ... (96 85.1) (0 85.1) 898.76 10 1 898.76 29.97 s s              [4.5] Observamos que [4.4] difiere de las calificaciones de los diez alumnos de la muestra. Como alternativa al resultado en [4.4] utilizaremos otra medida de tendencia central conocida como mediana. 4.2 Otras medidas de tendencia central 4.2.1 La mediana La mediana es el valor que se encuentra en la mitad de una muestra, siempre que los datos hayan sido ordenados de acuerdo a su magnitud. Si el número de observaciones en una muestra es impar, la mediana es el valor ubicado exactamente en la mitad de los valores de la muestra ordenada. Encontremos la mediana para nuestros ejemplos 4.1 y 4.2. Primero ordenamos los datos. Ejemplo 4.1  15,15,16,17, ,22,24,25,2517,20 [4.6] La mediana será, 18.5, el promedio entre 17 y 20. No parece tan lejana de la media 19.6. Para el caso del ejemplo 4.2, al ordenar los datos  0,91,92,93, ,95,96,97,9894,95 [4.7] La mediana en este caso será, 94.5, el promedio entre 94 y 95. Podemos observar que la mediana es tal vez más representativa de la muestra que la media. Tal vez el investigador prefiera el valor de la mediana como valor de tendencia central. Los datos atípicos son la causa de esto, como es el caso de la calificación 0. Otra medida de tendencia central es la moda, que puede en algunos casos indicar una tendencia. 4.2.2 La moda La moda es el valor que aparece con mayor frecuencia en un grupo de datos.
  • 13. 13 Veamos los datos del ejemplo 4.1  24,25,22,20,15,25,17,16,15,17 Hay más de una moda en este caso, 15, 17 y 25. Si se quiere utilizar como medida de tendencia central, probablemente 17 debería ser nuestra elección, pues es más cercana a la media y mediana. Descartamos 15 y 25, debido a que se encuentran en los límites inferior y superior de los datos, respectivamente perdiéndose un poco la idea de una medida de tendencia central. Veamos los datos del ejemplo 4.2  91,95,95,94,92,93,98,97,96,0 Aquí la moda es única, 95. Difiere poco de la mediana, que para estos datos es 94.5. En este caso parecen ser más representativos de la muestra que la media. Es importante aclarar que la moda de un grupo de datos puede no existir, ser única o haber más de una. 4.3 Otras medidas de variabilidad 4.3.1 El rango La medida más simple de variabilidad es el rango, que es la diferencia entre el valor máximo y el mínimo en un conjunto de datos. En el caso del ejemplo 4.1, el rango es 25-15=10. Para el ejemplo 4.2 es 98-0=98. El rango como medida de variabilidad, es limitado. Al tomar en cuenta únicamente los valores extremos de un conjunto de datos, no informa adecuadamente el cómo varían los valores alrededor de la media. Por otro lado el rango de una muestra depende de su tamaño. Las muestras pequeñas tienden a tener rangos pequeños y las grandes, rangos grandes. Bibliografía [1] Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México. Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill. México. [2] Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw- Hill. México. [3] Ibid.
  • 14. 14 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 5 5.1 Introducción Muchas distribuciones de datos en la práctica tiene la apariencia semejante a una campana. De suceder esto, es posible aproximarlas mediante una distribución de frecuencias que tiene tal forma conocida como distribución normal 1 . Cuando poseemos evidencia de tal comportamiento (en posteriores lecciones volveremos a este asunto), los datos muestran características de variación bien definidas, conocida como Regla empírica. 5.2 Regla empírica En una distribución de medidas con un comportamiento aproximadamente normal (forma de campana de Gauss), se puede deducir qué, en el intervalo cuyos puntos extremos son:    contiene alrededor del 68% de los datos  2  contiene alrededor del 95% de los datos  3  contiene alrededor del 99% de los datos Una vez conocida la distribución de frecuencias de una serie de datos, se pueden establecer probabilidades respecto al conjunto de observaciones. Tales probabilidades se pueden asociar con las áreas de un histograma de frecuencias. En consecuencia, las probabilidades de la regla empírica constituyen áreas bajo la curva normal. (ver Gráfico 5.1). Figura 5.1 1 De todas las distribuciones de variable continua conocidas, quizá la más importante en estadística es la distribución normal. La función de distribución normal se publicó por vez primera en 1733 por A. Demoivre. Cerca de 1820, Karl Friedrich Gauss buscando la determinación matemática de la forma y tamaño del globo terráqueo, desarrolló varias herramientas en el tratamiento con datos de las observaciones existentes. Una de ellas es la curva de distribución de errores, que en su honor, también se conoce como campana de Gauss.
  • 15. 15 Un ejemplo puede ilustrar lo anterior. Regresemos al ejemplo 1.1, recordemos que los datos representan los puntajes del CI de 150 estudiantes de tercer grado de un determinado sistema escolar. Utilizando la hoja de cálculo Excel©, obtenemos las medidas de tendencia central y dispersión de los datos (Tabla 5.1) y el histograma respectivo (Gráfico 5.2) Tabla 5.1 Media 108.43 Mediana 108.50 Moda 113 Desviación estándar 11.14 Varianza de la muestra 124.21 Curtosis -0.83 Rango 44 Mínimo 85 Máximo 129 Cuenta 150 Gráfica 5.2 De la tabla 5.1 y de acuerdo a la Regla empírica, suponiendo que los datos tienen un comportamiento normal, esperamos que el 68% de los datos este entre 97.29 y 119.57. Dicho de otra manera, la probabilidad de que el valor de una calificación del CI, elegida al azar, este entre 97.29 y 119.57, es de 68%. Excel muestra entre otras medidas la curtosis. En específico, la ayuda de Excel© da la siguiente descripción: Devuelve la curtosis de un conjunto de datos. La curtosis caracteriza la elevación o el achatamiento relativo de una distribución, comparada con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana. Bibliografía [1] Mendenhall III, D. et al. (2002). Estadística matemática con aplicaciones. Thomson. México. Wayne W. Daniel.(1988). Estadística con aplicaciones a las ciencias sociales y a la educación. McGraw-Hill. México. [2] Microsoft Excel© 2010. 0.00% 20.00% 40.00% 60.00% 80.00% 100.00% 120.00% 0 10 20 30 40 50 95 105 115 125 y mayor... Frecuencia Clase Histograma Frecuencia % acumulado
  • 16. 16 División de Ciencias Sociales y Humanidades Tronco Divisional Casa abierta al tiempo UNIVERSIDAD AUTÓNOMA METROPOLITANA Taller de Matemáticas Aplicadas a las Ciencias Sociales Lección 6 6.1 Introducción
  • 17. 17