2. La Estadística es una disciplina que utiliza
recursos matemáticos para organizar y
resumir una gran cantidad de datos
obtenidos de la realidad, e inferir
conclusiones respecto de ellos.
Por ejemplo, la estadística interviene
cuando se quiere conocer estado sanitario
de un país, a través de ciertos parámetros
como la tasa de morbilidad o mortalidad de
la población
3. • En este caso la estadística describe la
muestra en términos de datos organizados
y resumidos, y luego infiere conclusiones
respecto de la población.
• Aplicada a la investigación científica,
también infiere cuando provee los medios
matemáticos para establecer si una
hipótesis debe o no ser rechazada
4. • La estadística puede aplicarse a cualquier
ámbito de la realidad, y por ello es utilizada
en física, química, biología, medicina,
astronomía, psicología, sociología,
lingüística, demografía, y así en diversas
ramas.
5. • Desde un punto de vista histórico, la
humanidad ha utilizado cuatro métodos
para adquirir el conocimiento:
La Autoridad
El Racionalismo
La Intuición
El Método Científico
6. • La Autoridad
– Al utilizar el método de autoridad, algo se
considera verdadero debido a una tradición o a
que alguna persona eminentemente dice lo que
es. Aunque este método de conocimiento es
poco favorable en la actualidad y a veces
conduce a errores es indispensable en nuestra
vida cotidiana
7. • La Autoridad
– Simplemente aceptamos una gran cantidad de
información como cierta con base en una
autoridad, tan solo sea por la razón que no
tenemos el tiempo ni la pericia para verificarlo
de primera mano
8. • El racionalismo
– Este método utiliza exclusivamente el
razonamiento para llegar el conocimiento.
Supone que si las premisas son validas y el
razonamiento se realiza de manera correcta, de
acuerdo con las reglas de la lógica, entonces las
conclusiones llegarán a la verdad
•
9. • La intuición
– Se entiende como una inspiración súbita, la idea
que aclara y salta a la conciencia como un todo.
No se llega por medio de la razón, por el
contrario, con frecuencia la idea parece surgir
después de que ha fallado el razonamiento
consciente.
10. • Método cientifico
– Aunque el método científico utiliza el
razonamiento y la intuición para llegar a la
verdad, se fundamenta en una evaluación
objetiva que es lo que lo distingue de los otros
métodos. El experimento científico esta en el
centro de la ciencia, y el método de la ciencia es
bastante directo.
11. • Se trata de valores de la variable estadística que se
caracterizan por la posición que ocupan dentro del
rango de valores posibles de esta. Entre ellos se
distinguen:
– Las medidas de tendencia central:
• Media
• Moda
• Mediana.
– Las medidas de posición no central:
• cuantiles (cuartiles, deciles y percentiles)
12. • Media
– Tambien denominada promedio aritmetico del
conjunto
– Media muestral x n
x1 x2 ... xn x i
x i 1
n n
n
x1 f1 x2 f 2 ... xn f n x f i i
x i 1
n n
13. • Mediana
– Otra medida de tendencia central, utilizada
principalmente en estadística no paramétrica,
es la mediana, la cual no se basa en la magnitud
de los datos, como la media aritmética, sino en
la posición central que ocupa en el orden de su
magnitud, dividiendo la información en dos
partes iguales, dejando igual número de datos
por encima y por debajo de ella.
14. • Mediana
Mediana Me x n 1 si n es impar
2
x n x n
1
2 2
Mediana Me si n es par
2
15. • Mediana
n
fa i 1
Me LI 2
A
fi
Me : M ediana
LI : Límite inferior del intervalo donde se encuentra la mediana
(intervalo mediano), el cual se determina observando en que clase
se encuentra la posición n/2.
n : Número de observacio nes
fa i 1 : Frecuencia acumulada anterior al intervalo mediano
f i : Frecuencia del intervalo mediano
A : Amplitud del intervalo
16. • Moda
– La moda, como su nombre lo indica, es el valor
más común (de mayor frecuencia dentro de una
distribución. Una información puede tener una
moda y se llama unimodal, dos modas y se
llama bimodal, o varias modas y llamarse
multimodal. Sin embargo puede ocurrir que la
información no posea moda.
17. • Moda
f m f m 1
Mo LI A
2 f m f m 1 f m 1
Mo : M oda
LI : Límite inferior del intervalo modal
f m : Frecuancia de clase modal
f m 1 : Frecuancia de clase premodal
f m 1 : Frecuancia de clase posmodal
A : Amplitud de los intervalos
18. • CUARTILES
– Las cuartillas o cuartiles son valores
posicionales que dividen la información en
cuatro partes iguales, el primer cuartil deja el
25% de la información por debajo de él, y el 75%
por encima, el segundo cuartil, al igual que la
mediana, divide la información en dos partes
iguales, y por último el tercer cuartil deja el 75%
por debajo de sí, y el 25% por encima.
19. • QUINTILES
– Los quintiles o quintillas dividen la información
en cinco partes iguales, agrupándolas en
porcentajes de 20, 40, 60, y 80 por ciento, en
consecuencia debemos calcular cuatro
parámetro
20. • DECILES
– Similarmente, los deciles o decillas dividen la
información en diez partes iguales, en
cantidades porcentuales de 10 en 10.
21. • CENTILES
– Obviamente los centiles dividen la información
en 100 partes, lo cual facilita la interpretación
porcentual de una distribución de frecuencias.
22. • Para calcular cualquier percentil
kn
fa i 1
Qk LI r A
fi
r : Número de partes en que se divide la informació n
Frecuancia de clase modal
k : Orden del percentil k 1,2.....r 1
LI : Limite inferior del intervalo que contiene el percentil
fa i 1 : Frecuencia acumulada hasta el intervalo anterior al que
contiene el percentil
f i : Frecuencia del intervalo que contiene el percentil
n : Número de observacio nes
A : Amplitud de los intervalos
23. • En el análisis estadístico no basta el cálculo e
interpretación de las medidas de tendencia
central o de posición, ya que, por ejemplo,
cuando pretendemos representar toda una
información con la media aritmética, no
estamos siendo absolutamente fieles a la
realidad, pues suelen existir datos extremos
inferiores y superiores a la media aritmética,
los cuales, en honor a la verdad, no están
siendo bien representados por este parámetro.
24. • En dos informaciones con igual media
aritmética, no significa este hecho, que las
distribuciones sean exactamente iguales,
por lo tanto, debemos analizar el grado de
homogeneidad entre sus datos
25. • Para medir el grado de dispersión de una
variable, se utilizan principalmente los
siguientes indicadores:
– Rango o recorrido
– Desviación media
– Varianza y desviación típica o estándar
– Coeficiente de variabilidad
26. • Rango o recorrido
– Es la medida de dispersión mas sencilla ya que
solo considera los dos valores extremos de una
colección de datos, sin embargo, su mayor
utilización está en el campo de la estadística no
paramétrica.
R xmax xmin
27. • Desviación media
– La desviación media, mide la distancia absoluta
promedio entre cada uno de los datos, y el
parámetro que caracteriza la información.
Usualmente se considera la desviación media
con respecto a la media aritmética
28. • Desviación media
m
x i x fi
DM i 1
n
DM : Desviación media
xi : Diferentes valores de la variable x
f i : Número de veces que se repite la observació n xi
x : M edia arítmetica de la informació n
n : Tamaño de la muestra
m : Numero de intervalos
29. • Varianza y desviación típica o estándar
– El problema de los signos en la desviación
media, es eludido tomando los valores
absolutos de las diferencias de los datos con
respecto a la media aritmética. Ahora bien, la
varianza obvia los signos elevando las
diferencias al cuadrado, lo cual resulta ser más
elegante, aparte de que es supremamente útil
en el ajuste de modelos estadísticos que
generalmente conllevan formas cuadráticas.
30. • Varianza y desviación típica o estándar
– La varianza es uno de los parámetros más
importantes en estadística paramétrica, se
puede decir que, teniendo conocimiento de la
varianza de una población, se ha avanzado
mucho en el conocimiento de la población
misma.
31. • Varianza y desviación típica o estándar
x
m 2
i x fi
S2 i 1
n
x
n 2
S 2 : Varianza x
i
xi : Diferentes valores de la variable x S2 i 1
n
f i : Frecuencia absoluta de la observació n xi
x : M edia arítmetica de la informació n
n : Tamaño de la muestra
m : Numero de intervalos
32. • Varianza y desviación típica o estándar
x
m 2
i x fi
S S2 i 1
n
S : Desviación estandar
x
n 2
x
S 2 : Varianza i
S S2 i 1
xi : Diferentes valores de la variable x n
f i : Frecuencia absoluta de la observació n xi
x : M edia arítmetica de la informació n
n : Tamaño de la muestra
m : Numero de intervalos
33. • Coeficiente de variabilidad
– Generalmente interesa establecer
comparaciones de la dispersión, entre
diferentes muestras que posean distintas
magnitudes o unidades de medida.
34. • Coeficiente de variabilidad
– El coeficiente de variabilidad tiene en cuenta el
valor de la media aritmética, para establecer un
número relativo, que hace comparable el grado
de dispersión entre dos o mas variables, y se
define como:
S
CV
x
35. • Variable discreta
– Es aquella que entre dos valores próximos
puede tomar a un número finito de valores, es
decir, es aquella que contiene saltos entre un
número y otro (1, 2, 3, 4, etc.), por ejemplo: el
número de miembros de una familia, el de
obreros de una fábrica, el de alumnos de la
universidad, etc.
36. • Variable continúa
– Es la que puede tomar infinitos valores de un
intervalo, es decir, es aquella que no contiene
saltos (1.1, 1.2, 1.3, 1.4, etc.) En muchas ocasiones
la diferencia es más teórica que práctica, ya que
los aparatos de medida dificultan que puedan
existir todos los valores del intervalo. Ejemplos,
peso, estatura, distancias, etc.