3. DEFINICIÓN DE ESTADÍSTICA
Es un sistema o método en la
recolección ,organización ,análisis y
descripción numérica de la
información.
También se puede decir que la
estadística estudia el comportamiento
de los fenómenos de grupo.
4. DIVISIÓN DE LA ESTADÍSTICA
ESTADÍSTICA
ESTADÍSTICA INFERENCIAL O
ESTADÍSTICA ANALÍTICA
DESCRIPTIVA
Busca dar explicaciones al
Tiene como finalidad poner comportamiento de conjunto de
en evidencia aspectos observaciones, probar la sigilación o
característicos (promedios, validez de los resultados ;intenta
variabilidad de los datos, descubrir las causas que lo
etc),que sirven para efectuar originan, con gran aplicación en el
comparaciones sin pretender campo del muestreo, lográndose de
sacar conclusiones del tipo esta manera, conclusiones que se
más general. extienden mas allá de la muestra
estadística misma.
6. POBLACIÓN
O Grupo de estudio que tiene una
característica en común.
Ejemplo: La población de
fumadores de Colombia.
Los clubes de futbol de España.
El número de tornillos
defectuosos en 1ooo cajas ,etc.
7. MUESTRA
Es un subgrupo de la
población que , goza de las
mismas propiedades de la
población y sirve para facilitar
un estudio estadístico
particular.
8. VARIABLE ESTADÍSTICA
Es la característica que se
estudia en el conglomerado
o población. La variable
estadística se subdivide en
cualitativa y cuantitativa.
10. TABLA DE FRECUENCIAS
Las tablas de frecuencias son
métodos de agrupación , que
permiten organizar, simplificar y
analizar la información de la manera
más objetiva y conveniente.
11. VARIABLE CUALITATIVA
En un barrio x de un municipio z, una firma
comercial realiza una encuesta para establecer cual
es la marca de tenis preferida por los habitantes de
dicha población entre Baltus, Ponty , Muntre ,Titán y
Atlantis y estos sonP los resultados A
B M M P A P A T
T T B B T M P P T M
M T M T A M P P P M
T P M T A B T M T T
M P A M A B T P A A
A A M T B A T B A M
T M T A B A B A A T
A P M A T A M B A M
12. Antes de construir la tabla de
frecuencias, se debe establecer la cantidad
de datos y el tipo de variable con respecto
a los datos suministrado. Para este caso se
tiene n=80 y la variable es la cualitativa .
La tabla de frecuencias que se construirá
siempre tendrá 7 columnas y el número de
filas dependerá de la cantidad de
variables implicadas más dos filas ,así:
15. B M M P P A A P A T
T T B B T M P P T M
M T M T A M P P P M
T P M T A B T M T T
M P A M A B T P A A
A A M T B A T B A M
T M T A B A B A A T
A P M A T A M B A M
17. MARCAS TENIS PREFERIDOS POR LOS HABITANTES
DEL BARRIO X DEL MUNUCIPIO Z
Atlantis 21 26,25 21 26,25
Baltus 10 12,50 31 38,75
Muntre 18 22,50 49 61,25
Ponty 12 15,00 61 76,25
Titán 19 23,75 80 100,00
18. VARIABLE CUANTITATIVA DISCRETA
En un barrio r de un municipio t, la primera
autoridad del municipio ,realiza un sondeo entre las
familias de dicho barrio, sobre el número de hijos
de las mismas con el fin de ayudarlas
proporcionalmente a la cantidad de hijos que posean
, y estos son los resultados.
1 2 4 0 1 2 3 4 2 1
0 3 2 2 3 3 2 2 0 0
2 2 3 4 2 2 3 1 3 2
3 1 1 2 4 4 1 2 3 1
4 0 2 1 2 3 4 3 2 1
19. Se realiza el mismo
procedimiento como si se
estuviera trabajando con la
variable cualitativa , solo que
para este caso las variables
son números enteros.
25. La información anterior
corresponde a las masas corporales
medidas en kgs de los estudiantes
de una institución educativa x,
realizar una tabla de frecuencias y
escribir un título adecuado en
acorde con la información.
26. Antes de construir la tabla de frecuencias, se
debe establecer la cantidad de datos y el tipo de
variable con respecto a los datos suministrado.
Para este caso se tiene n=100 y la variable es la
cuantitativa continua . La tabla de frecuencias que
se construirá siempre tendrá 8 columnas y el
número de filas dependerá de la cantidad de
intervalos de clase implicados más dos filas.
Ya se sabe que la cantidad de columnas son 8 y
hay dos filas fijas .
33. 7.Como el rango resultó de la
diferencia entre el dato más
grande y el dato más pequeño,
entonces con el nuevo rango se
altera automáticamente el dato de
mayor valor y el de menor valor ;
por ende se deben recalcular, así:
34. Como ya se realizaron todos los pasos necesarios
para construir la tabla de frecuencia, se procede a
construirla, así: se sabe que la tabla debe tener 8
columnas por que estas son fijas y 10 filas por que
dos filas son fijas más 8 filas que resultaron de la
cantidad de intervalos , luego la tabla queda de la
siguiente forma:
35.
36. Como ya se tiene la tabla se
procede a escribir los
intervalos de clase y las
marcas de clase en la
tabla,así:
38. Luego se procede a contar la
información que corresponde a cada
intervalo, es decir en el caso del
intervalo [48-53)se cuenta toda la
información que está entre 48 y
53,pero 53 no se cuenta ,se cuenta en
el siguiente intervalo; así:
44. GRÁFICOS ESTADÍSTICOS
Los gráficos estadísticos son el complemento de las
tablas de frecuencias y nos permiten visualizar la
información de un modo más agradable e
interpretarla con mayor facilidad; entre los gráficos
más utilizados tenemos: El diagrama de pastel, el
diagrama de barras, el histograma, el polígono de
frecuencias, el diagrama lineal, la ojiva ,pictogramas y
la pirámide.
45. EL DIAGRAMA DE PASTEL
Es uno de los gráficos más utilizado
en estadística, el cual sirve para
representar a las variables cualitativa y
cuantitativa discreta.
Se recomienda para su uso que las
variables involucradas no sean más de
7.
46. EJEMPLO DEL DIAGRAMA DE PASTEL MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL MUNUCIPIO
Z
MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL MUNUCIPIO Z
Titán, 1 Atlantis,
21 26,25 9 21
Atlantis Ponty, 1 Baltus,
10 2 Muntre, 10
12,50
Baltus 18
18 22,50
Muntre
12 15,00
Ponty
47. EJEMPLO DEL DIAGRAMA DE PASTEL
MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL
MUNUCIPIO Z
23,75% 26,25% Atlantis
21 26,25
Atlantis 15,00%
Baltus
12,50%
Muntre
10 22,50%
12,50 Ponty
Baltus
Titán
18 22,50
Muntre
12 15,00
Ponty
48. EL DIAGRAMA DE BARRAS
Es otro de los gráficos más
utilizado en estadística, el cual
sirve para representar a las
variables cualitativa y
cuantitativa discreta.
49. EJEMPLO DEL DIAGRAMA DE BARRAS MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL MUNUCIPIO
Z
MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL MUNUCIPIO Z
50
21
10 18
21 26,25 0 12 19
Atlantis
10 12,50
Baltus
MARCAS TENIS PREFERIDOS POR
18 22,50 LOS HABITANTES DEL BARRIO X DEL
Muntre MUNUCIPIO Z
12 15,00
Ponty
50. EJEMPLO DEL DIAGRAMA DE BARRAS
MARCAS TENIS PREFERIDOS POR LOS HABITANTES DEL BARRIO X DEL
MUNUCIPIO Z
MARCAS PREFERIDAS POR LOS HABITANTES DE
UN BARRIO X EN UN MUNICIPIO Z
21 26,25 26,25%
Atlantis 12,50%22,50%
15,00% 23,75%
10 12,50
Baltus
18 22,50
Muntre
12 15,00
Ponty
51. INCLINACIÓN SEXUAL EN
LA REPÚBLICA DE MACHIKISTAN EN
SUS PRINCIPALES CAPITALES
80%
CANTIDAD DE
60%
40%
HABITATES
20%
0%
HETEROSEXUAL
HOMOSEXUAL
BISEXUAL
CIUDADES CAPITALES
52. EGRESADOS DE LA FACULTAD DE INGENIERÍAS EN
LAS PRINCIPALES UNIVERSIDADES DE MACHIKISTÁN
EN EL AÑO 3.047
75
80
53 52 54
60 43 39 45
29 34
40 21 18 26
20
0
PALOYA KALMI PIRTISCAN ASORCAN
I.DE SISTEMAS I.ELECTRÓNICA I.CIVIL
53. DIAGRAMA LINEAL
Sirve para expresar datos cualitativos
o cuantitativos. Uno de los mayores
beneficios de este diagrama
consiste en las etapas cronológicas
que se se llevan a situaciones
productivas bien sea en ascenso o
descenso .
54. 16
14
12
10
TONELADAS
8
EXPORTACIONES DE CAFÉ
DE LA FIRMA GATULOPIA
6
4
2
0
2036 2037 2038 2039
AÑOS
55. EXPORTACIONES DE CAFÉ EN TONELADAS DE LAS EMPRESAS MACHIKISTIANAS
CAFÉ AMERICANO MUNDO CAFETAL CAFÉ LATINO
16
14
12
10 10
8 8
6 6
4 4
2
2036 2037 2038 2039
56. HISTOGRAMA DE FRECUENCIAS
El histograma de frecuencias es un
gráfico que facilita la visualización e
interpretación de información
correspondiente a la variable
cuantitativa continua, dicho gráfico basta
trazarlo conociendo los intervalos de
clase y la frecuencia absoluta para cada
intervalo, así:
57. PESO EN KGS DE LOS ESTUDIANTES DE
UNA INSTITUCIÓN EDUCATIVA X
[50- 60) 55 8
[60-- - 70) 65 10
[70- 80) 75 16
[80- 90) 85 14
[90- 100) 95 10
[100- 110) 105 5
[110- 120) 115 2
58. PESO EN KGS DE LOS ESTUDIANTES DE
UNA INSTITUCIÓN EDUCATIVA X
59. POLÍGONO DE FRECUENCIAS
Es un gráfico que representan datos continuos;
consiste en unir en una línea quebrada cada una
de las marcas de clase entre sí, comenzando
desde el valor más pequeño con la primera
marca de clase del intervalo de esta y luego con
la segunda marca de clase hasta la unión de la
última marca de clase con el valor más grande del
último intervalo. Como ejemplo se tiene la línea
roja que se combina con el histograma de
frecuencias.
60. PESO EN KGS DE LOS ESTUDIANTES DE
UNA INSTITUCIÓN EDUCATIVA X
[50- 60) 55 8
[60-- - 70) 65 10
[70- 80) 75 16
[80- 90) 85 14
[90- 100) 95 10
[100- 110) 105 5
[110- 120) 115 2
61. PESO EN KGS DE LOS ESTUDIANTES DE
UNA INSTITUCIÓN EDUCATIVA X
62. LA OJIVA
Es un gráfico que corresponde a la
variable cuantitativa continua ; su
construcción consiste en tomar los
intervalos de clase con las
frecuencias acumuladas bien sea
absoluta o porcentual y unir la
ascendencia o la descendencia de
los puntos resultantes en una
línea que por lo general es curva
65. Las medidas de posición o
tendencia central, denominados
también promedios, nos
permiten determinar la
posición de un valor respecto a
un conjunto de datos , el cual
consideramos como
representativo o típico, para el
66. Si con el resultado obtenido en
una encuesta, aplicada en una
zona o barrio de la ciudad,
afirmamos que el consumo
promedio de leche por familia
es dos litros por semana,
estamos representando una
gama o variedad de consumos,
67. consumen , hasta un consumo
superior a dos litros. Con esta
información hacemos referencia
al comportamiento del consumo
de leche en una zona de la
ciudad; también ,el resultado
puede ser comparado con los
consumos promedios de otros
68. por persona, o establecer la
relación que hay entre el consumo
y los niveles de ingreso.
Las medidas de tendencia central
más utilizada son: la media
aritmética, la mediana y la moda.
70. CÁLCULO DE LA MEDIA ARITMÉTICA
PARA DATOS SIN AGRUPAR
O
71. CÁLCULO DE LA MEDIA ARITMÉTICA PARA
LA VARIABLE CUANTIITATVA DISCRETA
O
72. EJEMPLO
Calcular la media aritmética ,correspondiente al
número de hijos de las familias de un barrio x de
la ciudad z.
1 40 26,67 40 26,67 40 0,267
2 78 52,00 118 78,67 156 1,040
3 32 21,33 150 100 96 0,640
150 100 ----- ----- ---- 292 1,947
94. CÁLCULO DE LA MODA PARA LA
VARIABLE CUANTITATIVA DISCRETA
O
95. EJEMPLO
Calcular la moda , correspondiente al número
de hijos de las familias de un barrio x de la
ciudad z.
1 40 26,67 40 26,67
52,00 118 78,67
3 32 21,33 150 100
150 100 ----- ----- ----
96. CÁLCULO DE LA MODA PARA LA
VARIABLE CUANTITATIVA CONTINUA
O
97. EJEMPLO
O Calcular la moda correspondiente a las velocidades (km/h)de
los automóviles que se trasladan entre las ciudades A y B.
[55 - 65) 60 90 18,0 90 18,0
[65 - 75) 70 87 17,4 177 35,4
[75 - 85) 21,2 283 56,6
[85 - 95) 90 73 14,6 356 71,2
[95 - 105) 100 58 11,6 414 82,6
98.
99. CÁLCULO DE LA MODA PARA LA
VARIABLE CUANTITATIVA CONTINUA
O
100. EJEMPLO
O Calcular la moda correspondiente a las velocidades (km/h)de
los automóviles que se trasladan entre las ciudades A y B.
[55 - 65) 60 90 18,0 90 18,0
[65 - 75) 70 17,4 177 35,4
80 21,2 283 56,6
[85 - 95) 90 14,6 356 71,2
[95 - 105) 100 58 11,6 414 82,6
105. Como su nombre lo indica , las
medidas de dispersión son
mecanismos que nos permiten analizar
y comparar datos de tal manera que nos
indican que tan homogéneos o
distantes están los datos de una
muestra representativa. Entre las
medidas de dispersión tenemos: El
rango, la desviación media, la varianza y
la desviación estándar.
106. EL RANGO
O Se define como la diferencia entre el
dato de mayor valor y el dato de
menor valor, sin tener en cuenta la
frecuencia absoluta de los mismos. El
rango se calcula tanto para datos
agrupados como para datos sin
agrupar.
120. CÁLCULO DE LA VARIAZA Y LA
DESVIACIÓN TÍPICA PARA
DATOS NO AGRUPADOS
121. FÓRMULA DE LA VARIANZA Y LA DESVIACIÓN
TÍPICA PARA DATOS NO AGRUPADOS
VARIANZA DESVIACIÓN TÍPICA
122. EJEMPLO DE LA VARIAZA Y LA DESVIACIÓN
TÍPICA PARA DATOS NO AGRUPADOS
O
123. CÁLCULO DE LA VARIAZA Y LA
DESVIACIÓN TÍPICA PARA
DATOS AGRUPADOS
124. FÓRMULA DE LA VARIANZA Y LA DESVIACIÓN
TÍPICA PARA DATOS AGRUPADOS
VARIANZA DESVIACIÓN TÍPICA
125. EJEMPLO
Calcular la media aritmética ,correspondiente al
número de hijos de las familias de un barrio x de
la ciudad z.
1 40 40 0,267 40
2 78 156 1,040 0
3 32 96 0,640 32
150 292 1,947 ---------- 72
126. EJEMPLO
O Calcular la media aritmética correspondiente a las
velocidades (km/h)de los automóviles que se trasladan
entre las ciudades A y B.
[55 - 65) 60 98 5880
[65 - 75) 70 87 6090
[75 - 85) 80 98 7840
[85 - 95) 90 73 6570
[95 - 105) 100 58 5800
[105 - 115) 110 45 4950
127.
128. EJEMPLO
O Calcular la media aritmética correspondiente a las
velocidades (km/h)de los automóviles que se trasladan
entre las ciudades A y B.
[55 - 65) 60 98 5880 56919,38
[65 - 75) 70 87 6090 17296,47
[75 - 85) 80 98 7840 1647,38
[85 - 95) 90 73 6570 2541,13
[95 - 105) 100 58 5800 14662,98
[105 - 115) 110 45 4950 30186,45
132. COEFICIENTE DE VARIACIÓN-CV
Más conocido como variación relativa. En ocasiones nos
interesa comparar la variabilidad de dos series de
datos, sin embargo podemos encontrar, al hacerlo, que
ambas series están expresadas en diferentes unidades,
por lo tanto no se podrán comparar sus varianzas o
sus desviaciones típicas. Puede darse el caso de que
estén expresadas en la misma unidad, pero nos
interesa determinar la variación respecto a una base.
Para resolver los anteriores problemas se usa el
coeficiente de variación. Si es multiplicado por 100,el
resultado se dará en términos porcentuales.
136. CONCEPTO DE PROBABILIDAD
El concepto de probabilidad puede ser interpretado
como algo indifinible,pero usado para expresar de
algún modo, un grado de creencia que uno tiene de
la ocurrencia de un suceso; nos referimos a algo que
puede suceder con base en la experiencia que se
tenga.
Los hinchas de los diferentes equipos de fútbol
discuten frecuentemente sobre la posibilidad de
clasificación o de ganar el campeonato; algo similar
ocurre con los que juegan la lotería o apuestan en
las carreras de caballos.
137. En la actualidad las probabilidades tienen una estrecha
relación con la Teoría de Conjuntos, de gran importancia
en el campo de la inferencia estadística debido a la
incertidumbre que siempre se tiene en la toma de
decisiones, permitiendo el análisis de los riesgos que se
corren y la forma de minimizar el azar inherente. En
estadística, el uso de las predicciones es de gran utilidad
cuando se realizan investigaciones por muestreo , en la
mayoría de los casos obligado por el costo y el tiempo que
conllevaría la realización de una investigación total, lo cual
nos limita a un reducido número de elementos; y con base
en esa información disponible, procedemos a la realización
de predicciones o estimaciones, asignando límites de
confianza a esos resultados.
138. Las probabilidades conjuntamente con la
estadística tienen infinidad de aplicaciones
a problemas de economía y ciencias
sociales,de la misma manera a las ciencias
físicas,industria,comercio y gobierno,con la
observación de en cada uno de ellos tendrá
sus requisitos particulares. Se puede hablar
de posibilidades y de probabilidades,el
primero el primero hace referencia a la
comparación entre el número de resultadsos
favorables con los desfaborables:
139.
140. Es difícil dar una definición
exacta de que son las
probabilidades, sin embargo
se tratara de obtener alguna
que se aproxime a ella.
142. Si la probabilidad fuera 0 ó 1
no habría problema en decidir el resultado
para esos valores pero existen una serie de
fenómenos cuyos valores están
comprendidos entre esos límites que
dificultan un poco su cálculo. Se llamará
suceso a cada caso posible, es decir a la
realización de un acontecimiento y este
puede ser :
143. Se dirá que un echo es
cierto , cuando son favorables
todos los casos posibles. Un
ejemplo puede ser, el de
comprar todos los billetes de
un sorteo, por lo tanto será
un echo cierto que ganará el
sorteo.
144. Se llamará un echo
verosímil aun suceso
susceptible de realizarse
pero su probabilidad
favorable es menor que la
unidad y mayor que 0,5.
145. Si la probabilidad es igual a
0,5 será un echo dudoso, ya
que las probabilidades
ventajosas y desventajosas
son iguales; Tal es el caso
del lanzamiento de una
moneda , en la aparición de
cara o sello.
146. Hecho inverosímil, Se
presenta cuando la
probabilidad es menor
que 0,5 y mayor que
cero.
147. Hecho imposible , es cuando
no existe posibilidad alguna
de salir favorecido ; por
ejemplo el individuo que no
compra lotería, la
probabilidad que tiene para
ganar es cero.