2. Introducción
La Estadística es una ciencia
que facilita la solución de
problemas en los cuales
necesitamos conocer
características sobre el
comportamiento de algún
suceso o evento.
Nos permite inferir el
comportamiento de sucesos
iguales o similares sin necesidad
de que estos ocurran.
3. Esto nos da la posibilidad de
tomar decisiones acertadas y a
tiempo, así como realizar
proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos
de una muestra de la población
y no con toda la población.
4. Actualmente el INE es el encargado de
concentrar y publicar la información
estadística del estado y del país.
5. Conceptos básicos
Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para después
obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:
Se encarga de la
recolección, organización,
presentación y análisis de
los datos de una población.
6. Estadística inferencial:
Se encarga de analizar la
información presentada por la
estadística descriptiva mediante
técnicas que nos ayuden a conocer,
con determinado grado de confianza,
a la población. Lo que nos permite
tomar decisiones.
7. Población:
Conjunto definido de TODOS los INDIVIDUOS,
de donde se observa cierta característica.
Al número de integrantes de la población se
llama tamaño de la población y se
representa con la letra N.
Las poblaciones pueden ser finitas o infinitas.
8. Población Estadística:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medición de una
variable en los elementos de una población.
Muestra:
Subconjunto de una población, que intenta
reflejar las características de la población lo
mejor posible.
El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.
9. Individuo:
Es el elemento de la población o de la muestra
que aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos
que se desea estudiar y se puede medir o
calificar; cambia o varía con el tiempo en un
individuo dado, o cambia o varía de elemento
a elemento.
Ej. Edad, peso, sexo, estado civil, número de
hijos, etc.
10. Dato:
Valor que se obtiene al realizar la medición
de la característica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
11. Datos Cuantitativos
(números):
Valores obtenidos al medir
peso, estatura, temperatura,
número de hijos.
Datos Cualitativos
(categorías):
Se obtienen al calificar la
característica en cuestión
como el sexo, estado civil,
grado máximo de estudios.
12. Variable
Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1,
hombre – mujer, bueno – malo, encendido –
apagado).
En la variable CUANTITATIVA se pueden
distinguir dos tipos: continua y discreta.
13. Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un
individuo.
14. Escalas de Medición
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
15. Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritméticas entre sus
valores, pues éstos son únicamente
ETIQUETAS.
Ejemplo: sexo, código postal, estado civil,
número telefónico, número al correr en un
maratón, deporte favorito, carrera a
estudiar, etc.
16. Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel específico, pero no
se pueden hacer operaciones
aritméticas entre ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno –
Excelente
Primaria – Secundaria – Preparatoria -
Licenciatura
17. Escala de Intervalo:
En ella existe un orden entre los valores
de la variable y además una NOCIÓN
DE DISTANCIA aunque no se puedan
realizar operaciones.
El cero o punto de inicio no es único, es
más bien un punto de referencia.
Ejemplo: Escalas de temperatura, la
edad de la Tierra, la línea del tiempo de
la humanidad.
18. Escala de Razón:
La magnitud tiene SENTIDO FÍSICO,
existe el cero absoluto, existe orden,
se puede determinar cuántas veces
es mayor uno que otro.
Ejemplo: peso, estatura, edad,
distancia, dinero, etc.
19. Fuentes de información
Encuesta:
Recopilar los datos mediante el
uso de cuestionarios o
entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
20. Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
21. Orden de datos
La ordenación es el proceso mediante el
cual los datos están acomodados de tal
manera que se establece un orden
(ascendente o descendente) entre ellos.
Hay dos métodos comunes:
• Listado en orden ascendente
• Método de tallo y hojas
22. Ejemplo
Considera que la variable de estudio
es el peso de 25 estudiantes. Los
pesos se encuentran en la siguiente
tabla:
Peso de 25 estudiantes (en kg)
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
23. Listado en orden ascendente
El proceso consiste en ordenarlos de
menor a mayor
Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)
42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45 55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
24. Método de tallo y hojas
Si los números de los datos están formados
por dos dígitos, se hace una columna con el
primer dígito (decenas) y a la derecha de
cada uno de ellos se escribe, en fila, sólo el
segundo dígito (unidades) de cada uno de
los datos que tengan el mismo primer dígito.
25. Datos sin ordenar: Peso de 25 estudiantes (en kg)
4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
6 52 62 44 50 59
2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
26. Doble tallo
Una variante de este método es en lugar de
dividir en un grupo las decenas, se divide en
dos grupos. El primero abarcando los dígitos
del 0 al 4 y el segundo del 5 al 9.
El ejemplo anterior
4 0,2,3,4,4
queda: 4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
27. Caso de variables cualitatitivas
El procedimiento es:
◦ Se identifican todos los valores diferentes
y se acomodan en columna.
◦ Se agrega una segunda columna en
donde se van registrando, mediante una
línea vertical, la veces que aparece el
valor dado.
28. Ejemplo
Considera que la variable de estudio
es el color de playera de 25
estudiantes.
Los colores se encuentran en la
siguiente tabla:
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
29. Color Frecuenci
rosa azul blanco azul rosa a
IIII
gris blanco café negro blanco Azul
IIII I
rosa azul café blanco blanco Blanco III
I
gris azul blanco rosa gris Café
IIII
gris blanco café negro verde Gris
II
Negro
IIII
Rosa
I
Verde
30. Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los
datos, se acomodan en la “Tabla de
distribución de frecuencias o tabla de
frecuencias”.
La tabla es básicamente una tabla de
valores x-y, dónde “x” representa el dato y
“y” representa la frecuencia.
31. La frecuencia es el número de veces
que aparece cada dato.
Hay dos clases de tablas de
frecuencias:
◦ Para datos NO agrupados.
◦ Para datos agrupados.
32. Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para
la variable “xi” y la otra para su
frecuencia “f”, a esta frecuencia se le
llama frecuencia absoluta o frecuencia
observada.
33. Ejemplo
Tabla de frecuencias de los pesos en
kg de 25 alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
34. Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas:
la de la frecuencia relativa “fr” y la de la
frecuencia acumulada “fa”.
La frecuencia relativa se obtiene
mediante el cociente de la frecuencia y
el número total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene
sumando las frecuencias anteriores a las
frecuencias de un dato dado.
35. Ejemplo
1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 10 63 2 número
0.08 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Tot 25 1
al
Siempre es 1
36. Intervalo de clase
En ocasiones es conveniente acomodar los datos en pequeños
grupos de igual tamaño, llamados intervalos de clase.
El punto medio o marca de clase “xi”, se obtiene con:
El tamaño del intervalo se obtiene mediante la diferencia de
los límites superior e inferior.
Marca de clase = Límite inferior + límite superior
2
38. Límite verdadero del intervalo
Frontera de clase o límite verdadero
del intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
39. Tabla de intervalos con
límites verdaderos
UsandoNo está incluido
Está incluido
símbolos Está incluido paréntesis
Usando No está incluido
de desigualdad y corchetes
Intervalo de Punto Intervalo de Punto
clase medio clase medio
“xi” “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
El tamaño del intervalo es de
40. Si por alguna razón no es fácil decidir el
ancho del intervalo y el número de ellos,
se pueden utilizar las siguientes fórmulas:
K = 1 + 3.3 log (n)
Donde K = número aproximado de clases
n = número de datos.
Amplitud de los intervalos = Rango / K
Donde Rango = diferencia entre el dato
mayor y el dato
menor.
41. Ejemplo
Para el ejemplo de los datos de los
pesos de 25 alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
Y la amplitud de los intervalos sería:
Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.
Aproximadamente 5 unidades es la amplitud
de los intervalos.
42. Tabla de distribución de
frecuencias para datos
agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar
40 1 55 2 Intervalo Punto f
42 1 56 2 de clase medio “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
43. Se agregan las columnas de
frecuencia relativa “fr” y frecuencia
acumulada “fa”: f
Intervalo Punto fr Fa 2/25
de clase medio
“xi” 4/25
0.08 2
38 – 42 40 2 8/25
0.16 6
43 – 47 45 4
0.32 14
48 – 52 50 8
0.20 19
53 – 57 55 5
0.12 22
58 – 62 60 3
0.12 25
63- 68 65 3
1
Total 25
44. Por último se agregan las columnas:
◦ Frecuencia porcentual, “f%” ó “%f”, se
obtiene multiplicando la frecuencia
relativa “fr” x 100.
◦ Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas
anteriores a un dato dado.
◦ Frecuencia porcentual acumulada,
“f%a”, se obtiene sumando las
frecuencias porcentuales acumuladas a
un dato dado.
45. Tablas de frecuencias absoluta, x
0.08
100
relativa y acumulada
0.08 x 2/25
100
Interval Punto f fr f% fa fra f%a
o de medio “xi”
clase 8 0.08 8
38 – 42 40 2 0.08 16 2 0.24 24
43 – 47 45 4 0.16 32 6 0.56 56
48 – 52 50 8 0.32 20 14 0.76 76
53 – 57 55 5 0.20 12 19 0.88 88
58 – 62 60 3 0.12 12 22 1 100
63- 68 65 3 0.12 100 25
Total 25 1
46. Gráfica de Datos
Existen dos tipos de gráficas mas
usuales:
◦ Polígono de Frecuencias
◦ Histograma
Otros gráficos:
◦ Gráfica de barras
◦ Pictograma
◦ Gráfico Circular o de pastel.
47. Polígono de Frecuencias
Es la representación mediante un
gráfico de línea. En él se muestra la
distribución de frecuencias y está
formado por segmentos de línea que
unen los puntos correspondientes a la
frecuencia de cada una de las clases.
El eje “x” representa el dato “xi”
y el eje “y” las frecuencias.
48. Ejemplo
9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio f 3
clase “xi” 2
1
38 – 42 40 2
0
43 – 47 45 4 35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
49. El eje “y” puede ser sustituido por las
frecuencias relativas o porcentuales.
Polígono de Frecuencia Relativa
0.35
0.3
0.25
fr 0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65 70
xi
51. Histograma
Es la representación gráfica de
14
12
10
los datos mediante una sucesión
8
6
de rectángulos. 4
2
0
0,95 2,95 4,95
Está formado por rectángulos cuya
anchura representa a cada uno de los
intervalos y la altura corresponde a la
frecuencia.
En el eje “x” estarán los límites
verdaderos, los puntos medios y en el
eje “y” las frecuencias.
52. Intervalo de Punto medio f
clase “xi”
Ejemplo 38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
Histograma 63 - 68 65 3
9
Total 25
8
7
6
5
f 4
3
2
1
0
35 40 45 50 55 60 65
xi
53. También podemos usar la frecuencia
relativa y la frecuencia porcentual.
Histograma con frecuencias relativas
0.35
0.3
0.25
fr
0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65
xi
55. Pirámide Poblacional
Una variante en el histograma es colocar
en el eje “x” de tal manera que las
columnas quedarán en forma
horizontal, es muy común en datos
poblacionales.
56. Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias
acumuladas de los datos.
En el eje “x” estarán los puntos
medios y en el eje “y” las frecuencias
acumuladas.
57. Ejemplo
Intervalo Punto f fr fa
de clase medio
“xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
62. Gráfico Circular
También es llamado gráfico de pastel.
Sólo se representan datos de
frecuencias relativas o frecuencias
porcentuales.
Se debe dividir el área del círculo de
13% 13%
PERRO
17%
manera proporcional a las PAJARO
HAMSTER
GATO
frecuencias. 57%
63. Agregaremos una columna a nuestra
tabla de frecuencias “Frecuencia relativa
al círculo”, multiplicando (fr)(360°), para
mostrar la parte proporcional de círculo
medida en grados que corresponde a
cada intervalo.
64. Ejemplo 1
0.08 x
360
Intervalo Punto f fr (fr ) (360°)
de clase medio “xi” 0.16 x
38 – 42 40 2 0.08 28.8 360
43 – 47 45 4 0.16 57.6
48 – 52 50 8 0.32 115.2
53 – 57 55 5 0.20 72
58 – 62 60 3 0.12 43.2
63- 68 65 3 0.12 43.2
Total 25 1 360
66. Ejemplo 2
Color Frecuenci Conteo Color de Playera
a
IIII Azul Blanco Café Gris
Azul 4 Negro Rosa Verde
IIII I 4%
Blanco III 7
I 16% 16%
Café 3
IIII 8%
Gris 4 28%
II 16%
Negro 2
IIII 12%
Rosa 4
I
Verde 1
67. Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se
dibujan separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números
NO consecutivos.
Frecuencia absoluta
60
50
40
30
20
10
0
PERRO PAJARO HAMSTER GATO
68. Alumno
Carrera
s Elección de Carrera
Medicina 8
11 11
Mecánica 11 8 8
Civil 8 6
3 3
Agronomía 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
69. Pictograma
Similar al de barras, sólo que se
sustituyen por figuras, generalmente
relacionadas con la variable
estudiada.