1. CONCEPTOS ESTADÍSTICOS BÁSICOS
INTRODUCCIÓN
En este documento se elaboró con el propósito de facilitar la conceptualización de los
principales términos estadísticos y contar con las formulas básicas para el desarrollo de la
competencia.
ESTADISTICA
“Ciencia que estudia los hechos colectivos, mediante la observación numérica, el análisis
matemático y la interpretación lógica, investigando especialmente sus causa y leyes empíricas”.
“Conjunto de métodos aplicados en la recolección, clasificación, presentación e interpretación
de datos numéricos, obtenidos de la observación de hechos que permiten, a la vez, inferir
conclusiones lógicas”.
ESTADISTICA DESCRIPTIVA
Describe el comportamiento de un hecho, a través de la recolección, ordenamiento,
clasificación, presentación mediante cuadros y gráficas, análisis e interpretación y utilización de
medidas.
Conjunto de instrumentos que colaboran en la depuración de datos, en su presentación clara y
en su simplificación para la interpretación, análisis y publicación.
ESTADISTICA INDUCTIVA O INFERENCIAL
Técnicas aplicadas en investigaciones parciales, denominadas MUESTRAS, que permiten la
obtención de ciertos resultados mediante la aplicación de medidas; considerados como
estimadores de los valores estadísticos de la población es decir parámetros.
IMPORTANCIA DE LA ESTADISTICA
- Se considera la estadística como una herramienta de vital importancia, en la toma de
decisiones, ya que suministra información para la valoración de planes y programas.
- En la vida cotidiana interpretamos y usamos datos, muchas veces sin tener conocimiento de
lo que es la estadística, pero nos permite aprovechar la información.
CAMPOS DE APLICACIÓN
La estadística tiene un vasto campo de aplicación, tanto en las empresas industriales como en
las comerciales.
- Permite obtener una visión general de la empresa y de algunos aspectos particulares.
- Facilita descubrir el efecto en las distintas manifestaciones económicas.
- Ayuda a analizar y a separar lo que es normal de lo que no lo es, es decir, permite ejercer
control en muchas de as actividades u operaciones de la empresa.
Es importante para la planeación de operaciones, el control de calidad, determinación de
mercado, en la elaboración de presupuestos, control de inventarios, etc.
POBLACIÓN
Totalidad o conjunto de medidas, o recuento de todos los elementos que presentan una
característica común (Finita. Infinita).
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
2. ELEMENTO
Objeto que va ser sometido a estudio, debe ser claramente definida, entendida por todos,
además debe permitir ser contada o medida.
CARACTERÍSTICA
Rasgo o características de los elementos que conforman la población deben ser comunes a
todos los elementos.
- Cualitativas o Atributos expresadas mediante palabra, sexo (M, F), Aficiones (Canto,
Baile,...).
- Cuantitativas o Variables expresadas en forma numérica, peso, valor, tiempo.
Discretas: Valores enteros.
Continuas: Admiten fracciones.
CENSO
Investigación de la totalidad de los elementos que constituyen la población objetivo.
Censo de población, vivienda, agropecuarios o industrial.
El censo es en muchos casos impracticable:
Cuando el número de observaciones es demasiado grande o infinita, siendo imposible
investigar la totalidad de los elementos.
Cuando de requiere demasiado tiempo en la observación presentándose desactualización al
momento de utilizarla
Cuando los costos son elevados.
Cuando el elemento sometido a prueba pede ser destruido (control de calidad). Cuando no
se cuenta con el personal necesario para realizar las observaciones.
MUESTRA
Parte seleccionada de la población, que posee una característica igual a la que no fue
seleccionada.
Subconjunto de elementos, que resulta de la aplicación de algún proceso estadístico; con el
objeto de investigar las características de los elementos de la población.
Se utiliza el muestreo cuando no se puede realizar el censo.
Es menos costosa, más rápido, requiere menos personal y que puede proporcionar mayor
precisión en los resultados.
MUESTREO ALEATORIO: Cuando la probabilidad de selección de todos los elementos es
igual.
Muestreo Aleatorio Simple.
Muestreo Estratificado.
Muestreo Sistemático.
Muestreo por Conglomerados.
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
3. MUESTREO NO PROBABILISTICO: Las unidades no son seleccionadas al azar, sino en
forma caprichosa.
Muestreo Voluntario.
Muestro de Juicios.
Muestreo por Cuotas.
PARAMETROS O ESTIMADORES
Parámetros: Medidas aplicadas a las características de la población. (Media, proporción, razón).
Estimadores: Medidas aplicadas a las características de una muestra.
INVESTIGACION ESTADISTICA
FUENTES DE INFORMACION
- Fuentes Internas: Son las que se producen o registran la interior de la empresa (ventas,
producción, horas), muchas veces no se les da la importancia que tienen y solo se
consideran como operaciones corrientes y rutinarias.
- Fuentes Externas: Son aquellas que nos suministran datos e información que no podemos
obtener de la fuente interna o primaria, boletines, revistas, publicaciones especializadas o
informes realizados por otras personas o instituciones.
CLASES DE INVESTIGACION
- Investigación Descriptiva: Se realiza sobre hechos reales con el fin de explicar de modo
sistemático, sus características. Comprende etapas como: recolección, clasificación,
descripción análisis e interpretación de datos.
Puede referirse al análisis de datos provenientes de fuentes secundarias:
Características de un mercado.
Problemas Sociales.
Investigaciones Económicas.
Comportamiento de los Consumidores.
- Investigación Experimental: Corresponde a una observación rigurosamente controlada.
Determinando las relaciones causa –efecto. Debe quedar claro que el experimento es una
situación provocada, necesitando de un diseño adecuado.
La primera tiene su base en realidades físicas y la segunda son abstracciones.
ETAPAS DE UNA INVESTIGACION
1- Formulación del Problema.
2- Formulación de objetivos.
3- Unidad de Investigación.
4- Formulación de la Hipótesis.
5- Métodos de Investigación.( Censo –Diseño Muestra)
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
4. 6- Recolección de Datos.
7- Clasificación. Tabulación. Descripción. Resultados.
8- Generalización.
9- Informe Final.
1- Planteamiento del Problema
El planteamiento del problema, plantea la necesidad de realizar la investigación.
La decisión de realizar una investigación surge cuando se siente la necesidad de diseñar
correctivos o fijar políticas a corto o largo plazo, y cuando no se dispone de información
adecuada.
Se requiere la elaboración de un plan de investigación, que permita la recolección y análisis de
resultados.
2- Formulación de Objetivos
Deben ser claramente definidos, indicando la que se desea hacer.
- ¿Qué se va a investigar?
- ¿Cómo se va a realizar?
- ¿Cómo se pueden obtener los datos?
- ¿Cuál sería el diseño del muestreo?
- ¿Cuál sería la cobertura?
- ¿Dónde se realizará?
- ¿A quién va dirigida?
3- La Unidad de Investigación
Se tendrá definida cuando los objetivos de la investigación se han determinado con precisión
“Elemento de Estudio” la claridad del objetivo nos dará una visión perfecta de lo que se va a
hacer:
- El fin de la observación.
- La elección de la unidad.
- La lista de los elementos y de las características.
- El momento en que se va a realizar.
- El método de observación.
- Las condiciones en que se desarrollará.
- La elección de las medidas.
4- Formulación de Hipótesis
Son supuestos que se hacen en una investigación para ser comprobados. Son aquellos
supuestos hechos respecto a valores de la población o parámetros y cuya comprobación
requiere aplicación de métodos estadísticos, media, proporción, razón, etc.
5- Métodos de Investigación
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
5. Se tendrá en cuenta el número de unidades a investigar, su dispersión geográfica, el grado de
variabilidad, el costo, el tiempo, el tamaño de la población, para determinar si la investigación
será total (Censo) o parcial (Muestra).
El diseño de la encuesta por muestreo nos ayudará a controlar la cantidad de información y en
la decisión sobre el método más indicado para la investigación.
Al diseñar un cuestionario se deben considerar ciertos aspectos:
- Incluir únicamente las preguntas que son necesarias.
- Usar preguntas claras y concisas.
- No hacer preguntas que estemos seguros que no van a ser contestadas.
- Iniciar con preguntas generales y luego seguir con las específicas-
Las preguntas en lo posible deben ser cerradas.
Antes de aplicar el cuestionario es necesario realizar una prueba para ajustarlo, conociendo las
reacciones de los informantes, el tiempo necesario.
6- Recolección de Datos
Es la aplicación de instrumentos de medición. Es necesario la supervisión permanente del
trabajo de los encuestadores.
7- Clasificación, tabulación y descripción de resultados
8- Análisis de Datos
Aplicación de medidas que permitan la obtención de estimadores, que faciliten la comprobación
de hipótesis.
9- Elaboración de Informe – Partes:
- Introducción.
- Conclusiones.
- Apéndices.
VARIABLES
Discretas: son aquellos datos que únicamente aceptan valores enteros.
xi Manera de simbolizar el valor de cada observación. Donde i = 1,2 ….n
m El número de valores que toma la variable en una tabla de frecuencias.
n Tamaño de la muestra.
N Número de elementos de la población.
f i Frecuencia absoluta, número de veces que se repite el valor de la variable. Su suma
debe ser igual a n.
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
6. f i / n Frecuencia relativa, valores fraccionarios entre 0 y 1, la suma de todas las
frecuencias debe ser 1.
N i Frecuencia absoluta acumulada, se obtiene acumulando frecuencias absolutas.
H i Frecuencia relativa acumulad, se obtiene acumulando las frecuencias relativas.
Continuas: son aquellos datos que aceptan como valores fracciones o decimales.
xi Valor promedio entre el límite inferior y superior Inter.
xmax Valor máximo que toma la variable.
xmin Valor mínimo que toma la variable.
Rango Recorrido diferencia entre le valor máximo y mínimo de la variable.
Rango xmax xmin
m Número de intervalos 5< m >16
m 1 3.322Log10 n
c Amplitud del rango
c Rango / m
MEDIDAS DE TENDENCIA CENTRAL
Generalmente denominadas promedios y pretenden reducir al conjunto de datos a un solo
número representativo.
- Media Aritmética (Media Geométrica, media cuadrática, media cúbica, media armónica,
cuarteles, deciles)
- Mediana.
- Moda.
Si se calculan con valores de una población parámetros.
Si se aplican a los valores de una muestra estimadores.
LA MEDIA ARITMÉTICA X, µ
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
7. X
x i
n
n Total de observaciones del a muestra o censo.
xi Valores de del a variable
Donde i = 1, 2, 3,…, n
Indica la suma de los elementos
X Media para el conjunto.
MEDIA PONDERADA
X
x f i i
n
a- Se multiplica cada valor de la variable por su respectiva frecuencia.
b- Se usan los anteriores productos y se divide por n o N.
DESVIACIONES
Diferencias que se obtienen entre los valores de una variable y un punto fijo, por lo general la
media.
CON RESPECTO A LA MEDIA ARITMETICA
(x i X ) f i
La sumatoria de las desviaciones respecto de la media aritmética es cero.
PROPIEDADES DE LA MEDIA ARITMETICA
La suma de las desviaciones con respecto a la medio es cero.
(x i X ) f i 0
La media aritmética de una constante es la misma constante.
k nk k
n n
La media aritmética de una constante por una variable es igual a la constante por la media
aritmética de la variable.
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
8. kx k x i
kX
n n
MEDIANA
Es el valor de la variable que divide la frecuencia total en dos partes iguales.
DATOS NO AGRUPADOS
1- Se ordenan los datos.
n 1
2- Se determínale valor de posición central
2
a- Si n es impar.
n 1
Me
2
b- Si n es par, se promedia el valor de la variable en las posiciones superior e inferior al valor
de:
n 1 xi1 x1
Me y entonces
Me
2 2
DATOS AGRUPADOS
1- Se obtienen las frecuencias absolutas acumuladas.
n
2- Se divide entre 2 el número total de las observaciones 2.
3- Se busca el resultado anterior en la columna de las frecuencias absolutas acumuladas.
n
a- Cuando observamos el valor de 2 en la columna de las frecuencias absolutas
n N j 1 y el inmediatamente superior será N j
acumuladas, entonces el valor 2 es
N j 1 n
2.
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
9. n
b- Cuando el valor 2 no esta en al columna de las frecuencias absolutas acumuladas
entonces N j 1 será el valor inmediatamente inferior a n 2 y Nj el inmediatamente
n
superior N j 1 2 .
MODA Md
Mediada de posición que sacrifica una mayor cantidad información que la mediana, y se define
como el valor de la variable con mayor frecuencia.
Puede ser unimodal, bimodal, plurimodal.
Si X = Me = Md Distribución Simétrica.
X > Me > Md Distribución Asimétrica.
X < Me < Md Distribución Asimétrica.
Relación X, Me, Md
1- En una distribución simétrica y unimodal
X = Me = Md se prefiere la media.
2- Cuando la distribución es simétrica o ligeramente asimétrica se debe utilizar la media, si no
la más adecuado es la Mediana.
3- X – Md = 3 ( X – Me)
Md = 3 Me – 2 X
MEDIA GEOMETRICA Mg
Se aplica en aquellos casos en que la variable muestra un crecimiento exponencial o
geométrico (población, ingresos o tasas de crecimiento o interés).
DATOS NO AGRUPADOS
Mg n xi Mg n x1 x2 ... xn
Log10 Mg
Log x
10 i
Log10 Mg
Log10 x1 Log10 x1 ... Log10 xn
n n
Mg 10 Log10 Mg
Ejemplo: Determinar la población promedio de una región
1983 – 6 millones
1993 – 8.6 millones
2003 – 10.2 millones
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
10. a- entre 1983 y 1993.
b- entre 1993 y 2003.
c- entre 1983 y 2003.
a-
Mg n xi Log 10 Mg
Log 10 xi
n
Mg 2 6 8.6 Log10 6 Log10 8.6
Log10 Mg
Mg 7.1833 2
1.712649
Log10 Mg
2
Log10 Mg 0.8563
Mg 10 Log10 Mg
Mg 100.8563 Mg 7.1833
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
11. b-
Mg n xi Log 10 Mg
Log 10 xi
n
Mg 2 8.6 10.2 Log10 8.6 Log1010.2
Log10 Mg
Mg 9.3658 2
1.943098
Log10 Mg
2
Log10 Mg 0.971549
Mg 10 Log10 Mg
Mg 100.971549 Mg 9.3658
c-
Mg n xi Log Mg
Log x 10 i
10
n
Mg 3 6 8.6 10.2 Log10 6 Log10 8.6 Log1010.2
Log10 Mg
3
Mg 8.0738
2.721249
Log10 Mg
3
Log10 Mg 0.907083
Mg 10 Log10 Mg
DATOS AGRUPADOS Mg 100.907083 Mg 8.0738
Para estas variables las formulas cambian un poco, pues los datos deben estar ponderados.
fi f1 f2 fn
n n
Mg xi n Mg x1 n x2 n ... xn n
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
12. Log10 Mg
f Log i x
10 i
n
f Log10 x1 f 2 Log10 x1 ... f n Log10 xn
Log10 Mg 1
n
Mg 10 Log10Mg
MEDIA ARMONICA
Se aplica de manera muy especial en casos en que la variable esta expresando tasas o
velocidades.
DATOS NO AGRUPADOS
n
Ma
1
x
i
DATOS AGRUPADOS
n
Ma
fi
x
i
MEDIDAS DE DISPERSION
Las mediadas de dispersión nos indican cómo se distribuyen los valores observados a ambos
lados del promedio o del valor central o típico.
RANGO O RECORRIDO
Es la diferencia entre le valor máximo y mínimo que toma la variable.
R = X máx – X mín
VARIANZA S2, σ2
Es la medida de los cuadrados, de las diferentas entre los valores de la variable y su media
aritmética.
2 (x i X )2
S
n
DATOS NO AGRUPADOS
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.
13. 2 (x i X )2
S
n
2
x i nX 2
S2
n
2
S2
xi X2
n
DATOS AGRUPADOS
2 (x i X )2 fi
S
n
2
x i f i nX 2
S2
n
2
S 2
x i fi
X2
n
DESVIACION TIPICA O ERROR ESTANDAR S, σ
La varianza presenta el inconveniente de que el resultado corresponde a la unidad en que esta
medida la variable peor elevada al cuadrado.
2 2 (xi X )2
S S S2
n
Documento elaborado por: HAROLD IVÁN MERA MARTÍNEZ – Instructor SENA – CGA.