SlideShare ist ein Scribd-Unternehmen logo
1 von 167
Downloaden Sie, um offline zu lesen
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
0
ESTADÍSTICA I
APLICADA A LA ADMINISTRACIÓN DE EMPRESAS
0
5
10
15
20
25
30
Comidas Transporte Alojamiento
Ene
Feb
Mar
Abr
May
Jun
ALBERTO QUINTO JIMÉNEZ
Especialista en Matemática Avanzada.
Universidad Nacional de Colombia.
FACULTAD DE HUMANIDADES
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
UNIVERSIDAD TECNOLÓGICA DEL CHOCO
“DIEGO LUIS CORDOBA”
2005
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
1
OFRENDA
A mi abuela MIGUELINA MOSQUERA de QUINTO, a mis hijos, a
todos y cada uno de mis actuales y futuros alumnos promesas del
mañana, dedico.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
2
INDICE
PAGINA
Ofrenda
Prologo
UNIDAD 1.0
LA ESTADÍSTICA Y SU HISTORIA 6
1.1 Historia 6
1.2 Definición de Estadística 8
1.3 Términos de uso corriente en Estadística 8
1.4 División de la Estadística 11
1.5 Aplicación de la Estadística 11
1.6 Importancia de la Estadística 12
1.7 Fenómeno que abarca y no abarca la Estadística 13
1.8 La investigación Estadística 13
1.9 Clases de investigación 14
1.10 Etapas de la investigación 15
Evaluación de la unidad 23
UNIDAD 2.0
REPRESENTACIÓN DE DATOS 31
2.1 Distribución de frecuencia 32
2.2 Distribución de frecuencia simple 33
2.3 Distribución de frecuencia por intervalo 37
2.4 Gráficos Estadísticos 42
Evaluación de la unidad 54
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
3
UNIDAD 3.0
MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL 62
3.1 Media Aritmética 63
3.1.1 Propiedades 67
3.1.2 Ventajas y desventajas 68
3.2 Mediana 69
3.2.1 Ventajas y desventajas 74
3.3 Moda 75
3.3.1 Ventajas y desventajas 80
3.4 Características principales de los promedios anteriores 80
3.5 Relación entre la Media, Mediana y Moda 82
3.6 Media Geométrica 83
3.6.1 Propiedades 86
3.6.2 Ventajas y desventajas 87
3.6.3 Características 88
3.7 Media Armónica 89
3.7.1 Característica 90
3.8 Relación entre Media Aritmética, Geométrica y Armónica 91
3.9 Cuartiles, Decíles y Percentiles 91
Evaluación de la unidad 97
UNIDAD 4.0
MEDIDAS DE DISPERSIÓN 107
4.1 Varianza 108
4.1.1 Propiedades 110
4.1.2 Corrección de Shepard 110
4.2 Rango o recorrido 111
4.2.1 Características 111
4.3 Desviación Típica o Estándar 114
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
4
4.3.1 Propiedades 114
4.4 Coeficiente de variación 118
4.4.1 Característica 118
4.5 Puntaje Típico o Stándarizado 120
4.6 Recorrido intercuartilico 122
4.7 Desviación Mediana 124
4.8 Desviación Media 125
Evaluación de la unidad. 129
UNIDAD 5.0
REGRESIÓN Y CORRELACION 133
5.1 Introducción a la bidimensionalidad 134
5.2 Relación entre dos variables 134
5.3 Regresión 138
5.4 Teoría de la correlación 141
5.5 Error típico de la estima 144
5.6 Variación explicada y no explicada 146
5.7 Coeficiente de correlación 146
5.8 Correlación gradual 151
Evaluación de la unidad. 161
UNIDAD 6.0
INTRODUCCIÓN A LAS COMPUTADORAS 165
6.1 La computadora en la Estadística 166
6.2 Introducción a Microsoft Excel 167
6.2.1 Grafica en Excel 168
6.3 Manejo del Statgraphics 169
BIBLIOGRAFÍA.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
5
INTRODUCCIÓN
El uso de la Estadística se ha generalizado en los últimos años no sólo como
herramienta de análisis de problemas de economía, sino como auxiliar en el
estudio y valoración de cualquier investigación. El propósito de este módulo
es proporcionar a los estudiantes de administración de empresas, el material
básico exigido en su curso de Estadística I, incluyendo algunas de sus
aplicaciones.
Se ha hecho un esfuerzo para lograr que el módulo sea útil a la mayor
cantidad posible de profesionales dedicados a las ciencias económicas,
porque existe la necesidad de un modulo de Estadística que aborde tópicos
que exceden estas áreas de las ciencias.
En un esfuerzo por llenar este vacío, he incluido ejemplos y ejercicios que no
sólo interesan al estudiante de administración de empresas, sino también al
contador, al Educador y, a muchos otros profesionales dedicados a las
ciencias económicas.
Por la forma en que está estructurado el módulo, es poca la preparación
matemática que se requiere para usarla. Aquellos que hayan tomado un
curso de álgebra, no tendrán dificultad alguna para seguir la manipulación
matemática. Tengo fe en que el estudiante, o el lector común, llegará a darse
cuenta que en la estadística hay más que las meras matemáticas; que la
Estadística, primero que todo, es una filosofía, una manera de pensar. Si el
estudiante puede desarrollar los conceptos, verá las matemáticas
simplemente como el vehículo para su expresión y comunicación.
Aspiro, en consecuencia, prestar un nuevo servicio a los educadores
Colombianos; porque considero que todo lo que se hace en beneficio de los
futuros ciudadanos ha de estar inspirado en un elevado anhelo de
engrandecimiento patrio, y ello sólo se logra con la dedicación y el sacrificio
constante de cada uno de nosotros, pues como lo expresa claramente
CHARLES SUMMER, “ la verdadera grandeza de las naciones está en
aquellas cualidades que constituyen la grandeza del individuo”.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
6
UNIDAD 1.0
LA ESTADÍSTICA Y SU HISTORIA
OBJETIVO
DE LA UNIDAD: describir la importancia y el uso de la Estadística y su relación
con otras ciencias; dar un concepto general de la metodología de la
investigación Estadística.
CONTENIDOS:
1.1 Historia
1.2 Definición de Estadística
1.3 Términos de uso corriente en Estadística
1.4 División de la Estadística
1.5 Aplicación de la Estadística
1.6 Importancia de la Estadística
1.7 Fenómeno que abarca y no abarca la Estadística
1.8 La investigación Estadística
1.9 Clases de investigación
1.10 Etapas de la investigación
Evaluación de la unidad
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
7
1.1 HISTORIA.
El estudio de la estadística ha sufrido cambios substanciales desde su
comienzo. Merecen mención especial dos fuentes de tendencia de
desarrollo. Primeramente, el de origen de la estadística puede advertirse ya
en la necesidad de datos numéricos en los estados que surgían de la
sociedad medieval en la Europa Occidental. Al transformarse la sociedad
medieval en el estado político, el nuevo gobierno necesitaba información
sobre los recursos del país para poder tener éxito. Así pues era obligado
para los nuevos gobernantes el obtener descripciones numéricas, tales
como : el número de ciudadanos de las diversas unidades políticas bajo su
jurisdicción, ciudades, condados y provincias.
El término estadística, se deriva del latín status, que significa estado en el
sentido político, se empleó entonces para referirse a la recolección y
descripción de tales datos del estado. La necesidad de acopiar y analizar
datos numéricos impulsó a desarrollar métodos para facilitar la labor, que era
lo que constituía lo más considerable de la estadística hasta la era moderna.
No es necesario enumerar todos los que contribuyeron al desarrollo de los
métodos estadísticos; pero ha de mencionarse sin embargo al Belga
ADOLPH QUETELET (1796 - 1874), que fue el primero en aplicar métodos
modernos a conjuntos de datos.
Suele llamarse a QUETELET “ Padre de la estadística moderna”, por su
continua insistencia en la importancia de aplicar métodos estadísticos. Sus
distinguidas contribuciones a la practica y a la metodología estadísticas
cubrieron muchos campos de la estadística oficial, tales como los censos, el
desarrollo de la uniformidad y compatibilidad de estadísticos entre las
naciones, y la organización de la primera conferencia estadística,
internacional. La comisión central de estadística, que QUETELET fundó, fue el
modelo para instituciones similares en otros países.
Otra fuente de la estadística se encuentra en la atención prestada al juego de
azar en el siglo XVII, que organizaba la nobleza de Inglaterra y Francia para
la recreación, tales como dados y cartas; cosa que sin proponérselo, llevó al
desarrollo de la Teoría de las probabilidades.
Al mismo tiempo los estudios de probabilidades requerían el tratamiento de
los errores en las mediciones, de lo que resulto la distribución de tales
errores. Ya desde el siglo XVIII se había observado que las medidas de
cierto objeto o fenómeno daban lugar a una configuración en la distribución
de los errores que tenía la forma de una curva acampanada.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
8
A propósito de la evaluación de los errores de observación en Astronomía,
se hizo un descubrimiento de mayor importancia para la estadística. La
distribución de errores resultante con su forma de campana y su simetría se
llama Curva Normal de Errores . También se dice Distribución Gaussiana
de errores, por el nombre de su descubridor Karl Friedrich Gauss (1777 -
1855).
Entre los contemporáneos de QUETELET Y GAUSS que contribuyeron al
avance de la estadística como ciencia, estaban : Florence Nightingale
(18820 - 1911).
Florence Nightingale creía firmemente en los métodos estadísticos.
Sostenía que todo Director debería guiarse por el conocimiento estadístico si
quería tener éxito y que los políticos y los legisladores fracasaban
frecuentemente por la insuficiencia de sus conocimientos estadísticos.
Galton, como su primo Charles Darwin, se interesó profundamente en el
estudio de la herencia, a la cual aplico métodos estadísticos. Entre sus
principales contribuciones se encuentra, el haber desarrollado métodos tan
fundamentales como la Regresión y la Correlación.
La obra de Galton fue estímulo para una serie de investigaciones de Karl
Pearson ( 1857-1936 ), el cuál inició la publicación del periódico Biométrica,
que ha influido profundamente en el desarrollo de la Estadística, uno de los
métodos más importante, descubierto por Pearson es la Distribución Ji-
cuadrado, que encontró en 1900.
En el siglo XX, quienes han contribuido de manera más sobresaliente al
estudio de la Estadística, han sido Willian S. Gosset ( 1876 - 1967 ) y Sir
Ronald Fisher ( 1890 - 1962 )
Gosset, que escribía bajo el seudónimo “ Student “ , dedujo la distribución
“ t “ y su contribución especial fue en el campo de la teoría de pequeñas
muestras.
Fisher halló la conocida distribución “ F “ y aportó contribuciones
continuamente hasta 1962 ; muchas de ellas han tenido grandes influencias
en los modernos procedimientos Estadísticos. Si bien su trabajo era sobre
todo en los campos de la Biología, Genética y la Agricultura, su impacto ha
llegado a todas las aplicaciones de la Estadística.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
9
1.2 DEFINICIÓN DE LA ESTADÍSTICA
En términos generales, la palabra estadística se refiere a un sistema o
método científico usado en la recolección, organización, análisis,
interpretación numérica de la información.
También se puede decir que la estadística está ligada con los métodos
científicos en la toma, organización, recopilación, presentación y análisis de
datos, tanto para la deducción de conclusiones, como para tomar decisiones
razonables de acuerdo con tales análisis. El término se utiliza para denotar
datos o número, por ejemplo, estadística de empleo, accidente, producción,
etc.
1.3 TÉRMINOS DE USO CORRIENTE EN ESTADÍSTICA
1.3.1. POBLACIÓN O UNIVERSO. Es el conjuntos de individuos, medidas u
objetos que poseen alguna característica común observable como son :
altura, peso de estudiantes de un colegio, el número de camisas defectuosas
o no defectuosas producidas por una fábrica de un día determinado, el nivel
de glucosas en la sangre extraída a 50 niños en determinada hora del día.
Una población puede ser finita o infinita. La población consistente en todas
las camisas producidas por una fábrica en un día es FINITA, y la población
formada por todos los posibles sucesos ( cara o sello) en tirada sucesiva de
una moneda es INFINITA.
1.3.2.MUESTRA. Una muestra puede definirse simplemente como una parte
de una población. Supongamos que una población consiste en los pesos de
todo los estudiantes de un colegio, si se reúnen para el análisis los pesos de
sólo un nivel o grado del total de niños del colegio, sólo se tiene una parte de
la población de pesos, es decir se tiene una muestra.
1.3.3 PARÁMETRO. Cualquier característica de una población que sea
medible, por ejemplo, la proporción de niños de un país que entran a
estudiar.
1.3.4.VARIABLE. Rasgo, característica o propiedades que poseen los
elementos de una población o de una muestra.
1.3.5.VARIABLE DISCRETA. Son aquellas que sólo admiten valores enteros,
por ejemplo el número de hijos de una familia, ya que no se puede decir que
una familia tiene dos hijos y medio.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
10
1.3.6.VARIABLE CONTINUA. Son aquellas que admiten valores fraccionarios
por ejemplo, la estatura de una persona, su peso, etc.
1.3.7.VARIABLE CUANTITATIVA. Es aquella que puede medirse, por
ejemplo se puede obtener mediciones de los adultos del sexo masculino, los
pesos de los niños en edad preescolar y las edades de los pacientes que se
ven en una clínica dental.
1.3.8. VARIABLE CUALITATIVA. Algunas características pueden no ser
medidas, en el sentido en que se miden las estaturas, el peso, la edad ;
muchas características sólo pueden catalogarse, como por ejemplo cundo a
una persona enferma se le da un diagnostico médico, cuando a una persona
se le designa dentro de un grupo socioeconómico.
Las variables cualitativas dan origen a los atributos, como por ejemplo,
profesión, sexo, estado civil.
1.3.9.ESCALA. Es un patrón o conjunto de criterios claramente definidos que
permite asignar, sin ambigüedades, valor a una variable. El concepto de valor
incluye, además de números, letras, letras y números, palabras, etc.
1.3.9.1.ESCALA NOMINAL. Sirven únicamente para identificar, como el criterio
para asignar el número de la cédula a un individuo o el código para saber el
color del pelo de una persona.
1.3.9.2.ESCALA ORDINAL. Que permite asignar valor a una variable que sirve
sólo para ordenar, como el puesto que ocupa un atleta en una carrera.
1.3.9.3 ESCALA DE RAZÓN. Asigna un valor numérico, a una variable usando
una unidad determinada inicialmente como 1. En este caso están las
unidades físicas como peso, volumen, longitud, área, resistencia etc.
En una escala el cero ( 0 ) no necesariamente representa la ausencia
absoluta de la variable, sino que se toma en referencia a un valor no nulo y
se tiene una escala conocida como intervalo. Por ejemplo en la temperatura,
los grados Kelvin usan una escala de razón mientras que los grados
centígrados usan una escala de intervalo, en la aeronáutica la altura sobre
Bogotá usa una escala de intervalo, mientras que la altura sobre el nivel del
mar es de razón.
En síntesis se tiene que, una variable puede clasificarse según el diagrama.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
11
NOMINAL
CUALITATIVA  DISCRETA
ORDINAL
VARIABLE
ORDINAL
DISCRETA
CUANTITATIVA DE RAZÓN
CONTINUA DE RAZÓN
1.3.10 BIOESTADISTICA. Es la rama de la Estadística que trata de los seres
vivientes desde un punto de vista biológico.
1.3.11 ESTADIGRAFOS. Cálculos realizados con los datos de la muestra.
1.3.12.FRECUENCIA. Repetición de un dato en una muestra.
1.3.13.PARÁMETROS. Cálculo realizado con los datos de la población.
1.4. DIVISIÓN DE LA ESTADÍSTICA.
Prácticamente todos los autores están de acuerdo en clasificar la Estadística
en dos tipos: Estadística Deductiva o Descriptiva y la Estadística Inductiva o
de Inferencia.
1.4.1 ESTADÍSTICA DEDUCTIVA O DESCRIPTIVA: Esta fase sólo se limita a
la descripción y análisis de una serie de datos sin llegar a conclusiones o
generalizar con respecto a un grupo mayor.
1.4.2 ESTADÍSTICA INDUCTIVA O DE INFERENCIA: Trata de llegar a
conclusiones a cerca de un grupo mayor basado en la información de un
grupo menor o muestra.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
12
1.5. APLICACIONES DE LA ESTADÍSTICA.
La Estadística o métodos estadísticos como a veces se le llama está
desempeñando un importante papel ascendente en casi todas las facetas del
progreso humano.
Anteriormente sólo era aplicada a los asuntos del Estado, de donde viene su
nombre ; pero ahora la influencia de la Estadística se extiende a la
agricultura, biología, negocio, ciencias políticas, sicología, sociología y otros
muchos campos de ciencia e ingeniería.
1.5.1. EN LA EMPRESA: Una compañía de fábrica de harina, empaqueta la
harina en bolsa de papel, cada una de las cuales se supone contener 25
libras. Si el proceso de empaque está bajo control, el peso medio de las
bolsas será de 25 libras. Supóngase que se toma periódicamente una
muestra de bolsas para comprobar la bondad del proceso de empaquetado.
Si una muestra de 50 bolsas da una media muestra de 24 libras y 12 onzas,
se puede aplicar el método de la inferencia estadística para determinar si el
proceso está bajo control.
1.5.2. EN QUÍMICA Y BIOLOGÍA: Considérese una nueva vacuna contra el
resfriado que ha sido desarrollado por una compañía farmacéutica. Dicha
compañía afirma que la nueva vacuna es eficaz en un 95 % o sea que de
cada 100 personas que la han utilizado, 95 pasaron a invierno sin sufrir
resfriado, si en una muestra de 30 personas que han sido vacunados, hay 27
que pasaron el invierno sin resfriado: ¿ prueba esto suficientemente las
pretensiones de la compañía ?.
1.5.3 EN BIOLOGÍA Y AGRONOMÍA: Para ayudar a determinar los efectos de
los tipos de semillas, de los insecticidas y de los fertilizantes en la cosecha.
Se ha utilizado para producir ganado de mejor calidad con planos especiales
de alimentación y cría.
1.5.4 EN LA PRODUCCIÓN : En la producción de un artículo en grandes
cantidades se hace necesario detectar y eliminar alteraciones sistemáticas
de calidad.
1.5.5 EN FINANZAS : En la estimación de la magnitud que tomará cierto
aspecto en algún punto futuro del tiempo( corto, mediano o largo plazo), en
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
13
los controles presupuéstales y en el planteamiento de ciertas actividades de
carácter financiero.
1.5.6 EN CONTABILIDAD : De gran importancia en la auditoria, ya que
mediante la aplicación de ciertos métodos se seleccionan algunas facturas,
cuentas o documentos de cobro, sin recurrir a la totalidad y con base en el
examen de ellas, se puede obtener conclusiones sobre la situación actual de
cartera.
1.5.7 EN PERSONAL : El control sobre el número de horas laboradas,
tiempo dejado de laborar, accidentes de trabajos, clasificación del personal
( por antigüedad, sueldo, estudios, etc),información estadística necesarias en
una empresa, para toma de decisiones en las políticas empresariales.
1.5.8 EN MERCADO : Las encuestas estadísticas son indispensables para
determinar la reacción de los consumidores frente a los actuales productos
de la empresas y para el lanzamiento de los nuevos.
1.6 IMPORTANCIA DE LA ESTADÍSTICA.
A continuación se precisan algunos aspectos para las cuales la Estadística
es de gran importancia:
1.6.1 Conocimiento de la realidad de una observación o un fenómeno. Para
conocer la situación actual de un fenómeno es necesario cuantificarlo o graficarlo.
1.6.2.Determinación de lo típico o normal de una observación. Esto se realiza
mediante el cálculo de promedios representativos de la característica cualificada.
1.6.3.Determinación de los cambios que representa el fenómeno. Estas
variaciones se determinan en el tiempo, lo cual requiere una observación
continua.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
14
1.6.4.Establecimiento de la relación entre dos o más fenómenos. Se
relacionan las características o variables que determinan los fenómenos.
1.6.5.Determinación de las causas que originan el fenómeno.
1.6.6.Realización de estimaciones e inferencias estadísticas. Los
resultados obtenidos al estudiar una muestra se generalizan como
comportamiento de la población entera. En estos casos es necesario
precisar el grado de validez y confiabilidad de los análisis efectuados.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
15
1.7. FENÓMENOS QUE ABARCA Y NO ABARCA LA ESTADÍSTICA
Los fenómenos o hechos que continuamente suelen suceder, presentan
ciertas características tales como la de ser observables y manifestarse y a
un el de poder determinar la intensidad con que se produce el fenómeno.
1.7.1.Los fenómenos que abarca son:
1.7.1.1. Fenómenos colectivos o de grupos
1.7.1.2. Fenómenos de frecuente repetición
1.7.1.3. Fenómenos de distintas frecuencias
1.7.1.4. Fenómenos distantes en el espacio
1.7.1.5. Fenómenos distantes en el tiempo
1.7.1.6. Fenómenos cualitativos que no se pueden cuantificar
1.7.2. Los fenómenos que no abarcan son:
1.7.2.1 Fenómenos individuales
1.7.2.2 Fenómenos que no se exteriorizan
1.7.2.3 Fenómenos accidentales en el tiempo y en el espacio
1.7.2.4 Fenómenos cualitativos que no se pueden cuantificar
1.8. LA INVESTIGACIÓN ESTADÍSTICA
La investigación estadística por sencilla que sea, es una operación compleja
que requiere atender múltiples aspectos, y que genera muy variadas
funciones.
El resultado depende en gran parte de la finalidad que se persiga, de la
naturaleza de los fenómenos que desean estudiar y de la facilidad que se
tenga para observar los elementos.
1.8.1. CARACTERISTICA BASICAS: Toda la investigación debe reunir las
siguientes características básicas:
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
16
1.8.1.1. Claridad: En todos sus aspectos debe ser clara y precisa. Conocida
por todas las personas que en ella participan.
1.8.1.2 Sencillez: Es indispensable aunque no debe limitar la presentación
completa de la investigación. Es condición esencial de claridad.
1.8.1.3 Utilidad: Toda investigación estadística debe tener alguna aplicación
practica que justifique su realización.
1.9. CLASES DE INVESTIGACIÓN
1.9.1 INTERNA. Investiga fenómenos originados dentro de la misma empresa
o entidad. Requiere organizar la información de tal manera que permita la
aplicación de métodos estadísticos, a fin de lograr las conclusiones válidas
deseadas
.1.9.2 EXTERNA. Se realiza con el fin de obtener información que permita
comparar fenómenos o entidades, establecer suposiciones relativas, estudiar
su comportamiento actual o futuro.
1.9.3 EXHAUSTIVA. Se denomina así a aquella investigación donde se
observan todos los elementos: que constituyen la población objetivo.
1.9.4.PARCIAL. Sólo se observa una parte de los elementos o unidades que
constituyen la población (muestra), es decir, estudia la población a través de
la muestra. Se realiza cuando no se desea o no es posible una investigación
exhaustiva.
1.10. ETAPAS DE UNA INVESTIGACIÓN.
Se requiere una investigación de carácter estadístico cuando no se tiene un
buen flujo de información que permita que dicha información se organice y;
por lo general se encuentre dispersa.
Se puede considerar tres clases de operaciones o etapas en una
investigación. Planeamiento, Recolección y Análisis.
Las etapas que requiere una investigación estadística la podemos sintetizar
así:
1.10.1 PLANEAMIENTO: Al trazar un plan de inversión, se debe definir y
organizar cada una de las actividades necesarias para llevar a cabo el
trabajo y poder alcanzar los objetivos propuestos.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
17
Dentro de la etapa del planteamiento se podrán considerar ciertos aspectos
que a continuación se presentan, donde el orden y la necesidad de cada uno
de ellos dependerá de la misma naturaleza de la investigación.
1.10.1.1 Objeto de la Investigación: ¿Que se investiga?
Es el hecho o fenómeno que se desea estudiar; en una investigación de
salarios, será el salario, en una sobre el rendimiento académico de un grupo
de estudiantes, será los resultados obtenidos en su período escolar.
Es de gran Importancia definir el objeto de investigación y determinar su
naturaleza cualitativa y cuantitativa. Definir además, las posibilidades de
investigarlo y limitaciones.
1.10.1.2 Objetivo o Finalidad de la Investigación: ¿Que pretende la
investigación?
Identificar con claridad y precisión el fin que se propone, formulando el
problema de tal manera que nos permita establecer los objetivos generales y
los específicos y, de ser posible una jerarquización de los mismos.
En esta fase se deben contestar los siguientes interrogantes: ¿Que se
investiga ?, ¿como se realizará la investigación? (condiciones y medios),
¿cuándo y donde se realizará?
1.10.1.3 Unidad de Investigación: ¿Donde se realiza una investigación?
La unidad es la fuente de información es decir, a quien va dirigida; puede ser
a una persona, un grupo familiar, laboral o social, una vivienda, una empresa
pública, una explotación agropecuaria, una región. Su selección depende del
objeto propuesto.
La unidad debe ser clara en tal forma que sea entendida por todos, además
adecuada al tipo de investigación; mensurable, que permita ser medida, y
comparable con los resultados obtenidos en investigaciones similares.
Al lado de la unidad principal se pueden establecer unidades secundarias.
La fuente de información puede ser directa o indirecta.
 ES DIRECTA. Si allí se produce el hecho, ejemplo: Las notarías, para
determinar el número de nacimientos.
 ES INDIRECTA, cuando se consideran aquellas en las cuales el hecho
se refleja, ejemplo: Las rentas departamentales, para determinar el
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
18
consumo de bebidas alcohólicas. Estas se usan, generalmente, como
complementarias a las fuentes directas.
1.10.1.4 Examen de la documentación y metodología: ¿ Qué y cómo se
ha investigado al respecto?.
Es importante determinar si la investigación ha sido realizada con
anterioridad, con el fin de prescindir del estudio; averiguar si se cumplió el
objetivo propuesto y si la información estaba actualizada.
En caso contrario se realizará tratando de corregir las diferencias
presentadas en anteriores investigaciones, al mismo tiempo que
aprovechando sus aspectos positivo.
1.10.1.5 Método de observación: ¿Que características debe reunir la
investigación? En qué forma se realiza la toma de dato?
Debe decirse el método que se empleará: Censo o Muestra. Esta elección
depende, entre otros, de los siguientes factores: disponibilidad de tiempo,
recursos humanos y financieros, número de unidades que componen la
población, caracteres por investigar, el grado de variabilidad, la descripción
del objeto.
1.10.1.6 Proceso de Recolección: ¿Qué técnicas empleará para recolectar
la información?.
Los datos se pueden recolectar mediante encuesta realizada por correo,
entrega personal del cuestionario, entrevista, panel, observación directa,
motivación, teléfono, otros.
1.10.1.7 Preparación del Presupuesto: Se cuenta con los recursos
económicos suficientes para todo el proceso de la investigación.
Se debe analizar si los recursos económicos son suficientes para los otros
costos requeridos en cada etapa, desde el planeamiento hasta la publicación.
1.10.1.8 Calendario de trabajo: Qué tiempo requiere cada etapa ? Es el
ordenamiento de la diferencia inicial y final de cada etapa.
En el siguiente cuadro aparece un modelo de calendario.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
19
ETAPAS
FECHAS
INICIAL FINAL
1. Planeamiento
a.) Fase preliminar I - VI 10 - VI
b.) Preparación de encuestas 8 - VI 20 - VI
c) Preparación de personal 18 - VI 23 - VI
2. Recolección
a.) Pretes 25 - VI 30 - VI
b.) Trabajo de campo 5 - VII 20 - VII
3.Procesamiento y análisis
a.) Depuración y clasificación 21 - VII 27 - VII
b.) Tabulación y análisis 26 - VII 5 - VIII
C.) Publicación 3 - VII 20 - VIII
1.10.1.9 Preparación del cuestionario. ¿Qué contiene la encuesta y cómo
se resuelve?
Al elaborar un cuestionario se consideran aspectos materiales y aspectos
técnicos.
 ASPECTOS MATERIALES: Tamaño del formulario, calidad del papel,
color de la tinta, tipo de impresión.
 ASPECTOS TÉCNICOS: Las preguntas se ordenan gradualmente
según su dificultad. No se deben emplear abreviaturas, las preguntas
deben ser claras, precisas y comprensibles.
Las partes que constituyen un formulario son:
ENCABEZAMIENTO : Contiene el nombre de la institución u organismos
que realiza la investigación, nombre o título de la investigación, el título
debe llevar implícito el qué, cómo, cuándo y dónde se realiza.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
20
CUERPO: Contiene las preguntas. Si se requiere identificar al informante
será necesario iniciar preguntando nombre, dirección, estado civil, edad,
profesión etc.
INSTRUCCIONES: Son explicaciones generales sobre el sentido y forma de
responder el cuestionario, son indispensable en razón de la brevedad y
condición de las preguntas.
Puede escribirse al final del cuestionario, al iniciarse o en separata.
OBSERVACIONES : Espacio libre al final del formulario para que el
entrevistador o el entrevistado escriban aclaraciones, opiniones u
observaciones complementarias del trabajo realizado.
1.10.1.10 Selección y preparación del personal. ¿Qué requisitos deben
reunir los entrevistadores y cuál es su función?.
Para esta selección se tienen en cuenta los siguientes criterios: número de
personas acorde al número de formulario o unidades a entrevistar,
conocimiento que tenga del interrogatorio y del objetivo de la investigación,
cualidades morales que le impidan falsear las respuestas, cualidades de
sociabilidad y cortesía, presentación personal correcta y sencilla. El
adiestramiento del personal se realiza mediante cursos o seminarios más o
menos breves.
1.10.1.11 Preparación y actualización de Informantes. Se confirma la
unidad de investigación; se prepara una lista de todas las unidades que
conforman la población objetivo y seleccionan la muestra.
1.10.1.12 Propagandas. La labor de enunciar la investigación, para
disponer el ánimo del público fuente de información, al tiempo que se da a
conocer el interés general de los resultados esperados.
1.10.1.13 La encuesta preliminar. Se realiza con el fin de tener un mayor
conocimiento sobre la población objetivo y facilitar así, la prueba del
cuestionario. Permite además chequear el cálculo del costo y tiempo y la
variabilidad de las características en estudio.
1.10.2 RECOLECCIÓN: Terminada la etapa de planeamiento, se procede a
distribuir y a recoger los formulario, controlando el número de formularios
entregados y recogidos, al mismo tiempo verificando la calidad de las
informaciones obtenidas.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
21
La organización del trabajo de campo de recolección contemplan entre otros
siguientes puntos.
- Supervisión
- Control de encuesta
- Revisión de los cuestionarios inconclusos
- calidad y consistencia de las respuestas
- Cumplimiento de los plazos prefijados
- Distribución de los entrevistados
Algunos errores que se pueden presentar en la recolección de los datos se
clasifican en:
- Errores de la medición o cuantificación de la característica.
- Errores del entrevistador o influencia negativa del mismo.
- Mal diseño del cuestionario.
- Falta de instrucciones imprecisas.
Pueden presentarse algunos que afectan la recolección de los datos y que
deben ser corregidos:
 El informante no quiere suministrar los datos, alegando: estar
ocupado, motivo político, desconfianza de la investigación no vale la pena
etc.
 El informante no puede responder por problemas, tales como en
enfermedad, incapacidad física, idioma, etc.
 La dirección del informante, la familia estaba paseando, hubo
demolición del edificio, edificación desocupada, etc.
1.10.3 PROCESAMIENTO Y ANÁLISIS: La información obtenida debe ser
depurada, clasificada, resumida y analizada, aplicando para ello adecuadas
técnicas estadísticas. Los puntos más importantes en esta etapa son:
1.10.3.1 Codificación: Ya revisadas las respuestas obtenidas, se procede a
su codificación: especialmente si se utiliza la tabulación mecánica.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
22
El código es un número que sustituye la respuesta cuando se va a hacer el
recuento. Ejemplo:
Numero de piezas producidas : En buen estado === 1
En mal estado ==== 2
Si el número de constelaciones pasa de nueve, se utiliza números de dos
dígitos. Ejemplo:
Los establecimientos industriales por departamento: 01 Choco
02 Caquetá
1.10.3.2 Tabulación: puede ser manual o mecánica, dependiendo de la
calidad de los formularios, del número de preguntas, del tiempo y de los
recursos disponibles.
En la tabulación mecánica se utiliza tarjetas perforadoras, las cuales
alimentan el computador. La más conocida es la llamada HOLLERTH,
utilizado en las computadoras IBM.
La tabulación manual se realiza mediante la elaboración de cuadros, -
gráficas y esquemas que faciliten el análisis de la información y la inferencia
de conclusiones y recomendaciones.
1.10.3.3 Análisis e Interpretación: Esta etapa encierra dos aspectos:
análisis y evaluación estadística de los resultados, análisis y evaluación
técnica de acuerdo con la naturaleza de la investigación.
1.10.3.4 Publicación: Se realiza con el fin de hacer llegar a las personas
interesadas el resultado total del estudio. Se hace esencial presentar todos
los aspectos considerados en el proceso investigativo, además de la
correspondiente validez que merezca las conclusiones.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
23
EVALUACION DE LA PRIMERA UNIDAD
1.1 Qué significa generalmente la palabra “ Estadística” para el hombre de la
calle?
1.2 En qué contexto se utiliza la palabra “Estadística” en las finanzas, el
mercado, la contabilidad y la Administración?
1.3 Decir brevemente cuáles fueron las contribuciones debidas a los
siguientes estadísticos?
a) Adolph Quelet
b) Karl Friedrich gauss
c) Florence Nigh Tingale
d) Franco Galton
e) Karl Pearson
f) William s. Cosset
g) Ronald A. Fisher
1.4 Cuáles son las fuentes de estudio de las estadísticas?
1.5 Explique la diferencia existente entre Estadística deductiva o descriptiva
y la estadística inductiva o inferencial.
1.6 Diga cuatro fenómenos que abarca la estadística y dos que no abarcan.
1.7 Diga cuatro finalidades de la Estadística.
1.8 El proceso de proyección y preparación de la investigación se divide en
cinco fases: recolección, planeamiento, análisis e interpretación, elaboración.
Ordene estas fases, como crea conveniente y explique brevemente cada
fase.
1.9 Se ha hecho un estudio para determinar si las amas de casa de Quibdó,
Chocó prefieren una marca especial de detergente, Entre las 50 amas de
casas entrevistadas, 30 dijeron que preferían esta marca.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
24
a) Qué constituye la muestra?
b) Qué constituye la población?
c)cuál es el estadígrafo muestral y cuál es el parámetro de la
población?
1.10 Una fábrica de gaseosas, proyecta lanzar al mercado un nuevo sabor.
Se realiza un Test de aceptación de dicho sabor en una muestra de 30 niños
utilizando una escala de 10 puntos, para medir el grado de aceptación.
Los puntos obtenidos en los 30 niños fueron los siguientes:
2 6 8 7 4 5 10 6 6 7 6 7 3 8 7
6 8 6 5 4 7 8 5 7 6 7 2 7 2 7
La muestra obtuvo compuesta por igual número de niños de ambos sexos,
de 5 a 12 años de edad residentes en el Barrio César Conto de la ciudad de
Quibdó.
a. Cual es la población
b. Cuál es la muestra?
c. Es cualitativa o cuantitativa?
d. Cuál es la variable?
e. De que tipo es la variable
f. Qué clase de escala se ha utilizado en la medición de la variable?
1.11 Se realiza un estudio en la ciudad de Istmina- Chocó , a 150 familias de
clase media, para conocer el tipo de aceite ó manteca usado en la cocina;
los resultados son los siguientes:
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
25
Maíz 14 Hogares.
Soya 65 Hogares.
Ajonjolí 21 Hogares.
Compran. Aceite al detal sin especificar tipo 17 hogares.
Manteca de cerdo 21 Hogares.
Grasas de origen vegetal 6 Hogares.
Oliva 13 Hogares.
a. cuál es la población?
b. cuál es el tamaño de la muestra
c. Qué carácter tiene la población
d. Cómo se explica que la suma de frecuencia sea superior al
número de hogares?
1.12 La siguiente tabla muestra el número de fanegadas de trigo y maíz
producidas en la Granja “ La Mazorca “ durante el decenio 1977 a 1987.
AÑOS NÚMERO DE
FANEGADAS DE TRIGO
NÚMERO DE
FANEGADAS DE
MAÍZ
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
200
185
225
250
240
195
210
225
250
230
235
75
90
100
85
80
100
100
105
95
110
100
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
26
Con los datos de la tabla, determinar el año o años en los que:
a. Se produjo el menor número de fanegas de trigo
b. Se produjo el mayor número de fanegas de maíz
c. Se produjo el mayor decrecimiento en la producción de trigo
d. Se produjo un decrecimiento con relación al año anterior
e. Se produjo el mismo número de fanegas de trigo
f . Se obtuvo la máxima producción entre los dos cereales.
1.13. De tres ejemplos de población finita y tres de población infinita.
1.14 Anotar I o F según sean infinitas o finitas las siguientes poblaciones.
a. Las drogas producidas por una fabrica en un día
b. Resultados obtenidos en sucesivas tiradas de una moneda
c. Estudiantes de la Universidad Tecnológica del Chocó
d. Acciones vendidas cada día en la bolsa de valores
e. Papeletas extraídas de una urna, en extracciones con
reemplazamiento.
1.15 Clasificar cada variable en las siguientes distribuciones:
a. Alumnos por mes de nacimiento
b. Profesionales por estatura y peso
c. Obreros por salarios
d. Accidentes por causas
e. Fallecimiento por edades.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
27
1.16 Ubicar en estadística descriptiva o estadística inferial cada uno de los
siguientes aspecto motivo de estudio estadístico:
a. Describir los grupos en término de promedio de estatura
b. Determinar la probabilidad de que muestras de observaciones sean
sólo el de variaciones de azar.
c. En contar una diferencia consistente entre dos métodos
específicos de enseñanza.
d. Determinar la vida media de lámparas producidas por determinada
Fábrica.
e. Analizar la conducta de un grupo de escolares frente a una prueba
de lectura.
1.17 Señale con C las series de variables continuas y con D las de variables
discretas.
a. Distribución de obreros pos salarios
b. Distribución de fallecimiento por edades
c. Distribución de alumnos por números de hermanos
d. Distribución de alumnos por estatura.
1.19 Contestar (V) verdadero o (F) falso, según el caso.
a. Código es la representación cualitativa de un hecho cualitativo
b. Las instrucciones permiten diligenciar mejor el formulario.
c. Un formulario se precodifica para agilizar la codificación
d. Un formulario debe llevar una sola clase de preguntas.
e. L a recolección de datos se puede hace mediante la observación.
f. Después de elaborar el formulario se define el objetivo de la
investigación
g. Al recolectar información por medio de entrevistadores se tiene la
ventaja de que éstos pueden observar el sitio de la operación que se
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
28
está llevando a cabo.
h. Se conoce como fuente primaria aquella que obtuvo inicialmente la
información directamente de la persona o entidad.
i. Al diseñar un cuestionario no es de gran importancia la forma como
se hace la pregunta, siempre que ésta sea clara.
j . No hay posibilidad alguna de que en una encuesta por correo se interprete
mal las preguntas de un cuestionario, siempre y cuando que la persona
que reciba sepa leer.
k. El examen de la documentación y metodología se efectúa después de
tabular la información.
1.20 Se ha dicho que en una investigación se consideran tres etapas, las
que a su vez se subdividen en otras fases. ¿Cuáles son? podría usted
reagrupar los titulares de este capítulo en un índice de temas de acuerdo con
estas etapas?
1.21 Mencionar algunos aspectos técnicos y materiales que deben tenerse
en cuenta en el diseño de un formulario.
1.22 En los siguientes ejemplos, identifique: población, muestra, variable y
escala de medición.
 Varias veces durante el día un ingeniero de control de calidad, en una
fábrica de textil, selecciona diferentes muestras de metros cuadrados de
telas, las examina y registra en número de imperfecciones que
encuentra.
 Un investigador médico examina los efectos de un agente cancerígeno en
humanos. Tres meses después de inyectado el agente en una persona,
el investigador realiza una operación para extraer y pesar los tumores.
 Un gerente desea conocer si aquellos empleados que recibieron 30 días
de vacaciones son más productivos durante el año, que los que
recibieron sólo 15 días. El gerente selecciona 140 trabajadores y registra
su rendimiento.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
29
UNIDAD 2.0
REPRESENTACION DE DATOS.
OBJETIVO
DE LA UNIDAD: Representar correctamente una información estadística en
forma tabular y gráfica, para hacer más fácil su comprensión y analizar una tabla
para obtener mayor provecho en su lectura.
CONTENIDOS:
2.1 Distribución de frecuencia
2.2 Distribución de frecuencia simple
2.3 Distribución de frecuencia por intervalo
2.4 Gráficos Estadísticos
Evaluación de la unidad
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
30
REPRESENTACION DE DATOS.
2.1 DISTRIBUCION DE FRECUENCIA
Una distribución de frecuencia es un método para organizar y resumir datos.
También se conoce con el nombre de distribución de frecuencia a una
ordenación, tabulación de datos en clases y con la frecuencia
correspondiente a cada una.
La toma de datos es la obtención de una colección de los mismo, los cuales
no están ordenados numéricamente.
La ordenación es la colocación de los datos numéricos en orden creciente o
decreciente de magnitud.
La diferencia entre el mayor y el menor número se llama RECORRIDO o RANGO
de los datos,
La construcción de la distribución de los datos facilita la presentación de
ellos o de la información y especialmente su análisis.
Para elaborar los cuadros o tablas de la distribución de los datos se debe,
antes que todo Identificar las características que se investigaron, ya que esto
permite una mejor clasificación de lo observado, estas características
pueden ser:
a) Cualitativas o Atributos: Ventas en valor o cantidad, por sucursales,
empleados de una empresa por cargo, marca de droga más aceptada,
exportación por puertos, etc.
b) Cuantitativas: Clasificación de empleados por sueldo, tiempo de reacción
de cierta droga, Kilómetros recorridos diariamente por vehículo, clasificación
de familias por número de hijos etc.
2.2. DISTRIBUCIÓN DE FRECUENCIA SIMPLE
Antes de pasar a realizar ejercicios que nos de una claridad con respecto a la
distribución de frecuencia simple presentaremos la siguiente sismología:
n : Tamaño de la muestra, es el número de observaciones.
Xi : La variable, es cada uno de los diferentes valores que se han
observando.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
31
La variable Xi, toma los X1, X2, ... , Xn valores. También se le llamará marca
de clase.
Fi : la frecuencia absoluta o simplemente frecuencia, representa el número
de veces que se repite la observación Xi , F2 el número de X2 etc.
Fa : la frecuencia acumulada, se obtiene acumulando la frecuencia absoluta,
y siempre nos da un acumulado igual al tamaño de la muestra.
Fr : frecuencia relativa, resulta de dividir cada una de las frecuencias absoluta
por el tamaño de la muestra.
Fra: Frecuencia relativa acumulada, resulta de la acumulación de las
frecuencias relativas, esta frecuencia siempre tiende a la unidad.
TABLA Nro1
1-1-2-2-2-3-3-6-4-1-2-3-4-2-7-2-1-1-4-2-0-1-2-5-1-0-1-8-2-6-2-1-3-1
2-0-1-0-0-4-2-1-4-2-3-0-1-2-2-4-0-0-1-2-0-3-2-2-2-3 -
Para hacer la respectiva distribución de dichos datos es conveniente que
presentemos las siguientes tablas:
EJEMPLO: Los resultados obtenidos en un encuesta a 60 personas acerca del
número de veces que han visitado a su médico para ver el grado de
concentración de cierto mineral en el tejido (ppm) fueron los siguiente:
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
32
Encuesta realizada a 60 personas sobre el número de veces que han visitado
a su médico para comprobar un ppm (datos ordenados).
TABLA Nº 2 : ORDENACIÓN DE LOS DATOS
0-0--0-0-0-0-0-0-0-1-1-1-1-1-1-1-1-1-1-1-1-1-1-2-2-2-2-2-2-2-2-2
2-2-2-2-2-2-2-2-2-2-3-3-3-3-3-3-3-4-4-4-4-4-4-5-6-6-7-8.
Encuesta realizadas a 60 personas sobre el número de veces que han
visitado a su médico por comprobar su PPM (recuento de efectivo).
TABLA No 3 : CONTEO DE DATOS
Nº DE VECES Nº DE PERSONAS
(conteo)
VECES QUE SE REPITE
0
1
2
3
4
5
6
7
8
IIII IIII I
IIII IIII IIII II
IIII IIII IIII IIII III
IIII III
IIII II
I
II
I
I
9
14
19
7
6
1
2
1
1
SUMAS 60
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
33
Distribución de frecuencia de la encuesta realizada a 60 personas sobre el
número de veces que han visitado a su médico para comprobar su ppm.
TABLA Nº 4
Xi Fi Fa Fr Fra
0 9 9 = 9 9/60 = 0.15 0.15 = 0.15
1 14 9 + 14 = 23 14/60 = 0.233 0.15 + 0.233 = 0.383
2 19 23 + 19 = 42 19/60 = 0.316 0.383 + 0.316 = 0.699
3 7 42 + 7 = 49 7/60 = 0.116 0.699 + 0.116 = 0.815
4 6 49 + 6 = 55 6/60 = 0.1 0.815 + 0.1 = 0.915
5 1 55 + 1 = 56 1/60 = 0.016 0.915 + 0.016 = 0.931
6 2 56 + 2 = 58 2/60 = 0.033 0.931 + 0.033 = 0.964
7 1 58 + 1= 59 1/60 = 0.016 0.964 + 0.016 = 0.98
8 1 59 + 1 = 60 1/60 = 0.016 0.98 + 0.016 = 0.996
SUMAS 60
En la práctica, cuando se posee confianza en el ordenamiento y conteo de
los datos , no es necesario tantas tablas, se puede pasar de la tabla No 1
directamente a la tabla Nro.5.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
34
Distribución de frecuencia en la encuesta realizada a 60 personas sobre el
número de veces que han visitado a su médico para comprobar su ppm.
TABLA Nº 5
Xi Fi Fa Fr Fra
0 9 9 0.15 0.15
1 14 23 0.233 0.383
2 19 42 0.316 0.699
3 7 49 0.116 0.815
4 6 55 0.1 0.915
5 1 56 0.016 0.931
6 2 58 0.033 0.964
7 1 598 0.016 0.98
8 1 60 0.016 0.996
SUMAS n =60
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
35
- Analizando las columnas porcentuales Fr y Fra se puede tener entre otras
las siguientes conclusiones:
- El 31.6% de los encuestados ha visitado dos veces a su médico
- El 15% de los encuestados respondió no haber visitado a su médico con
ese objetivo.
- Solo el 1.6% lo ha visitado 8 veces.
-El 69.9% o 70% han visitado a su medico entre 0 y 2 veces
2.3 DISTRIBUCIÓN DE FRECUENCIA POR INTERVALOS
Como se ha visto, un conjunto de observaciones puede hacerse más
comprensible y adquirir mayor significado por medio de un arreglo ordenado;
puede lograrse una mayo síntesis, agrupando los datos. Para agrupar a un
conjunto de observaciones, se selecciona un conjunto de intervalos,
contiguos, que no se traslapen, tales que cada valor en el conjunto de
observación puede colocarse en uno, de los intervalos de clase.
Unos de los primeros puntos a considerar, cuando se van agrupar ciertos
datos, es cuántos intervalos van a incluirse. Demasiado poco no es
conveniente debido a que hay perdida de información. Por otra parte, si se
usan demasiados intervalos, no se logra objetivo de la síntesis.
La mejor guía en relación con lo anterior, a sí como para otras decisiones
que deben tomarse al agrupar los datos, es el conocimiento que se tenga de
ellos. Pueda ser que se hayan tomado con anterioridad, los intervalos de
clase de años anteriores con fines de comparación. Una de las formas para
obtener el número de intervalos (#i) es aplicando la regla de STURGES, con
la cual se obtiene una aproximación aceptable sobre el número de intervalos
necesarios para agruparlos:
#i = 1 + 3.3 Log n
Donde n nos representa el número de valores considerados, esta regla de
STURGES no se considera como final, sino sólo como una guía. El número
de intervalos especificado por medio de esta regla debe aumentarse o
disminuirse según convenga y el beneficio de una presentación clara.
Otra cuestión que hay que aclarar es lo relativo a la amplitud de los
intervalos de clase.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
36
Aunque a veces es imposible, por lo general, los intervalos deben ser
amplitudes iguales. Puede determinarse esta amplitud (A) dividiendo el
recorrido ( R) entre el número de intervalo (#i ):
A = R  i
Como regla, este procedimiento proporciona una amplitud que no es
conveniente usarla. Una vez más, debe aplicarse el buen juicio y seleccionar
una amplitud (por lo común, próxima a la dada por la ecuación) que sea más
conveniente.
Consideramos el siguiente Ejemplo:
En un estudio de 50 sujetos entre las edades de 20 y 60 años sobre el valor
del rendimiento del electroencefalograma. Se dieron los siguientes datos.
98 75 95 100 64 70 75 95
63 72 82 98 58 56 70 49
55 50 61 60 70 75 71 93
98 100 62 66 50 92 70 58
66 69 73 77 120 104 119 105
99 60 70 102 120 90 71 78
65 56
Antes de elaborar una tabla o cuadro de frecuencia por intervalos se debe
tener en cuenta los siguientes pasos:
1. Se determina el valor máximo y mínimo de Xi
Xmin = 49 X máx = 120
2. Sacamos la diferencia entre el valor máximo y el mínimo que
denominaremos rango o recorrido. (R):
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
37
R = X máx - X mín = 120 - 49 = 71
3. Se hace necesario determinar el número de intervalo (# i) que se utilizará
para agrupar los datos:
#i = 1+3.3 Log n
#i = 1+3.3 Log 50
# i = 1+3.3 (1.69897)
# i = 1+5.60
# i = 6.6
En la práctica el #i se determina atendiendo varios factores, tales como:
finalidad del estudio, grado de variabilidad de los datos , necesidad de
efectuar comparaciones. En todo caso, se recomienda que el #i hasta donde
sea posible, no sea menos de 5, ni mayor de 16, en nuestro caso
tomaremos 7 intervalo ya que no se puede tener 6.6 intervalos.
4. Una vez determinado el número de intervalos se debe dividir el rango por
el este valor para obtener el valor de la amplitud de cada intervalo,
aplicando la formula
A = R  i
A = 71 7 = 10.14
Para facilitar los cálculos se aproximará A = 11, por lo tanto se altera el valor
del rango de 71 a 77 en 6 unidades.
Cuando éste caso sucede se tendrá un quinto paso, que denominaremos
rango ampliado ( Ra ) que es igual rango( R ) más un incremento (a).
R a = R + a
5. A = Ra  i = 71 + 6 7 = 77/ 7 = 11
6. El incremento a del rango se debe distribuir equitativamente entre
el dato mayor y el dato menor, al dato mayor se le suma a/2 y al dato menor
se le resta a/2, con esto no podemos descartar la palabra equitativo
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
38
pues es opcional para cada trabajo que se elabora; en nuestro caso el
incremento es de 6 unidades, luego:
Xmáx = 120 + 3 = 123
X mín = 49 – 3 = 46
Por tanto se tendrá un nuevo dato mayor o límite superior de 123 y un límite
inferior de 46.
7. Se procede a elaborar los intervalos empezando con el nuevo dato
menor y sumándole la amplitud, así:
1° 46 a 57
2° 57 a 68
3° 68 a 79
4° 79 a 90
5° 90 a 101
6º 101 a 112
7º 112 a 123
8. Por último se elabora la tabla de frecuencias con sus respectivos
punto medios ( Xi ) o marca de clase, el cual se determina sumando
el límite superior y el limite inferior de cada intervalo dividendo por dos
esta suma.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
39
INTERVALOS Xi Fi Fa Fr Fra
46 - 57 51.5 6 6 0.12 0.12
57 - 68 62.5 11 17 0.22 0.34
68 - 79 73.5 15 32 0.30 0.64
79 - 90 84.5 1 33 0.02 0.66
90 - 101 95.5 11 44 0.22 0.88
101 - 112 106.5 3 47 0.06 0.94
112 - 123 117.5 3 50 0.06 1.00
SUMAS 50
Como conclusión podemos decir:
- el 30% de los sujetos poseen un rendimiento de su electroencefalograma.
entre 68 y 79, y son 15 sujetos.
- El 2 % lo poseen entre 79 y 90, y es un sujeto.
- Solo el 6% se encuentra en un rendimiento entre 112 a 123, y son 3
sujetos
- El 66 % de los sujetos posee un rendimiento entre 46 y 90 y son 33 sujetos.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
40
2.4 GRÁFICAS.
Un gráfico es un método de presentar datos estadísticos de forma visual.
Hay numerosos tipos de graficas, como lo veremos al utilizar los programas
estadísticos en la computadora; por lo general, se clasifican en :
a. Diagramas: de puntos, lineales(rectilíneos y curvilíneos),
superficiales(rectangulares-barras-, triangulares, cuadrados y
circulares-pastel-).
b. Estereometrías: cúbicas, prismáticas y pirámides.
c. Pictogramas.
d. Cartogramas: mapas estadísticos y cartodiagramas.
2.5 GRÁFICAS LINEALES.
Un gráfico de línea se distingue por el hecho de que las variaciones en los
datos se indican por medio de líneas o curvas, cuyas posiciones está
determinadas por sus respectivos valores en las escalas X e Y los puntos se
unen mediante líneas rectas. Hay diferentes tipos de gráficos lineales:
2.5.1 GRÁFICOS DE SILUETA
Son gráficos de líneas que muestran las desviaciones positivas y negativas
respecto a la línea base o cero y la línea de evolución de las, desviaciones,
los gráficos de silueta se construyen representando los puntos que indican
las desviaciones reales respecto a la línea base.
2.5.2 GRÁFICOS DE BANDAS
Muestran las variaciones de las partes componentes así como total, el gráfico
se prepara representando en primer lugar las variaciones de la parte
componente mayor. Se sombrea o se raya este segmento. A éste segmento
se suma la siguiente parte componente y se representa el resultado. Este
proceso acumulativo se prosigue hasta incluir todas las partes
componentes.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
41
Las variaciones de la línea superior representan, entonces las del total, las
variaciones en el ancho de cualquier segmento indicarán las variaciones de
ese componente particular.
2.5.3 GRÁFICOS DE MÁXIMO Y MÍNIMO
Presentan no solo los cambios ocurrido durante el periodo de tiempo, si no
también las fluctuaciones de cada periodo (días, semanas, meses etc.)
indicando valores máximo del mismo periodo. Este procedimiento se
continua hasta el fin del tiempo cubierto por el gráfico.
2.5.4 EL HISTOGRAMA:
Conocido como polígono de frecuencias rectangular para una distribución de
frecuencia; se construye de la siguiente forma: Se dibujan rectángulos cuya
base es el tamaño del intervalo de clase y cuya altura es la frecuencia de
cada intervalo de clase.
2.5.5 GRÁFICAS LOGARÍTMICAS Y SEMILOGARITMICAS
2.5.5.1 CARACTERÍSTICAS:
a. No hay línea base o cero.
b. Los gráficos semilogarítmicos presentan una escala aritmética en el eje
horizontal. Los gráficos logarítmicos presentan escalas logarìtmicas en
ambos ejes.
c. Cuando se presenta en un papel logarítmico las progresiones geométricas
en X y en Y se disponen según una recta, ya que los logaritmos de una
progresión geométrica forman una progresión aritmética.
En un papel semilogarítmico, si los valores de y constituyen una progresión
geométrica se dispondrá también según una recta.
d. Aumento ó disminuciones iguales indican cambios porcentuales iguales.
e. Iguales pendiente en un gráfico logarítmico revelan taza de cambios
iguales.
2.5.5.2 UTILIZACIÓN DE LOS GRÁFICOS LOGARÍTMICOS:
2.5.5.2.1. Para comparar tasas proporcionales de cambio.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
42
2.5.5.2.2. Mostrar la relación entre 2 ó más series cuyas cantidades difieren
ampliamente.
2.5.5.3 PRECAUCIONES AL USAR GRÁFICAS SEMILOGARITMICAS:
Hemos hecho notar que este tipo de presentación gráfica se adapta bien
para permitir un análisis de cambios relativos. Existe un peligro de que las
personas, antes de adquirir experiencia con las gráficas semilogarítmicas,
deseen usarla en cualquier circunstancia.
Una segunda precaución se refiere a la necesidad de comprensión especial
de una gráfica semilogarítmica. Algunas personas no saben como
interpretar una gráficas semilogarítmica; por esta razón, este tipo de
gráficas, no se usan a veces, aún cuando resultaría más apropiado. Sin
embargo, tal interpretación de una gráfica semilogarítmica es tan simple que
la persona que debe observar una gráfica puede ser entrenada para su
interpretación en unos cuantos minutos.
2.5.6 GRÁFICOS CUADRATICOS.
Para la presentación gráfica de datos estadísticos, se recurre en algunos
casos a figuras geométricas, tales como cuadros y los triángulos.
Estas gráficas deben ser simples, es decir, no se deben recargar demasiado.
Hay varias formas de hacer la representación gráfica mediante la utilización
de cuadros. Con figuras continuas que queremos representar la distribución
porcentual de los factores que se deben tener en cuenta en análisis de una
empresa.
2.5.7 REGLAS PARA LA CONSTRUCION DE LOS GRÁFICOS.
2.5.7.1.Cada gráfico debe tener un título claro y conciso, que se sitúan
generalmente en la parte superior central del gráfico. El título debe incluir
información sobre:
2.5.7.1.1 La naturaleza de los datos
2.5.7.1.2 La situación geográfica
2.5.7.1.3 El período de tiempo cubierto
2.5.7.2 Las líneas coordenadas deberían reducirse al mínimo y las líneas
curvas puestas de tal forma que resaltasen sobre el fondo del gráfico.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
43
2.5.7.3 La fuente de los datos debería indicarse debajo del gráfico a la
izquierda.
2.5.7.4 Las notas, si la hay, se deberían situar en la parte inferior izquierda
del gráfico.
2.5.7.5. Para entender fácilmente el gráfico, se debería reducir en la medida
de los posibles el número de líneas curvas, segmentos y otros detalles.
2.5.7.6 Cada escala debe presentar un titulo indicando la unidad utilizada,
2.5.7.6.1 El título correspondiente al eje X debería estar centrado,
inmediatamente debajo del eje.
2.5.7.6.2. El título del eje y debería situarse en la parte superior del eje.
2.5.7.7 Se debe indicar el cero de la escala ( eje y) de lo contrario se puede
realizar una comparación errónea. La necesidad de indicar el origen se
evidencia en la comparación de los picos de los dos gráficos.
2.5.7.8 En el eje y la escala de valores debería abarcar desde cero (0)
desde el valor mas pequeño en la parte inferior del gráfico, al valor mas alto
en su parte superior.
2.5.8 ESCALAS.
2.5.8.1 ESCALA ARITMÉTICA: El papel con escalas aritmética presenta
distancias iguales entre las líneas coordenadas. Cantidades iguales
equivaldrán entonces, a iguales distancias. Así, las distancias entre 1 y 3
será la misma que entre 8 y 10.
2.5.8.2 Los valores de las escalas deben situarse a lo largo de los ejes x e y,
dando así una indicación general del tamaño de las variaciones que
representa el gráfico. no es necesario indicar una graduación fina en la
escala de valores , ya que no se pretende que se lean las cifras reales en el
gráfico. Los valores exactos se pueden obtener de la tabla de datos original
que usualmente acompañe el gráfico.
2.5.8.3. Si se utiliza una longitud, en eje X, para indicar un intervalo de
tiempo el punto representativo del valor de cada período debería marcarse el
punto central del período. Pero si se desean los períodos pueden hacerse
coincidir con líneas coordenadas dadas, trazándose entonces los puntos en
ellas.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
44
2.5.8.4 ESCALA LOGARÍTMICA Y SEMILOGARITMICAS: Cuando se desea
comparar cambios porcentuales en lugar de absolutos, se utiliza un tipo de
escala algo diferente.
Se puede demostrar que cuando hay cambio porcentual constante entre 2
pares de cifras, las diferencias entre los logaritmos de las cifras serán
iguales. Así, si el lugar de los valores originales se representan los logaritmos
de esos valores, las diferencias constantes equivaldrán a cambios
porcentuales constantes.
NUMERO LOGARITMO
2 0.30103
4 0,60206
.
Diferencia 0,30103 100% de aumento
NUMERO LOGARITMO
5 0.69897
10 1.0000
________
Diferencia 0.30103 100% de aumento
2.5.8.5 TIPOS DE ESCALAS:
2.5.8.5.1 UNIFORME: Previamente determina un valor representativo para
cada uno de los valores reales del dato que se debe representar.
2.5.8.5.2 LOGARÍTMICAS: Las escalas ó representaciones de valor se hace
aplicando el logaritmo.
Las gráficas respectivas se elaboran en papel logarítmico ó semilogarítmico.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
45
2.6. GRÁFICAS ESTADÍSTICAS.
Hay numerosas gráficas estadísticas, especialmente aquellas que son
consideradas como las más usuales, teniendo en cuenta que estas deben
ser sencillas, explícita y se representa siempre de izquierda a derecha y de
abajo hacia arriba.
A continuación daremos algunos conceptos y ejemplos de gráficas más
usuales en estadística.
2.6.1. DIAGRAMAS DE BARRA:
Es la representación visual mediante rectángulos de la relación entre las
variables.
Las barras utilizadas para representar las características cualitativas y
cuantitativa por lo general, son construidas en forma vertical sobre una base
horizontal, en el cual se colocan las características o el tiempo,(años,
meses, etc) y la altura estará dada por el valor que toma la variable o atributo
observado.
También se elabora el diagrama proporcional de barras cuando se trabaja
con grupos relativamente pequeños y se desea establecer comparaciones
entre dos o más distribuciones proporcionales.
2.6.2.HISTOGRAMA Y POLÍGONO DE FRECUENCIAS.
2.6.2.1 HISTOGRAMA. Son representaciones gráficas de las distribuciones de
frecuencias, que consiste en una serie de rectángulos, cada uno de ellos
levantados en cada intervalo, de tal manera que la base sería igual a la
amplitud y la altura estará dada ya sea por la frecuencia absoluta o por la
relativa, si los intervalos son desiguales las alturas de los rectángulos
deberán ser calculadas por procedimientos matemáticos, para que en la
gráfica, no nos quede una imagen engañosa de la distribución que se quiere
presentar.
2.6.2.2 POLÍGONO DE FRECUENCIAS. Se puede representar con la misma
información del histograma, mediante la unión de los puntos medios de los
techos de los rectángulos en el histograma por medio de una línea
prolongada en el primero y último rectángulo. Los polígonos también se
pueden dibujar estableciendo los puntos medios del intervalo, denominados
marcas de clases, que se colocan en el eje horizontal o abscisa, para cada
valor de la variable corresponderá un valor de la frecuencia, señalándose en
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
46
el plano cartesiano por un punto, luego de establecido todos los puntos se
unen mediante líneas rectas, las que en conjunto forman el polígono.
2.6.3 OJIVA. Para el trazado de esta gráfica, se emplea también el
polígono, para presentar la frecuencia acumulada y la frecuencia acumulada
relativa, se ubican los puntos en el plano cartesiano y se unen mediante
segmentos de rectas y el gráfico así obtenido se llama polígono de
frecuencia u ojiva.
La ojiva o polígono de frecuencia acumulada tiene la ventaja de que da una
manera cómoda de estimar la mediana y los percentiles de una muestra,
otra ventaja que tiene es que se puede averiguar fácilmente el número de
partida entre dos valores por ej. el número de partida entre 56.5 y 62.5 es
simple la diferencia entre las correspondientes frecuencias acumuladas; o
sea entre 3 y 20 es 17 ; Este método opera bien solamente para los valores
y puntos que estén efectivamente representados.
El histograma, el polígono y la ojiva, se utilizan para representar la variable
continua, y los diagramas de frecuencias para la variable discreta.
2.6.4 DIAGRAMA CIRCULAR: Se utiliza para representar características
cualitativas, sirve para notar las diferencias en las proporciones o porcentajes
en que está dada la distribución.
Como en total la circunferencia tiene 360º, se calcula a cuantos grados
( sector circular ) equivale la parte que se va a representar. El procesos
que sigue en la confección de la gráfica circular o pastel consiste:
En hacer la sumatoria total de las frecuencias, luego para sacar el
porcentaje se multiplica cada frecuencia por el 100% y se divide por el total
de la frecuencia, pero en este caso no es necesario; ya sacado el porcentaje
de todas las frecuencias, se llevan a grados, multiplicando 360º por cada
frecuencia en porcentaje dividiéndola por 100.
2.6.5 PICTOGRAMAS O PICTOGRAFOS: Se emplean cuando se trata de
llamar la atención al público.
Las figuras empleadas deben explicarse por sí misma. Se acostumbra que el
tamaño sea uniforme, en algunos casos, se acostumbra colocar o señalar el
valor total del conjunto buscado de esta manera la eliminación del cuadro.
Algunos autores señalan que el tamaño puede variar, y ,la altura de cada
objeto estará dada por la frecuencia absoluta o relativa, pero una inmensa
mayoría considera que dicha representación puede conducir a errores
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
47
en su interpretación, especialmente cuando los tamaños de la figuras no son
proporcionales a la cantidad que se representa.
2.6.6.CARTOGRAMA :Son croquis o mapas que contienen datos estadísticos
u otros de carácter no cartográficos, dentro de los cuales se ubican símbolos
y en algunos casos gráficas, para indicar tanto la localización geográfica, así
como la importancia del valor de la variable observada en la relación con el
conjunto.
2.6.7 DIAGRAMA DE LÍNEAS. Es otra de las gráficas muy utilizadas, pero al
mismo tiempo, la que presenta mayores dificultades en la visualización de los
datos, dando lugar, algunas veces, a imágenes o conclusiones erróneas,
debido a la mal confección de las escalas de los ejes.
A los diagramas lineales también se les denomina curvas de sucesión,
porque generalmente se refieren a variables observadas durante un periodo.
Se denominan series de tiempo o series cronológicas. La variable tiempo se
coloca en el eje horizontal y los valores que toman la variable, van al eje
vertical.
2.6.8.CUADROS Y TRIÁNGULOS. Para representación gráficas de datos
estadísticos, se recurre a la figura geométrica como los cuadros y
rectángulos.
Estas gráficas deben ser simples y es aconsejable superponer las figuras
en lugar de yuxta - ponerlas.
Hay varias formas de hacer la presentación gráfica mediante la utilización de
los cuadros, una la más recomendadas es que, antes que todo, identificar
las características que se investigaron, ya que esto permite una mejor
clasificación de lo observado, ya que estas características pueden ser
cualitativas o atributos y cuantitativas.
En la gráfica mediante la utilización de triángulos se debe buscar una base
común y luego localizar la altura, como también son utilizados triángulos
donde cada uno de ellos tiene una base diferente.
Otra forma es, determinando zonas proporcionales a las cantidades
representadas y tener una clara diferencia entre las zonas demarcadas al
igual que anexar los signos convencionales correspondientes.
2.6.9. GRÁFICA DE CANTT. La utilización de estas gráfica se hace con
mayor necesidad, en la dirección de empresas, en la cual establecen las
diferentes etapas de trabajo por ejecutar y el ejecutado durante un
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
48
determinado período. El campo de aplicación de esta gráfica es muy vasto,
siendo imposible en esta investigación la descripción de todas las formas y
usos que tiene.
2.6.10 PIRÁMIDES. Las gráficas denominadas pirámides son utilizadas con
mucha frecuencia para representar las edades de una población de una
región. Si en un triángulo se determinan zonas proporcionales a las
cantidades representadas y hay diferenciación entre las zonas demarcadas,
al igual que anexar los signos convencionales correspondientes, la gráfica
así elaborada se denomina pirámide.
EJEMPLO: Los siguientes datos representan la distribución de los gastos en
millones de pesos, de las empresas la Mazorca y El diamante en un
determinado periodo:
EMPRESAS SALARIOS ALQUILER IMPUESTO PUBLICIDAD
LA MAZORCA 20.4 47.5 39.8 20.4
EL DIAMANTE 30.6 38.6 34.6 31.6
1.0 Gráfico de barra.
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable
0
10
20
30
40
50
Salario Alquiler Impuesto Publicidad
La mazorca
El Diamante
Fuente: División Financiera
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
49
2.0 Gráfico circular
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable
16%
37%
31%
16%
Salario
Alquielr
Impuesto
Publicidad
Fuente: División Financiera
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
50
3. Grafico de cilindro
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable
0
20
40
60
80
100
Salario Alquiler Impuesto Publicidad
El Diamante
La Mazorca
Fuente: División Financiera.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
51
4. Grafico de Líneas.
Gasto en millones de pesos de las empresas la Mazorca y el Diamante
durante un periodo contable
0
20
40
60
80
100
Salario Alquiler Impuesto Publicidad
El Diamante
La Mazorca
Fuente: División Financiera.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
52
EVALUACION SOBRE LA UNIDAD Nº 2
2.1 Construir un diagrama circular para la siguiente distribución.
Distribución porcentual del numero de personas vacunadas
según tipo de vacunas (1986 - 1987)
TIPO DE VACUNA PERSONAS
VACUNADAS
PORCENTAJE
DPT
POLIO
BCG
SARAMPIÓN
TOTAL
48.958
55.068
46.884
46.450
197.360
24.81
27.9
23.76
23.53
100.00
2.2 Construir un diagrama de línea que visualice los datos de la siguiente
tabla que muestra los depósitos y préstamos de las entidades financieras de
esta ciudad.
ENTIDAD DEPOSITO (MILES DE $) PRESTAMOS (MILES DE $)
Sistema Bancario 1
Caja Agraria 2
UPAC 3
Corporaciones
Financieras 4
8´699.699
2´517.702
3´303.211
368.218
7´145.909
6´609.804
2´212.117
610.281
2.3 Construir un diagrama de barra con los datos que se muestran en la
tabla que representan los servicios de salud en hora años medicas,
odontológicas y de enfermería, según subsectores.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
53
SUBSECTORES
OFICIAL Y MIXTO SEGURIDAD
SOCIAL
PRIVADO TOTAL
MÉDICOS
ODONTOLÓGICOS
ENFERMERÍA
178.348
115.500
112.000
120.746
51.952
18.680
13.212
13.380
00
312.308
180.832
130.680
2.4 Elaborar un diagrama triangular que represente las extensiones
territoriales de los países Bolivarianos.
PAÍS ÁREA (KM²)
BOLIVIA
COLOMBIA
ECUADOR
PERÚ
VENEZUELA
1´099.000
1´138.000
284.000
1´285.000
916.000
2.5 Los aviones agrícolas como modernas máquinas agrícolas, participan
cada vez más en gran número de trabajo. Aproximadamente unos 60 países
con unos 19.000 aviones tratan al rededor de 200.000.000 hectáreas según
la (FAO). A continuación aparecen algunos datos referentes a diversos
países. Elaborar un pictograma que visualice los datos presentados.
PAIS Nº DE AVIONES
URSS
EE. UU.
CANADÁ
ARGENTINA
MÉXICO
RDA
RFA
8.000
6.100
666
450
450
100
2.030
2.6 Para formar las curvas de calibración para estimación de la
concentración de protombina, se considera arbitrariamente que el plasma de
un sujeto normal tiene una concentración de 100%. Con suero salino se
prepara una serie de diluciones de esta muestra y se mide un tiempo que se
requiere para la coagulación después de agregar una mezcla de cloruro de
calcio y trasmboplastina. La tabla siguiente ilustra el tipo de dato que se
tiene.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
54
CONCENTRACIÓN NOMINAL DE
PROTOMBINA, X
TIEMPO EN SEGUNDOS QUE SE
REQUIERE PARA QUE
APAREZCA UN COAGULO , Y
100
50
25
15
14
18
22
24
Representar los puntos en una gráfica de Y en función de X y trazar la curva
a mano alzada a través de esos puntos.
2.7 En un sujeto cuyo nivel de glucosa en sangre en ayunas es de 100
mg/100ml, se inyectan por vía intravenosa 50 gr de glucosa. Se miden
muestra de sangre, con intervalos de media hora, obteniendo los resultados
siguientes:
MINUTOS DESPUÉS DE LA INYECCIÓN Mg/100 ml DE GLUCOSA EN
SANGRE
30
60
90
120
161
128
119
108
Trazar la gráfica del logaritmo del aumento en la concentración de azúcar en
la sangre, en función del tiempo.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
55
2.8.- Sírvase registrar ( F ) dentro del paréntesis en caso de que el
enunciado sea completamente falso y ( V ) verdadero en caso contrario.
El gráfico circular (pastel) lo usamos para representar variables cualitativas
( )
La elaboración del pictograma exige que sobre el eje x vaya la variable de
interés ( )
La parte inicial en la construcción de un formulario debe contener las
preguntas acerca del tema de interés. ( ).
El gráfico de barras simple y el de pastel se utiliza cuando la variable es de
naturaleza cualitativa ( )
En el procesos de investigación estadística, la selección de las variables a
estudiar se realiza independientemente de los objetivos o hipótesis de
investigación. ( )
Toda investigación científica debe contar con el método estadístico como su
único auxiliar. ( )
Las tablas estadísticas son arreglos de datos expuestos en filas y columnas
para su manejo y presentación. ( )
Para utilizar un polígono de frecuencias, la variable debe ser de naturaleza
cuantitativa continua y deberá ocupar la ordenada del sistema del
coordenadas cartesianas ( )
Kilogramos, onza y libra son unidades de medida de la variable peso ( )
Toda variable cuantitativa puede ser transformada para ser manejada a un
nivel de medición nominal u ordinal ( ).
2.9 A cada espacio en blanco que aparece en la columna A, escribir la letra
correspondiente de la columna B (respuesta) que usted crea es la respuesta
correcta. Cada expresión de la columna B, puede ser utilizada como
respuesta en A más de una vez.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
56
COLUMNA A COLUMNA B
Elementos que permiten cuantificar A. Los porcentajes
la unidad de análisis
Permiten visualizar el comportamiento B. El coeficiente de Asimetría
real y objetivo del objeto de estudio.
Permiten tener un conocimiento de D. El coeficiente de variación
la variable desde el centro de la serie.
Como medida de dispersión está E. Desviación estándar
asociada con la media.
Permiten describir el comportamiento F. El saber cotidiano
de una variable cuantitativa.
Permite comparar la variabilidad o G. Unidad de observación
heterogeneidad que presentan dos
variables con igual unidad de medida
Utiliza los numerales como códigos H. Gráfico de líneas
para establecer una categorización.
Se utiliza para conocer el grado I. Medidas de tendencia
central de simetría que presenta la
Distribución de una variable.
Permiten describir el comportamiento J. Medidas de resumen
de una variable cualitativa.
K. Histograma de frecuencias
2.10 Dentro de un estudio de clima organizacional en una unidad local de
salud que cuenta con 55 empleados, se tomó una muestra de 15 empleados
en los cuales se evaluó en nivel motivacional, y, la aplicación del test arrojó
los siguientes resultados calificados con una escala de 1 a 5 y 30 ítem.
42 36 65 70 42 58 66 65 58 90 85 70 90 66 36
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
57
Con base en la información anterior precisar:
Cuál es la variable de estudio? -------------------------------------------------------------
-----------------------------------------------------------------------------------------------
Cuál es la naturaleza de la variable de estudio? y nivel de medición ------------
--------------------------------------------------------------------------------------------------
Cuál es la unidad de medida de la variable?.---------------------------------------
Cuál es la unidad de análisis? ----------------------------------------------------------
Cuál es la muestra? ----------------------------------------------------------------------
Cuantos valores diferentes tiene la variable? ----------------------------------------
Cuál es el universo? -----------------------------------------------------------------------
Cuál es el puntaje máximo que se puede esperar en el test para una
persona? -------------------------------------------------------------------------------------
Cuál es la frecuencia absoluta para cada valor de la variable? -------------------
-------------------------------------------------------------------------------------------------
Cuál es el puntaje mínimo que se puede esperar en el test de una persona?
---------------------------------------------------------------------------------------------------
2.11 Los siguientes datos agrupados corresponden a las Estaturas de 98
estudiantes, hombres, que participaron en un estudio titulado “Desarrollo de
las medidas Craneofaciales de crecimiento de población X”. En uno de los
objetivos de la investigación, se requería hacer una descripción de talla inicial
de las personas bajo estudio, para efectos comparativos posteriores.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
58
Distribución porcentual de las Estaturas de 98 hombres, en un estudio sobre
Desarrollo de las Medidas Craneofaciales y de Crecimiento. Medellín, 1.995
INTERVALO
S
Marcas de
clase Xi
Frecuencia
absoluta
Fi
Frecuencia
acumulada
Fa
Frecuencia
Relativa en %
Fr
Frecuencia
Relativa
Acumulada %
Fra
1.47 – 1.53 1.50 9 9 9.2 9.2
1.53 - 1.59 1.56 18 27 18.4 27.6
1.59 - 1.65
1.62 20 47 20.4 48.0
1.65- 1.71
1.68 16 63 16. 64.3
1.71 - 1.77
1.74 19 82 19.4 83.7
1.77 -1.83
1.80 8 90 8.2 91.9
1.83 - 1.89
1.86 5 95 5.1 97.0
1.89- 1.95
1.92 3 98 3.0 100.0
Tomando como referencia el cuadro anterior, una o unas de las siguientes
afirmaciones es o son falsa:
a.- La estatura que predomina en el estudio es 1.62 mts.
b.- A lo sumo el 48% de las estaturas está entre 1.47 mts y 1.65
c.- El 48% de las Estaturas está entre 1.59 mts y 1.65 mts
d.- El 3% de las Estaturas más altas está entre 1.83 y 1.95 mts.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
59
UNIDAD 3.0
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL
OBJETIVO
DE LA UNIDAD: Proporcionar una comprensión de las características o propiedades de los
Datos numéricos (tendencia central) y sus mediciones descriptivas de Resumen
correspondientes, como una ayuda para el análisis e interpretación de datos.
CONTENIDOS:
3.1 Media Aritmética
3.1.1 Propiedades
3.1.2 Ventajas y desventajas
3.2 Mediana
3.2.1 Ventajas y desventajas
3.3 Moda
3.3.1 Ventajas y desventajas
3.4 Características principales de los promedios anteriores
3.5 Relación entre la Media, Mediana y Moda
3.6 Media Geométrica
3.6.1 Propiedades
3.6.2 Ventajas y desventajas
3.6.3 Características
3.7 Media Armónica
3.7.1 Característica
3.8 Relación entre Media Aritmética, Geométrica y Armónica
3.9 Cuartiles, Decíles y Percentiles
Evaluación de la unidad
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
60
MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL
3.0. MEDIDAS DE POSICIÓN.
Son parámetros o promedios que se consideran representativos de una
distribución de datos , los cuales tienen tendencia a concentrar los datos, o
sea , que son valores de posición central a cuyo alrededor se distribuyen los
datos del conjunto. Los más importantes son: Media Aritmética, Mediana y
Moda. Se encuentran otras medidas de menos importancia que
analizaremos en éste trabajo como son: Media Geométrica, Armónica,
Cuadrática, Cúbica, Cuartiles, Deciles y percentiles.
3.1 MEDIA ARITMÉTICA :
Es el promedio más utilizado. Es la suma de los valores de la distribución
dividida por el número total de datos. Es un promedio que se obtiene por
medio del cálculo cuyo valor depende del que tienen los diversos datos que
entran en la distribución.
La medida Aritmética se representa por medio de
__
X (que se lee X barra)
3 .1.1. CALCULO DE MEDIA ARITMÉTICA.
3.1.1.1 Para datos no Agrupados. La Media Aritmética se calcula a partir de
la formula:
X
__

n
XnXXXXXXX ...7654321 
X
__

Xi
n
i
n

1
representa la media de la muestra
Donde x Se utiliza para indicar la suma de todas las X y n es el número
total de datos de la muestra.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
61
EJEMPLO 1:
Las calificaciones de un alumno durante el grado 10º han sido las siguientes:
Matemáticas, 8 , Estadística 7, Ingles , 7; Física 6 Química, 9 Filosofía, 5 ,
Literatura, 6, Hallar la nota media (
_ _
X ).
__
X 
X X X X X X X1 2 3 4 5 6 7
7
     
__
X 
Xi
n
i 
1
7
__
X =
8 7 7 6 9 5 6
7
     
= 6.85
EJEMPLO 2.
Hallar la Media Aritmética de la siguiente distribución de datos:
32, 25, 29, 30, 30, 27, 24, 35, 34, 30, 29
__
X =
32 25 29 30 30 27 24 35 34 30 29
11
         
__
X = 29.54
Ejemplo 3.
La Media Aritmética de los números 8, 3, 5, 12, 10 es:
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
62
__
X =
8 3 5 12 10
5
   
= 7.6
3.1.1.2 Para Datos Agrupados. Se puede calcular por efectivos, frecuencia y
por intervalos. Se calcula a partir de la fórmula.
__
X =
X f
n
i i
i
n

1
; Media aritmética ponderada
EJEMPLO 1.
Los valores de las edades en años obtenidas en una toma de datos en una
encuesta, son los que figuran en la tabla siguiente. Hallar la Media Aritmética
de la distribución de los datos.
Xi (Edad en años) fi XI . fi
29 0 0
30 2 60
31 7 217
32 13 416
33 22 726
34 32 1088
35 49 1715
36 35 1260
37 23 851
38 9 342
39 5 195
40 3 120
41 0 0
N = 200 6.990.
__
X =
X f
n
i i
i
n

1
=
6990
200
= 34.95 = 35 años, edad promedio.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
63
EJEMPLO 2.
Hallar la Media Aritmética (
__
X ) de los datos que figuran en la siguiente
tabla en la cual vamos a encontrar la estatura en centímetros de las especies
de árboles estudiados en una área determinada.
Intervalo Xi Fi Xi Fi
6 25 15,5 4 62
26 45 35,5 3 106,5
46 65 55,5 7 388,5
66 85 75,5 9 679,5
86 105 95,5 16 1528
106 125 115,5 14 1617
126 145 135,5 20 2710
146 165 155,5 32 4796
166 185 175,5 24 4212
186 205 195,5 13 2514.5
206 225 215,5 6 1293
------------ ---------------
N = 148 19907
__
X =
X f
n
i i
i
n

1
=
19907
148
= 134.50cm; estatura promedio
EJEMPLO 3.
En la siguiente tabla se encuentra unas distribuciones de los datos de la
estatura de 50 trabajadores.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
64
Estatura en
pulgada
INTERVALOS
Puntos medios
Xi
frecuencia
Fi
Xi .Fi
50.5 - 53,5
53.5 - 56.5
56.5 - 59.5
59.5 - 62.5
62.5 - 65.5
65.5 - 68.5
68.5 - 71.5
71.5 - 74.5
52
55
58
61
64
67
70
73
1
2
6
11
16
9
4
1
52
110
3 48
6 71
1024
603
280
73
__
X =
X f
n
i i
i
n

1
=
3161
50
= 63.22 pulgadas, estatura promedio.
3.1.2 PROPIEDADES DE LA MEDIA ARITMÉTICA
a. La suma algebraica de las desviaciones de un conjunto de números
de su Medida Aritmética es igual a 0 (cero).
Así : (Xi
j
n


1
__
X ) = O
b. La suma de los cuadros de las desviaciones de un conjunto Xi
respecto ciertos número a es mínima sí y solo sí a es igual a
__
X .
c. Si f1 número tienen la media m1 , f2 número tiene la media
m 2, fk número tiene la media mk entonces la media de todos los números es :
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
65
__
X =
1 1 2 2
1 2
f m f m f mk k
f f f k
  
  
...
...
3.1.3 VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA
3.1.3.1. ventajas
a. El promedio aritmético es, en así, la medida más fácil de entender y la
más comúnmente usada. Es un valor tal que si calculamos para un grupo en
el cual todos los elementos fueran iguales, cada uno de ellos sería igual a su
promedio aritmético de “n” elementos es nuevo elemento formado, tomado
una parte igual a 1/n de cada uno los elementos originales.
b. Esta media se define en forma rígida por una ecuación matemática
muy fácil de entender y algunas veces se puede obtener cuando no es
posible calcular otros tipos de medida de tendencia central y aún en el caso
de no conocer los valores individuales de las serie, por ejemplo.
Sí 10 filas consumen 20 litros de leche, el promedio aritmético será de 2
litros por fila.
c. El promedio aritmético es extraordinariamente estable en el muestreo.
d. Es altamente sensible a cualquier cambio en los datos de la
distribución.
e. Como una ventaja más del promedio aritmético, podemos anotar que
es excepcionalmente adaptable cuando se trata de hacer cálculos
matemáticos posteriores con él (promedio ponderado, métodos abreviados y
promedio de promedios).
3.1.3.2. Desventajas
a. Es sensible a los valores muy grande o muy pequeños, especialmente
a los primeros, y a la inclusión de tales datos en distribución que se esté
estudiando pueden dar un promedio aritmético que no sea realmente el
representante típico del grupo.
b. Cuando una distribución es marcadamente aritmética en tal forma que
el promedio aritmético, la mediana y la moda difieren en forma apreciable,
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
66
debe considerarse siempre la posibilidad de que el promedio aritmético
pueda no ser el valor único representativo de la serie.
c. Otro inconveniente o desventaja del promedio aritmético, es cuando la
distribución tiene forma de “U”, es decir parabólicamente este corresponde
a los valores menos comunes en la serie y por tanto, puede dar una idea
irreal de la distribución.
3.2. MEDIANA (Me)
La Mediana de una serie de datos ordenados es el valor central de la
distribución de datos que divide dicho conjunto de datos de tal manera que el
número de partidas por encima de la Mediana sea igual al número de
partidas por debajo de la Mediana.
3.2.1 MEDIANA PARA DATOS NO AGRUPADOS.
Cuando el número de valores de la distribución es impar, la mediana está
bien definida será el valor que se encuentre en el medio cuando se hayan
ordenado los valores.
Si los números de la distribución son pares, se ordenan, se suman los
valores centrales y se dividen por dos(2).
EJEMPLO 1.
Calcular la Mediana para cada una de las distribuciones de datos que siguen:
4, 6, 7, 9, 15, 16, 17, (número de datos impares)
La Mediana es 9 ya que este es el valor central de la distribución
EJEMPLO 2.
Calcule la mediana para: 3, 7, 9, 12, 15, 20, 21, 25
(número de datos par)
La mediana es = (12 +15) / 2 = 13.5
En este caso, la Mediana no corresponde a un valor real de la distribución.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
67
EJEMPLO 3.
32 25 29 30 31 27 24 34 32 29 25
Ordenando los datos:
24 25 25 27 29 29 30 31 32 32 34
La Mediana es 29
En éste caso corresponde a un valor real de distribución.
3.2.2 MEDIANA PARA DATOS AGRUPADOS:
Para encontrar la Mediana de datos agrupados se suele utilizar el método de
interpretación que exige la construcción de una distribución de frecuencia
acumulada o de una distribución de frecuencia acumulada relativa.
La Mediana se obtiene mediante la fórmula:
Mediana = Li +
n
fmediana
i
f/
'
2
1








 A
Donde Li = Límite real inferior de la clase mediana
n = Número total de datos (frecuencia total )
i
f  1
= Suma de las frecuencias de todas las clases por debajo de la
clase Mediana.
F mediana = Frecuencia de la clase Mediana.
A = Tamaño del intervalo de la clase mediana.
EJEMPLO 1.
Hallar la Mediana para las cargas máximas de los cables de la siguiente
tabla.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
68
Máxima de cargas Número de cables
Toneladas Cortas.
9,3 - 9,7 2
9,8 - 10.2 5
10,3 - 10,7 12
10,8 - 11,2 17
11,3 - 11,7 14
11,8 - 12,2 6
12,3 - 12,7 3
12,8 - 13,2 1
TOTAL 60
Me = Li +
n
fmediana
i
f/
'
2
1








 A
Me = 10.8 +
60 2 19
17
/ 




 0.4
Me = 10.8 +
11
17





 0.4
Me = 10.8 + 0.258
Mediana = 11.06 Toneladas cortas
Es decir que el 50% de los cables resisten menos de 11.06 toneladas y el
otro 50% mas de 11.06 toneladas.
EJEMPLO 2.
Halle la Mediana de los diámetros de las cajas de remaches de la siguiente
tabla.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
69
DIÁMETRO FRECUENCIA
(PULGADAS)
0,7247 - 0,7244 2
0,7250 - 0,752 6
0,7253 - 0,755 8
0,7256 - 0,7258 15
0,7259 - 0,7261 42
0,7262--- 0,7264 68
0,7265--- 0,7267 49
0,7268--- 0,7270 25
0,7271--- 0,7273 18
0,7274--- 0,7276 12
0,7277--- 0,7279 4
0,7280--- 0,7282 1
Me = Li +
n
fmediana
i
f/
'
2
1








 A
Me = 0.7262 +
250 2 73
68
/ 




 0.0002
Me = 0.7277
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
70
EJEMPLO 3.
Hallar la mediana de la siguiente tabla, que muestra los salarios recibidos por
algunas familias.
CLASES(salarios) FRECUENCIA(familias)
10 - Menor de 15 3
15 -Menor de 20 7
20 -Menor de 25 16
25 -Menor de 30 12
30 -Menor de 35 9
35 -Menor de 40 5
40 -Menor de 45 2
TOTAL 54
Me = Li +
n
fmediana
i
f/
'
2
1








 A
Me = 25 +
54 2 26
12
/ 




 5
Me = 25.41 salarios; el 50% de las familias reciben menos de 25.41 salarios
y el otro 50% mas de 25.41 salarios.
3.2.3 VENTAJAS Y DESVENTAJAS DE LA MEDIANA
3.2.3.1 Ventajas
3.2.3.1.1 La Mediana tiene una definición rígida y el concepto que envuelve
es tan claro que cualquiera puede entenderlo aún no siendo familiar el
término.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
71
3.2.3.1.2 Si los datos están ordenados en un cuadro de frecuencias esta
medida es fácil de calcular y por otro lado los datos extremos no tienen
ninguna influencia en ella.
3.2.3.1.3 Tiene menos estabilidad en el muestreo que el promedio
aritmético, pero es más aceptable en otras medidas.
3.2.3.1.4 Hay situación en que la única medida de tendencia central que
puede calcularse es la Mediana, tal como sucede en el uso de una
distribución cuyos intervalos extremos no están definidos.
3.2.3.2 Desventajas.
3.2.3.2.1 No es tan conocida como la Media Aritmética
3.2.3.2.2 Es necesario ordenar los datos para poderla calcular
3.2.3.2.3 La mediana no se adapta a cálculos posteriores aritméticos, por
cuanto que si obtenemos la mediana de diferentes grupos, no podemos
tener una mediana de los grupos reunidos.
3.2.3.2.4 La Mediana no es sensible a cambios de valores de los
elementos que componen la distribución.
3.3 MODA ( Mo)
Se define como el valor que ocurre con mayor frecuencia en una distribución
o sea el punto donde la concentración es máxima, Si todos los valores son
diferentes, no existen moda, por otra parte un conjunto de valores puede
tener más de una moda. Si la moda es única la distribución de datos se
denomina UNIMODAL si hay dos modas BIMODAL etc.
Por ejemplo:
Un laboratorio con 10 empleados cuyas edades son 20, 21, 20, 20, 34, 22,
24, 27, 27 y 27. Puede decirse que estos datos tienen dos modas, 20 y 27.
La muestra que consiste de los valores 10, 21, 33, 53 y 54 son diferentes.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
72
De una distribución de frecuencia o histograma la moda puede sacarse de la
fórmula:
Moda = Li +
1
1 2

 







 A
Li = Limite real inferior de clase modal
1 = Exceso de la frecuencia modal sobre la frecuencia de la clase
contigua inferior.
2 = El exceso de la frecuencia modal sobre la frecuencia de la clase
contigua superior.
A = Tamaño del intervalo de clase modal.
Para datos no agrupados la moda es el valor que más se repite o es el valor
de más alta frecuencia.
EJEMPLO1.
Hallar la Moda para el siguiente conjunto de datos:
7, 4, 10, 15, 12, 7, 9, 7,
Moda = 7
EJEMPLO 2.
Los tiempos de reacción de un individuo a determinados estímulos fueron :
0,53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 055 segundos
Moda = 0.53
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
73
EJEMPLO 3.
Una serie de números está formada por seis 6, siete 7, ocho 8 , nueve 9, y
Diez 10.
La Moda = 10
EJEMPLO 4.
Hallar la moda para la siguiente frecuencia que demuestra el ingreso familiar
diario en pesos.
INGRESO FAMILIAR DIARIO EN $ Nº DE FAMILIAS
Menos de 3.000 25
3.000 - 4.999 31
5.000 - 6.999 42
7.000 - 8.999 45
9.000 - 10.999 52
11.000 - 12.000 42
13.000 - 14.999 35
15.000 - o más 28
TOTAL 300
Mo = Li +
1
1 2

 







 A
Mo = 9000 +
7
7 10





 1999
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
74
Mo = 9000 + ( 0.411) 1999
Moda = $ 9821.58
La mayor parte de las familias ganan alrededor de $ 9,822 .
EJEMPLO 5.
Distribución de las partículas de materia en suspensión ( microgramos por
metros cúbicos ) en muestras de aires tomadas en 57 grandes ciudades.
INTERVALO DE CLASE FRECUENCIA
10 19 5
20 29 19
30 39 10
40 49 13
50 59 4
60 69 4
70 79 2
Mo = Li +
1
1 2

 







 A
Mo = 20 +
14
14 9





 9
Mo = 20 + ( 0.608)9
Moda = 25.47 micro gramos/ metro cúbico.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
75
EJEMPLO 6.
En la siguiente distribución observamos el tiempo en minutos que demoraron
algunos atletas en recorrer una distancia.
INTERVALO DE CLASES FRECUENCIA
20 30 15
30 40 18
40 50 22
50 60 30
60 70 15
100
Mo = Li +
1
1 2

 







 A
Mo = 50 +
8
8 15





 10
Mo = 53.47 minutos
3.3.1 VENTAJAS Y DESVENTAJAS DE LA MODA
3.3.1.1 Ventajas
3.3.1.1.1. El hecho de que la moda indique el número de mayor
concentración, lo que hace tal vez la mejor medida de tendencia central,
cuando una distribución es asimétrica. Claramente se ve que el modo es el
más representativo del grupo, y en algunos casos si los promedios son
simplificativamente diferentes del valor es preferible usar el modo.
3.3.1.1.2 En series polimodales, el modo permite dividir la distribución con
fines de estratificación
3.3.1.2 Desventajas.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
76
3.3.1.2.1 El modo es difícil de calcular en una serie agrupada y las
aproximaciones de su cálculo no son de mucha confianza.
3.3.1.2.2 El modo es muy inestable en el muestreo.
3.3.1.2.3 El modo puede ser usado fácilmente en procesos algebraicos
posteriores.
3.3.1.2.4. El modo no es sensible a cambios de valores en la distribución,
a menos que tales cambios afecten a su propio valor.
3.3.1.2.5 No es recomendable, en la variable continua o cuando la
amplitud de los intervalos es diferente.
3.4 CARACTERÍSTICAS DE LOS PRINCIPALES PROMEDIOS VISTOS
ANTERIORMENTE.
3.4.1 Media Aritmética.
3. 4.1.1 El valor de la media aritmética depende de cada una de las medidas
que forman la serie, y se halla afectada excesivamente por las desviaciones
extremas con respecto al promedio, lo que habría que tener presente en
algunas de sus aplicaciones.
3.4.1.2 La media aritmética se calcula con facilidad, y es única para cada
caso.
3.4.1.3 La media aritmética es un promedio calculado, susceptible de las
operaciones algebraicas.
3.4.2 MEDIANA (CARACTERES PRINCIPALES)
3.4.2.1 El valor de la mediana no está sujeto a la magnitud de las
desviaciones extremas con respecto al promedio.
3.4.2.2 La mediana puede ser localizada cuando los términos que forman la
serie no son susceptibles de evaluación cuantitativa.
3.4.2.3 La mediana no se presta tanto como los medios aritméticos,
geométricos y armónicos a las operaciones algebraicas.
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
77
3.4.3 MODA (CARACTERES PRINCIPALES)
3.4.3.1 El valor de la moda no está afectado por las magnitudes de las
desviaciones extremas con relación al promedio.
3.4.3.2 Es fácil localizar la moda aproximadamente, pero, la determinación
de su valor exacto exige prodigiosos cálculos.
3.4.3.3. La moda carece de significado a menos que la distribución
comprenda un gran número de datos y ofrezca marcada concentración.
3.4.3.4. La moda es el promedio más típico de toda la distribución pues se
halla localizado en el punto de máxima concentración.
3.4.3.5 La moda no es susceptible de operaciones algebraicas.
3.5.- RELACIÓN ENTRE MEDIA, MEDIANA Y MODA.
En una distribución de frecuencias uní modales que sea moderadamente
asimétricas, la mediana se encuentra entre la media aritmética y la moda a
un tercio aproximadamente de distancia; de aquí se tiene la relación
empírica:
MEDIA - MODA = 3 (MEDIA - MEDIANA)
___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ
78
Ejemplo
Hallar la media, mediana y moda de los pesos de 40 estudiante de una
Universidad.
PESOS ( LIBRAS ) Xi Fi Xi.Fi
118 - 126 122 3 366
127 - 135 131 5 655
136 - 144 140 9 1260
145 - 153 149 12 1788
154 - 162 158 5 790
163 - 171 167 4 668
172 - 180 176 2 352
n =40 5879
__
X =
X f
n
i i
i
n

1
= 5879
40
= 146.97
Me = Li +
n
fmediana
i
f/
'
2
1








 A
Me = 145 +
40 2 17
12
/ 




 9
Me = 147.25
Mo = Li +
1
1 2

 







 A
Mo = 145 +
3
3 7





 8
Mo = 147.4
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i
Modulo de estadistica i

Weitere ähnliche Inhalte

Was ist angesagt?

Cc trabajo tema 5
Cc trabajo tema 5Cc trabajo tema 5
Cc trabajo tema 5josele78
 
Representación grafica en estadística
Representación grafica en estadísticaRepresentación grafica en estadística
Representación grafica en estadísticaRicardo Oropeza
 
Probabilidad clásica, de frecuencia relativa y subjetiva
Probabilidad clásica, de frecuencia relativa y subjetivaProbabilidad clásica, de frecuencia relativa y subjetiva
Probabilidad clásica, de frecuencia relativa y subjetivaRuben Veraa
 
Mapa conceptual estadistica aplicada
Mapa conceptual estadistica aplicadaMapa conceptual estadistica aplicada
Mapa conceptual estadistica aplicada0125cvam
 
Maxíma verosimilitud
Maxíma verosimilitudMaxíma verosimilitud
Maxíma verosimilitudPedro Anzurez
 
Ensayo probabilidad
Ensayo probabilidadEnsayo probabilidad
Ensayo probabilidadmaykeljunior
 
Estimación del error de la media poblacional
Estimación del error de la media poblacionalEstimación del error de la media poblacional
Estimación del error de la media poblacionalAlfredo Loayza Chavarrìa
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenCarlo Herrera
 
Muestreo técnicas de recolección
Muestreo técnicas de recolecciónMuestreo técnicas de recolección
Muestreo técnicas de recolecciónAlejandra Camors
 
Calculo Del Tamaño De La Muestra
Calculo Del Tamaño De La MuestraCalculo Del Tamaño De La Muestra
Calculo Del Tamaño De La Muestrafernandoalvarado
 
S13 distribución de probabilidad para v.a continuas
S13 distribución de probabilidad para v.a continuasS13 distribución de probabilidad para v.a continuas
S13 distribución de probabilidad para v.a continuasYorladys Martínez Aroca
 
La distribucion binomial
La distribucion binomialLa distribucion binomial
La distribucion binomialADrián Murillo
 
Ensayo teoria de la probabilidad
Ensayo teoria de la probabilidadEnsayo teoria de la probabilidad
Ensayo teoria de la probabilidadDanny Gonzalez
 
Presentación de medidas de dispersión
Presentación de medidas de dispersiónPresentación de medidas de dispersión
Presentación de medidas de dispersiónluzcamilabp
 
Prueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalPrueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalfranciscoe71
 
Cómo se hace la delimitación semántica
Cómo se hace la delimitación semánticaCómo se hace la delimitación semántica
Cómo se hace la delimitación semánticaMarina H Herrera
 
TIPOS DE DISTRIBUCIONES
TIPOS DE  DISTRIBUCIONESTIPOS DE  DISTRIBUCIONES
TIPOS DE DISTRIBUCIONESYovana Marin
 

Was ist angesagt? (20)

Cc trabajo tema 5
Cc trabajo tema 5Cc trabajo tema 5
Cc trabajo tema 5
 
Variables aleatorias
Variables aleatoriasVariables aleatorias
Variables aleatorias
 
Representación grafica en estadística
Representación grafica en estadísticaRepresentación grafica en estadística
Representación grafica en estadística
 
Probabilidad clásica, de frecuencia relativa y subjetiva
Probabilidad clásica, de frecuencia relativa y subjetivaProbabilidad clásica, de frecuencia relativa y subjetiva
Probabilidad clásica, de frecuencia relativa y subjetiva
 
Mapa conceptual estadistica aplicada
Mapa conceptual estadistica aplicadaMapa conceptual estadistica aplicada
Mapa conceptual estadistica aplicada
 
Maxíma verosimilitud
Maxíma verosimilitudMaxíma verosimilitud
Maxíma verosimilitud
 
Introducion al muestreo y tipos de muestreo
Introducion al muestreo y tipos de muestreoIntroducion al muestreo y tipos de muestreo
Introducion al muestreo y tipos de muestreo
 
Ensayo probabilidad
Ensayo probabilidadEnsayo probabilidad
Ensayo probabilidad
 
Estimación del error de la media poblacional
Estimación del error de la media poblacionalEstimación del error de la media poblacional
Estimación del error de la media poblacional
 
Resumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumenResumen estadistica descriptiva resumen
Resumen estadistica descriptiva resumen
 
Muestreo técnicas de recolección
Muestreo técnicas de recolecciónMuestreo técnicas de recolección
Muestreo técnicas de recolección
 
Calculo Del Tamaño De La Muestra
Calculo Del Tamaño De La MuestraCalculo Del Tamaño De La Muestra
Calculo Del Tamaño De La Muestra
 
S13 distribución de probabilidad para v.a continuas
S13 distribución de probabilidad para v.a continuasS13 distribución de probabilidad para v.a continuas
S13 distribución de probabilidad para v.a continuas
 
La distribucion binomial
La distribucion binomialLa distribucion binomial
La distribucion binomial
 
Ensayo teoria de la probabilidad
Ensayo teoria de la probabilidadEnsayo teoria de la probabilidad
Ensayo teoria de la probabilidad
 
Presentación de medidas de dispersión
Presentación de medidas de dispersiónPresentación de medidas de dispersión
Presentación de medidas de dispersión
 
Prueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalPrueba de hipotesis 2018 final
Prueba de hipotesis 2018 final
 
Cómo se hace la delimitación semántica
Cómo se hace la delimitación semánticaCómo se hace la delimitación semántica
Cómo se hace la delimitación semántica
 
Resumen de Teoría de Muestreo
Resumen de Teoría de MuestreoResumen de Teoría de Muestreo
Resumen de Teoría de Muestreo
 
TIPOS DE DISTRIBUCIONES
TIPOS DE  DISTRIBUCIONESTIPOS DE  DISTRIBUCIONES
TIPOS DE DISTRIBUCIONES
 

Andere mochten auch

Estadistica 2. distribucion de frecuencias
Estadistica   2. distribucion de frecuenciasEstadistica   2. distribucion de frecuencias
Estadistica 2. distribucion de frecuenciasEdward Ropero
 
Actividades de Estadística
Actividades de EstadísticaActividades de Estadística
Actividades de EstadísticaDiana Garcia
 
Ejercicio 1 estadistica
Ejercicio 1 estadisticaEjercicio 1 estadistica
Ejercicio 1 estadisticalolaromero123
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011cesarzatta
 
Tres Fases de la Investigación
Tres Fases de la InvestigaciónTres Fases de la Investigación
Tres Fases de la InvestigaciónHoracio Guevara
 
Etapas de la investigación
Etapas de la investigaciónEtapas de la investigación
Etapas de la investigaciónNahomy Alvarez
 
Módulo desarrollado de Estadística
Módulo desarrollado de EstadísticaMódulo desarrollado de Estadística
Módulo desarrollado de Estadísticajustoenriquezvizcain
 
Coeficiente de asimetria
Coeficiente de asimetriaCoeficiente de asimetria
Coeficiente de asimetriaoaca54
 
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...jeshua166
 
Histogramas de frecuencia
Histogramas de frecuenciaHistogramas de frecuencia
Histogramas de frecuenciaArtruro Benites
 
Saber cotidiano y saber filosófico
Saber cotidiano y saber filosóficoSaber cotidiano y saber filosófico
Saber cotidiano y saber filosóficofilosofiaiztapalapa3
 
Etapas de la investigación
Etapas de la investigaciónEtapas de la investigación
Etapas de la investigaciónNahomy Alvarez
 
Trabajo Estadística
Trabajo EstadísticaTrabajo Estadística
Trabajo Estadísticapabloteba
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShareSlideShare
 

Andere mochten auch (20)

Estadistica 2. distribucion de frecuencias
Estadistica   2. distribucion de frecuenciasEstadistica   2. distribucion de frecuencias
Estadistica 2. distribucion de frecuencias
 
Actividades de Estadística
Actividades de EstadísticaActividades de Estadística
Actividades de Estadística
 
Ejercicio 1 estadistica
Ejercicio 1 estadisticaEjercicio 1 estadistica
Ejercicio 1 estadistica
 
Modulo Estadística 2011
Modulo Estadística 2011Modulo Estadística 2011
Modulo Estadística 2011
 
Tres Fases de la Investigación
Tres Fases de la InvestigaciónTres Fases de la Investigación
Tres Fases de la Investigación
 
Etapas de la investigación
Etapas de la investigaciónEtapas de la investigación
Etapas de la investigación
 
01.introd..[1]
01.introd..[1]01.introd..[1]
01.introd..[1]
 
Modulo de estadistica ii
Modulo de estadistica iiModulo de estadistica ii
Modulo de estadistica ii
 
Módulo de estadística
Módulo de estadísticaMódulo de estadística
Módulo de estadística
 
Módulo desarrollado de Estadística
Módulo desarrollado de EstadísticaMódulo desarrollado de Estadística
Módulo desarrollado de Estadística
 
Coeficiente de asimetria
Coeficiente de asimetriaCoeficiente de asimetria
Coeficiente de asimetria
 
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...
Estadistica descriptiva modulo II y III distribución de frecuencias tabular y...
 
Histogramas de frecuencia
Histogramas de frecuenciaHistogramas de frecuencia
Histogramas de frecuencia
 
Saber cotidiano y saber filosófico
Saber cotidiano y saber filosóficoSaber cotidiano y saber filosófico
Saber cotidiano y saber filosófico
 
Etapas de la investigación
Etapas de la investigaciónEtapas de la investigación
Etapas de la investigación
 
Tipos de escalas y variables estadísticas
Tipos de escalas y variables estadísticasTipos de escalas y variables estadísticas
Tipos de escalas y variables estadísticas
 
Formulacion problemas pl
Formulacion problemas plFormulacion problemas pl
Formulacion problemas pl
 
Trabajo Estadística
Trabajo EstadísticaTrabajo Estadística
Trabajo Estadística
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
 
Estadistica i historia
Estadistica i historiaEstadistica i historia
Estadistica i historia
 

Ähnlich wie Modulo de estadistica i

Monografia de relaciones y funciones
Monografia de relaciones y funcionesMonografia de relaciones y funciones
Monografia de relaciones y funcionesYbilder Vasquez
 
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...Naydu Moran Carmen
 
Presentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdfPresentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdfNachoSalgado4
 
Webquest Nociones De Estadistica
Webquest Nociones De EstadisticaWebquest Nociones De Estadistica
Webquest Nociones De Estadisticajpgv84
 
Webquest nociones de estadistica
Webquest nociones de estadisticaWebquest nociones de estadistica
Webquest nociones de estadisticasefemor
 
Webquest nociones de estadistica
Webquest nociones de estadisticaWebquest nociones de estadistica
Webquest nociones de estadisticasefemor
 
C:\Fakepath\Webquest Nociones De Estadistica
C:\Fakepath\Webquest Nociones De EstadisticaC:\Fakepath\Webquest Nociones De Estadistica
C:\Fakepath\Webquest Nociones De Estadisticadurandmarisela
 
Estadistica introduccion
Estadistica introduccionEstadistica introduccion
Estadistica introduccionk4rol1n4
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)Luisa Santa María
 

Ähnlich wie Modulo de estadistica i (20)

Estadistica i
Estadistica iEstadistica i
Estadistica i
 
Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2
 
Clase1 unidad1
Clase1 unidad1Clase1 unidad1
Clase1 unidad1
 
Cuadernillo de probabilidad
Cuadernillo de probabilidadCuadernillo de probabilidad
Cuadernillo de probabilidad
 
Econometria
EconometriaEconometria
Econometria
 
Monografia de relaciones y funciones
Monografia de relaciones y funcionesMonografia de relaciones y funciones
Monografia de relaciones y funciones
 
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...Población, muestra y datos. Presentación de datos: cuadros de distribución de...
Población, muestra y datos. Presentación de datos: cuadros de distribución de...
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Unidad i
Unidad iUnidad i
Unidad i
 
Tecnologia
TecnologiaTecnologia
Tecnologia
 
Presentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdfPresentacion_Tema1_estadistica_uc3m .pdf
Presentacion_Tema1_estadistica_uc3m .pdf
 
Webquest Nociones De Estadistica
Webquest Nociones De EstadisticaWebquest Nociones De Estadistica
Webquest Nociones De Estadistica
 
Webquest nociones de estadistica
Webquest nociones de estadisticaWebquest nociones de estadistica
Webquest nociones de estadistica
 
Webquest nociones de estadistica
Webquest nociones de estadisticaWebquest nociones de estadistica
Webquest nociones de estadistica
 
C:\Fakepath\Webquest Nociones De Estadistica
C:\Fakepath\Webquest Nociones De EstadisticaC:\Fakepath\Webquest Nociones De Estadistica
C:\Fakepath\Webquest Nociones De Estadistica
 
Prog. Estadistica I
Prog. Estadistica IProg. Estadistica I
Prog. Estadistica I
 
Estadistica introduccion
Estadistica introduccionEstadistica introduccion
Estadistica introduccion
 
Ensayo 1
Ensayo 1Ensayo 1
Ensayo 1
 
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
52812712 probabilidad-y-estadistica-m-isaias-e-farias (1)
 
Estadistica modulo i
Estadistica modulo iEstadistica modulo i
Estadistica modulo i
 

Kürzlich hochgeladen

Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfJC Díaz Herrera
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdfJC Díaz Herrera
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfJC Díaz Herrera
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxJamesHerberthBacaTel
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfJC Díaz Herrera
 

Kürzlich hochgeladen (20)

Familias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdfFamilias_más_ricas_de_AL_en_la_historia.pdf
Familias_más_ricas_de_AL_en_la_historia.pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptxINTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
INTRODUCCION-A-LOS-ALGORITMOS-BASICOS.pptx
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Las familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdfLas familias más ricas del sionismo en el siglo XXI.pdf
Las familias más ricas del sionismo en el siglo XXI.pdf
 

Modulo de estadistica i

  • 1. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 0 ESTADÍSTICA I APLICADA A LA ADMINISTRACIÓN DE EMPRESAS 0 5 10 15 20 25 30 Comidas Transporte Alojamiento Ene Feb Mar Abr May Jun ALBERTO QUINTO JIMÉNEZ Especialista en Matemática Avanzada. Universidad Nacional de Colombia. FACULTAD DE HUMANIDADES PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS UNIVERSIDAD TECNOLÓGICA DEL CHOCO “DIEGO LUIS CORDOBA” 2005
  • 2. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 1 OFRENDA A mi abuela MIGUELINA MOSQUERA de QUINTO, a mis hijos, a todos y cada uno de mis actuales y futuros alumnos promesas del mañana, dedico.
  • 3. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 2 INDICE PAGINA Ofrenda Prologo UNIDAD 1.0 LA ESTADÍSTICA Y SU HISTORIA 6 1.1 Historia 6 1.2 Definición de Estadística 8 1.3 Términos de uso corriente en Estadística 8 1.4 División de la Estadística 11 1.5 Aplicación de la Estadística 11 1.6 Importancia de la Estadística 12 1.7 Fenómeno que abarca y no abarca la Estadística 13 1.8 La investigación Estadística 13 1.9 Clases de investigación 14 1.10 Etapas de la investigación 15 Evaluación de la unidad 23 UNIDAD 2.0 REPRESENTACIÓN DE DATOS 31 2.1 Distribución de frecuencia 32 2.2 Distribución de frecuencia simple 33 2.3 Distribución de frecuencia por intervalo 37 2.4 Gráficos Estadísticos 42 Evaluación de la unidad 54
  • 4. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 3 UNIDAD 3.0 MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL 62 3.1 Media Aritmética 63 3.1.1 Propiedades 67 3.1.2 Ventajas y desventajas 68 3.2 Mediana 69 3.2.1 Ventajas y desventajas 74 3.3 Moda 75 3.3.1 Ventajas y desventajas 80 3.4 Características principales de los promedios anteriores 80 3.5 Relación entre la Media, Mediana y Moda 82 3.6 Media Geométrica 83 3.6.1 Propiedades 86 3.6.2 Ventajas y desventajas 87 3.6.3 Características 88 3.7 Media Armónica 89 3.7.1 Característica 90 3.8 Relación entre Media Aritmética, Geométrica y Armónica 91 3.9 Cuartiles, Decíles y Percentiles 91 Evaluación de la unidad 97 UNIDAD 4.0 MEDIDAS DE DISPERSIÓN 107 4.1 Varianza 108 4.1.1 Propiedades 110 4.1.2 Corrección de Shepard 110 4.2 Rango o recorrido 111 4.2.1 Características 111 4.3 Desviación Típica o Estándar 114
  • 5. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 4 4.3.1 Propiedades 114 4.4 Coeficiente de variación 118 4.4.1 Característica 118 4.5 Puntaje Típico o Stándarizado 120 4.6 Recorrido intercuartilico 122 4.7 Desviación Mediana 124 4.8 Desviación Media 125 Evaluación de la unidad. 129 UNIDAD 5.0 REGRESIÓN Y CORRELACION 133 5.1 Introducción a la bidimensionalidad 134 5.2 Relación entre dos variables 134 5.3 Regresión 138 5.4 Teoría de la correlación 141 5.5 Error típico de la estima 144 5.6 Variación explicada y no explicada 146 5.7 Coeficiente de correlación 146 5.8 Correlación gradual 151 Evaluación de la unidad. 161 UNIDAD 6.0 INTRODUCCIÓN A LAS COMPUTADORAS 165 6.1 La computadora en la Estadística 166 6.2 Introducción a Microsoft Excel 167 6.2.1 Grafica en Excel 168 6.3 Manejo del Statgraphics 169 BIBLIOGRAFÍA.
  • 6. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 5 INTRODUCCIÓN El uso de la Estadística se ha generalizado en los últimos años no sólo como herramienta de análisis de problemas de economía, sino como auxiliar en el estudio y valoración de cualquier investigación. El propósito de este módulo es proporcionar a los estudiantes de administración de empresas, el material básico exigido en su curso de Estadística I, incluyendo algunas de sus aplicaciones. Se ha hecho un esfuerzo para lograr que el módulo sea útil a la mayor cantidad posible de profesionales dedicados a las ciencias económicas, porque existe la necesidad de un modulo de Estadística que aborde tópicos que exceden estas áreas de las ciencias. En un esfuerzo por llenar este vacío, he incluido ejemplos y ejercicios que no sólo interesan al estudiante de administración de empresas, sino también al contador, al Educador y, a muchos otros profesionales dedicados a las ciencias económicas. Por la forma en que está estructurado el módulo, es poca la preparación matemática que se requiere para usarla. Aquellos que hayan tomado un curso de álgebra, no tendrán dificultad alguna para seguir la manipulación matemática. Tengo fe en que el estudiante, o el lector común, llegará a darse cuenta que en la estadística hay más que las meras matemáticas; que la Estadística, primero que todo, es una filosofía, una manera de pensar. Si el estudiante puede desarrollar los conceptos, verá las matemáticas simplemente como el vehículo para su expresión y comunicación. Aspiro, en consecuencia, prestar un nuevo servicio a los educadores Colombianos; porque considero que todo lo que se hace en beneficio de los futuros ciudadanos ha de estar inspirado en un elevado anhelo de engrandecimiento patrio, y ello sólo se logra con la dedicación y el sacrificio constante de cada uno de nosotros, pues como lo expresa claramente CHARLES SUMMER, “ la verdadera grandeza de las naciones está en aquellas cualidades que constituyen la grandeza del individuo”.
  • 7. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 6 UNIDAD 1.0 LA ESTADÍSTICA Y SU HISTORIA OBJETIVO DE LA UNIDAD: describir la importancia y el uso de la Estadística y su relación con otras ciencias; dar un concepto general de la metodología de la investigación Estadística. CONTENIDOS: 1.1 Historia 1.2 Definición de Estadística 1.3 Términos de uso corriente en Estadística 1.4 División de la Estadística 1.5 Aplicación de la Estadística 1.6 Importancia de la Estadística 1.7 Fenómeno que abarca y no abarca la Estadística 1.8 La investigación Estadística 1.9 Clases de investigación 1.10 Etapas de la investigación Evaluación de la unidad
  • 8. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 7 1.1 HISTORIA. El estudio de la estadística ha sufrido cambios substanciales desde su comienzo. Merecen mención especial dos fuentes de tendencia de desarrollo. Primeramente, el de origen de la estadística puede advertirse ya en la necesidad de datos numéricos en los estados que surgían de la sociedad medieval en la Europa Occidental. Al transformarse la sociedad medieval en el estado político, el nuevo gobierno necesitaba información sobre los recursos del país para poder tener éxito. Así pues era obligado para los nuevos gobernantes el obtener descripciones numéricas, tales como : el número de ciudadanos de las diversas unidades políticas bajo su jurisdicción, ciudades, condados y provincias. El término estadística, se deriva del latín status, que significa estado en el sentido político, se empleó entonces para referirse a la recolección y descripción de tales datos del estado. La necesidad de acopiar y analizar datos numéricos impulsó a desarrollar métodos para facilitar la labor, que era lo que constituía lo más considerable de la estadística hasta la era moderna. No es necesario enumerar todos los que contribuyeron al desarrollo de los métodos estadísticos; pero ha de mencionarse sin embargo al Belga ADOLPH QUETELET (1796 - 1874), que fue el primero en aplicar métodos modernos a conjuntos de datos. Suele llamarse a QUETELET “ Padre de la estadística moderna”, por su continua insistencia en la importancia de aplicar métodos estadísticos. Sus distinguidas contribuciones a la practica y a la metodología estadísticas cubrieron muchos campos de la estadística oficial, tales como los censos, el desarrollo de la uniformidad y compatibilidad de estadísticos entre las naciones, y la organización de la primera conferencia estadística, internacional. La comisión central de estadística, que QUETELET fundó, fue el modelo para instituciones similares en otros países. Otra fuente de la estadística se encuentra en la atención prestada al juego de azar en el siglo XVII, que organizaba la nobleza de Inglaterra y Francia para la recreación, tales como dados y cartas; cosa que sin proponérselo, llevó al desarrollo de la Teoría de las probabilidades. Al mismo tiempo los estudios de probabilidades requerían el tratamiento de los errores en las mediciones, de lo que resulto la distribución de tales errores. Ya desde el siglo XVIII se había observado que las medidas de cierto objeto o fenómeno daban lugar a una configuración en la distribución de los errores que tenía la forma de una curva acampanada.
  • 9. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 8 A propósito de la evaluación de los errores de observación en Astronomía, se hizo un descubrimiento de mayor importancia para la estadística. La distribución de errores resultante con su forma de campana y su simetría se llama Curva Normal de Errores . También se dice Distribución Gaussiana de errores, por el nombre de su descubridor Karl Friedrich Gauss (1777 - 1855). Entre los contemporáneos de QUETELET Y GAUSS que contribuyeron al avance de la estadística como ciencia, estaban : Florence Nightingale (18820 - 1911). Florence Nightingale creía firmemente en los métodos estadísticos. Sostenía que todo Director debería guiarse por el conocimiento estadístico si quería tener éxito y que los políticos y los legisladores fracasaban frecuentemente por la insuficiencia de sus conocimientos estadísticos. Galton, como su primo Charles Darwin, se interesó profundamente en el estudio de la herencia, a la cual aplico métodos estadísticos. Entre sus principales contribuciones se encuentra, el haber desarrollado métodos tan fundamentales como la Regresión y la Correlación. La obra de Galton fue estímulo para una serie de investigaciones de Karl Pearson ( 1857-1936 ), el cuál inició la publicación del periódico Biométrica, que ha influido profundamente en el desarrollo de la Estadística, uno de los métodos más importante, descubierto por Pearson es la Distribución Ji- cuadrado, que encontró en 1900. En el siglo XX, quienes han contribuido de manera más sobresaliente al estudio de la Estadística, han sido Willian S. Gosset ( 1876 - 1967 ) y Sir Ronald Fisher ( 1890 - 1962 ) Gosset, que escribía bajo el seudónimo “ Student “ , dedujo la distribución “ t “ y su contribución especial fue en el campo de la teoría de pequeñas muestras. Fisher halló la conocida distribución “ F “ y aportó contribuciones continuamente hasta 1962 ; muchas de ellas han tenido grandes influencias en los modernos procedimientos Estadísticos. Si bien su trabajo era sobre todo en los campos de la Biología, Genética y la Agricultura, su impacto ha llegado a todas las aplicaciones de la Estadística.
  • 10. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 9 1.2 DEFINICIÓN DE LA ESTADÍSTICA En términos generales, la palabra estadística se refiere a un sistema o método científico usado en la recolección, organización, análisis, interpretación numérica de la información. También se puede decir que la estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones, como para tomar decisiones razonables de acuerdo con tales análisis. El término se utiliza para denotar datos o número, por ejemplo, estadística de empleo, accidente, producción, etc. 1.3 TÉRMINOS DE USO CORRIENTE EN ESTADÍSTICA 1.3.1. POBLACIÓN O UNIVERSO. Es el conjuntos de individuos, medidas u objetos que poseen alguna característica común observable como son : altura, peso de estudiantes de un colegio, el número de camisas defectuosas o no defectuosas producidas por una fábrica de un día determinado, el nivel de glucosas en la sangre extraída a 50 niños en determinada hora del día. Una población puede ser finita o infinita. La población consistente en todas las camisas producidas por una fábrica en un día es FINITA, y la población formada por todos los posibles sucesos ( cara o sello) en tirada sucesiva de una moneda es INFINITA. 1.3.2.MUESTRA. Una muestra puede definirse simplemente como una parte de una población. Supongamos que una población consiste en los pesos de todo los estudiantes de un colegio, si se reúnen para el análisis los pesos de sólo un nivel o grado del total de niños del colegio, sólo se tiene una parte de la población de pesos, es decir se tiene una muestra. 1.3.3 PARÁMETRO. Cualquier característica de una población que sea medible, por ejemplo, la proporción de niños de un país que entran a estudiar. 1.3.4.VARIABLE. Rasgo, característica o propiedades que poseen los elementos de una población o de una muestra. 1.3.5.VARIABLE DISCRETA. Son aquellas que sólo admiten valores enteros, por ejemplo el número de hijos de una familia, ya que no se puede decir que una familia tiene dos hijos y medio.
  • 11. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 10 1.3.6.VARIABLE CONTINUA. Son aquellas que admiten valores fraccionarios por ejemplo, la estatura de una persona, su peso, etc. 1.3.7.VARIABLE CUANTITATIVA. Es aquella que puede medirse, por ejemplo se puede obtener mediciones de los adultos del sexo masculino, los pesos de los niños en edad preescolar y las edades de los pacientes que se ven en una clínica dental. 1.3.8. VARIABLE CUALITATIVA. Algunas características pueden no ser medidas, en el sentido en que se miden las estaturas, el peso, la edad ; muchas características sólo pueden catalogarse, como por ejemplo cundo a una persona enferma se le da un diagnostico médico, cuando a una persona se le designa dentro de un grupo socioeconómico. Las variables cualitativas dan origen a los atributos, como por ejemplo, profesión, sexo, estado civil. 1.3.9.ESCALA. Es un patrón o conjunto de criterios claramente definidos que permite asignar, sin ambigüedades, valor a una variable. El concepto de valor incluye, además de números, letras, letras y números, palabras, etc. 1.3.9.1.ESCALA NOMINAL. Sirven únicamente para identificar, como el criterio para asignar el número de la cédula a un individuo o el código para saber el color del pelo de una persona. 1.3.9.2.ESCALA ORDINAL. Que permite asignar valor a una variable que sirve sólo para ordenar, como el puesto que ocupa un atleta en una carrera. 1.3.9.3 ESCALA DE RAZÓN. Asigna un valor numérico, a una variable usando una unidad determinada inicialmente como 1. En este caso están las unidades físicas como peso, volumen, longitud, área, resistencia etc. En una escala el cero ( 0 ) no necesariamente representa la ausencia absoluta de la variable, sino que se toma en referencia a un valor no nulo y se tiene una escala conocida como intervalo. Por ejemplo en la temperatura, los grados Kelvin usan una escala de razón mientras que los grados centígrados usan una escala de intervalo, en la aeronáutica la altura sobre Bogotá usa una escala de intervalo, mientras que la altura sobre el nivel del mar es de razón. En síntesis se tiene que, una variable puede clasificarse según el diagrama.
  • 12. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 11 NOMINAL CUALITATIVA  DISCRETA ORDINAL VARIABLE ORDINAL DISCRETA CUANTITATIVA DE RAZÓN CONTINUA DE RAZÓN 1.3.10 BIOESTADISTICA. Es la rama de la Estadística que trata de los seres vivientes desde un punto de vista biológico. 1.3.11 ESTADIGRAFOS. Cálculos realizados con los datos de la muestra. 1.3.12.FRECUENCIA. Repetición de un dato en una muestra. 1.3.13.PARÁMETROS. Cálculo realizado con los datos de la población. 1.4. DIVISIÓN DE LA ESTADÍSTICA. Prácticamente todos los autores están de acuerdo en clasificar la Estadística en dos tipos: Estadística Deductiva o Descriptiva y la Estadística Inductiva o de Inferencia. 1.4.1 ESTADÍSTICA DEDUCTIVA O DESCRIPTIVA: Esta fase sólo se limita a la descripción y análisis de una serie de datos sin llegar a conclusiones o generalizar con respecto a un grupo mayor. 1.4.2 ESTADÍSTICA INDUCTIVA O DE INFERENCIA: Trata de llegar a conclusiones a cerca de un grupo mayor basado en la información de un grupo menor o muestra.
  • 13. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 12 1.5. APLICACIONES DE LA ESTADÍSTICA. La Estadística o métodos estadísticos como a veces se le llama está desempeñando un importante papel ascendente en casi todas las facetas del progreso humano. Anteriormente sólo era aplicada a los asuntos del Estado, de donde viene su nombre ; pero ahora la influencia de la Estadística se extiende a la agricultura, biología, negocio, ciencias políticas, sicología, sociología y otros muchos campos de ciencia e ingeniería. 1.5.1. EN LA EMPRESA: Una compañía de fábrica de harina, empaqueta la harina en bolsa de papel, cada una de las cuales se supone contener 25 libras. Si el proceso de empaque está bajo control, el peso medio de las bolsas será de 25 libras. Supóngase que se toma periódicamente una muestra de bolsas para comprobar la bondad del proceso de empaquetado. Si una muestra de 50 bolsas da una media muestra de 24 libras y 12 onzas, se puede aplicar el método de la inferencia estadística para determinar si el proceso está bajo control. 1.5.2. EN QUÍMICA Y BIOLOGÍA: Considérese una nueva vacuna contra el resfriado que ha sido desarrollado por una compañía farmacéutica. Dicha compañía afirma que la nueva vacuna es eficaz en un 95 % o sea que de cada 100 personas que la han utilizado, 95 pasaron a invierno sin sufrir resfriado, si en una muestra de 30 personas que han sido vacunados, hay 27 que pasaron el invierno sin resfriado: ¿ prueba esto suficientemente las pretensiones de la compañía ?. 1.5.3 EN BIOLOGÍA Y AGRONOMÍA: Para ayudar a determinar los efectos de los tipos de semillas, de los insecticidas y de los fertilizantes en la cosecha. Se ha utilizado para producir ganado de mejor calidad con planos especiales de alimentación y cría. 1.5.4 EN LA PRODUCCIÓN : En la producción de un artículo en grandes cantidades se hace necesario detectar y eliminar alteraciones sistemáticas de calidad. 1.5.5 EN FINANZAS : En la estimación de la magnitud que tomará cierto aspecto en algún punto futuro del tiempo( corto, mediano o largo plazo), en
  • 14. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 13 los controles presupuéstales y en el planteamiento de ciertas actividades de carácter financiero. 1.5.6 EN CONTABILIDAD : De gran importancia en la auditoria, ya que mediante la aplicación de ciertos métodos se seleccionan algunas facturas, cuentas o documentos de cobro, sin recurrir a la totalidad y con base en el examen de ellas, se puede obtener conclusiones sobre la situación actual de cartera. 1.5.7 EN PERSONAL : El control sobre el número de horas laboradas, tiempo dejado de laborar, accidentes de trabajos, clasificación del personal ( por antigüedad, sueldo, estudios, etc),información estadística necesarias en una empresa, para toma de decisiones en las políticas empresariales. 1.5.8 EN MERCADO : Las encuestas estadísticas son indispensables para determinar la reacción de los consumidores frente a los actuales productos de la empresas y para el lanzamiento de los nuevos. 1.6 IMPORTANCIA DE LA ESTADÍSTICA. A continuación se precisan algunos aspectos para las cuales la Estadística es de gran importancia: 1.6.1 Conocimiento de la realidad de una observación o un fenómeno. Para conocer la situación actual de un fenómeno es necesario cuantificarlo o graficarlo. 1.6.2.Determinación de lo típico o normal de una observación. Esto se realiza mediante el cálculo de promedios representativos de la característica cualificada. 1.6.3.Determinación de los cambios que representa el fenómeno. Estas variaciones se determinan en el tiempo, lo cual requiere una observación continua.
  • 15. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 14 1.6.4.Establecimiento de la relación entre dos o más fenómenos. Se relacionan las características o variables que determinan los fenómenos. 1.6.5.Determinación de las causas que originan el fenómeno. 1.6.6.Realización de estimaciones e inferencias estadísticas. Los resultados obtenidos al estudiar una muestra se generalizan como comportamiento de la población entera. En estos casos es necesario precisar el grado de validez y confiabilidad de los análisis efectuados.
  • 16. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 15 1.7. FENÓMENOS QUE ABARCA Y NO ABARCA LA ESTADÍSTICA Los fenómenos o hechos que continuamente suelen suceder, presentan ciertas características tales como la de ser observables y manifestarse y a un el de poder determinar la intensidad con que se produce el fenómeno. 1.7.1.Los fenómenos que abarca son: 1.7.1.1. Fenómenos colectivos o de grupos 1.7.1.2. Fenómenos de frecuente repetición 1.7.1.3. Fenómenos de distintas frecuencias 1.7.1.4. Fenómenos distantes en el espacio 1.7.1.5. Fenómenos distantes en el tiempo 1.7.1.6. Fenómenos cualitativos que no se pueden cuantificar 1.7.2. Los fenómenos que no abarcan son: 1.7.2.1 Fenómenos individuales 1.7.2.2 Fenómenos que no se exteriorizan 1.7.2.3 Fenómenos accidentales en el tiempo y en el espacio 1.7.2.4 Fenómenos cualitativos que no se pueden cuantificar 1.8. LA INVESTIGACIÓN ESTADÍSTICA La investigación estadística por sencilla que sea, es una operación compleja que requiere atender múltiples aspectos, y que genera muy variadas funciones. El resultado depende en gran parte de la finalidad que se persiga, de la naturaleza de los fenómenos que desean estudiar y de la facilidad que se tenga para observar los elementos. 1.8.1. CARACTERISTICA BASICAS: Toda la investigación debe reunir las siguientes características básicas:
  • 17. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 16 1.8.1.1. Claridad: En todos sus aspectos debe ser clara y precisa. Conocida por todas las personas que en ella participan. 1.8.1.2 Sencillez: Es indispensable aunque no debe limitar la presentación completa de la investigación. Es condición esencial de claridad. 1.8.1.3 Utilidad: Toda investigación estadística debe tener alguna aplicación practica que justifique su realización. 1.9. CLASES DE INVESTIGACIÓN 1.9.1 INTERNA. Investiga fenómenos originados dentro de la misma empresa o entidad. Requiere organizar la información de tal manera que permita la aplicación de métodos estadísticos, a fin de lograr las conclusiones válidas deseadas .1.9.2 EXTERNA. Se realiza con el fin de obtener información que permita comparar fenómenos o entidades, establecer suposiciones relativas, estudiar su comportamiento actual o futuro. 1.9.3 EXHAUSTIVA. Se denomina así a aquella investigación donde se observan todos los elementos: que constituyen la población objetivo. 1.9.4.PARCIAL. Sólo se observa una parte de los elementos o unidades que constituyen la población (muestra), es decir, estudia la población a través de la muestra. Se realiza cuando no se desea o no es posible una investigación exhaustiva. 1.10. ETAPAS DE UNA INVESTIGACIÓN. Se requiere una investigación de carácter estadístico cuando no se tiene un buen flujo de información que permita que dicha información se organice y; por lo general se encuentre dispersa. Se puede considerar tres clases de operaciones o etapas en una investigación. Planeamiento, Recolección y Análisis. Las etapas que requiere una investigación estadística la podemos sintetizar así: 1.10.1 PLANEAMIENTO: Al trazar un plan de inversión, se debe definir y organizar cada una de las actividades necesarias para llevar a cabo el trabajo y poder alcanzar los objetivos propuestos.
  • 18. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 17 Dentro de la etapa del planteamiento se podrán considerar ciertos aspectos que a continuación se presentan, donde el orden y la necesidad de cada uno de ellos dependerá de la misma naturaleza de la investigación. 1.10.1.1 Objeto de la Investigación: ¿Que se investiga? Es el hecho o fenómeno que se desea estudiar; en una investigación de salarios, será el salario, en una sobre el rendimiento académico de un grupo de estudiantes, será los resultados obtenidos en su período escolar. Es de gran Importancia definir el objeto de investigación y determinar su naturaleza cualitativa y cuantitativa. Definir además, las posibilidades de investigarlo y limitaciones. 1.10.1.2 Objetivo o Finalidad de la Investigación: ¿Que pretende la investigación? Identificar con claridad y precisión el fin que se propone, formulando el problema de tal manera que nos permita establecer los objetivos generales y los específicos y, de ser posible una jerarquización de los mismos. En esta fase se deben contestar los siguientes interrogantes: ¿Que se investiga ?, ¿como se realizará la investigación? (condiciones y medios), ¿cuándo y donde se realizará? 1.10.1.3 Unidad de Investigación: ¿Donde se realiza una investigación? La unidad es la fuente de información es decir, a quien va dirigida; puede ser a una persona, un grupo familiar, laboral o social, una vivienda, una empresa pública, una explotación agropecuaria, una región. Su selección depende del objeto propuesto. La unidad debe ser clara en tal forma que sea entendida por todos, además adecuada al tipo de investigación; mensurable, que permita ser medida, y comparable con los resultados obtenidos en investigaciones similares. Al lado de la unidad principal se pueden establecer unidades secundarias. La fuente de información puede ser directa o indirecta.  ES DIRECTA. Si allí se produce el hecho, ejemplo: Las notarías, para determinar el número de nacimientos.  ES INDIRECTA, cuando se consideran aquellas en las cuales el hecho se refleja, ejemplo: Las rentas departamentales, para determinar el
  • 19. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 18 consumo de bebidas alcohólicas. Estas se usan, generalmente, como complementarias a las fuentes directas. 1.10.1.4 Examen de la documentación y metodología: ¿ Qué y cómo se ha investigado al respecto?. Es importante determinar si la investigación ha sido realizada con anterioridad, con el fin de prescindir del estudio; averiguar si se cumplió el objetivo propuesto y si la información estaba actualizada. En caso contrario se realizará tratando de corregir las diferencias presentadas en anteriores investigaciones, al mismo tiempo que aprovechando sus aspectos positivo. 1.10.1.5 Método de observación: ¿Que características debe reunir la investigación? En qué forma se realiza la toma de dato? Debe decirse el método que se empleará: Censo o Muestra. Esta elección depende, entre otros, de los siguientes factores: disponibilidad de tiempo, recursos humanos y financieros, número de unidades que componen la población, caracteres por investigar, el grado de variabilidad, la descripción del objeto. 1.10.1.6 Proceso de Recolección: ¿Qué técnicas empleará para recolectar la información?. Los datos se pueden recolectar mediante encuesta realizada por correo, entrega personal del cuestionario, entrevista, panel, observación directa, motivación, teléfono, otros. 1.10.1.7 Preparación del Presupuesto: Se cuenta con los recursos económicos suficientes para todo el proceso de la investigación. Se debe analizar si los recursos económicos son suficientes para los otros costos requeridos en cada etapa, desde el planeamiento hasta la publicación. 1.10.1.8 Calendario de trabajo: Qué tiempo requiere cada etapa ? Es el ordenamiento de la diferencia inicial y final de cada etapa. En el siguiente cuadro aparece un modelo de calendario.
  • 20. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 19 ETAPAS FECHAS INICIAL FINAL 1. Planeamiento a.) Fase preliminar I - VI 10 - VI b.) Preparación de encuestas 8 - VI 20 - VI c) Preparación de personal 18 - VI 23 - VI 2. Recolección a.) Pretes 25 - VI 30 - VI b.) Trabajo de campo 5 - VII 20 - VII 3.Procesamiento y análisis a.) Depuración y clasificación 21 - VII 27 - VII b.) Tabulación y análisis 26 - VII 5 - VIII C.) Publicación 3 - VII 20 - VIII 1.10.1.9 Preparación del cuestionario. ¿Qué contiene la encuesta y cómo se resuelve? Al elaborar un cuestionario se consideran aspectos materiales y aspectos técnicos.  ASPECTOS MATERIALES: Tamaño del formulario, calidad del papel, color de la tinta, tipo de impresión.  ASPECTOS TÉCNICOS: Las preguntas se ordenan gradualmente según su dificultad. No se deben emplear abreviaturas, las preguntas deben ser claras, precisas y comprensibles. Las partes que constituyen un formulario son: ENCABEZAMIENTO : Contiene el nombre de la institución u organismos que realiza la investigación, nombre o título de la investigación, el título debe llevar implícito el qué, cómo, cuándo y dónde se realiza.
  • 21. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 20 CUERPO: Contiene las preguntas. Si se requiere identificar al informante será necesario iniciar preguntando nombre, dirección, estado civil, edad, profesión etc. INSTRUCCIONES: Son explicaciones generales sobre el sentido y forma de responder el cuestionario, son indispensable en razón de la brevedad y condición de las preguntas. Puede escribirse al final del cuestionario, al iniciarse o en separata. OBSERVACIONES : Espacio libre al final del formulario para que el entrevistador o el entrevistado escriban aclaraciones, opiniones u observaciones complementarias del trabajo realizado. 1.10.1.10 Selección y preparación del personal. ¿Qué requisitos deben reunir los entrevistadores y cuál es su función?. Para esta selección se tienen en cuenta los siguientes criterios: número de personas acorde al número de formulario o unidades a entrevistar, conocimiento que tenga del interrogatorio y del objetivo de la investigación, cualidades morales que le impidan falsear las respuestas, cualidades de sociabilidad y cortesía, presentación personal correcta y sencilla. El adiestramiento del personal se realiza mediante cursos o seminarios más o menos breves. 1.10.1.11 Preparación y actualización de Informantes. Se confirma la unidad de investigación; se prepara una lista de todas las unidades que conforman la población objetivo y seleccionan la muestra. 1.10.1.12 Propagandas. La labor de enunciar la investigación, para disponer el ánimo del público fuente de información, al tiempo que se da a conocer el interés general de los resultados esperados. 1.10.1.13 La encuesta preliminar. Se realiza con el fin de tener un mayor conocimiento sobre la población objetivo y facilitar así, la prueba del cuestionario. Permite además chequear el cálculo del costo y tiempo y la variabilidad de las características en estudio. 1.10.2 RECOLECCIÓN: Terminada la etapa de planeamiento, se procede a distribuir y a recoger los formulario, controlando el número de formularios entregados y recogidos, al mismo tiempo verificando la calidad de las informaciones obtenidas.
  • 22. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 21 La organización del trabajo de campo de recolección contemplan entre otros siguientes puntos. - Supervisión - Control de encuesta - Revisión de los cuestionarios inconclusos - calidad y consistencia de las respuestas - Cumplimiento de los plazos prefijados - Distribución de los entrevistados Algunos errores que se pueden presentar en la recolección de los datos se clasifican en: - Errores de la medición o cuantificación de la característica. - Errores del entrevistador o influencia negativa del mismo. - Mal diseño del cuestionario. - Falta de instrucciones imprecisas. Pueden presentarse algunos que afectan la recolección de los datos y que deben ser corregidos:  El informante no quiere suministrar los datos, alegando: estar ocupado, motivo político, desconfianza de la investigación no vale la pena etc.  El informante no puede responder por problemas, tales como en enfermedad, incapacidad física, idioma, etc.  La dirección del informante, la familia estaba paseando, hubo demolición del edificio, edificación desocupada, etc. 1.10.3 PROCESAMIENTO Y ANÁLISIS: La información obtenida debe ser depurada, clasificada, resumida y analizada, aplicando para ello adecuadas técnicas estadísticas. Los puntos más importantes en esta etapa son: 1.10.3.1 Codificación: Ya revisadas las respuestas obtenidas, se procede a su codificación: especialmente si se utiliza la tabulación mecánica.
  • 23. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 22 El código es un número que sustituye la respuesta cuando se va a hacer el recuento. Ejemplo: Numero de piezas producidas : En buen estado === 1 En mal estado ==== 2 Si el número de constelaciones pasa de nueve, se utiliza números de dos dígitos. Ejemplo: Los establecimientos industriales por departamento: 01 Choco 02 Caquetá 1.10.3.2 Tabulación: puede ser manual o mecánica, dependiendo de la calidad de los formularios, del número de preguntas, del tiempo y de los recursos disponibles. En la tabulación mecánica se utiliza tarjetas perforadoras, las cuales alimentan el computador. La más conocida es la llamada HOLLERTH, utilizado en las computadoras IBM. La tabulación manual se realiza mediante la elaboración de cuadros, - gráficas y esquemas que faciliten el análisis de la información y la inferencia de conclusiones y recomendaciones. 1.10.3.3 Análisis e Interpretación: Esta etapa encierra dos aspectos: análisis y evaluación estadística de los resultados, análisis y evaluación técnica de acuerdo con la naturaleza de la investigación. 1.10.3.4 Publicación: Se realiza con el fin de hacer llegar a las personas interesadas el resultado total del estudio. Se hace esencial presentar todos los aspectos considerados en el proceso investigativo, además de la correspondiente validez que merezca las conclusiones.
  • 24. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 23 EVALUACION DE LA PRIMERA UNIDAD 1.1 Qué significa generalmente la palabra “ Estadística” para el hombre de la calle? 1.2 En qué contexto se utiliza la palabra “Estadística” en las finanzas, el mercado, la contabilidad y la Administración? 1.3 Decir brevemente cuáles fueron las contribuciones debidas a los siguientes estadísticos? a) Adolph Quelet b) Karl Friedrich gauss c) Florence Nigh Tingale d) Franco Galton e) Karl Pearson f) William s. Cosset g) Ronald A. Fisher 1.4 Cuáles son las fuentes de estudio de las estadísticas? 1.5 Explique la diferencia existente entre Estadística deductiva o descriptiva y la estadística inductiva o inferencial. 1.6 Diga cuatro fenómenos que abarca la estadística y dos que no abarcan. 1.7 Diga cuatro finalidades de la Estadística. 1.8 El proceso de proyección y preparación de la investigación se divide en cinco fases: recolección, planeamiento, análisis e interpretación, elaboración. Ordene estas fases, como crea conveniente y explique brevemente cada fase. 1.9 Se ha hecho un estudio para determinar si las amas de casa de Quibdó, Chocó prefieren una marca especial de detergente, Entre las 50 amas de casas entrevistadas, 30 dijeron que preferían esta marca.
  • 25. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 24 a) Qué constituye la muestra? b) Qué constituye la población? c)cuál es el estadígrafo muestral y cuál es el parámetro de la población? 1.10 Una fábrica de gaseosas, proyecta lanzar al mercado un nuevo sabor. Se realiza un Test de aceptación de dicho sabor en una muestra de 30 niños utilizando una escala de 10 puntos, para medir el grado de aceptación. Los puntos obtenidos en los 30 niños fueron los siguientes: 2 6 8 7 4 5 10 6 6 7 6 7 3 8 7 6 8 6 5 4 7 8 5 7 6 7 2 7 2 7 La muestra obtuvo compuesta por igual número de niños de ambos sexos, de 5 a 12 años de edad residentes en el Barrio César Conto de la ciudad de Quibdó. a. Cual es la población b. Cuál es la muestra? c. Es cualitativa o cuantitativa? d. Cuál es la variable? e. De que tipo es la variable f. Qué clase de escala se ha utilizado en la medición de la variable? 1.11 Se realiza un estudio en la ciudad de Istmina- Chocó , a 150 familias de clase media, para conocer el tipo de aceite ó manteca usado en la cocina; los resultados son los siguientes:
  • 26. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 25 Maíz 14 Hogares. Soya 65 Hogares. Ajonjolí 21 Hogares. Compran. Aceite al detal sin especificar tipo 17 hogares. Manteca de cerdo 21 Hogares. Grasas de origen vegetal 6 Hogares. Oliva 13 Hogares. a. cuál es la población? b. cuál es el tamaño de la muestra c. Qué carácter tiene la población d. Cómo se explica que la suma de frecuencia sea superior al número de hogares? 1.12 La siguiente tabla muestra el número de fanegadas de trigo y maíz producidas en la Granja “ La Mazorca “ durante el decenio 1977 a 1987. AÑOS NÚMERO DE FANEGADAS DE TRIGO NÚMERO DE FANEGADAS DE MAÍZ 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 200 185 225 250 240 195 210 225 250 230 235 75 90 100 85 80 100 100 105 95 110 100
  • 27. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 26 Con los datos de la tabla, determinar el año o años en los que: a. Se produjo el menor número de fanegas de trigo b. Se produjo el mayor número de fanegas de maíz c. Se produjo el mayor decrecimiento en la producción de trigo d. Se produjo un decrecimiento con relación al año anterior e. Se produjo el mismo número de fanegas de trigo f . Se obtuvo la máxima producción entre los dos cereales. 1.13. De tres ejemplos de población finita y tres de población infinita. 1.14 Anotar I o F según sean infinitas o finitas las siguientes poblaciones. a. Las drogas producidas por una fabrica en un día b. Resultados obtenidos en sucesivas tiradas de una moneda c. Estudiantes de la Universidad Tecnológica del Chocó d. Acciones vendidas cada día en la bolsa de valores e. Papeletas extraídas de una urna, en extracciones con reemplazamiento. 1.15 Clasificar cada variable en las siguientes distribuciones: a. Alumnos por mes de nacimiento b. Profesionales por estatura y peso c. Obreros por salarios d. Accidentes por causas e. Fallecimiento por edades.
  • 28. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 27 1.16 Ubicar en estadística descriptiva o estadística inferial cada uno de los siguientes aspecto motivo de estudio estadístico: a. Describir los grupos en término de promedio de estatura b. Determinar la probabilidad de que muestras de observaciones sean sólo el de variaciones de azar. c. En contar una diferencia consistente entre dos métodos específicos de enseñanza. d. Determinar la vida media de lámparas producidas por determinada Fábrica. e. Analizar la conducta de un grupo de escolares frente a una prueba de lectura. 1.17 Señale con C las series de variables continuas y con D las de variables discretas. a. Distribución de obreros pos salarios b. Distribución de fallecimiento por edades c. Distribución de alumnos por números de hermanos d. Distribución de alumnos por estatura. 1.19 Contestar (V) verdadero o (F) falso, según el caso. a. Código es la representación cualitativa de un hecho cualitativo b. Las instrucciones permiten diligenciar mejor el formulario. c. Un formulario se precodifica para agilizar la codificación d. Un formulario debe llevar una sola clase de preguntas. e. L a recolección de datos se puede hace mediante la observación. f. Después de elaborar el formulario se define el objetivo de la investigación g. Al recolectar información por medio de entrevistadores se tiene la ventaja de que éstos pueden observar el sitio de la operación que se
  • 29. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 28 está llevando a cabo. h. Se conoce como fuente primaria aquella que obtuvo inicialmente la información directamente de la persona o entidad. i. Al diseñar un cuestionario no es de gran importancia la forma como se hace la pregunta, siempre que ésta sea clara. j . No hay posibilidad alguna de que en una encuesta por correo se interprete mal las preguntas de un cuestionario, siempre y cuando que la persona que reciba sepa leer. k. El examen de la documentación y metodología se efectúa después de tabular la información. 1.20 Se ha dicho que en una investigación se consideran tres etapas, las que a su vez se subdividen en otras fases. ¿Cuáles son? podría usted reagrupar los titulares de este capítulo en un índice de temas de acuerdo con estas etapas? 1.21 Mencionar algunos aspectos técnicos y materiales que deben tenerse en cuenta en el diseño de un formulario. 1.22 En los siguientes ejemplos, identifique: población, muestra, variable y escala de medición.  Varias veces durante el día un ingeniero de control de calidad, en una fábrica de textil, selecciona diferentes muestras de metros cuadrados de telas, las examina y registra en número de imperfecciones que encuentra.  Un investigador médico examina los efectos de un agente cancerígeno en humanos. Tres meses después de inyectado el agente en una persona, el investigador realiza una operación para extraer y pesar los tumores.  Un gerente desea conocer si aquellos empleados que recibieron 30 días de vacaciones son más productivos durante el año, que los que recibieron sólo 15 días. El gerente selecciona 140 trabajadores y registra su rendimiento.
  • 30. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 29 UNIDAD 2.0 REPRESENTACION DE DATOS. OBJETIVO DE LA UNIDAD: Representar correctamente una información estadística en forma tabular y gráfica, para hacer más fácil su comprensión y analizar una tabla para obtener mayor provecho en su lectura. CONTENIDOS: 2.1 Distribución de frecuencia 2.2 Distribución de frecuencia simple 2.3 Distribución de frecuencia por intervalo 2.4 Gráficos Estadísticos Evaluación de la unidad
  • 31. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 30 REPRESENTACION DE DATOS. 2.1 DISTRIBUCION DE FRECUENCIA Una distribución de frecuencia es un método para organizar y resumir datos. También se conoce con el nombre de distribución de frecuencia a una ordenación, tabulación de datos en clases y con la frecuencia correspondiente a cada una. La toma de datos es la obtención de una colección de los mismo, los cuales no están ordenados numéricamente. La ordenación es la colocación de los datos numéricos en orden creciente o decreciente de magnitud. La diferencia entre el mayor y el menor número se llama RECORRIDO o RANGO de los datos, La construcción de la distribución de los datos facilita la presentación de ellos o de la información y especialmente su análisis. Para elaborar los cuadros o tablas de la distribución de los datos se debe, antes que todo Identificar las características que se investigaron, ya que esto permite una mejor clasificación de lo observado, estas características pueden ser: a) Cualitativas o Atributos: Ventas en valor o cantidad, por sucursales, empleados de una empresa por cargo, marca de droga más aceptada, exportación por puertos, etc. b) Cuantitativas: Clasificación de empleados por sueldo, tiempo de reacción de cierta droga, Kilómetros recorridos diariamente por vehículo, clasificación de familias por número de hijos etc. 2.2. DISTRIBUCIÓN DE FRECUENCIA SIMPLE Antes de pasar a realizar ejercicios que nos de una claridad con respecto a la distribución de frecuencia simple presentaremos la siguiente sismología: n : Tamaño de la muestra, es el número de observaciones. Xi : La variable, es cada uno de los diferentes valores que se han observando.
  • 32. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 31 La variable Xi, toma los X1, X2, ... , Xn valores. También se le llamará marca de clase. Fi : la frecuencia absoluta o simplemente frecuencia, representa el número de veces que se repite la observación Xi , F2 el número de X2 etc. Fa : la frecuencia acumulada, se obtiene acumulando la frecuencia absoluta, y siempre nos da un acumulado igual al tamaño de la muestra. Fr : frecuencia relativa, resulta de dividir cada una de las frecuencias absoluta por el tamaño de la muestra. Fra: Frecuencia relativa acumulada, resulta de la acumulación de las frecuencias relativas, esta frecuencia siempre tiende a la unidad. TABLA Nro1 1-1-2-2-2-3-3-6-4-1-2-3-4-2-7-2-1-1-4-2-0-1-2-5-1-0-1-8-2-6-2-1-3-1 2-0-1-0-0-4-2-1-4-2-3-0-1-2-2-4-0-0-1-2-0-3-2-2-2-3 - Para hacer la respectiva distribución de dichos datos es conveniente que presentemos las siguientes tablas: EJEMPLO: Los resultados obtenidos en un encuesta a 60 personas acerca del número de veces que han visitado a su médico para ver el grado de concentración de cierto mineral en el tejido (ppm) fueron los siguiente:
  • 33. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 32 Encuesta realizada a 60 personas sobre el número de veces que han visitado a su médico para comprobar un ppm (datos ordenados). TABLA Nº 2 : ORDENACIÓN DE LOS DATOS 0-0--0-0-0-0-0-0-0-1-1-1-1-1-1-1-1-1-1-1-1-1-1-2-2-2-2-2-2-2-2-2 2-2-2-2-2-2-2-2-2-2-3-3-3-3-3-3-3-4-4-4-4-4-4-5-6-6-7-8. Encuesta realizadas a 60 personas sobre el número de veces que han visitado a su médico por comprobar su PPM (recuento de efectivo). TABLA No 3 : CONTEO DE DATOS Nº DE VECES Nº DE PERSONAS (conteo) VECES QUE SE REPITE 0 1 2 3 4 5 6 7 8 IIII IIII I IIII IIII IIII II IIII IIII IIII IIII III IIII III IIII II I II I I 9 14 19 7 6 1 2 1 1 SUMAS 60
  • 34. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 33 Distribución de frecuencia de la encuesta realizada a 60 personas sobre el número de veces que han visitado a su médico para comprobar su ppm. TABLA Nº 4 Xi Fi Fa Fr Fra 0 9 9 = 9 9/60 = 0.15 0.15 = 0.15 1 14 9 + 14 = 23 14/60 = 0.233 0.15 + 0.233 = 0.383 2 19 23 + 19 = 42 19/60 = 0.316 0.383 + 0.316 = 0.699 3 7 42 + 7 = 49 7/60 = 0.116 0.699 + 0.116 = 0.815 4 6 49 + 6 = 55 6/60 = 0.1 0.815 + 0.1 = 0.915 5 1 55 + 1 = 56 1/60 = 0.016 0.915 + 0.016 = 0.931 6 2 56 + 2 = 58 2/60 = 0.033 0.931 + 0.033 = 0.964 7 1 58 + 1= 59 1/60 = 0.016 0.964 + 0.016 = 0.98 8 1 59 + 1 = 60 1/60 = 0.016 0.98 + 0.016 = 0.996 SUMAS 60 En la práctica, cuando se posee confianza en el ordenamiento y conteo de los datos , no es necesario tantas tablas, se puede pasar de la tabla No 1 directamente a la tabla Nro.5.
  • 35. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 34 Distribución de frecuencia en la encuesta realizada a 60 personas sobre el número de veces que han visitado a su médico para comprobar su ppm. TABLA Nº 5 Xi Fi Fa Fr Fra 0 9 9 0.15 0.15 1 14 23 0.233 0.383 2 19 42 0.316 0.699 3 7 49 0.116 0.815 4 6 55 0.1 0.915 5 1 56 0.016 0.931 6 2 58 0.033 0.964 7 1 598 0.016 0.98 8 1 60 0.016 0.996 SUMAS n =60
  • 36. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 35 - Analizando las columnas porcentuales Fr y Fra se puede tener entre otras las siguientes conclusiones: - El 31.6% de los encuestados ha visitado dos veces a su médico - El 15% de los encuestados respondió no haber visitado a su médico con ese objetivo. - Solo el 1.6% lo ha visitado 8 veces. -El 69.9% o 70% han visitado a su medico entre 0 y 2 veces 2.3 DISTRIBUCIÓN DE FRECUENCIA POR INTERVALOS Como se ha visto, un conjunto de observaciones puede hacerse más comprensible y adquirir mayor significado por medio de un arreglo ordenado; puede lograrse una mayo síntesis, agrupando los datos. Para agrupar a un conjunto de observaciones, se selecciona un conjunto de intervalos, contiguos, que no se traslapen, tales que cada valor en el conjunto de observación puede colocarse en uno, de los intervalos de clase. Unos de los primeros puntos a considerar, cuando se van agrupar ciertos datos, es cuántos intervalos van a incluirse. Demasiado poco no es conveniente debido a que hay perdida de información. Por otra parte, si se usan demasiados intervalos, no se logra objetivo de la síntesis. La mejor guía en relación con lo anterior, a sí como para otras decisiones que deben tomarse al agrupar los datos, es el conocimiento que se tenga de ellos. Pueda ser que se hayan tomado con anterioridad, los intervalos de clase de años anteriores con fines de comparación. Una de las formas para obtener el número de intervalos (#i) es aplicando la regla de STURGES, con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios para agruparlos: #i = 1 + 3.3 Log n Donde n nos representa el número de valores considerados, esta regla de STURGES no se considera como final, sino sólo como una guía. El número de intervalos especificado por medio de esta regla debe aumentarse o disminuirse según convenga y el beneficio de una presentación clara. Otra cuestión que hay que aclarar es lo relativo a la amplitud de los intervalos de clase.
  • 37. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 36 Aunque a veces es imposible, por lo general, los intervalos deben ser amplitudes iguales. Puede determinarse esta amplitud (A) dividiendo el recorrido ( R) entre el número de intervalo (#i ): A = R  i Como regla, este procedimiento proporciona una amplitud que no es conveniente usarla. Una vez más, debe aplicarse el buen juicio y seleccionar una amplitud (por lo común, próxima a la dada por la ecuación) que sea más conveniente. Consideramos el siguiente Ejemplo: En un estudio de 50 sujetos entre las edades de 20 y 60 años sobre el valor del rendimiento del electroencefalograma. Se dieron los siguientes datos. 98 75 95 100 64 70 75 95 63 72 82 98 58 56 70 49 55 50 61 60 70 75 71 93 98 100 62 66 50 92 70 58 66 69 73 77 120 104 119 105 99 60 70 102 120 90 71 78 65 56 Antes de elaborar una tabla o cuadro de frecuencia por intervalos se debe tener en cuenta los siguientes pasos: 1. Se determina el valor máximo y mínimo de Xi Xmin = 49 X máx = 120 2. Sacamos la diferencia entre el valor máximo y el mínimo que denominaremos rango o recorrido. (R):
  • 38. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 37 R = X máx - X mín = 120 - 49 = 71 3. Se hace necesario determinar el número de intervalo (# i) que se utilizará para agrupar los datos: #i = 1+3.3 Log n #i = 1+3.3 Log 50 # i = 1+3.3 (1.69897) # i = 1+5.60 # i = 6.6 En la práctica el #i se determina atendiendo varios factores, tales como: finalidad del estudio, grado de variabilidad de los datos , necesidad de efectuar comparaciones. En todo caso, se recomienda que el #i hasta donde sea posible, no sea menos de 5, ni mayor de 16, en nuestro caso tomaremos 7 intervalo ya que no se puede tener 6.6 intervalos. 4. Una vez determinado el número de intervalos se debe dividir el rango por el este valor para obtener el valor de la amplitud de cada intervalo, aplicando la formula A = R  i A = 71 7 = 10.14 Para facilitar los cálculos se aproximará A = 11, por lo tanto se altera el valor del rango de 71 a 77 en 6 unidades. Cuando éste caso sucede se tendrá un quinto paso, que denominaremos rango ampliado ( Ra ) que es igual rango( R ) más un incremento (a). R a = R + a 5. A = Ra  i = 71 + 6 7 = 77/ 7 = 11 6. El incremento a del rango se debe distribuir equitativamente entre el dato mayor y el dato menor, al dato mayor se le suma a/2 y al dato menor se le resta a/2, con esto no podemos descartar la palabra equitativo
  • 39. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 38 pues es opcional para cada trabajo que se elabora; en nuestro caso el incremento es de 6 unidades, luego: Xmáx = 120 + 3 = 123 X mín = 49 – 3 = 46 Por tanto se tendrá un nuevo dato mayor o límite superior de 123 y un límite inferior de 46. 7. Se procede a elaborar los intervalos empezando con el nuevo dato menor y sumándole la amplitud, así: 1° 46 a 57 2° 57 a 68 3° 68 a 79 4° 79 a 90 5° 90 a 101 6º 101 a 112 7º 112 a 123 8. Por último se elabora la tabla de frecuencias con sus respectivos punto medios ( Xi ) o marca de clase, el cual se determina sumando el límite superior y el limite inferior de cada intervalo dividendo por dos esta suma.
  • 40. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 39 INTERVALOS Xi Fi Fa Fr Fra 46 - 57 51.5 6 6 0.12 0.12 57 - 68 62.5 11 17 0.22 0.34 68 - 79 73.5 15 32 0.30 0.64 79 - 90 84.5 1 33 0.02 0.66 90 - 101 95.5 11 44 0.22 0.88 101 - 112 106.5 3 47 0.06 0.94 112 - 123 117.5 3 50 0.06 1.00 SUMAS 50 Como conclusión podemos decir: - el 30% de los sujetos poseen un rendimiento de su electroencefalograma. entre 68 y 79, y son 15 sujetos. - El 2 % lo poseen entre 79 y 90, y es un sujeto. - Solo el 6% se encuentra en un rendimiento entre 112 a 123, y son 3 sujetos - El 66 % de los sujetos posee un rendimiento entre 46 y 90 y son 33 sujetos.
  • 41. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 40 2.4 GRÁFICAS. Un gráfico es un método de presentar datos estadísticos de forma visual. Hay numerosos tipos de graficas, como lo veremos al utilizar los programas estadísticos en la computadora; por lo general, se clasifican en : a. Diagramas: de puntos, lineales(rectilíneos y curvilíneos), superficiales(rectangulares-barras-, triangulares, cuadrados y circulares-pastel-). b. Estereometrías: cúbicas, prismáticas y pirámides. c. Pictogramas. d. Cartogramas: mapas estadísticos y cartodiagramas. 2.5 GRÁFICAS LINEALES. Un gráfico de línea se distingue por el hecho de que las variaciones en los datos se indican por medio de líneas o curvas, cuyas posiciones está determinadas por sus respectivos valores en las escalas X e Y los puntos se unen mediante líneas rectas. Hay diferentes tipos de gráficos lineales: 2.5.1 GRÁFICOS DE SILUETA Son gráficos de líneas que muestran las desviaciones positivas y negativas respecto a la línea base o cero y la línea de evolución de las, desviaciones, los gráficos de silueta se construyen representando los puntos que indican las desviaciones reales respecto a la línea base. 2.5.2 GRÁFICOS DE BANDAS Muestran las variaciones de las partes componentes así como total, el gráfico se prepara representando en primer lugar las variaciones de la parte componente mayor. Se sombrea o se raya este segmento. A éste segmento se suma la siguiente parte componente y se representa el resultado. Este proceso acumulativo se prosigue hasta incluir todas las partes componentes.
  • 42. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 41 Las variaciones de la línea superior representan, entonces las del total, las variaciones en el ancho de cualquier segmento indicarán las variaciones de ese componente particular. 2.5.3 GRÁFICOS DE MÁXIMO Y MÍNIMO Presentan no solo los cambios ocurrido durante el periodo de tiempo, si no también las fluctuaciones de cada periodo (días, semanas, meses etc.) indicando valores máximo del mismo periodo. Este procedimiento se continua hasta el fin del tiempo cubierto por el gráfico. 2.5.4 EL HISTOGRAMA: Conocido como polígono de frecuencias rectangular para una distribución de frecuencia; se construye de la siguiente forma: Se dibujan rectángulos cuya base es el tamaño del intervalo de clase y cuya altura es la frecuencia de cada intervalo de clase. 2.5.5 GRÁFICAS LOGARÍTMICAS Y SEMILOGARITMICAS 2.5.5.1 CARACTERÍSTICAS: a. No hay línea base o cero. b. Los gráficos semilogarítmicos presentan una escala aritmética en el eje horizontal. Los gráficos logarítmicos presentan escalas logarìtmicas en ambos ejes. c. Cuando se presenta en un papel logarítmico las progresiones geométricas en X y en Y se disponen según una recta, ya que los logaritmos de una progresión geométrica forman una progresión aritmética. En un papel semilogarítmico, si los valores de y constituyen una progresión geométrica se dispondrá también según una recta. d. Aumento ó disminuciones iguales indican cambios porcentuales iguales. e. Iguales pendiente en un gráfico logarítmico revelan taza de cambios iguales. 2.5.5.2 UTILIZACIÓN DE LOS GRÁFICOS LOGARÍTMICOS: 2.5.5.2.1. Para comparar tasas proporcionales de cambio.
  • 43. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 42 2.5.5.2.2. Mostrar la relación entre 2 ó más series cuyas cantidades difieren ampliamente. 2.5.5.3 PRECAUCIONES AL USAR GRÁFICAS SEMILOGARITMICAS: Hemos hecho notar que este tipo de presentación gráfica se adapta bien para permitir un análisis de cambios relativos. Existe un peligro de que las personas, antes de adquirir experiencia con las gráficas semilogarítmicas, deseen usarla en cualquier circunstancia. Una segunda precaución se refiere a la necesidad de comprensión especial de una gráfica semilogarítmica. Algunas personas no saben como interpretar una gráficas semilogarítmica; por esta razón, este tipo de gráficas, no se usan a veces, aún cuando resultaría más apropiado. Sin embargo, tal interpretación de una gráfica semilogarítmica es tan simple que la persona que debe observar una gráfica puede ser entrenada para su interpretación en unos cuantos minutos. 2.5.6 GRÁFICOS CUADRATICOS. Para la presentación gráfica de datos estadísticos, se recurre en algunos casos a figuras geométricas, tales como cuadros y los triángulos. Estas gráficas deben ser simples, es decir, no se deben recargar demasiado. Hay varias formas de hacer la representación gráfica mediante la utilización de cuadros. Con figuras continuas que queremos representar la distribución porcentual de los factores que se deben tener en cuenta en análisis de una empresa. 2.5.7 REGLAS PARA LA CONSTRUCION DE LOS GRÁFICOS. 2.5.7.1.Cada gráfico debe tener un título claro y conciso, que se sitúan generalmente en la parte superior central del gráfico. El título debe incluir información sobre: 2.5.7.1.1 La naturaleza de los datos 2.5.7.1.2 La situación geográfica 2.5.7.1.3 El período de tiempo cubierto 2.5.7.2 Las líneas coordenadas deberían reducirse al mínimo y las líneas curvas puestas de tal forma que resaltasen sobre el fondo del gráfico.
  • 44. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 43 2.5.7.3 La fuente de los datos debería indicarse debajo del gráfico a la izquierda. 2.5.7.4 Las notas, si la hay, se deberían situar en la parte inferior izquierda del gráfico. 2.5.7.5. Para entender fácilmente el gráfico, se debería reducir en la medida de los posibles el número de líneas curvas, segmentos y otros detalles. 2.5.7.6 Cada escala debe presentar un titulo indicando la unidad utilizada, 2.5.7.6.1 El título correspondiente al eje X debería estar centrado, inmediatamente debajo del eje. 2.5.7.6.2. El título del eje y debería situarse en la parte superior del eje. 2.5.7.7 Se debe indicar el cero de la escala ( eje y) de lo contrario se puede realizar una comparación errónea. La necesidad de indicar el origen se evidencia en la comparación de los picos de los dos gráficos. 2.5.7.8 En el eje y la escala de valores debería abarcar desde cero (0) desde el valor mas pequeño en la parte inferior del gráfico, al valor mas alto en su parte superior. 2.5.8 ESCALAS. 2.5.8.1 ESCALA ARITMÉTICA: El papel con escalas aritmética presenta distancias iguales entre las líneas coordenadas. Cantidades iguales equivaldrán entonces, a iguales distancias. Así, las distancias entre 1 y 3 será la misma que entre 8 y 10. 2.5.8.2 Los valores de las escalas deben situarse a lo largo de los ejes x e y, dando así una indicación general del tamaño de las variaciones que representa el gráfico. no es necesario indicar una graduación fina en la escala de valores , ya que no se pretende que se lean las cifras reales en el gráfico. Los valores exactos se pueden obtener de la tabla de datos original que usualmente acompañe el gráfico. 2.5.8.3. Si se utiliza una longitud, en eje X, para indicar un intervalo de tiempo el punto representativo del valor de cada período debería marcarse el punto central del período. Pero si se desean los períodos pueden hacerse coincidir con líneas coordenadas dadas, trazándose entonces los puntos en ellas.
  • 45. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 44 2.5.8.4 ESCALA LOGARÍTMICA Y SEMILOGARITMICAS: Cuando se desea comparar cambios porcentuales en lugar de absolutos, se utiliza un tipo de escala algo diferente. Se puede demostrar que cuando hay cambio porcentual constante entre 2 pares de cifras, las diferencias entre los logaritmos de las cifras serán iguales. Así, si el lugar de los valores originales se representan los logaritmos de esos valores, las diferencias constantes equivaldrán a cambios porcentuales constantes. NUMERO LOGARITMO 2 0.30103 4 0,60206 . Diferencia 0,30103 100% de aumento NUMERO LOGARITMO 5 0.69897 10 1.0000 ________ Diferencia 0.30103 100% de aumento 2.5.8.5 TIPOS DE ESCALAS: 2.5.8.5.1 UNIFORME: Previamente determina un valor representativo para cada uno de los valores reales del dato que se debe representar. 2.5.8.5.2 LOGARÍTMICAS: Las escalas ó representaciones de valor se hace aplicando el logaritmo. Las gráficas respectivas se elaboran en papel logarítmico ó semilogarítmico.
  • 46. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 45 2.6. GRÁFICAS ESTADÍSTICAS. Hay numerosas gráficas estadísticas, especialmente aquellas que son consideradas como las más usuales, teniendo en cuenta que estas deben ser sencillas, explícita y se representa siempre de izquierda a derecha y de abajo hacia arriba. A continuación daremos algunos conceptos y ejemplos de gráficas más usuales en estadística. 2.6.1. DIAGRAMAS DE BARRA: Es la representación visual mediante rectángulos de la relación entre las variables. Las barras utilizadas para representar las características cualitativas y cuantitativa por lo general, son construidas en forma vertical sobre una base horizontal, en el cual se colocan las características o el tiempo,(años, meses, etc) y la altura estará dada por el valor que toma la variable o atributo observado. También se elabora el diagrama proporcional de barras cuando se trabaja con grupos relativamente pequeños y se desea establecer comparaciones entre dos o más distribuciones proporcionales. 2.6.2.HISTOGRAMA Y POLÍGONO DE FRECUENCIAS. 2.6.2.1 HISTOGRAMA. Son representaciones gráficas de las distribuciones de frecuencias, que consiste en una serie de rectángulos, cada uno de ellos levantados en cada intervalo, de tal manera que la base sería igual a la amplitud y la altura estará dada ya sea por la frecuencia absoluta o por la relativa, si los intervalos son desiguales las alturas de los rectángulos deberán ser calculadas por procedimientos matemáticos, para que en la gráfica, no nos quede una imagen engañosa de la distribución que se quiere presentar. 2.6.2.2 POLÍGONO DE FRECUENCIAS. Se puede representar con la misma información del histograma, mediante la unión de los puntos medios de los techos de los rectángulos en el histograma por medio de una línea prolongada en el primero y último rectángulo. Los polígonos también se pueden dibujar estableciendo los puntos medios del intervalo, denominados marcas de clases, que se colocan en el eje horizontal o abscisa, para cada valor de la variable corresponderá un valor de la frecuencia, señalándose en
  • 47. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 46 el plano cartesiano por un punto, luego de establecido todos los puntos se unen mediante líneas rectas, las que en conjunto forman el polígono. 2.6.3 OJIVA. Para el trazado de esta gráfica, se emplea también el polígono, para presentar la frecuencia acumulada y la frecuencia acumulada relativa, se ubican los puntos en el plano cartesiano y se unen mediante segmentos de rectas y el gráfico así obtenido se llama polígono de frecuencia u ojiva. La ojiva o polígono de frecuencia acumulada tiene la ventaja de que da una manera cómoda de estimar la mediana y los percentiles de una muestra, otra ventaja que tiene es que se puede averiguar fácilmente el número de partida entre dos valores por ej. el número de partida entre 56.5 y 62.5 es simple la diferencia entre las correspondientes frecuencias acumuladas; o sea entre 3 y 20 es 17 ; Este método opera bien solamente para los valores y puntos que estén efectivamente representados. El histograma, el polígono y la ojiva, se utilizan para representar la variable continua, y los diagramas de frecuencias para la variable discreta. 2.6.4 DIAGRAMA CIRCULAR: Se utiliza para representar características cualitativas, sirve para notar las diferencias en las proporciones o porcentajes en que está dada la distribución. Como en total la circunferencia tiene 360º, se calcula a cuantos grados ( sector circular ) equivale la parte que se va a representar. El procesos que sigue en la confección de la gráfica circular o pastel consiste: En hacer la sumatoria total de las frecuencias, luego para sacar el porcentaje se multiplica cada frecuencia por el 100% y se divide por el total de la frecuencia, pero en este caso no es necesario; ya sacado el porcentaje de todas las frecuencias, se llevan a grados, multiplicando 360º por cada frecuencia en porcentaje dividiéndola por 100. 2.6.5 PICTOGRAMAS O PICTOGRAFOS: Se emplean cuando se trata de llamar la atención al público. Las figuras empleadas deben explicarse por sí misma. Se acostumbra que el tamaño sea uniforme, en algunos casos, se acostumbra colocar o señalar el valor total del conjunto buscado de esta manera la eliminación del cuadro. Algunos autores señalan que el tamaño puede variar, y ,la altura de cada objeto estará dada por la frecuencia absoluta o relativa, pero una inmensa mayoría considera que dicha representación puede conducir a errores
  • 48. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 47 en su interpretación, especialmente cuando los tamaños de la figuras no son proporcionales a la cantidad que se representa. 2.6.6.CARTOGRAMA :Son croquis o mapas que contienen datos estadísticos u otros de carácter no cartográficos, dentro de los cuales se ubican símbolos y en algunos casos gráficas, para indicar tanto la localización geográfica, así como la importancia del valor de la variable observada en la relación con el conjunto. 2.6.7 DIAGRAMA DE LÍNEAS. Es otra de las gráficas muy utilizadas, pero al mismo tiempo, la que presenta mayores dificultades en la visualización de los datos, dando lugar, algunas veces, a imágenes o conclusiones erróneas, debido a la mal confección de las escalas de los ejes. A los diagramas lineales también se les denomina curvas de sucesión, porque generalmente se refieren a variables observadas durante un periodo. Se denominan series de tiempo o series cronológicas. La variable tiempo se coloca en el eje horizontal y los valores que toman la variable, van al eje vertical. 2.6.8.CUADROS Y TRIÁNGULOS. Para representación gráficas de datos estadísticos, se recurre a la figura geométrica como los cuadros y rectángulos. Estas gráficas deben ser simples y es aconsejable superponer las figuras en lugar de yuxta - ponerlas. Hay varias formas de hacer la presentación gráfica mediante la utilización de los cuadros, una la más recomendadas es que, antes que todo, identificar las características que se investigaron, ya que esto permite una mejor clasificación de lo observado, ya que estas características pueden ser cualitativas o atributos y cuantitativas. En la gráfica mediante la utilización de triángulos se debe buscar una base común y luego localizar la altura, como también son utilizados triángulos donde cada uno de ellos tiene una base diferente. Otra forma es, determinando zonas proporcionales a las cantidades representadas y tener una clara diferencia entre las zonas demarcadas al igual que anexar los signos convencionales correspondientes. 2.6.9. GRÁFICA DE CANTT. La utilización de estas gráfica se hace con mayor necesidad, en la dirección de empresas, en la cual establecen las diferentes etapas de trabajo por ejecutar y el ejecutado durante un
  • 49. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 48 determinado período. El campo de aplicación de esta gráfica es muy vasto, siendo imposible en esta investigación la descripción de todas las formas y usos que tiene. 2.6.10 PIRÁMIDES. Las gráficas denominadas pirámides son utilizadas con mucha frecuencia para representar las edades de una población de una región. Si en un triángulo se determinan zonas proporcionales a las cantidades representadas y hay diferenciación entre las zonas demarcadas, al igual que anexar los signos convencionales correspondientes, la gráfica así elaborada se denomina pirámide. EJEMPLO: Los siguientes datos representan la distribución de los gastos en millones de pesos, de las empresas la Mazorca y El diamante en un determinado periodo: EMPRESAS SALARIOS ALQUILER IMPUESTO PUBLICIDAD LA MAZORCA 20.4 47.5 39.8 20.4 EL DIAMANTE 30.6 38.6 34.6 31.6 1.0 Gráfico de barra. Gasto en millones de pesos de las empresas la Mazorca y el Diamante durante un periodo contable 0 10 20 30 40 50 Salario Alquiler Impuesto Publicidad La mazorca El Diamante Fuente: División Financiera
  • 50. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 49 2.0 Gráfico circular Gasto en millones de pesos de las empresas la Mazorca y el Diamante durante un periodo contable 16% 37% 31% 16% Salario Alquielr Impuesto Publicidad Fuente: División Financiera
  • 51. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 50 3. Grafico de cilindro Gasto en millones de pesos de las empresas la Mazorca y el Diamante durante un periodo contable 0 20 40 60 80 100 Salario Alquiler Impuesto Publicidad El Diamante La Mazorca Fuente: División Financiera.
  • 52. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 51 4. Grafico de Líneas. Gasto en millones de pesos de las empresas la Mazorca y el Diamante durante un periodo contable 0 20 40 60 80 100 Salario Alquiler Impuesto Publicidad El Diamante La Mazorca Fuente: División Financiera.
  • 53. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 52 EVALUACION SOBRE LA UNIDAD Nº 2 2.1 Construir un diagrama circular para la siguiente distribución. Distribución porcentual del numero de personas vacunadas según tipo de vacunas (1986 - 1987) TIPO DE VACUNA PERSONAS VACUNADAS PORCENTAJE DPT POLIO BCG SARAMPIÓN TOTAL 48.958 55.068 46.884 46.450 197.360 24.81 27.9 23.76 23.53 100.00 2.2 Construir un diagrama de línea que visualice los datos de la siguiente tabla que muestra los depósitos y préstamos de las entidades financieras de esta ciudad. ENTIDAD DEPOSITO (MILES DE $) PRESTAMOS (MILES DE $) Sistema Bancario 1 Caja Agraria 2 UPAC 3 Corporaciones Financieras 4 8´699.699 2´517.702 3´303.211 368.218 7´145.909 6´609.804 2´212.117 610.281 2.3 Construir un diagrama de barra con los datos que se muestran en la tabla que representan los servicios de salud en hora años medicas, odontológicas y de enfermería, según subsectores.
  • 54. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 53 SUBSECTORES OFICIAL Y MIXTO SEGURIDAD SOCIAL PRIVADO TOTAL MÉDICOS ODONTOLÓGICOS ENFERMERÍA 178.348 115.500 112.000 120.746 51.952 18.680 13.212 13.380 00 312.308 180.832 130.680 2.4 Elaborar un diagrama triangular que represente las extensiones territoriales de los países Bolivarianos. PAÍS ÁREA (KM²) BOLIVIA COLOMBIA ECUADOR PERÚ VENEZUELA 1´099.000 1´138.000 284.000 1´285.000 916.000 2.5 Los aviones agrícolas como modernas máquinas agrícolas, participan cada vez más en gran número de trabajo. Aproximadamente unos 60 países con unos 19.000 aviones tratan al rededor de 200.000.000 hectáreas según la (FAO). A continuación aparecen algunos datos referentes a diversos países. Elaborar un pictograma que visualice los datos presentados. PAIS Nº DE AVIONES URSS EE. UU. CANADÁ ARGENTINA MÉXICO RDA RFA 8.000 6.100 666 450 450 100 2.030 2.6 Para formar las curvas de calibración para estimación de la concentración de protombina, se considera arbitrariamente que el plasma de un sujeto normal tiene una concentración de 100%. Con suero salino se prepara una serie de diluciones de esta muestra y se mide un tiempo que se requiere para la coagulación después de agregar una mezcla de cloruro de calcio y trasmboplastina. La tabla siguiente ilustra el tipo de dato que se tiene.
  • 55. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 54 CONCENTRACIÓN NOMINAL DE PROTOMBINA, X TIEMPO EN SEGUNDOS QUE SE REQUIERE PARA QUE APAREZCA UN COAGULO , Y 100 50 25 15 14 18 22 24 Representar los puntos en una gráfica de Y en función de X y trazar la curva a mano alzada a través de esos puntos. 2.7 En un sujeto cuyo nivel de glucosa en sangre en ayunas es de 100 mg/100ml, se inyectan por vía intravenosa 50 gr de glucosa. Se miden muestra de sangre, con intervalos de media hora, obteniendo los resultados siguientes: MINUTOS DESPUÉS DE LA INYECCIÓN Mg/100 ml DE GLUCOSA EN SANGRE 30 60 90 120 161 128 119 108 Trazar la gráfica del logaritmo del aumento en la concentración de azúcar en la sangre, en función del tiempo.
  • 56. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 55 2.8.- Sírvase registrar ( F ) dentro del paréntesis en caso de que el enunciado sea completamente falso y ( V ) verdadero en caso contrario. El gráfico circular (pastel) lo usamos para representar variables cualitativas ( ) La elaboración del pictograma exige que sobre el eje x vaya la variable de interés ( ) La parte inicial en la construcción de un formulario debe contener las preguntas acerca del tema de interés. ( ). El gráfico de barras simple y el de pastel se utiliza cuando la variable es de naturaleza cualitativa ( ) En el procesos de investigación estadística, la selección de las variables a estudiar se realiza independientemente de los objetivos o hipótesis de investigación. ( ) Toda investigación científica debe contar con el método estadístico como su único auxiliar. ( ) Las tablas estadísticas son arreglos de datos expuestos en filas y columnas para su manejo y presentación. ( ) Para utilizar un polígono de frecuencias, la variable debe ser de naturaleza cuantitativa continua y deberá ocupar la ordenada del sistema del coordenadas cartesianas ( ) Kilogramos, onza y libra son unidades de medida de la variable peso ( ) Toda variable cuantitativa puede ser transformada para ser manejada a un nivel de medición nominal u ordinal ( ). 2.9 A cada espacio en blanco que aparece en la columna A, escribir la letra correspondiente de la columna B (respuesta) que usted crea es la respuesta correcta. Cada expresión de la columna B, puede ser utilizada como respuesta en A más de una vez.
  • 57. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 56 COLUMNA A COLUMNA B Elementos que permiten cuantificar A. Los porcentajes la unidad de análisis Permiten visualizar el comportamiento B. El coeficiente de Asimetría real y objetivo del objeto de estudio. Permiten tener un conocimiento de D. El coeficiente de variación la variable desde el centro de la serie. Como medida de dispersión está E. Desviación estándar asociada con la media. Permiten describir el comportamiento F. El saber cotidiano de una variable cuantitativa. Permite comparar la variabilidad o G. Unidad de observación heterogeneidad que presentan dos variables con igual unidad de medida Utiliza los numerales como códigos H. Gráfico de líneas para establecer una categorización. Se utiliza para conocer el grado I. Medidas de tendencia central de simetría que presenta la Distribución de una variable. Permiten describir el comportamiento J. Medidas de resumen de una variable cualitativa. K. Histograma de frecuencias 2.10 Dentro de un estudio de clima organizacional en una unidad local de salud que cuenta con 55 empleados, se tomó una muestra de 15 empleados en los cuales se evaluó en nivel motivacional, y, la aplicación del test arrojó los siguientes resultados calificados con una escala de 1 a 5 y 30 ítem. 42 36 65 70 42 58 66 65 58 90 85 70 90 66 36
  • 58. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 57 Con base en la información anterior precisar: Cuál es la variable de estudio? ------------------------------------------------------------- ----------------------------------------------------------------------------------------------- Cuál es la naturaleza de la variable de estudio? y nivel de medición ------------ -------------------------------------------------------------------------------------------------- Cuál es la unidad de medida de la variable?.--------------------------------------- Cuál es la unidad de análisis? ---------------------------------------------------------- Cuál es la muestra? ---------------------------------------------------------------------- Cuantos valores diferentes tiene la variable? ---------------------------------------- Cuál es el universo? ----------------------------------------------------------------------- Cuál es el puntaje máximo que se puede esperar en el test para una persona? ------------------------------------------------------------------------------------- Cuál es la frecuencia absoluta para cada valor de la variable? ------------------- ------------------------------------------------------------------------------------------------- Cuál es el puntaje mínimo que se puede esperar en el test de una persona? --------------------------------------------------------------------------------------------------- 2.11 Los siguientes datos agrupados corresponden a las Estaturas de 98 estudiantes, hombres, que participaron en un estudio titulado “Desarrollo de las medidas Craneofaciales de crecimiento de población X”. En uno de los objetivos de la investigación, se requería hacer una descripción de talla inicial de las personas bajo estudio, para efectos comparativos posteriores.
  • 59. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 58 Distribución porcentual de las Estaturas de 98 hombres, en un estudio sobre Desarrollo de las Medidas Craneofaciales y de Crecimiento. Medellín, 1.995 INTERVALO S Marcas de clase Xi Frecuencia absoluta Fi Frecuencia acumulada Fa Frecuencia Relativa en % Fr Frecuencia Relativa Acumulada % Fra 1.47 – 1.53 1.50 9 9 9.2 9.2 1.53 - 1.59 1.56 18 27 18.4 27.6 1.59 - 1.65 1.62 20 47 20.4 48.0 1.65- 1.71 1.68 16 63 16. 64.3 1.71 - 1.77 1.74 19 82 19.4 83.7 1.77 -1.83 1.80 8 90 8.2 91.9 1.83 - 1.89 1.86 5 95 5.1 97.0 1.89- 1.95 1.92 3 98 3.0 100.0 Tomando como referencia el cuadro anterior, una o unas de las siguientes afirmaciones es o son falsa: a.- La estatura que predomina en el estudio es 1.62 mts. b.- A lo sumo el 48% de las estaturas está entre 1.47 mts y 1.65 c.- El 48% de las Estaturas está entre 1.59 mts y 1.65 mts d.- El 3% de las Estaturas más altas está entre 1.83 y 1.95 mts.
  • 60. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 59 UNIDAD 3.0 MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL OBJETIVO DE LA UNIDAD: Proporcionar una comprensión de las características o propiedades de los Datos numéricos (tendencia central) y sus mediciones descriptivas de Resumen correspondientes, como una ayuda para el análisis e interpretación de datos. CONTENIDOS: 3.1 Media Aritmética 3.1.1 Propiedades 3.1.2 Ventajas y desventajas 3.2 Mediana 3.2.1 Ventajas y desventajas 3.3 Moda 3.3.1 Ventajas y desventajas 3.4 Características principales de los promedios anteriores 3.5 Relación entre la Media, Mediana y Moda 3.6 Media Geométrica 3.6.1 Propiedades 3.6.2 Ventajas y desventajas 3.6.3 Características 3.7 Media Armónica 3.7.1 Característica 3.8 Relación entre Media Aritmética, Geométrica y Armónica 3.9 Cuartiles, Decíles y Percentiles Evaluación de la unidad
  • 61. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 60 MEDIDAS DE POSICIÓN O DE TENDENCIA CENTRAL 3.0. MEDIDAS DE POSICIÓN. Son parámetros o promedios que se consideran representativos de una distribución de datos , los cuales tienen tendencia a concentrar los datos, o sea , que son valores de posición central a cuyo alrededor se distribuyen los datos del conjunto. Los más importantes son: Media Aritmética, Mediana y Moda. Se encuentran otras medidas de menos importancia que analizaremos en éste trabajo como son: Media Geométrica, Armónica, Cuadrática, Cúbica, Cuartiles, Deciles y percentiles. 3.1 MEDIA ARITMÉTICA : Es el promedio más utilizado. Es la suma de los valores de la distribución dividida por el número total de datos. Es un promedio que se obtiene por medio del cálculo cuyo valor depende del que tienen los diversos datos que entran en la distribución. La medida Aritmética se representa por medio de __ X (que se lee X barra) 3 .1.1. CALCULO DE MEDIA ARITMÉTICA. 3.1.1.1 Para datos no Agrupados. La Media Aritmética se calcula a partir de la formula: X __  n XnXXXXXXX ...7654321  X __  Xi n i n  1 representa la media de la muestra Donde x Se utiliza para indicar la suma de todas las X y n es el número total de datos de la muestra.
  • 62. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 61 EJEMPLO 1: Las calificaciones de un alumno durante el grado 10º han sido las siguientes: Matemáticas, 8 , Estadística 7, Ingles , 7; Física 6 Química, 9 Filosofía, 5 , Literatura, 6, Hallar la nota media ( _ _ X ). __ X  X X X X X X X1 2 3 4 5 6 7 7       __ X  Xi n i  1 7 __ X = 8 7 7 6 9 5 6 7       = 6.85 EJEMPLO 2. Hallar la Media Aritmética de la siguiente distribución de datos: 32, 25, 29, 30, 30, 27, 24, 35, 34, 30, 29 __ X = 32 25 29 30 30 27 24 35 34 30 29 11           __ X = 29.54 Ejemplo 3. La Media Aritmética de los números 8, 3, 5, 12, 10 es:
  • 63. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 62 __ X = 8 3 5 12 10 5     = 7.6 3.1.1.2 Para Datos Agrupados. Se puede calcular por efectivos, frecuencia y por intervalos. Se calcula a partir de la fórmula. __ X = X f n i i i n  1 ; Media aritmética ponderada EJEMPLO 1. Los valores de las edades en años obtenidas en una toma de datos en una encuesta, son los que figuran en la tabla siguiente. Hallar la Media Aritmética de la distribución de los datos. Xi (Edad en años) fi XI . fi 29 0 0 30 2 60 31 7 217 32 13 416 33 22 726 34 32 1088 35 49 1715 36 35 1260 37 23 851 38 9 342 39 5 195 40 3 120 41 0 0 N = 200 6.990. __ X = X f n i i i n  1 = 6990 200 = 34.95 = 35 años, edad promedio.
  • 64. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 63 EJEMPLO 2. Hallar la Media Aritmética ( __ X ) de los datos que figuran en la siguiente tabla en la cual vamos a encontrar la estatura en centímetros de las especies de árboles estudiados en una área determinada. Intervalo Xi Fi Xi Fi 6 25 15,5 4 62 26 45 35,5 3 106,5 46 65 55,5 7 388,5 66 85 75,5 9 679,5 86 105 95,5 16 1528 106 125 115,5 14 1617 126 145 135,5 20 2710 146 165 155,5 32 4796 166 185 175,5 24 4212 186 205 195,5 13 2514.5 206 225 215,5 6 1293 ------------ --------------- N = 148 19907 __ X = X f n i i i n  1 = 19907 148 = 134.50cm; estatura promedio EJEMPLO 3. En la siguiente tabla se encuentra unas distribuciones de los datos de la estatura de 50 trabajadores.
  • 65. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 64 Estatura en pulgada INTERVALOS Puntos medios Xi frecuencia Fi Xi .Fi 50.5 - 53,5 53.5 - 56.5 56.5 - 59.5 59.5 - 62.5 62.5 - 65.5 65.5 - 68.5 68.5 - 71.5 71.5 - 74.5 52 55 58 61 64 67 70 73 1 2 6 11 16 9 4 1 52 110 3 48 6 71 1024 603 280 73 __ X = X f n i i i n  1 = 3161 50 = 63.22 pulgadas, estatura promedio. 3.1.2 PROPIEDADES DE LA MEDIA ARITMÉTICA a. La suma algebraica de las desviaciones de un conjunto de números de su Medida Aritmética es igual a 0 (cero). Así : (Xi j n   1 __ X ) = O b. La suma de los cuadros de las desviaciones de un conjunto Xi respecto ciertos número a es mínima sí y solo sí a es igual a __ X . c. Si f1 número tienen la media m1 , f2 número tiene la media m 2, fk número tiene la media mk entonces la media de todos los números es :
  • 66. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 65 __ X = 1 1 2 2 1 2 f m f m f mk k f f f k       ... ... 3.1.3 VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA 3.1.3.1. ventajas a. El promedio aritmético es, en así, la medida más fácil de entender y la más comúnmente usada. Es un valor tal que si calculamos para un grupo en el cual todos los elementos fueran iguales, cada uno de ellos sería igual a su promedio aritmético de “n” elementos es nuevo elemento formado, tomado una parte igual a 1/n de cada uno los elementos originales. b. Esta media se define en forma rígida por una ecuación matemática muy fácil de entender y algunas veces se puede obtener cuando no es posible calcular otros tipos de medida de tendencia central y aún en el caso de no conocer los valores individuales de las serie, por ejemplo. Sí 10 filas consumen 20 litros de leche, el promedio aritmético será de 2 litros por fila. c. El promedio aritmético es extraordinariamente estable en el muestreo. d. Es altamente sensible a cualquier cambio en los datos de la distribución. e. Como una ventaja más del promedio aritmético, podemos anotar que es excepcionalmente adaptable cuando se trata de hacer cálculos matemáticos posteriores con él (promedio ponderado, métodos abreviados y promedio de promedios). 3.1.3.2. Desventajas a. Es sensible a los valores muy grande o muy pequeños, especialmente a los primeros, y a la inclusión de tales datos en distribución que se esté estudiando pueden dar un promedio aritmético que no sea realmente el representante típico del grupo. b. Cuando una distribución es marcadamente aritmética en tal forma que el promedio aritmético, la mediana y la moda difieren en forma apreciable,
  • 67. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 66 debe considerarse siempre la posibilidad de que el promedio aritmético pueda no ser el valor único representativo de la serie. c. Otro inconveniente o desventaja del promedio aritmético, es cuando la distribución tiene forma de “U”, es decir parabólicamente este corresponde a los valores menos comunes en la serie y por tanto, puede dar una idea irreal de la distribución. 3.2. MEDIANA (Me) La Mediana de una serie de datos ordenados es el valor central de la distribución de datos que divide dicho conjunto de datos de tal manera que el número de partidas por encima de la Mediana sea igual al número de partidas por debajo de la Mediana. 3.2.1 MEDIANA PARA DATOS NO AGRUPADOS. Cuando el número de valores de la distribución es impar, la mediana está bien definida será el valor que se encuentre en el medio cuando se hayan ordenado los valores. Si los números de la distribución son pares, se ordenan, se suman los valores centrales y se dividen por dos(2). EJEMPLO 1. Calcular la Mediana para cada una de las distribuciones de datos que siguen: 4, 6, 7, 9, 15, 16, 17, (número de datos impares) La Mediana es 9 ya que este es el valor central de la distribución EJEMPLO 2. Calcule la mediana para: 3, 7, 9, 12, 15, 20, 21, 25 (número de datos par) La mediana es = (12 +15) / 2 = 13.5 En este caso, la Mediana no corresponde a un valor real de la distribución.
  • 68. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 67 EJEMPLO 3. 32 25 29 30 31 27 24 34 32 29 25 Ordenando los datos: 24 25 25 27 29 29 30 31 32 32 34 La Mediana es 29 En éste caso corresponde a un valor real de distribución. 3.2.2 MEDIANA PARA DATOS AGRUPADOS: Para encontrar la Mediana de datos agrupados se suele utilizar el método de interpretación que exige la construcción de una distribución de frecuencia acumulada o de una distribución de frecuencia acumulada relativa. La Mediana se obtiene mediante la fórmula: Mediana = Li + n fmediana i f/ ' 2 1          A Donde Li = Límite real inferior de la clase mediana n = Número total de datos (frecuencia total ) i f  1 = Suma de las frecuencias de todas las clases por debajo de la clase Mediana. F mediana = Frecuencia de la clase Mediana. A = Tamaño del intervalo de la clase mediana. EJEMPLO 1. Hallar la Mediana para las cargas máximas de los cables de la siguiente tabla.
  • 69. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 68 Máxima de cargas Número de cables Toneladas Cortas. 9,3 - 9,7 2 9,8 - 10.2 5 10,3 - 10,7 12 10,8 - 11,2 17 11,3 - 11,7 14 11,8 - 12,2 6 12,3 - 12,7 3 12,8 - 13,2 1 TOTAL 60 Me = Li + n fmediana i f/ ' 2 1          A Me = 10.8 + 60 2 19 17 /       0.4 Me = 10.8 + 11 17       0.4 Me = 10.8 + 0.258 Mediana = 11.06 Toneladas cortas Es decir que el 50% de los cables resisten menos de 11.06 toneladas y el otro 50% mas de 11.06 toneladas. EJEMPLO 2. Halle la Mediana de los diámetros de las cajas de remaches de la siguiente tabla.
  • 70. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 69 DIÁMETRO FRECUENCIA (PULGADAS) 0,7247 - 0,7244 2 0,7250 - 0,752 6 0,7253 - 0,755 8 0,7256 - 0,7258 15 0,7259 - 0,7261 42 0,7262--- 0,7264 68 0,7265--- 0,7267 49 0,7268--- 0,7270 25 0,7271--- 0,7273 18 0,7274--- 0,7276 12 0,7277--- 0,7279 4 0,7280--- 0,7282 1 Me = Li + n fmediana i f/ ' 2 1          A Me = 0.7262 + 250 2 73 68 /       0.0002 Me = 0.7277
  • 71. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 70 EJEMPLO 3. Hallar la mediana de la siguiente tabla, que muestra los salarios recibidos por algunas familias. CLASES(salarios) FRECUENCIA(familias) 10 - Menor de 15 3 15 -Menor de 20 7 20 -Menor de 25 16 25 -Menor de 30 12 30 -Menor de 35 9 35 -Menor de 40 5 40 -Menor de 45 2 TOTAL 54 Me = Li + n fmediana i f/ ' 2 1          A Me = 25 + 54 2 26 12 /       5 Me = 25.41 salarios; el 50% de las familias reciben menos de 25.41 salarios y el otro 50% mas de 25.41 salarios. 3.2.3 VENTAJAS Y DESVENTAJAS DE LA MEDIANA 3.2.3.1 Ventajas 3.2.3.1.1 La Mediana tiene una definición rígida y el concepto que envuelve es tan claro que cualquiera puede entenderlo aún no siendo familiar el término.
  • 72. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 71 3.2.3.1.2 Si los datos están ordenados en un cuadro de frecuencias esta medida es fácil de calcular y por otro lado los datos extremos no tienen ninguna influencia en ella. 3.2.3.1.3 Tiene menos estabilidad en el muestreo que el promedio aritmético, pero es más aceptable en otras medidas. 3.2.3.1.4 Hay situación en que la única medida de tendencia central que puede calcularse es la Mediana, tal como sucede en el uso de una distribución cuyos intervalos extremos no están definidos. 3.2.3.2 Desventajas. 3.2.3.2.1 No es tan conocida como la Media Aritmética 3.2.3.2.2 Es necesario ordenar los datos para poderla calcular 3.2.3.2.3 La mediana no se adapta a cálculos posteriores aritméticos, por cuanto que si obtenemos la mediana de diferentes grupos, no podemos tener una mediana de los grupos reunidos. 3.2.3.2.4 La Mediana no es sensible a cambios de valores de los elementos que componen la distribución. 3.3 MODA ( Mo) Se define como el valor que ocurre con mayor frecuencia en una distribución o sea el punto donde la concentración es máxima, Si todos los valores son diferentes, no existen moda, por otra parte un conjunto de valores puede tener más de una moda. Si la moda es única la distribución de datos se denomina UNIMODAL si hay dos modas BIMODAL etc. Por ejemplo: Un laboratorio con 10 empleados cuyas edades son 20, 21, 20, 20, 34, 22, 24, 27, 27 y 27. Puede decirse que estos datos tienen dos modas, 20 y 27. La muestra que consiste de los valores 10, 21, 33, 53 y 54 son diferentes.
  • 73. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 72 De una distribución de frecuencia o histograma la moda puede sacarse de la fórmula: Moda = Li + 1 1 2            A Li = Limite real inferior de clase modal 1 = Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior. 2 = El exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior. A = Tamaño del intervalo de clase modal. Para datos no agrupados la moda es el valor que más se repite o es el valor de más alta frecuencia. EJEMPLO1. Hallar la Moda para el siguiente conjunto de datos: 7, 4, 10, 15, 12, 7, 9, 7, Moda = 7 EJEMPLO 2. Los tiempos de reacción de un individuo a determinados estímulos fueron : 0,53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 055 segundos Moda = 0.53
  • 74. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 73 EJEMPLO 3. Una serie de números está formada por seis 6, siete 7, ocho 8 , nueve 9, y Diez 10. La Moda = 10 EJEMPLO 4. Hallar la moda para la siguiente frecuencia que demuestra el ingreso familiar diario en pesos. INGRESO FAMILIAR DIARIO EN $ Nº DE FAMILIAS Menos de 3.000 25 3.000 - 4.999 31 5.000 - 6.999 42 7.000 - 8.999 45 9.000 - 10.999 52 11.000 - 12.000 42 13.000 - 14.999 35 15.000 - o más 28 TOTAL 300 Mo = Li + 1 1 2            A Mo = 9000 + 7 7 10       1999
  • 75. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 74 Mo = 9000 + ( 0.411) 1999 Moda = $ 9821.58 La mayor parte de las familias ganan alrededor de $ 9,822 . EJEMPLO 5. Distribución de las partículas de materia en suspensión ( microgramos por metros cúbicos ) en muestras de aires tomadas en 57 grandes ciudades. INTERVALO DE CLASE FRECUENCIA 10 19 5 20 29 19 30 39 10 40 49 13 50 59 4 60 69 4 70 79 2 Mo = Li + 1 1 2            A Mo = 20 + 14 14 9       9 Mo = 20 + ( 0.608)9 Moda = 25.47 micro gramos/ metro cúbico.
  • 76. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 75 EJEMPLO 6. En la siguiente distribución observamos el tiempo en minutos que demoraron algunos atletas en recorrer una distancia. INTERVALO DE CLASES FRECUENCIA 20 30 15 30 40 18 40 50 22 50 60 30 60 70 15 100 Mo = Li + 1 1 2            A Mo = 50 + 8 8 15       10 Mo = 53.47 minutos 3.3.1 VENTAJAS Y DESVENTAJAS DE LA MODA 3.3.1.1 Ventajas 3.3.1.1.1. El hecho de que la moda indique el número de mayor concentración, lo que hace tal vez la mejor medida de tendencia central, cuando una distribución es asimétrica. Claramente se ve que el modo es el más representativo del grupo, y en algunos casos si los promedios son simplificativamente diferentes del valor es preferible usar el modo. 3.3.1.1.2 En series polimodales, el modo permite dividir la distribución con fines de estratificación 3.3.1.2 Desventajas.
  • 77. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 76 3.3.1.2.1 El modo es difícil de calcular en una serie agrupada y las aproximaciones de su cálculo no son de mucha confianza. 3.3.1.2.2 El modo es muy inestable en el muestreo. 3.3.1.2.3 El modo puede ser usado fácilmente en procesos algebraicos posteriores. 3.3.1.2.4. El modo no es sensible a cambios de valores en la distribución, a menos que tales cambios afecten a su propio valor. 3.3.1.2.5 No es recomendable, en la variable continua o cuando la amplitud de los intervalos es diferente. 3.4 CARACTERÍSTICAS DE LOS PRINCIPALES PROMEDIOS VISTOS ANTERIORMENTE. 3.4.1 Media Aritmética. 3. 4.1.1 El valor de la media aritmética depende de cada una de las medidas que forman la serie, y se halla afectada excesivamente por las desviaciones extremas con respecto al promedio, lo que habría que tener presente en algunas de sus aplicaciones. 3.4.1.2 La media aritmética se calcula con facilidad, y es única para cada caso. 3.4.1.3 La media aritmética es un promedio calculado, susceptible de las operaciones algebraicas. 3.4.2 MEDIANA (CARACTERES PRINCIPALES) 3.4.2.1 El valor de la mediana no está sujeto a la magnitud de las desviaciones extremas con respecto al promedio. 3.4.2.2 La mediana puede ser localizada cuando los términos que forman la serie no son susceptibles de evaluación cuantitativa. 3.4.2.3 La mediana no se presta tanto como los medios aritméticos, geométricos y armónicos a las operaciones algebraicas.
  • 78. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 77 3.4.3 MODA (CARACTERES PRINCIPALES) 3.4.3.1 El valor de la moda no está afectado por las magnitudes de las desviaciones extremas con relación al promedio. 3.4.3.2 Es fácil localizar la moda aproximadamente, pero, la determinación de su valor exacto exige prodigiosos cálculos. 3.4.3.3. La moda carece de significado a menos que la distribución comprenda un gran número de datos y ofrezca marcada concentración. 3.4.3.4. La moda es el promedio más típico de toda la distribución pues se halla localizado en el punto de máxima concentración. 3.4.3.5 La moda no es susceptible de operaciones algebraicas. 3.5.- RELACIÓN ENTRE MEDIA, MEDIANA Y MODA. En una distribución de frecuencias uní modales que sea moderadamente asimétricas, la mediana se encuentra entre la media aritmética y la moda a un tercio aproximadamente de distancia; de aquí se tiene la relación empírica: MEDIA - MODA = 3 (MEDIA - MEDIANA)
  • 79. ___________________________MODULO DE ESTADISTICA UNO - ALBERTO QUINTO JIMENEZ 78 Ejemplo Hallar la media, mediana y moda de los pesos de 40 estudiante de una Universidad. PESOS ( LIBRAS ) Xi Fi Xi.Fi 118 - 126 122 3 366 127 - 135 131 5 655 136 - 144 140 9 1260 145 - 153 149 12 1788 154 - 162 158 5 790 163 - 171 167 4 668 172 - 180 176 2 352 n =40 5879 __ X = X f n i i i n  1 = 5879 40 = 146.97 Me = Li + n fmediana i f/ ' 2 1          A Me = 145 + 40 2 17 12 /       9 Me = 147.25 Mo = Li + 1 1 2            A Mo = 145 + 3 3 7       8 Mo = 147.4