2. PRE GRADO
AUTORES : PROFESORES DEL CURSO
TÍTULO : GUÍA DEL ALUMNO
FECHA : AGOSTO 2010
CURSO : ESTADÍSTICA APLICADA A LOS NEGOCIOS
CÓDIGO : MA130
ÁREA : CIENCIAS
CICLO : 2010-2
3. Estadística Aplicada a los Negocios UPC 2010 02 3
Contenido
Semana 1. Sesión 1 ................................................................................................................... 5
Unidad 1 Organización de datos ...................................................................................................... 5
1.1. Definición de estadística ......................................................................................................................... 9
1.2. Definiciones .......................................................................................................................................... 10
Semana 1. Sesión 2 ................................................................................................................. 19
1.3. Estadística descriptiva........................................................................................................................... 20
1.4. Resumen de datos cualitativos............................................................................................................... 21
1.5. Gráficos................................................................................................................................................. 22
1.6. Tabulaciones cruzadas........................................................................................................................... 27
Semana 2. Sesión 1 ................................................................................................................. 31
1.7. Resumen de datos cuantitativos............................................................................................................. 31
Semana 2. Sesión 2 ................................................................................................................. 38
1.8. Gráficos de datos cuantitativos.............................................................................................................. 38
Semana 3. Sesión 1 ................................................................................................................. 45
Unidad 2 Medidas descriptivas ...................................................................................................... 45
2.2. Medidas de tendencia central ................................................................................................................ 48
Semana 3. Sesión 2 ................................................................................................................. 57
Ejercicios para la práctica calificada 1 ......................................................................................................... 57
Semana 4. Sesión 1 ................................................................................................................. 58
2.3. Cuantiles................................................................................................................................................ 59
2.4. Percentiles ............................................................................................................................................. 59
Semana 4. Sesión 2 ................................................................................................................. 65
2.5. Medidas de variabilidad ........................................................................................................................ 66
Semana 5. Sesión 1 ................................................................................................................. 74
2.6. Medidas de asimetría............................................................................................................................. 74
2.7. Diagrama de cajas ................................................................................................................................. 77
Semana 5. Sesión 2 ................................................................................................................. 83
Unidad 3 Teoría de probabilidad................................................................................................... 83
3.1. Experimentos, reglas de conteo y asignación de probabilidades........................................................... 85
3.2. Eventos y sus probabilidades................................................................................................................. 86
Semana 6. Sesión 1 ................................................................................................................. 91
3.3. Algunas relaciones básicas de probabilidad .......................................................................................... 95
Semana 6. Sesión 2 ................................................................................................................. 99
Ejercicios para la práctica calificada 2 ......................................................................................................... 99
Semana 7. Sesión 1 ............................................................................................................... 101
3.4. Probabilidad condicional..................................................................................................................... 101
3.5. Teorema de Bayes ............................................................................................................................... 107
Semana 7. Sesión 2 ............................................................................................................... 112
3.6. Eventos independientes....................................................................................................................... 112
Semana 9. Sesión 1 ............................................................................................................... 117
Unidad 4 Variables aleatorias ...................................................................................................... 117
4.1. Variable aleatoria ................................................................................................................................ 119
4.2. Variable aleatoria discreta................................................................................................................... 119
Semana 9. Sesión 2 ............................................................................................................... 129
4.3. Distribuciones de probabilidad............................................................................................................ 129
4. Estadística Aplicada a los Negocios UPC 2010 02 4
Semana 10. Sesión 1 ............................................................................................................. 136
4.4. Variable aleatoria continua.................................................................................................................. 136
Semana 10. Sesión 2 ............................................................................................................. 147
4.5. Distribuciones de probabilidad............................................................................................................ 147
Semana 11. Sesión 1 ............................................................................................................. 154
Continuación de la distribución normal ..................................................................................................... 154
Semana 11. Sesión 2 ............................................................................................................. 157
Ejercicios para la práctica calificada 3 ....................................................................................................... 157
Semana 12. Sesión 1 ............................................................................................................. 159
Propiedad reproductiva de la normal.......................................................................................................... 159
Unidad 5 Distribuciones muestrales ............................................................................................ 167
5.1. Definiciones ........................................................................................................................................ 169
5.2. Distribución muestral de un estadístico............................................................................................... 171
5.3. Distribución de la media muestral....................................................................................................... 171
5.4. Teorema central del límite................................................................................................................... 172
Semana 12. Sesión 2 ............................................................................................................. 177
5.5. Intervalo de confianza para la media poblacional ............................................................................... 177
Semana 13. Sesión 1 ............................................................................................................. 181
5.6. Distribución de la proporción muestral ............................................................................................... 181
5.7. Distribución de la varianza muestral ................................................................................................... 184
Semana 13. Sesión 2 ............................................................................................................. 186
5.8. Distribución muestral de la razón de varianzas................................................................................... 186
5.9. Distribución muestral de la diferencia de medias................................................................................ 188
Semana 14. Sesión 1 ............................................................................................................. 192
5.10. Distribución con observaciones pareadas.......................................................................................... 192
5.11. Distribución muestral de la diferencia de proporciones .................................................................... 195
Semana 14. Sesión 2 ............................................................................................................. 197
Ejercicios para la práctica calificada 4 ....................................................................................................... 197
Semana 15. Sesión 1 y 2 ....................................................................................................... 199
Trabajo final............................................................................................................................................... 199
Tablas estadísticas......................................................................................................................... 200
Plan calendario .............................................................................................................................. 215
5. Logro de la unidad
Contenido
Debo saber
Comprende y utiliza los
conceptos básicos de
estadística y asimismo
organiza adecuadamente
datos para facilitar la
comprensión de los
mismos, con ayuda de los
programas MS Excel.
Unidad1
Organización de
datos
Definiciones
Escala de medición
Variables
Parámetro y estadístico
Distribuciones de fre-
cuencia
Gráficos
Sergio Vizcarra sonreía al
bajar del estrado en la ceremo-
nia de graduación de su uni-
versidad. Recordaba todo su
esfuerzo durante esos largos
cinco años. Sonreía, además,
por su contrato para como
redactor en la versión web del
periódico La Prensa, dirigido a
un público general y que bus-
caba volver a tener el mismo
protagonismo de hace unos
años. Sergio sabía que tendría
que “pagar piso” y que tendría
que rotar por varias secciones
del diario y hacer un poco de
todo.
Lo primero que le encomendó
su jefa, Rogelia Peña, sacada
posiblemente de alguna de las
páginas de la novela Tinta
Roja de Alberto Fuguet más
que de la película Todos los
hombres del presidente, a Ser-
gio, es tener una idea lo más
precisa posible de cuántas
mujeres en el Perú tienen com-
plicaciones durante el embara-
zo y el parto, el índice de mor-
talidad materna y sus principa-
les causas, las diferencias en el
ámbito rural y urbano, el tiem-
po en que se producen las
muertes maternas (durante el
embarazo, dentro de las prime-
ras 24 horas postparto, del
segundo al sétimo día postpar-
to y desde la segunda a sexta
semana postparto), buscar
alguna información con otro
país y darse una idea sobre el
porcentaje de mujeres que
tienen partos institucionales y
las razones por las cuales las
mujeres no van a atender a los
establecimientos de salud.
Sergio navegó dos días en la
Internet buscando publicacio-
nes con dicha información,
pero no pudo encontrarla. Por
ello, llamó a Sandra Baqueri-
zo, una amiga de la universi-
dad, que siempre sabía dónde
encontrar todo en la Internet.
Sergio, que seguía enamorado
de ella a pesar del tiempo
transcurrido y de que ya no se
veían mucho, vio la oportuni-
dad de volver a conversar con
ella. Sin embargo, al cabo de
un par de horas, ni Sandra
tenía muy claro la dirección
donde encontraría lo que el
requería. -Comienza con
www.inei.gob.pe o
www.minsa.gob.pe- le dijo.
En agradecimiento a Sergio
solo se le ocurrió poner una
foto de ellos en el tiempo de la
universidad en su muro de
Facebook junto a una frase del
escritor cubano Alejo Carpen-
tier “El periodismo es una
maravillosa escuela de vida”.
Caso: Investigar sobre salud materna
El origen de la palabra estadística
El Diccionario de la Real Aca-
demia señala que la palabra
estadística llegó al castellano
hacia 1765-1783 a partir del
alemán Statistik (1749), si bien
la palabra italiana statistica era
usada por lo menos desde
1633, aunque con el sentido de
‘ciencia del Estado’, tomada
del latín statisticum, con el
mismo significado.
Quien usó Statistik por prime-
ra vez fue el economista ale-
mán Gottfried Achenwall
(1719-1772) en su obra Com-
pendio de la constitución polí-
tica de los principales países y
pueblos europeos, a partir de
la cual se formaron el francés
statistique, el inglés statistics,
el portugués estatística y el
español estadística.
Tomado de http://www.elcastellano.org
Plantear y graficar funciones como rectas, parábolas, valor absoluto, etc.
Calcular el valor esperado y varianza para variables discretas en mi calculadora
Realizar integrales polinómicas, en la calculadora si ésta lo permite
Si la calculadora lo tiene, calcular probabilidades para la distribución normal
Usar mi calculadora
para cálculos sencillos
Usar funciones y plan-
tear fórmulas en Excel
Usar el asistente de
gráficos de Excel
6.
7. Estadística Aplicada a los Negocios UPC 2010 02 7
Notas importantes
Semana 1. Sesión 1
¿Cómo se evalúa
Estadística Aplicada a los Negocios?
Examen parcial ………………………………..
Examen final ………………………………..
Prácticas calificadas ………………………………..
Trabajo final ………………………………..
………………………………..
………………………………..
………………………………..
………………………………..
………………………………..
¿Cuándo son las prácticas calificadas?
………………………………………………………………..
………………………………………………………………..
………………………………………………………………..
¿Cuál es la bibliografía básica?
………………………………………………………………..
¿Quién es el coordinador del curso?
………………………………………………………………..
¿Cuáles son las reglas en el aula?
………………………………………………………………..
………………………………………………………………..
8. Estadística Aplicada a los Negocios UPC 2010 02 8
Notas importantes
Logro del curso
Aplica los conceptos y fundamentos de la Estadística Descriptiva y la Teoría de Probabilidad, a fin de
identificar y analizar críticamente situaciones reales, modelar y tomar decisiones adecuadas, siendo
conciente de la importancia de presentar la información de forma clara e imparcial.
¿Por qué estudiar Estadística en Administración?
Marketing
Ventas
Compras
Finanzas
Contabilidad
Recursos humanos
Calidad
Producción
Para la vida
9. Estadística Aplicada a los Negocios UPC 2010 02 9
Notas importantes
1.1. Definición de estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar, orga-
nizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Estadística descriptiva
Son métodos y técnicas de recolección, caracterización, resumen y presentación que permiten describir
apropiadamente las características de un conjunto de datos. Comprende el uso de gráficos, tablas, dia-
gramas y criterios para el análisis.
Inferencia estadística
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones sobre población basadas en el resultado de muestras. Estas conclusiones no son totalmente
válidas y tienen cierto margen de error.
Ejercicio 1
Fuente http://estadisticas.bcrp.gob.pe
¿Qué parte de la estadística nos dice cuál será el tipo de cambio el día de mañana?
………………………………………………………………………………...........................................
10. Estadística Aplicada a los Negocios UPC 2010 02 10
Notas importantes
1.2. Definiciones
Datos
Los datos son los hechos y los números que se recogen, analizan y resumen para su presentación en
interpretación.
Elementos, variables y observaciones
Elementos son las entidades acerca de las cuales se reúnen los datos.
Variable es una característica de interés de los elementos.
Observación es el conjunto de mediciones obtenido de un elemento particular.
Ejemplo 1
Un importador de historietas japonesas desea hacer una encuesta para
conocer mejor al público que compra regularmente este tipo de
publicaciones. En la tabla siguiente se muestra ocho observaciones de
dicha encuesta. Indique los elementos y las variables a medir.
Observación Sexo Edad Ocupación Distrito de residencia Género preferido Manga preferido
1 Masculino 18 Universitario San Borja Shōnen Kobato
2 Masculino 10 Escolar Lince Kodomo Hombre par
3 Masculino 32 Abogado San Borja Yaoi Junpei Kōsaka
4 Masculino 17 Universitario San Juan de Miraflores Shōnen Nyan Koi!
5 Femenino 18 Universitario Miraflores Josei Gozuken
6 Masculino 20 Universitario Lince Shōnen Jester El aventurero
7 Masculino 8 Escolar Pueblo Libre Kodomo Astroboy
8 Femenino 15 escolar San Miguel Josei Nodame Cantabile
Solución
Un elemento para esta investigación es cada persona que compran regularmente historietas japonesas
y las variables a medir son: sexo, edad, ocupación, distrito de residencia, género de historieta preferido
y manga preferido.
11. Estadística Aplicada a los Negocios UPC 2010 02 11
Notas importantes
Ejercicio 1
En una investigación, se quiere estimar el porcentaje actual de peruanos de 18 a 70 años que apoya la
renovación del Congreso por tercios. Indique un elemento y la variable a medir.
Elemento
Variable
Ejercicio 2
En una investigación, se quiere estimar el gasto promedio semanal en fotocopias de los alumnos de
pregrado en una universidad el año 2010. Indique un elemento y la variable a medir.
Elemento
Variable
Ejercicio 3
En una investigación, se quiere estimar el promedio diario de ventas de un supermercado durante los
últimos dos años. Indique un elemento y la variable a medir.
Elemento
Variable
Ejercicio 4
En una investigación, se quiere estimar el número promedio de personas que llegan en la primera hora
de atención de una farmacia en el año 2010. Indique un elemento y la variable a medir.
Elemento
Variable
12. Estadística Aplicada a los Negocios UPC 2010 02 12
Notas importantes
Escalas de medición de las variables
La escala de medición permite determinar la cantidad de información
que contienen los datos y el análisis estadístico más apropiado.
Nominal
Una variable está medida en escala nominal cuando los datos son
etiquetas que se emplean para definir un atributo del elemento.
Esta clasificación la propuso
en 1946 el psicólogo Stanley
Smith Stevens (1906 -1973).
Trabajó en Harvard.Ordinal
Una variable está medida en escala ordinal cuando los datos son etiquetas y el orden es significativo.
Se pueden ordenar, de tal manera que puedan expresar grados de la característica medida.
Intervalo
Una variable está medida en escala de intervalo si los datos tienen propiedades de datos ordinales y el
intervalo entre observaciones se expresa en términos de una unidad fija de medida.
Los datos de intervalo siempre son numéricos. En esta escala, el cero es relativo, es decir, no indica la
ausencia de la característica medida. Las diferencias entre las puntuaciones son importantes.
Razón
Una variable está medida en escala de razón si los datos tienen todas las propiedades de los datos de
intervalo y la división de los valores es significativa. El cero indica la ausencia de característica medi-
da.
Ejemplo 2
Nominal Ordinal Intervalo Razón
El género de las perso-
nas, el estado civil de
los empleados de una
empresa, las carreras
profesionales universita-
rias.
El orden de mérito de los
atletas en una competición,
el grado de instrucción de
los clientes de un banco, la
opinión de los alumnos
sobre su universidad.
Las escalas de tempera-
tura. Las temperaturas
en grados centígrados
0ºC, y 20ºC equivalen
a, en grados Fahrenheit,
32ºF, y 68ºF.
El sueldo de los
empleados de una
empresa, el tiem-
po en terminar un
examen.
Ejercicio 5
Indique la escala de medición de las siguientes variables
Variable Nominal Ordinal Intervalo Razón
Año de nacimiento
Código de un alumno(a) de la UPC
Tiempo de vida de una persona
Número de hermanos de una persona
13. Estadística Aplicada a los Negocios UPC 2010 02 13
Notas importantes
Tipos de variables según su naturaleza
Las variables se pueden clasificar en cualitativas o cuantitativas.
Variables cualitativas
Son las variables que pueden ser expresadas en escalas nominales u ordinales.
Variables cuantitativas
Son las variables que pueden ser medidas en escala de intervalo o de razón. A su vez, las variables
cuantitativas se pueden clasificar en discretas y continuas.
Variables cuantitativas discretas
Son las variables que tienen un número finito o infinito numerable de posibles valores; es decir, que en
un intervalo determinado, sólo pueden tomar ciertos valores.
Las siguientes son ejemplos de variables discretas: número de autos vendidos por una tienda en un día,
número de alumnos asistentes a las clases de un curso de estadística.
Variables cuantitativas continuas
Son las variables que tienen un número infinito no numerable de posibles valores; es decir, que en un
intervalo determinado, puede tomar cualquier valor.
Las siguientes son ejemplos de variables continuas: tiempo que demora un estudiante en realizar un
examen, peso de un estudiante.
A las variables discretas se las cuenta y a las continuas se las mide.
Ejemplo 3
Variables Tipo de variable Escala de medición
Marca de computadora personal que utiliza Cualitativa Nominal
Tiempo que usa la computadora personal por semana Cuantitativa continua Razón
Número de personas de la casa que usa la computadora personal Cuantitativa discreta Razón
Número de granos de arena en una gran playa Cuantitativa discreta Razón
Ejercicio 6
Indique el tipo de las siguientes variables y su escala de medición
Variable Tipo de variable Escala de medición
Nivel socioeconómico de una persona
Número de metros cuadrados de jardín de una casa
Número de bytes que puede almacenar una memoria USB
Cantidad de dinero gastado en un fin de semana
Altura de una persona en centímetros
14. Estadística Aplicada a los Negocios UPC 2010 02 14
Notas importantes
Población
Es el conjunto de todos los elementos de interés en determinado estudio.
La población es un conjunto de personas, objetos, conceptos, etc. de los cuales se sacan conclusio-
nes a partir de una o más características observables de naturaleza cualitativa o cuantitativa.
Muestra
Es un subconjunto de la población.
Una muestra será representativa si se parece a la población de la que proviene.
Ejemplo 4
La Secretaría Académica de una universidad está interesada en realizar un estudio sobre los motivos
por los cuales algunos alumnos del pregrado han decidido dar exámenes de recuperación ese ciclo. La
universidad cuenta con quince facultades y un total de 7500 alumnos, de los cuales 830 han decidido
rendir exámenes de recuperación ese ciclo. De la población se va a entrevistar a una muestra aleatoria
de 200 alumnos. Defina la población y la muestra
Solución
Población: Los 830 alumnos que han decidido dar exámenes de recuperación ese ciclo
Muestra: 200 alumnos que han decidido dar exámenes de recuperación ese ciclo.
Ejercicio 7
Se quiere hacer una investigación sobre el porcentaje de alumnos de la universidad que tienen celular.
Indique la población y la muestra.
Solución
Población: .................................................................................................................................
Muestra: ...................................................................................................................................
Ejercicio 8
PISA es el estudio internacional en educación de mayor escala del mundo y más de 60 países partici-
pan en él. Evalúa estudiantes de 15 años de edad que están cursando algún grado de secundaria en
comprensión lectora, matemática y ciencia. Defina la población del estudio para el caso peruano.
Solución
Población: ………………………………………………………………..……………………
Ejercicio 9
En una investigación se quiere determinar el promedio diario de pastillas para tratar los síntomas de la
gripe vendidas en una farmacia durante los meses de invierno. Indique la población y la muestra.
Población: .................................................................................................................................
Muestra: ...................................................................................................................................
15. Estadística Aplicada a los Negocios UPC 2010 02 15
Notas importantes
Parámetro
Es cualquier resumen de la población. Son ejemplos de parámetros los siguientes: la edad promedio de
todos los peruanos y la proporción de alumnos de la UPC que trabajan y estudian a la vez.
Estadístico
Es cualquier resumen de una muestra. Son ejemplos de estadísticos los siguientes: la edad promedio de
algunos peruanos elegidos al azar o el porcentaje muestral de personas que afirman teñirse el pelo
regularmente.
Ejercicio 10
Según los Censos Nacionales X de Población y V de Vivienda 2005 ejecutados por el INEI, el 50.06%
de los peruanos son mujeres, ¿este dato es un parámetro o un estadístico?
Ejercicio 11
El 19 de junio del 2010 el Instituto de Opinión Pública de la Universidad Católica realizó una encuesta
sobre intención de voto presidencial, la cual registró un 24% para Luis Castañeda, ¿este dato es un
parámetro o un estadístico?
Ejercicio 12
El siguiente gráfico muestra la evolución de la inflación desde el año 1980 al 2010. ¿El índice de pre-
cios al consumidor IPC que obtiene el INEI, es un parámetro o un estadístico?
16. Estadística Aplicada a los Negocios UPC 2010 02 16
Notas importantes
Ejercicio 13
Se realizó una investigación sobre la ocurrencia de síndrome de Down en niños peruanos durante el
año 2009. El síndrome de Down es un trastorno genético causado por la presencia de una copia extra
del cromosoma 21 (o una parte del mismo), en vez de los dos habituales. Indique solamente un posible
parámetro o estadístico de dicha investigación. Justifique por qué elige parámetro o estadístico.
Series de tiempo y datos transversales
Los datos de series de tiempo se coleccionan a lo largo de varios periodos de tiempo.
Los datos transversales se reúnen en un mismo periodo de tiempo.
Ejemplo 5
Gráfico comparativo de la clasificación de cuatro selecciones nacionales de fútbol según la FIFA.
Enero 2010
Estudios estadísticos
Los datos se obtienen mediante la realización de un estudio estadístico. A esos estudios se les clasifica
como experimentales u observacionales.
En un estudio experimental, se identifican las variables de interés, las cuales son controladas por
el investigador. Luego, se identifican otras variables que influyan en las variables de interés.
En un estudio observacional, no se trata de controlar las variables de interés, ni de influir sobre
ellas, por ejemplo, en una encuesta.
17. Estadística Aplicada a los Negocios UPC 2010 02 17
Notas importantes
Errores en la adquisición de datos
Un error en adquisición de datos se presenta cuando el valor obtenido de los datos no es igual al valor
real que se hubiera obtenido con un procedimiento correcto. Se debe comprobar la consistencia interna
de los datos. También se analiza la existencia de valores demasiado grandes o demasiado pequeños,
conocidos atípicos, que son datos candidatos a posibles errores.
Fuentes de datos
Fuentes existentes o de datos secundarios
Los datos se han compilado y están disponibles para el análisis estadístico.
Fuentes públicas: bases de datos de ministerios y de oficinas gubernamentales de estadística,
como por ejemplo.
o Portal del Estado Peruano www.peru.gob.pe/
o Instituto Nacional del Estadística e Informática www.inei.gob.pe
o Banco Central de Reserva del Perú www.bcrp.gob.pe/
o Ministerio de Salud del Perú www.minsa.gob.pe
o Ministerio de Trabajo www.mintra.org.pe
o Ministerio de Educación www.minedu.org.pe
o FAO. ONU para la Agricultura y Alimentación www.fao.org/corp/statistics/es/
o UNICEF. ONU para la Infancia www.unicef.org/spanish/
Fuentes privadas: bases de datos de las empresas, bases de datos que se compran a empresas de
estudios de mercado, bases de datos en Internet, como por ejemplo.
o Datum Perú www.datum.com.pe/
o Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe/
o Imasen www.imasenperu.com/
o Instituto de Opinión Pública PUCP www.pucp.edu.pe/iop/
o CPI www.cpi.com.pe/
o Gallup www.gallup.com
18. Estadística Aplicada a los Negocios UPC 2010 02 18
Notas importantes
Evaluación
Puede ver su resultado en el Aula virtual
1) Indique el tipo de las siguientes variables y su escala de medición (2 puntos)
Variable Tipo de variable Escala de medición
Número de DNI de una persona
Número de pares de zapatos de una persona
Número de metros de tela necesarios para hacer una blusa
Número de teléfono celular
2) Defina la población, muestra, elemento y variables si se desea determinar el promedio de la edad de las
mujeres peruanas que usan métodos anticonceptivos. (2 puntos)
Población
Muestra
Elemento
Variable
3) Indique si son verdaderas o falsas las siguientes afirmaciones (2 puntos)
Afirmación Verdadero Falso
El valor de un parámetro se puede conocer solamente si se realiza un censo
Los datos de series de tiempo se coleccionan a lo largo de varios periodos de tiempo
Variables cuantitativas discretas son las variables que sólo toman valores enteros
Variable es el conjunto de mediciones obtenido de un elemento particular
19. Estadística Aplicada a los Negocios UPC 2010 02 19
Notas importantes
Semana 1. Sesión 2
Ejercicio 14
Luego de una investigación en una empresa se tiene una base de datos, pero lo que nos piden es redac-
tar un informe que resume la información hallada.
Genero Funcion Edad Tiempo-emp Ing-pers Ing-tot No-prom Pos-prom Prom-gen No-capac Rech-trab Rel-Geren
Femenino Obrero 19 1 11400 11400 0 Improbable Peores 1 Muy probable Buenas
Masculino Profesional 31 5 210600 220600 2 No está seguro No influye 2 No está seguro Buenas
Masculino Profesional 34 8 193400 413400 1 Probable No influye 2 Improbable Buenas
Masculino Servicios 36 15 30800 30800 1 Improbable No influye 0 Muy probable Buenas
Masculino Obrero 44 4 9850 9850 0 Improbable No influye 1 Improbable Regulares
Masculino Obrero 44 10 9800 239800 0 Improbable No influye 1 Improbable Regulares
Masculino Técnico/ventas 31 5 40840 140840 0 Improbable Mejores 3 Muy probable Buenas
Femenino Profesional 37 8 93700 393700 1 No está seguro Mejores 2 No está seguro Buenas
Masculino Obrero 45 23 10150 10150 0 Improbable No influye 1 Improbable Regulares
Masculino Obrero 54 18 9050 9050 0 Muy improbable No influye 1 Muy improbable Regulares
Femenino Profesional 26 2 62200 72200 2 No está seguro No influye 2 No está seguro Buenas
Masculino Obrero 44 14 10200 160200 0 Probable No influye 0 Probable Regulares
Masculino Técnico/ventas 31 2 40335 40335 0 Muy improbable Mejores 2 Muy probable Buenas
Femenino Producción 28 10 30990 30990 1 Muy improbable No influye 1 Muy improbable Buenas
Femenino Obrero 23 5 9360 9360 1 Muy improbable Peores 1 Muy probable Buenas
Femenino Producción 38 20 33800 145000 0 Muy improbable No influye 1 Muy improbable Buenas
Masculino Servicios 35 10 29490 39000 0 Improbable No influye 2 Muy probable Muy buenas
Masculino Producción 38 9 35500 55000 1 Muy improbable No influye 2 Muy improbable Buenas
Masculino Técnico/ventas 32 2 40540 40540 0 Improbable Mejores 2 Muy probable Buenas
Masculino Servicios 36 18 27500 45000 1 Muy improbable No influye 1 Probable Buenas
Femenino Obrero 48 25 10200 210200 0 Muy improbable Peores 1 Muy probable Buenas
Masculino Obrero 45 20 9650 9650 0 Improbable No influye 1 Improbable Regulares
Femenino Técnico/ventas 22 2 44000 44000 0 No está seguro No influye 2 No está seguro Buenas
Masculino Técnico/ventas 32 6 48560 285000 1 Improbable Peores 2 Muy probable Buenas
Masculino Obrero 46 20 10300 10300 0 Muy improbable No influye 1 Muy probable Regulares
Masculino Profesional 28 1 108700 108700 3 Improbable Mejores 5 Improbable Buenas
Femenino Producción 27 5 30550 30550 1 Muy improbable Peores 2 Muy improbable Buenas
Masculino Producción 38 14 32300 32300 0 Muy improbable No influye 1 Muy improbable Buenas
Masculino Obrero 40 20 9130 9130 0 No está seguro No influye 0 Muy probable Regulares
Masculino Profesional 24 1 70000 70000 1 Probable No influye 3 Improbable Buenas
Masculino Obrero 56 30 9740 9740 0 Muy improbable No influye 1 Muy probable Regulares
Masculino Producción 37 19 31800 31800 2 Muy improbable No influye 1 Muy improbable Muy buenas
Masculino Obrero 48 28 9700 9700 0 No está seguro No influye 1 Muy probable Regulares
¿Qué podemos hacer para resumir esta información?
20. Estadística Aplicada a los Negocios UPC 2010 02 20
Notas importantes
1.3. Estadística descriptiva
Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan.
Ejemplo 6
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos el idioma o lengua con el que aprendió hablar, obteniéndose los siguien-
tes resultados
Idioma o lengua con que aprendió a hablar Número de personas Porcentaje por categoría Porcentaje acumulado
Castellano 21,713,165 84.13 84.13%
Quechua 3,360,331 13.02 97.15%
Aymará 443,248 1.72 98.87%
Otra lengua nativa 174,410 0.68 99.55%
Asháninka 67,724 0.26 99.81%
Es sordomudo 30,019 0.12 99.93%
Idioma extranjero 21,434 0.07 100.00%
Total 25,810,331 100.00
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Frecuencias absolutas, relativas y porcentuales
La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.
La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.
n
f
datosdenúmero
absolutafrecuencia
hrelativaFrecuencia i
i
La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.
Frecuencias acumuladas
La frecuencia acumulada absoluta (Fi) de una clase es la cantidad de elementos que pertenecen has-
ta esa clase.
La frecuencia acumulada relativa (Hi) de una clase es la proporción de elementos que pertenecen
hasta esa clase.
n
F
datosdenúmero
acumuladaabsolutafrecuencia
HacumuladarelativaFrecuencia i
i
La frecuencia acumulada porcentual (Pi) de una clase es la frecuencia acumulada relativa multipli-
cada por 100%.
21. Estadística Aplicada a los Negocios UPC 2010 02 21
Notas importantes
1.4. Resumen de datos cualitativos
Ejercicio 15
Se tomó una muestra de 80 personas y se les preguntó por la marca de cerveza más consumida en los
últimos tres meses. Los resultados se muestran en la siguiente tabla.
Construya la distribución de frecuencias de los datos.
Cusqueña Cristal Pilsen Pilsen Pilsen Cristal Cristal Cristal Cristal Cristal
Cristal Pilsen Cusqueña Cusqueña Cristal Cristal Cristal Cristal Cristal Cristal
Cristal Cristal Cristal Cristal Pilsen Cristal Otros Brahma Cristal Cristal
Brahma Brahma Cristal Cristal Brahma Cusqueña Cristal Pilsen Cristal Cristal
Cristal Pilsen Brahma Cristal Brahma Cristal Brahma Pilsen Cristal Pilsen
Cusqueña Cristal Cristal Cristal Cristal Cristal Cusqueña Cristal Cristal Cristal
Cristal Brahma Cristal Cristal Cristal Cristal Cristal Cristal Cristal Cristal
Cristal Cusqueña Cristal Otros Cristal Cristal Cristal Cristal Pilsen Cristal
22. Estadística Aplicada a los Negocios UPC 2010 02 22
Notas importantes
1.5. Gráficos
“Un gráfico puede valer más que mil palabras,
pero puede tomar muchas palabras para hacerlo”
John Wilder Tukey (1915-2000)
Gran estadístico del siglo XX, con gran influencia en la visualización de información
William Playfair (1759-1823), economista e ingeniero escocés es considerado el pionero de la estadís-
tica gráfica. Los principios de su trabajo fueron los siguientes:
El método gráfico es una forma de simplificar lo tedioso y lo complejo.
Las personas ocupadas necesitan ayuda visual.
Un gráfico es más accesible que una tabla.
El método gráfico ayuda al cerebro, ya que permite entender y memorizar mejor.
Wainer (1990) señala que entre la gente es muy común pensar que si un gráfico es bueno, éste deberá
ser totalmente comprensible sin ninguna ayuda adicional. Este pensamiento es limitante. Los gráficos
“buenos” los divide en dos categorías:
Un gráfico fuertemente bueno muestra todo lo que queremos conocer sólo con mirarlo.
Un gráfico débilmente bueno nos muestra lo que necesitamos conocer observándolo, una vez se-
pamos cómo mirarlo.
Una buena descripción puede transformar un gráfico débilmente bueno en uno fuertemente bueno.
Debemos siempre buscar esta transformación cuando sea posible. Una buena descripción informa al
lector y obliga al que produce el gráfico a pensar porqué y cómo está presentando el gráfico.
Una ventaja de los gráficos es que pueden mostrarnos cosas que de otra forma hubiese sido muy difícil
o imposible, es por ello que casi todo análisis estadístico comienza con gráficos.
Ejemplo 7
23. Estadística Aplicada a los Negocios UPC 2010 02 23
Notas importantes
Gráfico de barras
Es una forma de representar datos cualitativos que han resumido en una distribución de frecuencias,
frecuencias relativas o frecuencias porcentuales.
En uno de los ejes, se grafican las etiquetas de las clases. Para el otro eje, se puede usar una escala de
frecuencias, frecuencias relativas o de frecuencias porcentuales. Se traza una barra sobre cada indica-
dor de clase de una altura igual a la frecuencia correspondiente.
Las barras deben estar separadas para enfatizar el hecho de que cada clase es separada.
Diagrama circular
Cuando se utiliza el gráfico circular, también llamado pastel, cada sector circular representa el
valor específico de la variable.
Primero, se traza un círculo para representar todos los datos. Luego, se divide el círculo en partes.
El ángulo que le corresponde a cada parte se obtiene multiplicando 360º por la respectiva frecuen-
cia relativa.
Ejercicio 16
El siguiente gráfico muestra el número de viviendas afectadas en la provincia de Pisco por el
terremoto del 2007. Los datos fueron obtenidos del Censo de Damnificados del sismo del 15 de agosto
del 2007 realizado por el INEI. Complete adecuadamente el gráfico.
8,734
4,511
3,267
5,221
14,499
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
Viviendas
destruidas
Viviendas
muy
afectadas
Viviendas
afectadas
Viviendas
levemente
afectadas
Viviendas no
afectadas
24. Estadística Aplicada a los Negocios UPC 2010 02 24
Notas importantes
Ejercicio 17
En los Censos Nacionales 2005: X de Población y V de Vivienda del Perú se preguntó el combustible
que más usa para cocinar sus alimentos. Los resultados se muestran en la siguiente tabla.
Categorías fi hi Ángulo
Electricidad 68,110 0.0113
Gas 3,061,537 0.5057
Kerosene 391,349 0.0646
Carbón 131,861 0.0218
Leña 1,974,758 0.3262
Otro tipo de combustible 230,988 0.0382
No cocinan 195,078 0.0322
Total 6,053,681
Realice un diagrama circular con dichos datos.
Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores
pueden producir la mayoría de las consecuencias, lo que se podría resumir
como “pocos factores son vitales y muchos son triviales”. Por ejemplo, en
control de calidad, se puede mostrar que la mayoría de los defectos surgen de
un número pequeño de causas.
El nombre de gráfico de
Pareto lo propuso el Dr.
Joseph Juran, pionero
del movimiento de
calidad total, como un
homenaje al economis-
ta italiano Vilfredo
Pareto (1848-1923)
Los pasos para realizar un gráfico de Pareto son los siguientes:
Construya tabla de distribución de frecuencias, ordenando las categorías
en forma descendente respecto de la frecuencia.
La categoría Otros es colocada en la última posición. No importa cuán grande sea, porque está
compuesta de un grupo de categorías cuyas frecuencias son menores en relación con el valor de la
variable con frecuencia más pequeña.
Agregue a la tabla de distribución de frecuencias, una columna para la frecuencia acumulada
Dibuje dos ejes verticales y uno horizontal.
En el eje vertical izquierdo, marque este eje con una escala de 0% a 100%.
En el eje vertical derecho, marque una escala de 0 hasta el número total de observaciones.
En el eje horizontal: marque los espacios donde estarán dibujadas las barras para cada una de
las categorías, incluida la categoría Otros.
Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto).
25. Estadística Aplicada a los Negocios UPC 2010 02 25
Notas importantes
Ejemplo 8
El gerente de control de calidad de una fábrica que produce asientos especiales de fibra de vidrio,
quiere identificar los problemas más importantes que se presentan en la elaboración de estos, y poder
planear soluciones a dichos problemas de acuerdo a una estrategia basada en la prioridad del proble-
ma. Se extrae una muestra aleatoria de los problemas de calidad obteniendo los siguientes resultados:
Problema detectado Número de ocurrencias (fi)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Elabore el diagrama de Pareto.
Solución
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. No olvidar que la categoría
otros va al final. Luego se calcula las frecuencias relativas y las frecuencias relativas acumuladas.
Problema detectado fi hi Hi
Superficie rugosa 71 0.355 0.355
Medidas fuera de norma 50 0.250 0.605
Color inadecuado 28 0.140 0.745
Forma no simétrica 16 0.080 0.825
Desprendimiento de capa protectora 12 0.060 0.885
Bordes afilados 9 0.045 0.930
Otros 14 0.070 1.000
Se realiza el gráfico usando las frecuencias absolutas fi y las frecuencias relativas acumuladas Hi.
26. Estadística Aplicada a los Negocios UPC 2010 02 26
Notas importantes
Ejercicio 18
Se realizó un estudio de 50 casos, tomados al azar, de mujeres VIH positivas atendidas en el Consulto-
rio del Programa Contra Enfermedades de Transmisión Sexual y SIDA (PROCETSS) del Hospital
Nacional General Arzobispo Loayza en Lima, entre los meses de mayo de 1997 y junio de 1998. Se
registró seis ocupaciones distintas, 38 de ellas fueron amas de casa, seis eran vendedoras ambulantes,
dos eran empleadas domésticas, dos eran trabajadoras sexuales, una cuidaba personas de la tercera
edad y una se dedicaba a la limpieza de clínicas. Haga un diagrama de Pareto de los resultados.
27. Estadística Aplicada a los Negocios UPC 2010 02 27
Notas importantes
1.6. Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada.
Se usan para resumir de manera simultánea los datos para dos variables.
Ejercicio 19
En los Censos Nacionales 2007 ejecutados por el Instituto
Nacional de Estadística e Informática se preguntó a todos los
peruanos la religión que profesa, obteniéndose los siguientes
resultados
Religión que profesa
Sexo Católica Cristiana - Evangélica Otra Ninguna Total
Hombre 8,379,120 1,200,953 324,445 374,024 10,278,542
Mujer 8,577,602 1,405,102 354,846 234,410 10,571,960
Total 16,956,722 2,606,055 679,291 608,434 20,850,502
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Indique las variables usadas en la realización de esta tabla de doble entrada.
Rellene los espacios en blanco.
El número de cristianos evangélicos en el Perú es …………………
El número de peruanos que profesa una religión distinta a la católica es …………………
El ………….…….% de los peruanos profesa la religión católica.
El ………………..% de los hombres peruanos no profesa una religión.
El ………………..% de las peruanas no son cristianas-evangélicas ni católicas
El ……………….% de …………………………………………………………………….
28. Estadística Aplicada a los Negocios UPC 2010 02 28
Notas importantes
Gráfico de barras apiladas
Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada catego-
ría. El alto de cada barra es proporcional a la frecuencia de cada categoría.
Gráfico de barras apiladas al 100%
Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.
29. Estadística Aplicada a los Negocios UPC 2010 02 29
Notas importantes
Ejercicio 20
En los X Censos Nacionales de Población y V de Vivienda del año 2005 realizados en nuestro país se
preguntó por el tipo de alumbrado de la vivienda según área (urbana o rural). Los datos se muestran en
miles de viviendas
Tipo de alumbrado Área Urbana Área Rural
Electricidad 3,875 353
Kerosene (mechero / lamparín) 148 817
Vela 201 312
Otro 12 37
No tiene 17 9
Total 4,253 1,528
Elabore una gráfica de barras apiladas y otro de barras apiladas al 100% que permita ver la composi-
ción del tipo de alumbrado dentro de cada área.
30. Estadística Aplicada a los Negocios UPC 2010 02 30
Notas importantes
Evaluación
4) Indique si son verdaderas o falsas las siguientes afirmaciones (2 puntos)
Afirmación Verdadero Falso
Los cuadros de doble entrada usan exclusivamente variables ordinales o nominales
En un gráfico circular, el ángulo que le corresponde a cada parte se obtiene multiplicando
360º por la respectiva frecuencia absoluta.
La frecuencia relativa de una clase es la proporción de elementos que pertenecen a esa
clase.
En un gráfico de barras apiladas, el alto de cada barra es proporcional a la frecuencia de
cada categoría.
5) Encuentre todos los errores del siguiente gráfico, realizado a partir de los Censos Nacionales de
Población y Vivienda de los años 1993 y 2007 en el Perú. (2 puntos)
31. Estadística Aplicada a los Negocios UPC 2010 02 31
Notas importantes
Semana 2. Sesión 1
1.7. Resumen de datos cuantitativos
Distribución de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el nú-
mero de elementos (frecuencia) que la componen.
Gráfico de bastón
En este caso la variable se ubica en el eje de las abscisas y las frecuencias en el eje ordenado.
Ejercicio 21
Los siguientes datos muestran el número de veces que se han matriculados en el curso Estadística
Aplicada a los Negocios, los 32 alumnos de un horario del ciclo 2010 02.
2 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1
1 1 1 2 1 1 1 2 1 1 2 1 1 1 1 2
Construya la tabla de distribución de frecuencias de la variable número de veces matriculado en el
curso y su respectivo gráfico de bastones.
32. Estadística Aplicada a los Negocios UPC 2010 02 32
Notas importantes
Distribución de frecuencias de variables continuas
Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número de
elementos (frecuencia) que la componen.
Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos son
los siguientes:
Determinar la cantidad de clases
Determinar el ancho de cada clase
Determinar los límites de cada clase
Cantidad de clases
Se recomienda usar entre 5 y 20 clases
La regla de Sturges la
propuso Herbert Stur-
ges (1926). La fórmu-
la trata de que el his-
tograma resultante se
aproxime a la distri-
bución normal.
La idea es emplear suficientes clases para mostrar la variación de los
datos, pero no tantas que varias contendrían unos cuantos elementos.
Para determinar el número de clases se usa la regla de Sturges. Si la
estimación tiene decimales, se toma el entero más próximo.
o Regla de Sturges: k = 1 + 3,322 log n
Amplitud de cada clase
Se usa el mismo ancho para todas las clases.
Se calcula de la siguiente manera:
k
rango
Amplitud
La amplitud se redondea al número inmediato superior de acuerdo con la cantidad de decimales
que tienen los datos o según la precisión con que se desea trabajar.
Límites de cada clase
Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo
a una.
El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase. El límite
superior de clase es el valor máximo posible de los datos que se asigna a la clase.
La marca de clase es el punto medio de los límites de cada intervalo.
Recordar lo siguiente:
La regla de Sturges no se usa para hallar la cantidad de datos. Es decir,
- si se tiene el número de datos n, entonces se puede calcular k,
- si se tiene determinado k, no se puede calcular n con la regla de Sturges.
33. Estadística Aplicada a los Negocios UPC 2010 02 33
Notas importantes
Ejemplo 9
El jefe de la Oficina de Rentas de la Municipalidad de San Isidro ha realizado un estudio sobre los
impuestos que pagan los vecinos del distrito. La tabla muestra los pagos de impuestos, en nuevos so-
les, en el 2010 de 48 viviendas elegidas al azar.
145.1 216.3 252.5 303.6 196.9 234.8 265.2 317.2 206.5 242.9 289.1 331.7
151.0 225.9 257.1 305.8 202.6 238.4 271.0 320.2 208.0 244.0 291.0 344.6
159.0 227.1 259.2 315.4 204.9 239.9 286.7 324.8 208.0 247.7 291.9 346.7
195.6 231.2 262.5 315.5 206.1 241.1 288.1 331.1 209.3 249.5 294.5 351.1
Elabore la tabla de frecuencias para la variable pago por impuestos municipales año 2010.
Solución
El rango r se calcula con:
max min 351.1 145.1 206r x x
Siguiendo la regla de Sturges, el número de intervalos es:
7585.6)48(log322.31log322.31 1010 nk
El ancho del intervalo es:
5.29429.29
7
206
k
r
w (redondeo por exceso a un decimal)
Distribución de frecuencias del pago de impuestos municipales del año 2009
Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1;351,6] 336,85 6 0,1250 48 1,0000
Total 48 1.0000
34. Estadística Aplicada a los Negocios UPC 2010 02 34
Notas importantes
Ejercicio 22
Haga la tabla de distribución de frecuencias de los siguientes datos:
9.7 9.7 10.2 11.3 11.2 11.7 7.8 9.8 11.1 8.9 9.3 8.3 8.2 9.0 9.2
7.9 10.4 9.6 10.1 9.6 9.7 9.6 11.3 9.9 9.8 9.5 12.0 10.9 12.4 9.3
14.7 10.4 10.5 11.9 12.9 9.9 9.5 10.7 9.6 10.8 8.6 9.2 8.5 9.6 10.0
Ejercicio 23
La siguiente tabla corresponde a la distribución de frecuencias de los salarios del último mes de los
empleados de una empresa. Complete la tabla.
Clase Marca de
clase xi
Frecuencia
absoluta fi
Frecuencia
relativa hi
Frecuencia absoluta
acumulada Fi
Frecuencia relativa
acumulada Hi
450 - 8
- 750 10
- 0,3 33
- 12
-
35. Estadística Aplicada a los Negocios UPC 2010 02 35
Notas importantes
Ejemplo 10
La empresa de investigación de mercado “Eléctrico” lleva a cabo un estudio para obtener indicadores
que le permitan inferir respecto al consumo de energía eléctrica mensual (medido en kilovatios, re-
dondeado al entero mas próximo) de las familias en los departamentos de Arequipa y Tacna. Dicho
estudio, sustentado en el análisis de muestras aleatorias tomadas en ambos departamentos, arrojó los
siguientes resultados:
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
Arequipa
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
Tacna
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636
Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de distribución
de frecuencias que permita comparar los datos.
Solución
Hallar el mínimo de todos los datos (217) y el máximo de todos los datos (666) de ambas ciuda-
des, y usarlos para calcular el rango.
Calcular el número de categorías, el número de datos es el máximo número de datos (40) entre
ambas ciudades. Tener en cuenta que no es la suma de ambos tamaños muestrales.
Siguiendo la regla de Sturges, el número de intervalos es:
6322.6)40(log322.31log322.31 1010 nk (redondeo simple)
Consumo de energía Marca de clase
217; 292 254,5
292; 367 329,5
367; 442 404,5
442; 517 479,5
517; 592 554,5
592; 667 629,5
36. Estadística Aplicada a los Negocios UPC 2010 02 36
Notas importantes
Ejercicio 24
Un jefe de recursos humanos está interesado en analizar el impacto en los empleados al suprimir las
horas extras de trabajo pagadas que anteriormente se aplicaba. Con este fin se extraen dos muestras
aleatorias. La primera de 80 empleados tomando de los datos históricos de un día al azar con el siste-
ma anterior y la segunda de 60 empleados tomando los datos de un día al azar con el sistema vigente.
Se muestran las horas de trabajo por día por empleado.
Horas diarias trabajadas con horas extras pagadas Horas trabajadas sin horas extras pagadas
7,7 8,9 9,8 10,8 11,2 11,8 12,3 13,2 7,4 8,2 8,5 8,9 9,7 10,8
7,9 8,9 10,1 10,8 11,3 11,9 12,4 13,4 7,7 8,2 8,5 8,9 9,8 11,0
8,0 9,0 10,2 10,9 11,4 12,0 12,4 13,5 8,0 8,2 8,5 8,9 9,9 11,2
8,0 9,1 10,2 11,0 11,4 12,0 12,4 13,6 8,0 8,3 8,6 9,0 9,9 11,6
8,1 9,1 10,3 11,0 11,5 12,1 12,5 13,7 8,0 8,3 8,6 9,1 10,0 11,7
8,1 9,3 10,4 11,0 11,5 12,1 12,5 13,9 8,1 8,3 8,7 9,1 10,0 12,2
8,2 9,4 10,6 11,1 11,5 12,1 12,6 14,6 8,1 8,4 8,7 9,3 10,3 12,5
8,5 9,5 10,6 11,1 11,6 12,2 12,7 14,9 8,2 8,4 8,7 9,4 10,5 12,9
8,6 9,7 10,7 11,1 11,7 12,2 12,9 15,0 8,2 8,4 8,8 9,6 10,5 13,3
8,8 9,7 10,8 11,2 11,7 12,3 13,1 15,8 8,2 8,4 8,8 9,7 10,6 14,5
Determine las clases para agrupar y comparar los datos de ambas muestras.
37. Estadística Aplicada a los Negocios UPC 2010 02 37
Notas importantes
Evaluación
Responda a las siguientes preguntas.
6) ¿Por qué se usan los gráficos de bastón para variables discretas en vez de un gráfico de barras?
(1 punto)
7) ¿Por qué si en un ejercicio nos dan la cantidad de intervalos, no se usa la regla de Sturges?
(1 punto)
8) ¿Por qué se redondea por exceso la amplitud en las distribuciones de frecuencias de datos conti-
nuos?
(1 punto)
38. Estadística Aplicada a los Negocios UPC 2010 02 38
Notas importantes
Semana 2. Sesión 2
1.8. Gráficos de datos cuantitativos
Histograma
Este resumen gráfico se prepara con una distribución de frecuencias, frecuencias relativas o fre-
cuencias porcentuales.
Se traza colocando la variable sobre el eje horizontal y las frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo, cuya base es el intervalo de clase
sobre el eje horizontal y cuya altura es la frecuencia correspondiente.
Los rectángulos adyacentes se tocan entre sí.
Polígono de frecuencias
Es la representación por medio de una figura poligonal cerrada.
Se obtiene uniendo con segmentos de recta los puntos de intersección de las marcas de clase con
las frecuencias.
Los polígonos de frecuencias se cierran creando dos intervalos ficticios, uno antes del primer in-
tervalo y uno después del último.
Si los intervalos creados toman valores que pueden ser reales, igual se crea el intervalo, como,
ejemplo, tiempos negativos.
39. Estadística Aplicada a los Negocios UPC 2010 02 39
Notas importantes
Ejercicio 25
Grafique el histograma y el polígono de frecuencias de los siguientes datos.
8.2 8.4 9.0 9.3 9.6 9.7 9.9 10.5 11.1 11.7
7.9 8.5 9.2 9.4 9.6 9.7 10.0 10.7 11.2 11.9
8.2 8.6 9.2 9.5 9.6 9.8 10.0 10.8 11.3 12.0
8.3 8.7 9.3 9.5 9.6 9.8 10.1 10.9 11.3 12.2
8.3 8.9 9.3 9.6 9.7 9.9 10.2 10.9 11.7 11.8
40. Estadística Aplicada a los Negocios UPC 2010 02 40
Notas importantes
Ejercicio 26
En el año 2008, el Departamento de Calidad Educativa de una universidad le preguntó a una muestra
de estudiantes universitarios por el porcentaje de su tiempo fuera de clases que dedicaban a navegar
por Internet para buscar información para sus cursos. El gráfico muestra el polígono de frecuencias de
dicha información.
Polígono de frecuencias del porcentaje del tiempo fuera de clases
conectado a Internet para buscar información para sus cursos
1.25
2.50
5.00
7.50
11.50
21.00
36.00
11.50
2.50
1.25
0
5
10
15
20
25
30
35
40
5 15 25 35 45 55 65 75 85 95
Fuente: Departamento de Calidad Educativa 2008
Porcentaje de tiempo fuera de clases conectado a Internet para buscar información para cursos
Porcentajedealumnos
Polígono de frecuencias del porcentaje del tiempo fuera de clases
conectado a Internet para buscar información para sus cursos
1.25
2.50
5.00
7.50
11.50
21.00
36.00
11.50
2.50
1.25
0
5
10
15
20
25
30
35
40
5 15 25 35 45 55 65 75 85 95
Fuente: Departamento de Calidad Educativa 2008
Porcentaje de tiempo fuera de clases conectado a Internet para buscar información para cursos
Porcentajedealumnos
Calcule el porcentaje de alumnos que dedican, más del 30% de su tiempo fuera de clases a navegar en
Internet para buscar información para sus cursos.
41. Estadística Aplicada a los Negocios UPC 2010 02 41
Notas importantes
Distribuciones acumuladas
La distribución de frecuencias acumuladas muestra la cantidad de elementos con valores menores o
iguales al límite superior de clase para cada clase.
Ojiva
Es la gráfica de una distribución acumulada de frecuencias.
Se obtiene uniendo con segmentos de recta los puntos de intersección del límite superior de cada
intervalo y la frecuencia acumulada respectiva.
Con la ojiva se puede estimar fácilmente el número o porcentaje de observaciones que correspon-
den a un intervalo determinado.
Ojiva del tiempo en resolver un examen
0
30
40
72
80
100
0
10
20
30
40
50
60
70
80
90
100
0 20 40 60 80 1
Tiempo (minutos)
Fi
00
Ejercicio 27
Haga la ojiva de frecuencias relativas del ejercicio 24.
42. Estadística Aplicada a los Negocios UPC 2010 02 42
Notas importantes
Recomendaciones sobre la presentación de gráficos (diagramas)
Descripción del diagrama
El título del diagrama siempre debe ser indicado.
En los ejes, siempre se debe indicar explícitamente las variables que se está representando y las
respectivas unidades.
Las fuentes de donde se obtuvieron los datos que permitieron su construcción, así como quienes o
qué entidad elaboró el diagrama y cualquier otra información se debe indicar siempre que sea re-
levante.
Eliminación de ruido
Los excesivos adornos y la inclusión de figuras, muchas veces, en lugar de aclarar más los dia-
gramas, terminan confundiendo o dificultando su rápida comprensión.
El uso de algunas figuras en lugar de barras o columnas puede distorsionar visualmente la real
proporción de las magnitudes que se están representando.
Elección de la base de comparación
Si se va a representar gráficamente los datos de solo una muestra, el mismo diagrama sirve para
representar las frecuencias absolutas y relativas.
Si se va a comparar el comportamiento de una variable en dos o más poblaciones distintas pero
solo se tiene muestras representativas de las poblaciones, entonces es conveniente usar la frecuen-
cia relativa.
Si se va a comparar el comportamiento de una variable en dos o más poblaciones y se tiene los
datos de las poblaciones, entonces se puede realizar la comparación por separado de las frecuen-
cias absolutas y de las relativas.
Si bien es totalmente factible comparar gráficamente dos o más series de datos que han sido agru-
pados en intervalos distintos en amplitud y límites, es preferible para facilitar la comparación que
todas las serie de datos utilicen los mismos intervalos.
Uso de adecuada escala de los ejes
La escala utilizada en los ejes debe mantenerse. El cambio de proporciones distorsiona el propósi-
to de usar diagramas, el cual consiste en ver rápidamente la proporción con que se está distribu-
yendo la variable.
Si se ha utilizado una escala especial en alguno de los ejes del diagrama, por ejemplo, escala loga-
rítmica, esta se debe indicar.
Debe hacer que los valores de la variable abarquen adecuadamente la longitud de cada eje.
Uso del punto inicial del eje vertical.
El punto de inicio del eje vertical debe empezar con un cero para no distorsionar la impresión vi-
sual respecto de la magnitud.
El cambio de punto de inicio distinto de cero debe estar completamente justificado.
43. Estadística Aplicada a los Negocios UPC 2010 02 43
Notas importantes
Evaluación
9) Indique si son verdaderas o falsas las siguientes afirmaciones (1.5 puntos)
Afirmación Verdadero Falso
Para graficar las ojivas se usan las marcas de clase
Con la ojiva se puede estimar el porcentaje de observaciones que corresponde a un
intervalo determinado
Para el polígono de frecuencias solamente se usa las frecuencias absolutas
10) Se ha tomado un examen y se registró el tiempo empleado en terminarlo. Indique si son verdade-
ras o falsas las siguientes afirmaciones con respecto al gráfico siguiente. (3 puntos)
Ojiva del tiempo en resolver un examen
0
30
40
72
80
100
0
10
20
30
40
50
60
70
80
90
100
0 20 40 60 80 1
Tiempo (minutos)
Fi
00
Afirmación Verdadero Falso
El número de personas que tarda 60 minutos o menos es 72
El número de personas que tarda más de 60 minutos es 40
El número de personas que tarda más de 20 minutos pero menos o igual a 80 minutos es 50
El porcentaje de personas que tarda más de 40 minutos es 60%
El porcentaje de personas que tarda 30 minutos o menos es 20%
El porcentaje de personas que tarda 20 minutos es 30%
44.
45. Logro de la unidad
Contenido
Debo saber
Sergio llevaba menos de
treinta días en el diario
cuando le solicitaron una
investigación sobre el uso de
anticonceptivos entre
universitarios.
La Prensa quería sacar una
edición especial sobre la
sexualidad entre
universitarios y quería tener
información nueva y
exclusiva sobre dicho tema.
Sergio se llenó de angustia
cuando Rogelia, su jefa, le
explicó lo que tenía que
hacer, debía trabajar en un
grupo que hiciera una
primera versión de una
encuesta que luego sería
realizada por una empresa de
investigación de mercados.
Sergio comenzó a buscar
ideas para las preguntas de
su encuesta. Por lo menos,
debía preguntar por la edad,
los estudios, el distrito de
residencia, el conocimiento
de los métodos
anticonceptivos por parte de
los universitarios y su uso
¿eso se podía preguntar?
Pasó toda la noche
escribiendo preguntas.
Estaba emocionado, pero a la
vez tenía miedo por la
importancia de la
investigación. No podía
dormir. Ya en la madrugada,
se dio cuenta que quería
preguntar demasiado y que
alguna de sus preguntas eran
muy complicadas.
A la mañana siguiente, con
el pretexto de hacer una
prueba piloto, le envío a
Sandra, por correo, una
encuesta y le copió una frase
del periodista y corresponsal
de guerra Jack Fuller,
ganador del premio Pulitzer
"Si te equivocas en las cosas
pequeñas, los lectores no
confiarán en ti para las
cosas grandes".
Sandra sonrió al leer el
correo. Contestó la encuesta,
le sugirió cambios en
algunas preguntas y le envió
uno de sus acostumbrados
acertijos: “Una mujer
extrañadamente maquillada
ingresa a un bar y exige que
le den un vaso con agua. El
barman saca una gran
pistola y le apunta a la
cabeza. La mujer agradece y
se va”. Sergio sonrió, pues
ya sabía lo que Sandra le
había querido decir.
Caso: Primero debo acabar mi carrera
¿Quién inventó la varianza?
Ronald Fisher (1890-1962) fue
un brillante estadístico inglés.
Publicó alrededor de 300 tra-
bajos y siete libros, en los
cuales desarrolló muchos de
los conceptos de la estadística:
la importancia de la aleatoriza-
ción, la varianza, el análisis de
varianza, la distinción entre
estadística (medida de mues-
tra) y parámetro (medida de
población), la hipótesis nula,
los niveles de significación, y
las ideas fundamentales del
diseño de investigación. De
temperamento difícil, se vio
involucrado en profundas ene-
mistades. Se dice de él que
cuando le hablaban en broma,
él contestaba en serio; cuando
los demás estaban serios, en-
tonces él bromeaba.
Tomado de http://
www.psicologíacientifica.com
Medidas de tendencia
central
Percentiles
Medidas de variabili-
dad
Medidas de asimetría
Diagramas de caja
Utiliza rigurosamente
las medidas de resumen
de datos, reconoce su
importancia en el
análisis del
comportamiento de los
datos y es conciente de
sus implicancias.
Unidad2
Medidas
descriptivas
Calcular la media y la
desviación estándar
para datos simples y
agrupados en mi calcu-
ladora
Usar funciones y plan-
tear fórmulas en Excel
46.
47. Estadística Aplicada a los Negocios UPC 2010 02 47
Notas importantes
Semana 3. Sesión 1
Datos simples y datos agrupados
Se denomina datos simples (datos no agrupados) a los valores que no están agrupados en distribu-
ciones de frecuencia, mientras que son datos agrupados aquellos que si lo están.
Si se tienen datos simples no se construye la distribución de frecuencias para calcular la media, la
mediana o cualquier estadístico, se prefiere el cálculo con los datos simples.
Ejemplo de datos simples
18.5 10.6 14.5 17.2 12.8 13.6 11.6 11.3 13.0 13.5 10.8 13.9 14.2 15.3 14.3 14.3 14.3 17.7 14.8 14.6
18.3 11.8 16.1 16.8 18.8 14.8 14.0 16.4 14.2 16.5 12.1 13.3 12.0 14.3 14.9 15.1 14.4 19.4 11.5 13.5
Ejemplo de datos agrupados
Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1;351,6] 336,85 6 0,1250 48 1,0000
Total 48 1.0000
Ejercicio 28
Luego de una investigación se tiene muchos datos, con ellos se puede realizar algunos gráficos y ta-
blas de distribución de frecuencias. Pero ¿cómo se puede hacer para resumir la información en un nú-
mero?
48. Estadística Aplicada a los Negocios UPC 2010 02 48
Notas importantes
2.2. Medidas de tendencia central
Las medidas de localización o de tendencia central se refieren al valor central que representa a los
datos de una determinada variable.
Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de di-
chos valores dividida entre el número de valores.
La fórmula para la media poblacional es
N
x
N
i
i
1
La fórmula para la media muestral de datos no agrupados es
1
n
i
i
x
x
n
La fórmula para la media muestral de datos agrupados es
k
i
ii
k
i
ii
hx
n
fx
x
1
1
La fórmula para la media muestral de datos agrupados por intervalos es
k
i
ii
k
i
ii
hx
n
fx
x
1
1
donde xi : dato (datos no agrupados) o marca de clase ix (datos agrupados)
fi : frecuencia de cada clase
N : tamaño de la población
n : tamaño de la muestra
49. Estadística Aplicada a los Negocios UPC 2010 02 49
Notas importantes
Ejercicio 29
Los datos siguientes corresponden a las estaturas (en metros) de hombres peruanos de 18 años. Calcule
la estatura promedio.
1.78 1.65 1.74 1.65 1.80 1.52 1.74 1.56 1.65 1.62
Ejercicio 30
Los datos siguientes corresponden a las estaturas (en metros) de hombres peruanos de 18 años. Calcule
la estatura promedio.
Estatura fi
1.60 3
1.63 12
1.66 65
1.70 48
1.75 5
Ejercicio 31
Los datos siguientes corresponden a las estaturas (en metros) de hombres peruanos de 18 años. Com-
plete la distribución de frecuencias y calcule la estatura promedio.
Estatura (en intervalos) Marca de clase fi hi Fi Hi
150 , 0,48
, 166 0,32
, 0,95
, 200
50. Estadística Aplicada a los Negocios UPC 2010 02 50
Notas importantes
Características de la media
Se puede calcular para datos medidos en escala de intervalo o razón.
El valor de la media es sensible a los valores extremos, por lo que la presencia de valores inusua-
les la distorsionan.
El cálculo de la media es sencillo y fácil de entender e interpretar.
Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces,
la media de los n valores yi es:
y ax b
Ejercicio 32
En una tienda el precio promedio de los jeans es de 74 nuevos soles, se aumenta 8% a todos los pre-
cios y, además, se sube 4 nuevos soles a cada precio, calcule el nuevo precio promedio de los jeans.
Ejercicio 33
En una tienda el precio promedio de los jeans es de 74 nuevos soles, si se hace una oferta y se rebaja el
8% de todos los precios, calcule el nuevo precio promedio de los jeans.
Ejercicio 34
En una tienda el precio promedio de los jeans es de 74 nuevos soles, si se hace una oferta y se rebaja 8
nuevos soles a todos los precios, calcule el nuevo precio promedio de los jeans.
51. Estadística Aplicada a los Negocios UPC 2010 02 51
Notas importantes
Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
El 50% de las observaciones son menores o igual a la mediana.
Ejercicio 35
Según un estudio, en mujeres, del Centro Peruano de Estudios Sociales CEPES (2000), en Lima la
mediana de la edad a la primera unión (vida conyugal) es de 23.6 años, mientras que en Loreto es de
18 años. Indique lo que significa esta aseveración.
Ejercicio 36
Grupo A
1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83
Grupo B
1.56 1.61 1.62 1.63 1.63 1.64 1.64 1.66 1.70 1.70 1.73 1.73 1.77 1.83
En cada grupo se muestra la estatura de cada jugador. Indique el valor de la mediana de la estatura en
cada grupo.
52. Estadística Aplicada a los Negocios UPC 2010 02 52
Notas importantes
Características de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
El valor de la mediana depende del número de datos observados.
La mediana es un estadístico que no se ve afectado por valores extremos. Por eso se le utiliza
cuando hay datos inusuales o el polígono de frecuencias no es simétrico.
Mediana de datos no agrupados
Ordene los datos de manera ascendente.
Calcule la posición i de la mediana, usando la siguiente fórmula: i = 0,5n
donde n es la cantidad de observaciones
o Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posición de la
mediana
o Si i es entero, la mediana es el promedio de los valores de los datos ubicados en los lugares i e
i+1
Ejercicio 37
Los tiempos, en minutos, que se tardan 17 alumnos en contestar una pregunta de un examen se regis-
tran en la siguiente tabla.
Hombres 8 12 17 25 18 12 24 15 12 18
Mujeres 15 10 14 8 14 12 18
Calcule la mediana del tiempo por cada sexo e indique el grupo con mayor mediana.
53. Estadística Aplicada a los Negocios UPC 2010 02 53
Notas importantes
Mediana de datos agrupados en intervalos
Identificamos primero la clase en la que se encuentra la mediana. El valor se determina por la si-
guiente expresión:
1
2
i
i
i F
n
f
w
LMe
donde:
Li: límite inferior de la clase de la mediana
fi: frecuencia de la clase de la mediana
Fi-1: frecuencia acumulada de la clase que precede a la clase de la mediana
w: amplitud de clase
n: número de datos
Es equivalente la fórmula
11
2
1
2
i
i
ii
i
i H
h
w
LF
n
f
w
LMe
Ejercicio 38
En una gran ciudad, se tomó una muestra aleatoria y se les preguntó por su ingreso mensual, en dóla-
res, obteniéndose los siguientes resultados.
Ingresos (en intervalos) Marca de clase fi hi Fi Hi
30 0,0480
175 , 225 200 45 95 0,1827
225 , 275 250 190 405 0,7788
275 , 325 300 140 470 0,9038
275 , 325 130
325 , 450 425 520 1,0000
Complete la tabla de distribución de frecuencias y calcule la mediana del ingreso
54. Estadística Aplicada a los Negocios UPC 2010 02 54
Notas importantes
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.
Justin Bieber claims Lady Gaga's YouTube throne
LOS ANGELES | Fri Jul 16, 2010 6:24pm
(Reuters) - Teen sensation Justin Bieber has knocked Lady
Gaga off her reign as holder of the most-viewed video on You-
Tube.
Bieber, 16, who was discovered on YouTube, racked up more than 246
million views of his music video "Baby" on Friday, pushing Lady Gaga's
"Bad Romance" into second place with 245.6 million.
The Canadian singer, currently on tour in the United States to promote his
hit album "My World 2.0", thanked his fans in a Twitter message, but
added that he thinks Lady Gaga is "an incredible artist who (I) have great
respect 4. and her vid is incredible.
"So it doesnt matter who has more views what matters is that we have
incredible fans that support us...that im sure we are both greatful 4," he
continued.
Bieber signed a record deal at age 14 after posting his own videos on YouTube and now causes mob scenes of
hysterical girls wherever he goes.
Lady Gaga, 24, is in the middle of her "Monster Ball" tour and recently became the first living person to have more
than 10 million fans on social networking site Facebook.
Moda de datos no agrupados
Agrupe los datos de acuerdo a sus frecuencias, el dato con mayor frecuencia es la moda.
Ejercicio 39
Calcule la moda de los siguientes datos:
4 5 4 4 2 2 5 4 5 5 5 5 2 4 5 4 2 2 4 4
55. Estadística Aplicada a los Negocios UPC 2010 02 55
Notas importantes
Características de la moda
La moda se puede calcular para cualquier escala de medición.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
modas (multimodal). Algunas series de datos no tienen moda.
Moda de datos agrupados en intervalos
Identifique la clase con mayor frecuencia (clase modal).
Obtenga el valor de la moda mediante la expresión:
w
dd
d
LMo mo
21
1
donde:
Lmo : límite inferior de la clase modal
d1 : diferencia entre las frecuencias de las clases modal y precedente
d2 : diferencia entre las frecuencias de las clases modal y siguiente
w : amplitud de clase
Ejercicio 40
En una empresa se toma un examen de conocimientos sobre los procesos administrativos. Los resulta-
dos se muestran en la siguiente tabla:
Puntaje (en intervalos) Marca de clase fi hi Fi Hi
, 25 10 0.0667 10 0.0667
, 25 0.1667 35 0.2333
, 75 0.5000 110 0.7333
, 15 0.1000 125 0.8333
, 14 0.0933 139 0.9267
, 75 11 0.0733 150 1.0000
Calcular la moda del puntaje
56. Estadística Aplicada a los Negocios UPC 2010 02 56
Notas importantes
Ejercicio 41
La ojiva de los ingresos mensuales, en nuevos soles, de los trabajadores de una empresa se muestran
en la siguiente gráfica:
Ojiva de ingresos
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 11000
Ingresos
Hi
Calcule la media, mediana y moda de los ingresos
57. Estadística Aplicada a los Negocios UPC 2010 02 57
Notas importantes
Evaluación
11) Complete el siguiente texto: “La mediana de un conjunto de datos ordenados es el valor que divide
en dos partes a dicho conjunto. El …………………………………………….. son menores o igual
a la mediana.” (1 punto)
12) Complete el siguiente texto: “Usar la mediana como medida de tendencia central es preferible a usar
la media cuando………………………………………………” (1 punto)
13) Indique si son verdaderas o falsas las siguientes afirmaciones (2 puntos)
Afirmación Verdadero Falso
La moda se puede calcular en variables medidas en todas las escalas de medición
La media es un valor que siempre está entre el mínimo valor y el máximo valor de los
datos
Si se tienen datos simples se construye la distribución de frecuencias para calcular la
media, la mediana o moda.
La media se puede calcular en variables medidas en escala ordinal, intervalo y de razón
Semana 3. Sesión 2
Ejercicios para la práctica calificada 1
Fórmulas para la práctica calificada 1
n
f
hrelativaFrecuencia i
i
n
F
HacumuladarelativaFrecuencia i
i
Regla de Sturges: k = 1 + 3,322 log n
58. Estadística Aplicada a los Negocios UPC 2010 02 58
Notas importantes
Semana 4. Sesión 1
Media ponderada
También llamada media pesada. Permite calcular el valor medio considerando la importancia o peso
de cada valor sobre el total.
1
1
n
i i
i
ww n
i
i
x w
x
w
donde:
xi: Observación individual.
wi: Peso asignado a cada observación.
Ejercicio 42
Las notas de un alumno de Estadística Aplicada a los Negocios son:
PC1 PC2 PC3 PC4 Parcial Final Trabajo
12 8 15 17 7 16 13
Si el peso de cada práctica es 7.5% de la nota final, de cada examen 25% y del trabajo es 20% ¿cuál es
el promedio final del alumno?
59. Estadística Aplicada a los Negocios UPC 2010 02 59
Notas importantes
2.3. Cuantiles
En la foto aparece el fotógrafo puneño Martín Chambi (1891-1973) junto a un indígena muy alto, a quien
encontró en uno de sus viajes. La estatura del indígena seguramente fue mayor al percentil 99 de la
estatura de los campesinos de su región, Paruro en Cusco. Chambi es considerado una de las grandes
figuras de la fotografía mundial.
2.4. Percentiles
El percentil k-ésimo Pk es un valor tal que por lo menos k por ciento de las observaciones son me-
nores o iguales que este valor.
Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.
El valor del percentil no se ve afectado por valores extremos.
Ejercicio 43
Calcule e interprete el percentil 3 y el percentil 50 del peso para niños de un año según el gráfico.
60. Estadística Aplicada a los Negocios UPC 2010 02 60
Notas importantes
Percentil de datos no agrupados (simples)
Ordene los datos de manera ascendente.
Calcule la posición i del percentil
100
k
i n
donde: k el es percentil y n es la cantidad de observaciones
o Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posición
del k-ésimo percentil.
o Si i es entero, el k-ésimo percentil es el promedio de los valores de los datos ubicados en
los lugares i e i+1.
Ejercicio 44
Dados los siguientes datos, calcule la el percentil 30 y el percentil 75
1 2 5 4 6 25 8 3 1 5 3 5 6 4 3 5
Ejercicio 45
Calcule el percentil 75 de los siguientes datos.
xi fi Fi
1 4
4 48
6 79
12 50
15 7
61. Estadística Aplicada a los Negocios UPC 2010 02 61
Notas importantes
Percentil de datos agrupados en intervalos
Identificamos primero la clase en la que se encuentra el percentil Pk. Esta clase es aquella que
acumula por primera vez un porcentaje mayor o igual a k%.
El valor del percentil se determina por la siguiente expresión:
1
100
k i i
i
w nk
P L F
f
donde:
Li: límite inferior de la clase del percentil
fi: frecuencia de la clase del percentil
Fi-1: frecuencia acumulada de la clase que precede a la clase del percentil
w: amplitud de clase
n: número de datos
Es equivalente la fórmula
11
100100
i
i
ii
i
ik H
k
h
w
LF
nk
f
w
LP
Ejemplo 11
La siguiente tabla corresponde a la distribución de frecuencias de los 200 salarios del último mes de
los empleados de una empresa.
Salario (S/.) fi hi Fi Hi
450 - 650 32 0.160 32 0.160
650 - 850 40 0.200 72 0.360
850 - 1050 60 0.300 132 0.660
1050 - 1250 48 0.240 180 0.900
1250 - 1450 20 0.100 200 1.000
Calcule el sueldo mínimo para estar en el 15% de los trabajadores mejores pagados
Solución
33,2081132
100
85200
48
200
105085
P nuevos soles
El sueldo mínimo para estar en el 15% de los trabajadores mejores pagados es S/.1 208,33
62. Estadística Aplicada a los Negocios UPC 2010 02 62
Notas importantes
Ejercicio 46
Las notas de un curso se muestran en la siguiente distribución de frecuencias.
Notas Marca de clase fi hi Fi Hi
08 – 10 15
10 – 12 52
12 – 14 60
14 – 16 75
16 – 18 48
Calcule la nota mínima para estar en el quinto superior. Use la fórmula de percentiles.
Calcule la nota mínima para estar en el quinto superior. Use la ojiva.
63. Estadística Aplicada a los Negocios UPC 2010 02 63
Notas importantes
Calcule la nota máxima para estar en el 5% de las notas más bajas.
Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
Calcule el porcentaje de personas que tuvo notas mayores a 12 y menores o iguales a 15.
Cuartil
Se denomina así a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3
respectivamente.
64. Estadística Aplicada a los Negocios UPC 2010 02 64
Notas importantes
Evaluación
14) En una cierta región de un país se han realizado una gran investigación sobre el peso y la edad de
niñas y jóvenes con la cual se ha obtenido el siguiente gráfico:
¿Qué significa que para las jóvenes de 17 años el percentil 3 del peso sea 42.5 kilos? (1 punto)
15) Defina percentil 40 (1 punto)
16) Indique si son verdaderas o falsas las siguientes afirmaciones (2 puntos)
Afirmación Verdadero Falso
El percentil 40 es siempre menor al percentil 80
El cuartil 1 es igual al percentil 25
El percentil siempre está en las mismas unidades de los datos
Si todos los pesos son iguales, la media ponderada es igual a la media aritmética
65. Estadística Aplicada a los Negocios UPC 2010 02 65
Notas importantes
Semana 4. Sesión 2
Ejercicio 47
Calcule la media, mediana y moda de los siguientes grupos de datos.
Grupo 1
1 2 3 5 5 5 7 8 9
Grupo 2
1 4 4 5 5 5 6 6 9
Grupo 3
5 5 5 5 5 5 5 5 5
En base a sus resultados, ¿qué puede afirmar sobre los datos de cada grupo?
66. Estadística Aplicada a los Negocios UPC 2010 02 66
Notas importantes
2.5. Medidas de variabilidad
Con las medidas de tendencia central es posible determinar el valor central de una distribución,
pero no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que
los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de
la medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los da-
tos no están concentrados alrededor de la medida de tendencia central.
Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media. Las uni-
dades de la varianza son las unidades de los datos al cuadrado.
La fórmula para la varianza poblacional es
2
2 1
( )
N
i
i
x
N
La fórmula para la varianza muestral de datos no agrupados es
1
1
2
2
n
xx
s
n
i
i
La fórmula para la varianza muestral de datos agrupados es
1
1
2
2
n
xxf
s
k
i
ii
La fórmula para la varianza muestral de datos agrupados por intervalos es
1
1
2
2
n
xxf
s
k
i
ii
Desviación estándar
Es la raíz cuadrada positiva de la varianza.
67. Estadística Aplicada a los Negocios UPC 2010 02 67
Notas importantes
Ejercicio 48
Calcule la desviación estándar muestral de los siguientes datos
12 10 2 4 2 6 2 4 5 3 11 4 2 7
Ejercicio 49
Calcule la desviación estándar muestral de los siguientes datos.
xi fi
10 5
45 10
55 36
58 4
75 3
Ejercicio 50
El gerente de ventas de una empresa desea conocer la distribución de los volúmenes de venta en el
último mes. Para obtener los datos necesarios se calculan los montos de ventas mensuales (marzo de
2010) de cada vendedor. A continuación se muestra los siguientes datos:
Ventas, en miles de dólares Marca de clase Número de vendedores fi
5,0 - 7,8 3
7,8 - 10,6 10
10,6 - 13,4 28
13,4 - 16,2 9
Calcule la desviación estándar muestral.
68. Estadística Aplicada a los Negocios UPC 2010 02 68
Notas importantes
Propiedades de la varianza y la desviación estándar
La varianza y la desviación estándar son números reales no negativos.
Se pueden calcular para variables medidas en escala de intervalo o razón.
Se ven afectadas por valores extremos.
La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que, la
desviación estándar es expresada en las mismas unidades de los datos.
Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces,
la varianza de los n valores yi es:
2 2
y xS a S 2
Ejercicio 51
En una tienda la desviación estándar de los precios de los jeans es de 7.2 nuevos soles, si se realiza un
aumento del 12% de todos los precios, calcule la nueva desviación estándar de los precios de los jeans.
Ejercicio 52
En una tienda la desviación estándar de los precios de los jeans es de 7.2 nuevos soles, si se hace una
oferta y se rebaja 8 nuevos soles a todos los precios, calcule la nueva desviación estándar de los pre-
cios de los jeans.
Ejercicio 53
Compare los resultados de los ejercicios anteriores.
69. Estadística Aplicada a los Negocios UPC 2010 02 69
Notas importantes
Coeficiente de variación
El coeficiente de variación (CV) de un conjunto de datos indica lo grande que es la desviación estándar
en comparación con la media.
La fórmula para el coeficiente de variación poblacional es:
%100
CV
La fórmula para el coeficiente de variación muestral es:
%100
x
s
CV
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o igua-
les unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones
estándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
El coeficiente de variación se calcula en variables medidas en escala de razón.
Ejemplo 12
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto artículo
que realizaron dos grupos de técnicos.
Grupo 1: media = 3 y desviación estándar = 1,10
Grupo 2: media = 5 y desviación estándar = 1,66
¿En cuál de los grupos el número de mediciones es más disperso?
Solución
Como los promedios son diferentes, se usa como indicador el coeficiente de variación:
%67,36%100
3
10,1
1
CV
%20,33%100
5
66,1
2
CV
El número de mediciones es más disperso en el grupo 1.
70. Estadística Aplicada a los Negocios UPC 2010 02 70
Notas importantes
Ejercicio 54
El siguiente cuadro muestra la distribución de salario mensual de los empleados de dos empresas.
Sueldos (en nuevos soles) Marca de clase Empleados de la empresa A Empleados de la empresa B
[1500 – 2500] 0 1
]2500 – 3500] 2 4
]3500 – 4500] 6 15
]4500 – 5500] 8 13
]5500 – 6500] 12 12
¿Cuál de los grupos presenta mayor variabilidad de salarios?
Si en la empresa A hay un aumento de sueldo del 15%, mientras que en la B se da una bonificación de
250 nuevos soles ¿Cuál de los grupos presenta mayor variabilidad de salarios?
71. Estadística Aplicada a los Negocios UPC 2010 02 71
Notas importantes
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre dato
mayor y el dato menor.
R = Xmax - Xmin
donde:
Xmax : valor máximo observado de la variable
Xmin : valor mínimo observado de la variable
Se puede calcular en variables medidas en escala de intervalo o razón
Se ve muy afectado por valores extremos.
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango intercuartil = RIC = Q3 – Q1= P75 – P25
Se puede calcular en variables medidas en escala de intervalo o razón
No se ve muy afectado por valores extremos.
Ejercicio 55
El tiempo, en meses, que viene laborando 45 trabajadores en una empresa se registra en la siguiente
tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48
Calcule el rango y el rango intercuartil de los datos.
72. Estadística Aplicada a los Negocios UPC 2010 02 72
Notas importantes
Ejercicio 56
La siguiente tabla muestra información de los precios del artículo ABC (en nuevos soles) en estable-
cimientos elegidos al azar en el distrito de La Molina.
Intervalo de
clase
Marca de
clase
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia absoluta
acumulada
Frecuencia relativa
acumulada
– 4
– 0,150
– 0,300 22
– 8,35 8
– 0,900
– 40
Complete la tabla anterior si se sabe que el rango intercuartil es 0,8.
73. Estadística Aplicada a los Negocios UPC 2010 02 73
Notas importantes
Evaluación
17) Indique si son verdaderas o falsas las siguientes afirmaciones (4 puntos)
Afirmación Verdadero Falso
La desviación estándar se puede calcular en escalas de intervalo y de razón
El rango intercuartil se ve muy afectado por valores muy grandes
El rango intercuartil se puede calcular en escalas ordinales, de intervalo y de razón
El coeficiente de variación se puede calcular en escalas ordinales, de intervalo y de razón
La desviación estándar es siempre menor que la varianza
Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado
El rango se ve muy afectado por valores muy grandes o muy pequeños
El coeficiente de variación tiene las mismas unidades que la desviación estándar
74. Estadística Aplicada a los Negocios UPC 2010 02 74
Notas importantes
Semana 5. Sesión 1
Ejercicio 57
Calcule la media, desviación estándar y coeficiente de variación de los siguientes grupos de datos.
Grupo 1
1 2 3 4 5 6 8 8 8
Grupo 2
2 2 2 4 5 6 7 8 9
En base a sus resultados, ¿qué puede afirmar sobre los datos de cada grupo?
2.6. Medidas de asimetría
Coeficiente de asimetría de Pearson
Mide si los datos aparecen ubicados simétricamente o no respecto de la media.
Si el coeficiente de asimetría As es
igual a cero la distribución es simétrica alrededor de la media
positivo, indica sesgo a la derecha (cola derecha)
negativo indica sesgo a la izquierda (cola izquierda)
75. Estadística Aplicada a los Negocios UPC 2010 02 75
Notas importantes
Coeficiente de asimetría para datos simples o agrupados
El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:
s
Modax
As
Ejercicio 58
El siguiente cuadro muestra la distribución de salario mensual de los empleados de dos empresas.
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1500 – 2500] 2 1
]2500 – 3500] 20 6
]3500 – 4500] 12 25
]4500 – 5500] 6 6
]5500 – 6500] 1 1
Calcule la asimetría de los dos grupos. Realice una conclusión
76. Estadística Aplicada a los Negocios UPC 2010 02 76
Notas importantes
Ejercicio 59
El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuación:
15 13 19 14 15 16 15 16 18 15 42 24 36 15 15 23 24
Halle el coeficiente de asimetría de Pearson
Ejercicio 60
La empresa de investigación de mercados Apsos Consulting ha investigado acerca del porcentaje de
los ingresos totales que las familias del sector socioeconómico C y D destinan al rubro alimentación.
El siguiente gráfico muestra los resultados de dicha investigación.
Distribución del porcentaje de ingresos destinados a
alimentación NSE C y D
100.0%
76.2%
85.4%
90.0%
58.5%
20.0%
0%
20%
40%
60%
80%
100%
10 20 30 40 50 60 70 80
Porcentaje de ingresos
Porcentajerelativoacumulada
Fuente: Apsos Consulting. Marzo 2010
¿Los datos presentan asimetría con cola derecha (positiva)?
77. Estadística Aplicada a los Negocios UPC 2010 02 77
Notas importantes
2.7. Diagrama de cajas
Un diagrama de cajas es una gráfica que describe la distribución de un conjunto de datos tomando
como referencia los valores de los cuartiles como medida de posición y el valor del rango intercuartil
como medida de referencia de dispersión. Además, nos permite apreciar visualmente el tipo de distri-
bución de los datos (simétrica o asimétrica) y la identificación de valores extremos (datos atípicos).
Dato atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera dato atípico a
cualquier punto que esté:
a más de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
a más de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil
Pasos para trazar un diagrama de cajas
Se traza un rectángulo con los extremos en el primer y tercer cuartil
En la caja se traza una recta vertical en el lugar de la mediana. Así, la línea de la mediana divide
los datos en dos partes iguales
Se ubican los límites mediante el rango intercuartil,
el límite superior está a 1,5(RIC) arriba (o a la derecha) de Q3
el límite inferior está a 1,5(RIC) debajo (o ala izquierda) de Q1
Se trazan los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro de
los límites inferior y superior.
Se marcan con un asterisco (*) las localizaciones de los valores atípicos.
La siguiente figura presenta un diagrama de cajas con datos hipotéticos.
1,5RIC 1,5RICRIC
** *
Valores atípicos
Q1 Q3Mediana
Límite
inferior
Límite
superior
Bigotes
78. Estadística Aplicada a los Negocios UPC 2010 02 78
Notas importantes
Ejemplo 13
Los siguientes datos corresponden a la cantidad de horas extras semanales realizadas por los trabajado-
res de una fábrica textil en una muestra aleatoria de 18 semanas.
Realice un diagrama de cajas con la información proporcionada.
38 39 40 40 40 41 41 41 42 42 42 43 43 44 46 48 50 61
Solución
Primer cuartil: Q1= 40, mediana: Q2= 42 y tercer cuartil: Q3= 44, RIC = 44- 40 = 4
50)4(5,144)(5,1
34)4(5,140)(5,1
3
1
RICQLS
RICQLI
Siguiendo los pasos sugeridos para trazar un diagrama de cajas y teniendo en cuenta los cálculos ante-
riores tenemos:
Número de horas extras realizadas semanalmente por los trabajadores
Observe que existe un valor atípico y que el bigote de la izquierda es más pequeño que el de la derecha
lo que indica que la distribución del número de horas extras trabajadas por los empleados de la fábrica
está sesgados a la derecha, en otras palabras esta distribución es asimétrica positiva.
Ejercicio 61
Se presenta las cantidades de préstamos personales utilizados para financiar la compra de muebles y
aparatos eléctricos. Obtenga un diagrama de cajas con los datos mostrados.
1200 1316 1424 1808 2060 2216 2344 2368 2620 2640 2880 2908 3404 3728 3740
3892 4000 4000 4760 4800 4876 5112 5552 5692 6100 6440 6600 7560 7600 12160
79. Estadística Aplicada a los Negocios UPC 2010 02 79
Notas importantes
Ejercicio 62
El percentil 25 de un grupo de datos es 10, la mediana es 12 y el percentil 75 es 20. El mínimo de los
datos es 5 y el máximo es 34. Grafique el diagrama de cajas de los datos e indique el tipo de asimetría
que presenta.
Diagramas de caja comparativos
Una ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite la fácil
comparación visual de las características de varios conjuntos de datos
Ejemplo 14
Los registros policíacos muestran los siguientes números de informes de delitos diarios para una mues-
tra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medios, la variabili-
dad y encontrar los valores atípicos del número de delitos diarios.
Solución
Se debe calcular los percentiles con datos simples.
Para el invierno es:
0,40sup0,12inf0,135,200,165,7 755025 LímiteLímiteRICPPP
Para el verano es:
75,52sup25,17inf5,175,260,200,9 755025 LímiteLímiteRICPPP
VeranoInvierno
30
25
20
15
10
5
80. Estadística Aplicada a los Negocios UPC 2010 02 80
Notas importantes
Ejercicio 63
Se desea comparar el resultado de la primera práctica de tres horarios de Estadística Aplicada a los
Negocios, para lo cual, se tienen los siguientes resultados.
H1 0 10 10 11 10 10 10 11 11 12 12 12 12 12 12 13 14 15 17 17 18 18 19 19 20 20
H2 11 11 11 11 11 12 13 13 13 13 14 14 15 15 16 16 16 16 17 17 18 18 19 19 19
H3 0 1 1 3 3 4 5 10 11 11 12 12 13 13 13 14 15 15 16 16 16 16 17 18
Construya un diagrama de cajas que permita comparar el resultado de los horarios. Realice algunas
conclusiones.