SlideShare ist ein Scribd-Unternehmen logo
1 von 169
Downloaden Sie, um offline zu lesen
Ing. Freddy Burgos Robalino
UNIVERSIDAD DE GUAYAQUIL
Bioestadística
FUNDAMENTOS DE BIOESTADÍSTICA
Definiciones e Ideas Básicas
1
SEMANA 1
Ing. Freddy Burgos Robalino
Estadística
• La estadística deriva su nombre
del hecho de haber sido aplicada
en primer lugar a la recolecciòn de
datos que permitieran la
administración de los estados, con
propósitos militares e impositivos.
2
Ing. Freddy Burgos Robalino
Estadística
• La estadística es una ciencia y una
rama de las matemáticas a través
de la cual se recolecta, analiza,
describe y estudia una serie de
datos a fin de establecer
comparaciones o variabilidades que
permitan comprender un fenómeno
en particular.
• La estadística se vale, en gran
medida, de la observación para la
recolección de datos que
posteriormente serán analizados y
comparados a fin de obtener un
resultado.
3
Ing. Freddy Burgos Robalino
Estadística
• La Estadística estudia los métodos y procedimientos para
recoger, clasificar, resumir, hallar regularidades y analizar los
datos, siempre y cuando la variabilidad e incertidumbre sean
una causa intrínseca de los mismos; así como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la
toma de decisiones y en su caso formular predicciones.
4
Ing. Freddy Burgos Robalino
Transversalidad de la
Estadística
• Una de las características fundamentales de la estadística es
su transversalidad. Su metodología es aplicable al estudio de
diversas disciplinas tales como: biología, física, economía,
sociología, etc.
• La estadística ayuda a obtener conclusiones relevantes para el
estudio de todo tipo de agentes como: humanos, animales,
plantas, etc.
5
Ing. Freddy Burgos Robalino
Ramas de la Estadística
Estadística
descriptiva
Se refiere a los métodos de
recolección,organización, resumen y
presentación de un conjunto de
datos.
Se trata principalmente de describir
las características fundamentales de
los datos y para ellos se suelen
utilizar indicadores, gráficos y
tablas.
Estadística
inferencial
Se trata de un paso más allá de la mera
descripción.
Se refiere a los métodos utilizados para
poder hacer predicciones,
generalizaciones y obtener conclusiones
a partir de los datos analizados teniendo
en cuenta el grado de incertidumbre
existente.
6
Ing. Freddy Burgos Robalino
Diseño de Experimentos
• ¿Qué es un experimento?
• Es el cambio en las condiciones de operación de
un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio en una o
varias variables del producto. Ello nos permite
aumentar el conocimiento acerca del sistema o
del proceso.
• ¿Qué es un diseño de experimento?
• Es la planificación de un conjunto de pruebas
experimentales, de forma que los datos
generados puedan analizarse estadísticamente
para obtener conclusiones válidas y objetivas
acerca del problema establecido.
• Diseño de experimentos (DOE, Design of
Experiments) es el estudio simultáneo de varias
variables del proceso. Combinando varias
variables en un estudio en vez de estudiarlas por
separado.
7
Ing. Freddy Burgos Robalino
Razones para realizar un experimento
Determinar las principales causas de la variación en una
respuesta medida.
Para encontrar las condiciones que dan lugar a un máximo
o mínimo de respuesta
8
Ing. Freddy Burgos Robalino
Razones para realizar un experimento
Para comparar las respuestas logradas con diferentes
ajustes de variables controlables.
Para obtener un modelo matemático que permita predecir
respuestas futuras.
9
Ing. Freddy Burgos Robalino
Estadística Descriptiva
• La estadística descriptiva es una disciplina que se encarga de recoger,
almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos
sobre el conjunto de datos.
• La estadística descriptiva es la rama de las Matemáticas que recolecta,
presenta y caracteriza un conjunto de datos (por ejemplo, edad de una
población, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) con el fin de describir apropiadamente las diversas
características de ese conjunto.
10
La estadística descriptiva proporciona los métodos
para recabar información acerca de una determinada
población que se desea conocer o investigar con fines
específicos, entonces es importante obtener muestras
adecuadas que permitan inferir el comportamiento de
dicha población
Ing. Freddy Burgos Robalino
Metodología
11
Selección y determinación de la muestra.
Obtención de los datos.
Clasificación y organización de los datos.
Análisis descriptivo de los datos.
Representación gráfica de los datos.
Contraste de hipótesis, si procede.
Conclusiones
Ing. Freddy Burgos Robalino
Tablas y gráficos en la Estadística Descriptiva
12
Histogramas
Gráficos de Barras
Gráficos de Sectores
Tablas de probabilidad
Tablas bidimensionales
Gráficos de cajas
Ing. Freddy Burgos Robalino
Inferencia Estadística
• La inferencia estadística es el
conjunto de métodos que
permiten inducir, a través de una
muestra estadística, el
comportamiento de una
determinada población.
• La inferencia estadística, estudia
entonces como, a través de la
aplicación de dichos métodos
sobre los datos de una muestra, se
pueden extraer conclusiones sobre
los parámetros de la población de
datos. De la misma manera
estudia también el grado de
fiabilidad de los resultados
extraídos del estudio.
13
Ing. Freddy Burgos Robalino
Para entender el concepto es necesario
conocer:
Inferencia
Extraer juicios o
conclusiones a partir de
ciertos supuestos, sean
estos generales o
particulares.
Población
Una población de datos, es
el conjunto total de datos
que existen sobre un
variable.
Muestra estadística
Una muestra es una parte de la
población de datos.
14
Ing. Freddy Burgos Robalino
Bioestadística
• La bioestadística es una disciplina científica que se encarga de
la aplicación del análisis estadístico a diferentes cuestiones vinculadas
a la biología, a las ciencias de la naturaleza, entre las que se
encuentran todas las ciencias de la salud. Puede decirse que la
bioestadística es un área o una especialización de la estadística, la
ciencia dedicada al estudio cuantitativo de todo tipo de variables.
• La Bioestadística envuelve el desarrollo y aplicación de técnicas
estadísticas a la investigación en campos relacionados a la salud
incluyendo medicina, epidemiología, salud pública y también en áreas de
estudios ambientales, investigación agrícola y biología.
15
Ing. Freddy Burgos Robalino
Componente práctico
de la Bioestadística
Siendo una rama de la estadística, la
Bioestadística abarca diferentes aspectos
relacionados con el diseño de
experimentos, la recogida de datos, y el
análisis e interpretación de los mismos.
En la fase de diseño de una investigación,
la Bioestadística juega un papel
importante a la hora de determinar el
número de sujetos u observaciones que se
deben incluir en el estudio, cómo van a
seleccionarse los participantes y, si
procede, la forma en la que estos deben
ser asignados a los diferentes tratamientos
o condiciones que van a investigarse.
La Bioestadística proporciona las
herramientas de análisis necesarias para
describir y resumir los datos obtenidos y
representarlos gráficamente.
16
Ing. Freddy Burgos Robalino
Componente teórico
de la Bioestadística
La Bioestadística tiene además un
componente teórico. En los últimos años
se ha producido un gran auge de la
investigación en Bioestadística, mediante
el desarrollo de nuevos métodos de
análisis específicamente orientados a la
resolución de problemas prácticos
relacionados con las ciencias de la vida.
Esto ha contribuido a mejorar la capacidad
de extraer inferencias válidas a partir de
los datos observados y avanzar así en una
investigación de calidad en estos campos.
17
Ing. Freddy Burgos Robalino
Aplicaciones de la Bioestadística
• El campo de aplicación de la Bioestadística es muy extenso. Los
tratamientos médicos actuales se seleccionan en base a los resultados de
ensayos clínicos que son diseñados y analizados de acuerdo con
principios de la Bioestadística.
• En el campo de la medicina, el análisis bioestadístico de estudios
observacionales puede también ayudar a identificar factores de riesgo
relacionados con el desarrollo de diferentes enfermedades, o a
determinar la validez y fiabilidad de las pruebas utilizadas para el
diagnóstico de diversas patologías.
• La Bioestadística también se utiliza en la investigación de riesgos
medioambientales, y ha sido empleada en el campo de la agricultura
para mejorar los cultivos y la cría de animales.
18
Ing. Freddy Burgos Robalino
Población
• Es el conjunto de todos los elementos o individuos cuyas
propiedades o características (variables de estudio) se
van a estudiar
• Una población es un conjunto de todos los elementos que
estamos estudiando, acerca de los cuales intentamos
sacar conclusiones". Levin & Rubin (1996).
• "Una población es un conjunto de elementos que
presentan una característica común". Cadenas (1974).
19
Ing. Freddy Burgos Robalino
Tipos de Población
POBLACIÓN
DIANA
Esta definida
por los
objetivos de
estudio
POBLACIÓN
FINITA
Cuando se
conoce el
tamaño de la
población
POBLACIÓN
INFINITA
Cuando no se
conoce el
tamaño de la
población
Ing. Freddy Burgos Robalino
Muestra
• Es un subconjunto de casos o individuos de la población de
estudio; es el grupo de personas que realmente se estudiaran.
• Debe ser representativa de la población y para lograr esto se
tiene que tener bien definido los criterios de inclusión y
exclusión así como la realización de una buena técnica de
muestreo.
• Una muestra representativa indica que reúne
aproximadamente las características de la población que son
importantes para la investigación.
21
Ing. Freddy Burgos Robalino
Porque y cuando calcular el tamaño de la
Muestra
¿Por qué calcular el tamaño de la
muestra?
• Una muestra puede
estudiarse con mayor rapidez
que una población.
• El estudio de una muestra es
menos costoso.
• Toma menos tiempo el
estudio a realizar.
• Los resultados son mas
precisos.
¿Cuándo calcular el tamaño de la
muestra?
• Cuando no se puede estudiar
toda la población
• Cuando se quieren estudiar
dos o mas grupos y
establecer diferencias.
• Cuando se quieren estimar
parámetros, prevalencia,
promedio, porcentajes y
tasas.
Ing. Freddy Burgos Robalino
Muestreo
• El muestreo es el proceso
mediante el cual el investigador
podrá seleccionar a los pacientes
o a los sujetos de estudio a partir
de la muestra calculada
previamente.
• Es la técnica empleada para la
selección de elementos (unidades
de análisis o de investigación)
representativos de la población de
estudio que conformarán una
muestra y que será utilizada para
hacer inferencias (generalización)
a la población de estudio.
Ing. Freddy Burgos Robalino
Tipos de Muestreo
• Probabilístico (Aleatorio)
• No probabilístico
Ing. Freddy Burgos Robalino
Muestreo Probabilístico
• Su principal característica es que todos los sujetos de
la población de estudio tienen la misma probabilidad
de ser seleccionados para formar parte de la muestra.
Muestreo No Probabilístico
• En este tipo de muestreo hay uno o mas criterios de
selección por parte del investigador, para que uno o
mas sujetos pueda formar parte del estudio. No todos
los sujetos tienen la misma posibilidad para ser
elegidos.
Ing. Freddy Burgos Robalino
Variables
• El término variable refiere a cosas que son
susceptibles de ser modificadas
(de variar), de cambiar en función de algún
motivo determinado o indeterminado.
Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB
• En estadística, es una característica o
cualidad de un individuo que está
propensa a adquirir diferentes
valores. (Estos valores, se caracterizan por
poder medirse).
• Por ejemplo, el color de pelo, las notas de
un examen, el sexo o la estatura de una
persona, son variables estadísticas
26
Ing. Freddy Burgos Robalino
Variables estadísticas
• Una variable estadística es el conjunto de valores que puede
tomar cierta característica de la población sobre la que se
realiza el estudio estadístico y sobre la que es posible su
medición.
• Las variables estadísticas son fundamentales para lograr
estudiar eventos y circunstancias que tienen a oscilar en
diferentes resultados o soluciones
27
Ing. Freddy Burgos Robalino
Clasificación de las Variables Estadísticas
• Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
• Cualitativas: Serán
cualitativas aquellas que
expresen características o
cualidades diferentes;
• Cuantitativas: Serán
cuantitativas cuando
expresen argumentos
numéricos
Fuente: https://concepto.de/variable/#ixzz6RNUaF5GQ
28
Ing. Freddy Burgos Robalino
UNIVERSIDAD DE GUAYAQUIL
Bioestadística
FUNDAMENTOS DE BIOESTADÍSTICA
Definiciones e Ideas Básicas
29
SEMANA 2
Bioestadística
Ing. Freddy Burgos Robalino
Variables
• El término variable refiere a cosas que son susceptibles
de ser modificadas (de variar), de cambiar en función de
algún motivo determinado o indeterminado.
Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB
• En estadística, es una característica o cualidad de un
individuo que está propensa a adquirir diferentes
valores. (Estos valores, se caracterizan por poder
medirse).
• Por ejemplo, el color de pelo, las notas de un examen, el
sexo o la estatura de una persona, son variables
estadísticas
30
Ing. Freddy Burgos Robalino
Variables estadísticas
• Una variable estadística es el conjunto de valores que puede tomar
cierta característica de la población sobre la que se realiza el estudio
estadístico y sobre la que es posible su medición.
• Las variables estadísticas son fundamentales para lograr estudiar
eventos y circunstancias que tienen a oscilar en diferentes resultados
o soluciones
31
Ing. Freddy Burgos Robalino
Clasificación de las Variables Estadísticas
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
• Cualitativas: Serán cualitativas
aquellas que expresen
características o cualidades
diferentes;
• Cuantitativas: Serán
cuantitativas cuando expresen
argumentos numéricos
• Fuente: https://concepto.de/vari
able/#ixzz6RNUaF5GQ
32
Ing. Freddy Burgos Robalino
Variables Cualitativas
• Son aquellas que expresan características, cualidades o atributos, y no
pueden ser medidas con números. Pueden ser ordinales o nominales.
• Ejemplos de Variables cualitativas:
• Red social preferida por los millenials.
• El color de ojos de los actores de una película.
• Posición en la que llega un corredor en la prueba de 100 metros
planos.
• El curso favorito de tus amigos.
• Series de Netflix más vistas en tu país.
• La tienda de ropa preferida por los habitantes de una ciudad.
33
Ing. Freddy Burgos Robalino
Variables Cuantitativas
• Son aquellas que se expresan mediante un número, por tanto, se puede
realizar operaciones aritméticas con ellas. Puede ser discretas o continuas.
• Ejemplos de Variables cuantitativas:
• El peso de las vacas de una granja.
• Estatura de los habitantes de una ciudad.
• El número de hijos en una familia.
• Número de clientes atendidos en una tienda.
• Velocidad a la que avanza un tren.
• Número de personas que visitan el campus virtual de la UG en un día.
• Cantidad de goles anotados en un partido de fútbol.
34
Ing. Freddy Burgos Robalino
Método Descriptivo
• El método descriptivo es uno de los métodos cualitativos que se
utilizan en investigaciones que tienen el objetivo de evaluar algunas
características de una población o situación particular.
• En la investigación descriptiva, el objetivo es describir el
comportamiento o estado de un número de variables. El método
descriptivo orienta al investigador en el método científico.
35
Ing. Freddy Burgos Robalino
Características
• Suele atender a un método cualitativo
• Es un primer abordaje al objeto que
se esta estudiando y funciona como
un catalizador de nuevas
investigaciones
• Hace posible la consecución de
muchos datos sobre el objeto que se
estudia
• Implica una observación atenta y hay
un registro fiel de lo que se observa
• No implica generalizaciones ni
proyecciones
36
Ing. Freddy Burgos Robalino
Escalas de Medición en Estadística
• Escalas de medición: son una
sucesión de medidas que permiten
organizar datos en orden
jerárquico.
• Las escalas de medición, pueden
ser clasificadas de acuerdo a una
degradación de las características
de las variables.
• Las escalas de medición ofrecen
información sobre la clasificación
de variables discretas o continuas,
también más conocidas como
escalas grandes o pequeñas.
37
Ing. Freddy Burgos Robalino
Escalas de Medición en Estadística
• La medición es un proceso inherente y consustancial a toda investigación,
sea esta cualitativa y cuantitativa.
• Se mide principalmente variables considerando tres elementos básicos:
• La validez, consistencia y confiabilidad de los datos medidos dependen, en
buena parte, de la escala de medición que se adopte.
38
El instrumento de medición
La escala de medición
El sistema de unidades de medición
Ing. Freddy Burgos Robalino
Nivel de Escala o medición
• La medición puede definirse como la asignación de numerales a
objetos o sucesos siguiendo ciertas reglas, Stevens (1946). El autor
de esta definición desarrolló un método para clasificar los diferentes
resultados de las mediciones en lo que llamó niveles de medición.
• Un nivel de medición es la escala que representa una jerarquía de
precisión dentro de la cual una variable puede evaluarse, en función
de las características que rigen las escalas.
39
Ing. Freddy Burgos Robalino
Escalas de Medición
Variables Cualitativas o
Categóricas
Ordinal
Los datos pueden usarse para
jerarquizar u ordenar las
observaciones
Nominal
Los datos son etiquetas o
categorías que se usan para
definir un atributo de un
elemento
Variables Cuantitativas o
Numéricas
Intervalo
Los datos tienen las propiedades de
los datos ordinales, pero a su vez la
separación entre las variables tiene
sentido.
El valor cero no indica la ausencia de
la propiedad
Razón
Posee un cero absoluto (es
indispensable que exista) y
determina la igualdad de
relaciones o proporciones.
40
Ing. Freddy Burgos Robalino
Por ejemplo, la variable estatura puede analizarse en
diferentes niveles de medida
• Un conjunto de personas pueden clasificarse en altos y bajos, A y B,
creando dos grupos. Para ello no es necesario recurrir a ninguna
cinta métrica, simplemente basta observar quienes destacan sobre
los demás (el grupo de altos) y el resto completarán el grupo de
bajos. El nivel de medición que corresponde a esta forma de medir
es nominal.
• También podrían alinearse a los sujetos y ordenarlos según
su altura, el primero sería el más alto y el último el más bajo,
de forma que cada persona tuviese delante a uno más alto y
detrás a uno más bajo. El nivel de medición en este caso es
ordinal. Hasta el momento no es posible decir cuánto es una
persona más alta que otra.
Ing. Freddy Burgos Robalino
Por ejemplo, la variable estatura puede analizarse en
diferentes niveles de medida
• A través del número de personas que hay entre dos sujetos, por ejemplo,
Andrea y Juan en la fila ordenada anteriormente. En este caso además
del orden se conoce la magnitud de la altura. Si en lugar de utilizar el
número de personas se recurre a una regla se puede ofrecer otra
medida de la altura. Esta forma de medir es propia del nivel de
intervalos, que permite saber la magnitud de los elementos
comparando unos con otros.
• La cuarta posibilidad es utilizar un metro que sitúa el cero en
el mismo suelo y, por lo tanto, la altura se define en función
de la distancia desde la cabeza al suelo (valor cero absoluto
donde se sitúa la ausencia de altura). Una característica de
esta clasificación es que las propiedades de una escala se
cumplen en el nivel superior.
Ing. Freddy Burgos Robalino
Ejemplos:
Escala Nominal
• El sexo de una persona es un
dato nominal no numérico.
• El numero de seguro de salud de
una persona es un dato nominal
numérico.
43
Sexo:
Masculino ( 1 )
Femenino ( 2 )
Tipos de Pacientes:
Consulta externa (40)
Emergencia (15)
Internados (60)
Ing. Freddy Burgos Robalino
Ejemplos:
Escala Ordinal
• El estado de salud de un
paciente son datos ordinales no
numéricos.
Estado de Salud
Muy Saludable 5
Medianamente saludable
4
Saludable
X 3
Poco Saludable 2
No Saludable 1
44
Ing. Freddy Burgos Robalino
Ejemplos:
Escala Intervalo
• La temperatura (en grados centígrados)
media de una ciudad.
• En esta escala, los número mayores
corresponden a temperaturas mayores.
Es decir, el orden importa, pero a la vez
la diferencias entre las temperaturas
importa.
45
Ing. Freddy Burgos Robalino
Ejemplos:
Escala Razón
• Variables como la edad, la
distancia, la altura, el peso y
el tiempo se miden con una
escala de razón.
46
Ing. Freddy Burgos Robalino
Datos Cualitativos
• Datos que se expresan en forma de palabras o
textos que ayudan a comprender ciertas acciones
y actitudes de los encuestados que no son
cuantificables, por lo que su uso es muy
importante para fundamentar cualquier
investigación seria.
• Este tipo de datos tienen como principal
característica que no se pueden medir, ni
expresarse con número, deben ser interpretados.
• Los datos cualitativos son utilizados
principalmente como el primer acercamiento al
problema, ya que nos aporta información acerca
de la existencia de una realidad en la que están
involucrados nuestros participantes.
47
Ing. Freddy Burgos Robalino
Datos Cualitativos: Variables politómicas
• Son aquellos que no se pueden
expresa numéricamente.
• Representan una cualidad o atributo
que clasifica a cada sujeto en una de
varias categorías.
• Los valores para grupos de
individuos generalmente se tabulan
utilizando tablas de contingencia:
• Ejemplo:
48
Médicos según
Servicios
UCI
Cirugía
Consulta Externa
Medidas de
aislamiento
Lavado de manos
Mascarillas
Uso de guantes
Ing. Freddy Burgos Robalino
Datos Cualitativos: Variables dicotómicas
• Son aquellos que no se pueden expresar
numéricamente.
• Representan una cualidad o atributo
que clasifica a cada sujeto en una de
varias categorías.
• Ejemplo:
49
Vivo/ Muerto
Este es el ejemplo más claro (por lo
menos no se conocen muchos casos
de estados intermedios entre la vida
y la muerte).
Sano/ Enfermo
Requiere una definición para la
condición de enfermo.
Ing. Freddy Burgos Robalino
Datos Cuantitativos
• El concepto “datos cuantitativos” hace
referencia a la información tangible, la que
es obtenida mediante algún método de
investigación. La manera de cuantificar los
datos obtenidos en nuestro estudio nos
dará la pauta de hacia qué rumbo dirigirse,
de ahí la importancia de su correcto análisis
para poder demostrar si estamos en lo
correcto o no, en la hipótesis planteada.
• Hay dos tipos de datos cuantitativos, que
también se conocen como datos numéricos:
continuo y discreto. Como regla general, los
recuentos son discretos y las mediciones
son continuas.
50
Ing. Freddy Burgos Robalino
Datos Cuantitativos: Datos Continuos
• Se refiere al flujo constante de valores
posibles de la variable, estos datos no
se restringen a valores enteros (aunque
normalmente son reducidos a valores
enteros por aproximación).
• Los datos continuos se miden en lugar
de contarse. Además tienen entre sus
características que pueden dividirse.
• Son aquellos datos que pueden tomar
cualquier valor (dentro de un rango)
• Los datos continuos pueden tomar un
número infinito de valores y no tiene
categorías naturales.
• Ejemplo:
51
Medir la altura
de una persona
Medir la altura en metros,
centímetros y hasta dar una
medida en milímetros, es decir, los
datos son continuos
Edad Definir una edad en años, meses y
hasta día
Ing. Freddy Burgos Robalino
Datos Cuantitativos: Datos Discretos
• Los datos discretos tiene un número
finito de categorías naturales.
• Prácticamente hablamos de números
enteros, por valores completos.
• Se cuentan, no se miden.
• Ejemplo:
52
Número de hijos,
adultos o mascotas
en su familia.
Son datos discretos, porque se
cuentan por números
indivisibles: no se puede tener
2,5 hijos, o 1,3 mascotas.
Cantidad de
empleados que
trabajan en una
tienda.
Son datos discretos, porque se
cuentan por números
indivisibles: no se puede tener
20,5 empleados.
UNIVERSIDAD DE GUAYAQUIL
Bioestadística
DISTRIBUCIONES
SEMANA 3
Bioestadística
Generalidades
FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA
UNIVERSIDAD DE GUAYAQUIL
DISTRIBUCIÓN DE FRECUENCIA
Generalidades
Generalidades
La organización de los datos constituye la primera
etapa de su tratamiento, puesto que facilita los
cálculos posteriores y evita posibles confusiones.
Cuando no existían los computadores, o ni siquiera
calculadoras, era necesario que los datos tuvieran
alguna estructura que permitiera resumirlos y
comprenderlos de una forma más o menos
sencilla.
La organización va a depender del número de
observaciones distintas que se tengan y de las
veces que se repitan cada una de ellas. En base a lo
anterior, se pueden estructurar los datos de
maneras diferentes.
Generalidades…
Las distribuciones de frecuencias son tablas en que
se dispone las modalidades de la variable por filas.
En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que
contienen los datos
En estadística y por consiguiente en bioestadística,
se le llama distribución de frecuencias a la
agrupación de datos en categorías mutuamente
excluyentes que indican el número de observaciones
en cada categoría. Esto proporciona un valor
añadido a la agrupación de datos.
Recordemos: Variables en Estadística
Variable Discreta
Una variable discreta es aquella que no puede tomar algunos valores dentro
de un mínimo conjunto numerable, quiere decir, no acepta cualquier valor,
únicamente aquellos que pertenecen al conjunto.
Ejemplos: número de empleados de una fábrica; número de hijos;
Variable Continua
Una variable continua es aquella que puede adoptar cualquier valor en el
marco de un intervalo que ya está predeterminado.
Ejemplos: temperaturas registradas en un observatorio; tiempo en recorrer
una distancia en una carrera; contenido de alcohol en un cuba-libre; estatura
Tipos de Frecuencia
Una de los primeros pasos que se realizan en
cualquier estudio estadístico es la tabulación
de resultados, es decir, recoger la información
de la muestra resumida en una tabla en la que
a cada valor de la variable se le asocian
determinados números que representan el
número de veces que ha aparecido, su
proporción con respecto a otros valores de la
variable, etc. Estos números se denominan
frecuencias.
Tipos de Frecuencia…
FRECUENCIA
ABSOLUTA
Cuantas veces
se repite un
evento ( fi )
FRECUENCIA
RELATIVA
Frecuencia Absoluta
La frecuencia absoluta es una medida
estadística que nos da información
acerca de la cantidad de veces que se
repite un suceso al realizar un número
determinado de experimentos
aleatorios. Esta se representa mediante
las letras fi.
La letra f se refiere a la palabra
frecuencia y la letra i se refiere a la
realización i-ésima del experimento
aleatorio. (En otros textos las
encontraran como ni)
Ejemplo de Frecuencia Absoluta (Variable Discreta)
Supongamos que tenemos el número de
miembros de una familia y los datos son los
siguientes:
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
Xi = Variable aleatoria estadística, número de
miembros de una familia.
N = 20
fi = Frecuencia absoluta = Número de veces que
se repite el suceso (en este caso, el número de
miembros de cada familia).
Xi fi
1 1
2 2
3 1
4 1
5 4
6 2
7 2
8 3
9 1
10 3
∑ 20
Ejemplo de Frecuencia Absoluta (Variable continua)
Supongamos que la altura de 15 personas que se presentan a los
postulantes del cuerpo de policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75,
1,77, 1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de
menor a mayor, pero en este caso dado que la variable es continua
y podría tomar cualquier valor de un espacio continuo infinitesimal,
hay que agrupar las variables por intervalos.
Por tanto tendremos:
Xi = Variable aleatoria estadística, altura de los postulantes al
cuerpo de policía nacional.
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso
(en este caso, las alturas que se encuentran dentro de un
determinado intervalo).
Xi fi
[1,70 , 1,80) 5
[1,80 , 1,90) 4
[1,90 , 2,00) 3
[2,00 , 2,10) 3
∑ 15
Frecuencia Relativa
La frecuencia relativa es una medida estadística
que se calcula como el cociente de la frecuencia
absoluta de algún valor de la población/muestra
(fi) entre el total de valores que componen la
población/muestra (N)
Para calcular la frecuencia relativa es necesario
antes calcular la frecuencia absoluta. Sin ella no
podríamos obtener la frecuencia relativa. La
frecuencia relativa se representa con las letras hi
y su fórmula de cálculo es la siguiente:
Donde N = Tamaño de la muestra
Para calcular la Frecuencia Relativa…
hi = Frecuencia relativa de la observación i-ésima
fi = Frecuencia absoluta de la observación i-ésima
N = Número total de observaciones de la muestra
De la fórmula de cálculo de la frecuencia relativa se desprenden dos conclusiones:
La frecuencia relativa va a estar acotada entre 0 y 1, debido a que la frecuencia de los valores de la
muestra, siempre va a ser menor al tamaño de la muestra.
La suma de todas las frecuencias relativas va a ser 1 si se mide en tanto por 1, o 100 si se mide en tanto
por ciento.
Por consiguiente la frecuencia relativa nos informa acerca de la proporción o el
peso que tiene algún valor u observación en la muestra. Esto la hace de especial
utilidad, dado que a diferencia de la frecuencia absoluta, la frecuencia relativa nos
va a permitir hacer comparaciones entre muestras de tamaños distintos. Esta se
puede expresar como un valor decimal, como fracción o como porcentaje.
Ejemplo de Frecuencia Relativa (Variable Discreta)
Supongamos que tenemos el número de miembros
de una familia y los datos son los siguientes:
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
Xi = Variable aleatoria estadística, número de
miembros de una familia.
N = 20
fi = Frecuencia absoluta = Número de veces que se
repite el suceso (en este caso, el número de
miembros de una familia).
hi = Frecuencia relativa (proporción que representa
el valor i-ésimo en la muestra).
Xi fi hi
1 1 5%
2 2 10%
3 1 5%
4 1 5%
5 4 20%
6 2 10%
7 2 10%
8 3 15%
9 1 5%
10 3 15%
∑ 20 100%
Ejemplo de Frecuencia Relativa (Variable continua)
Supongamos que la altura de 15 personas que se presentan a las oposiciones
del cuerpo de policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77,
1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a
mayor, pero en este caso dado que la variable es continua y podría tomar
cualquier valor de un espacio continuo infinitesimal, hay que agrupar las
variables por intervalos.
Por tanto tendremos:
Xi = Variable aleatoria estadística, altura de los opositores al cuerpo de
policía nacional.
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este
caso, las alturas que se encuentran dentro de un determinado intervalo).
hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la
muestra)
Xi fi hi
[1,70 , 1,80) 5 33%
[1,80 , 1,90) 4 27%
[1,90 , 2,00) 3 20%
[2,00 , 2,10) 3 20%
∑ 15 100%
Ejemplo
Personas
Activas
Número
Familias
Xi fi fi/N hi
1 16 16/50 32%
2 20 20/50 40%
3 9 9/50 18%
4 5 5/50 10%
Total 50 100%
APLICACIONES INFORMÁTICAS PARA OBTENER LA TABLA DE
FRECUENCIAS
USO DE FÓRMULAS DE
EXCEL
USO DE ANÁLISIS DE DATOS
Práctica 1
Práctica 2
Ing. Freddy Burgos Robalino, MDGPT
UNIVERSIDAD DE GUAYAQUIL
Bioestadística
DISTRIBUCIONES
SEMANA 4
Bioestadística
72
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
FRECUENCIA ABSOLUTA
ACUMULADA
FRECUENCIA RELATIVA
ACUMULADA
73
Ing. Freddy Burgos Robalino, MDGPT
DISTRIBUCIÓN DE FRECUENCIA
ACUMULADA
Generalidades
74
Ing. Freddy Burgos Robalino, MDGPT
Tipos de Frecuencia Acumulada
FRECUENCIA
ABSOLUTA
ACUMULADA
Sumatoria del número
de veces que se repite
el suceso (Fi)
FRECUENCIA
RELATIVA
ACUMULADA
Sumatoria de la
proporción que
representa el valor i-
ésimo en la muestra
(Hi)
75
Ing. Freddy Burgos Robalino, MDGPT
Frecuencia Acumulada
La frecuencia acumulada es el
resultado de sumar
sucesivamente las frecuencias
absolutas o relativas, desde el
menor al mayor de sus valores
76
Ing. Freddy Burgos Robalino, MDGPT
Frecuencia Absoluta Acumulada
La frecuencia absoluta acumulada es el
resultado de ir sumando las frecuencias
absolutas de las observaciones o valores de una
población o muestra. Esta se representa por las
siglas Fi.
Para calcular la frecuencia absoluta acumulada,
hay que calcular primero la frecuencia absoluta
(fi) de la población o muestra. Para ello, los
datos se ordenan de menor a mayor y se
colocan en una tabla.
Una vez hecho esto, la frecuencia absoluta
acumulada se obtiene de ir sumando las
frecuencias absolutas de una clase o grupo de la
muestra con la anterior (primer grupo +
segundo grupo, primer grupo + segundo grupo +
tercer grupo y así sucesivamente hasta llegar a
acumular del primer grupo al último).
77
Ing. Freddy Burgos Robalino, MDGPT
Ejemplo de Frecuencia Absoluta Acumulada
(Variable Discreta)
Supongamos que tenemos el número de
miembros de una familia y los datos son los
siguientes:
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5,
10.
Xi = Variable aleatoria estadística, miembros
de una familia.
N = 20
fi = Frecuencia absoluta = Número de veces
que se repite el suceso (en este caso, los
miembros de la familia).
Fi= Frecuencia absoluta acumulada
(sumatorio del número de veces que se
repite el suceso, en este caso miembros de
una familia)
Xi fi Fi
1 1 1
2 2 3 (1+2)
3 1 4 (3+1)
4 1 5 (4+1)
5 4 9 (5+4)
6 2 11 (9+2)
7 2 13 (11+2)
8 3 16 (13+3)
9 1 17 (16+1)
10 3 20 (17+3)
∑ 20
78
Ing. Freddy Burgos Robalino, MDGPT
Ejemplo de Frecuencia Absoluta Acumulada
(Variable continua)
Supongamos que la altura de 15 personas que se presentan a las
postulaciones del cuerpo de policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77,
1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a
mayor, pero en este caso dado que la variable es continua y podría
tomar cualquier valor de un espacio continuo infinitesimal, hay que
agrupar las variables por intervalos.
Por tanto tenemos:
Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de
policía nacional.
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en
este caso, las alturas que se encuentran dentro de un determinado
intervalo).
Fi = Sumatorio del número de veces que se repite el suceso (en este
caso, las alturas que se encuentran dentro de un determinado
intervalo).
Xi fi Fi
[1,70 , 1,80) 5 5
[1,80 , 1,90) 4 9 (5+4)
[1,90 , 2,00) 3 12 (9+3)
[2,00 , 2,10) 3 15 (12+3)
∑ 15
79
Ing. Freddy Burgos Robalino, MDGPT
Frecuencia Relativa Acumulada
La frecuencia relativa acumulada es el resultado
de ir sumando las frecuencias relativas de las
observaciones o valores de una población o
muestra. Esta se representa por las siglas Hi.
Para calcular la frecuencia relativa acumulada,
hay que calcular primero la frecuencia absoluta
(fi) y la frecuencia relativa (hi) de los valores de
la población o muestra
Para ello, los datos se ordenan de menor a
mayor y se colocan en una tabla. Una vez hecho
esto, la frecuencia relativa acumulada se
obtiene de ir sumando las frecuencias relativas
de una clase o grupo de la muestra con la
anterior (primer grupo + segundo grupo, primer
grupo + segundo grupo + tercer grupo y así
sucesivamente hasta llegar a acumular del
primer grupo al último).
80
Ing. Freddy Burgos Robalino, MDGPT
Ejemplo de Frecuencia Relativa Acumulada
(Variable Discreta)
Supongamos que tenemos el número de
miembros de una familia y los datos son los
siguientes :
1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10.
Xi = Variable aleatoria estadística, miembros de
una familia.
N = 20
fi = Frecuencia absoluta = Número de veces que se
repite el suceso (en este caso, miembros de una
familia).
hi = Frecuencia relativa (proporción que
representa el valor i-ésimo en la muestra).
Hi = Frecuencia relativa acumulada (Sumatorio de
la proporción que representa el valor i-ésimo en la
muestra)
Xi fi hi Hi
1 1 5% 5%
2 2 10% 15%(5+10)
3 1 5% 20%(15+5)
4 1 5% 25%(20+5)
5 4 20% 45%(25+20)
6 2 10% 55%(45+10)
7 2 10% 65%(55+10)
8 3 15% 80%(65+15)
9 1 5% 85%(80+5)
10 3 15% 100%(85+15)
∑ 20 100%
81
Ing. Freddy Burgos Robalino, MDGPT
Ejemplo de Frecuencia Relativa Acumulada
(Variable continua)
Supongamos que la altura de 15 personas que se presentan a las
postulaciones del cuerpo de policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77,
1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a
mayor, pero en este caso dado que la variable es continua y podría tomar
cualquier valor de un espacio continuo infinitesimal, hay que agrupar las
variables por intervalos.
Por tanto tenemos:
Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de
policía nacional.
N = 15
fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este
caso, las alturas que se encuentran dentro de un determinado intervalo).
hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la
muestra).
Hi = Sumatorio de la proporción que representa el valor i-ésimo en la
muestra.
Xi
f
i
hi Hi
[1,70 , 1,80) 5 33% 33%
[1,80 , 1,90) 4 27% 60%(33+27)
[1,90 , 2,00) 3 20% 80%(50+20)
[2,00 , 2,10) 3 20% 100%(80+20)
∑ 15 100%
82
Ing. Freddy Burgos Robalino, MDGPT
Ejemplo:
Personas
Activas
Número
Familias
Xi fi fi/N hi Fi Fi/N Hi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50 100%
83
Ing. Freddy Burgos Robalino, MDGPT
Distribución de frecuencias agrupadas
O tabla con datos agrupados se
emplea si las variables toman un
número grande de valores o la
variable es continua. Se agrupan
los valores en intervalos que
tengan la misma amplitud
denominados clases. A cada clase
se le asigna su frecuencia
correspondiente.
84
Ing. Freddy Burgos Robalino, MDGPT
Distribución de frecuencias agrupadas…
No existen normas establecidas para
determinar cuándo es apropiado utilizar
datos agrupados o datos no agrupados;
se sugiere cuando el número total datos
(N) es igual o superior de 50 e y además
el rango o recorrido de la serie de datos
es mayor de 20, entonces se utilizará la
distribución de frecuencias para datos
agrupados, también se utilizara este
tipo de distribución cuando se requiera
elaborar gráficos lineales como el
histograma, el polígono de frecuencia o
la ojiva.
85
Ing. Freddy Burgos Robalino, MDGPT
Distribución de frecuencias agrupadas…
La razón fundamental para utilizar
la distribución de frecuencias de
clases es proporcionar mejor
comunicación acerca del patrón
establecido en los datos y facilitar
la manipulación de los mismos.
Los datos se agrupan en clases
con el fin de sintetizar, resumir,
considerar o hacer que la
información obtenida de una
investigación sea manejable con
mayor facilidad.
86
Ing. Freddy Burgos Robalino, MDGPT
Clase y Determinación del número de clases.
Concepto: Es el número de subconjuntos en que se han agrupado los datos.
Cada clase se puede denominar mediante una letra, un número o alguna
característica del subconjunto.
El número de clases en que se agrupan los datos se determina con la raíz
cuadrada del número de datos cuando este es menor de 200.
Número de clases = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Para muestras con 200 o más datos el número de clases se determina con la
raíz cúbica del número de datos.
Número de clases =
3
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Límites de la clase. Cada clase está delimitada por el límite inferior de la clase
y el límite superior de la clase.
87
Ing. Freddy Burgos Robalino, MDGPT
Fórmula de Sturges
Este es otra forma para calcular el
intervalo de la clase:
La fórmula de Sturges, determina
un número aproximado de
intervalos "k".
Aunque ésta no siempre resulta
muy adecuada, es una relación
muy utilizada: k = 1 + 3.322 log
(n).
Donde: n es el número de datos a
condensar en la tabla.
88
Ing. Freddy Burgos Robalino, MDGPT
Intervalo de clase y Cómo calcular el intervalo de clase
Concepto: Es un conjunto de elementos que forman a una clase,
conteniendo un límite inferior y un límite superior.
Como calcular el intervalo de la clase:
Calcular el rango de datos. El rango es la diferencia entre los puntos de datos
más altos y más bajos.
Determinar el número de clases del tamaño de la muestra. Como regla
general, se utilizan de cinco a siete clases para un tamaño de la muestra de
hasta 50, de ocho a 10 clases para un tamaño de la muestra entre 50 y 100,
10 a 15 clases para un tamaño de la muestra entre 100 y 250 y de 15 a 20
clases para un tamaño de la muestra mayor a 250.
Calcula el intervalo de clase utilizando la siguiente fórmula:
intervalo de clase = rango/número de clases.
89
Ing. Freddy Burgos Robalino, MDGPT
Tamaño de clase y Cálculo del tamaño de clase.
Concepto: Es la diferencia entre dos límites inferiores o superiores de
clases sucesivas.
Para determinar el tamaño de clase es necesario conocer el rango de la
muestra, que se obtiene con la diferencia entre el dato mayor y el dato
menor de la muestra y se representa con la letra R.
R = dato mayor - dato menor
El tamaño de clase se obtiene al dividir el rango entre el número de
clases, y se representa con la letra c.
Tamaño de clase = rango /número de clases
c= R/ 𝑛𝑢𝑚𝑒𝑟𝑜𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
90
Ing. Freddy Burgos Robalino, MDGPT
Amplitud y Marca de Clase
La amplitud de la clase es la diferencia entre el límite superior e inferior
de la clase (tamaño de la clase)
La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros.
91
Ing. Freddy Burgos Robalino, MDGPT
Elaboración de intervalos.
El tamaño de clase indica el número de datos que conforman a cada
intervalo, considerando los valores extremos llamados límites. En cada
intervalo aparece un límite inferior (LI) y un límite superior (LS).
Cada intervalo se forma sumando al límite inferior (LI) un número
menos que el tamaño de clase para obtener el límite superior (LS)
92
Ing. Freddy Burgos Robalino, MDGPT
APLICACIONES INFORMÁTICAS PARA
OBTENER LA TABLA DE FRECUENCIAS
USO DE FÓRMULAS DE
EXCEL
USO DE ANÁLISIS DE
DATOS
93
Ing. Freddy Burgos Robalino, MDGPT
Bioestadística
GRÁFICOS
SEMANA 5
Bioestadística
Ing. Freddy Burgos Robalino, MDGPT
¿Qué es un gráfico?
Generalidades:
Un grafico es la representación de datos, generalmente numéricos ,
mediante líneas, superficies o símbolos, para ver la relación que esos datos
guardan entre si y facilitar su interpretación. La utilización de gráficos hace
mas sencilla e inmediata la interpretación de los datos.
La calidad de un gráfico estadístico consiste en comunicar ideas complejas
con precisión, claridad y eficiencia, de tal manera que:
• Induzca a pensar en el contenido más que en la apariencia.
• No distorsione la información proporcionada por los datos.
• Presente mucha información (números) en poco espacio.
• Favorezca la comparación de diferentes grupos de datos o de relaciones
entre los mismos (por ejemplo una secuencia temporal)
Ing. Freddy Burgos Robalino, MDGPT
Elementos de un gráfico
Área del gráfico: Área que se
encuentra definida por el
marco del gráfico y que incluye
todas sus partes.
Título del gráfico: Texto
descriptivo del gráfico que se
coloca en la parte superior.
Series de datos: Son los puntos
de datos relacionados entre sí
trazados en un gráfico. Cada
serie de datos tiene un color
exclusivo. Un gráfico puede
tener una o más series de
datos a excepción de los
gráficos circulares que
solamente pueden tener una
serie de datos.
Ejes: Línea que sirve como
referencia de medida. El eje Y
es conocido como el eje
vertical y generalmente
contiene datos. El eje X es
conocido también como el eje
horizontal y suele contener las
categorías del gráfico.
Líneas de división: Son líneas
opcionales que extienden los
valores de los ejes de manera
que faciliten su lectura e
interpretación.
Título de eje: Texto descriptivo
que se alinea
automáticamente al eje
correspondiente.
Leyenda: Recuadro que ayuda
a identificar los colores
asignados a las series de datos.
Ing. Freddy Burgos Robalino, MDGPT
Elementos de un gráfico
Ing. Freddy Burgos Robalino, MDGPT
Elementos de un gráfico
Ing. Freddy Burgos Robalino, MDGPT
Representaciones gráficas de datos cualitativos
En cuanto a la representación gráfica de las variables cualitativas
destacamos dos tipos de gráfico por ser los que se utilizan con mayor
frecuencia.
• Diagrama de sectores.
• Gráfico de barras.
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
100
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE SECTORES
• El diagrama de sectores, se utiliza para visualizar de forma sencilla
las frecuencias relativas de las variables.
• En los gráficos de sectores se divide una figura, habitualmente de
forma circular, de forma que el área correspondiente a cada posible
respuesta de la variable será proporcional a la frecuencia relativa de
la variable.
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE SECTORES
Ejemplo: Se ha encuestado a 30 personas sobre el color
de sus ojos, obteniendo los siguientes resultados.
102
Marrón Verde Verde Azul Marrón Azul Marrón Marrón Azul Marrón
Azul Marrón Verde Verde Marrón Azul Verde Marrón Marrón Azul
Marrón Verde Marrón Verde Verde Marrón Marrón Marrón Azul Marrón
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE SECTORES
CATEGORIA fi hi Grados
30 --> 360°
Marrón 15 0.50 180
Verde 8 0.27 96
Azul 7 0.23 84
N 30 1.00 360
Marrón
0,50
50%
Verde
0,27
27%
Azul
0,23
23%
Diagrama de sectores: Color de ojos
Marrón Verde Azul
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
104
Ing. Freddy Burgos Robalino, MDGPT
GRÁFICO DE BARRAS
En este tipo de gráfico se
representa una barra vertical u
horizontal para cada una de las
categorías de la variable de altura
proporcional a su frecuencia
absoluta o relativa.
15
8
7
0
2
4
6
8
10
12
14
16
Marrón Verde Azul
Diagrama de barras: Color de
ojos - fi
Ing. Freddy Burgos Robalino, MDGPT
Representaciones gráficas de datos cuantitativos
Estas representaciones nos ayudarán a visualizar los datos y a
conocer sus principales características.
Entre las principales representaciones gráficas tenemos:
• Gráfico de barras
• Histograma
• Polígonos de frecuencia
• Diagrama de tallos y hojas
• Diagrama de cajas
Ing. Freddy Burgos Robalino, MDGPT
GRÁFICO DE BARRAS
Se usan también
para representar la
distribución de
frecuencias de
variables discretas.
Cada categoría se
representa por una
barra cuyo largo
indica la frecuencia
de observaciones
de dicha categoría.
1
2
1 1
4
2 2
3
1
3
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
1 2 3 4 5 6 7 8 9 10
CANTIDAD
DE
ESTUDIANTES
NOTAS
GRÁFICO DE BARRAS: NOTAS
DE EXÁMES - FI
Xi fi
1 1
2 2
3 1
4 1
5 4
6 2
7 2
8 3
9 1
10 3
∑ 20
Ing. Freddy Burgos Robalino, MDGPT
Gráficos estadísticos: Variables cuantitativas continuas
Generalidades:
• Cuando las variables son continuas, utilizamos como diagramas
diferenciales los histogramas y los polígonos de frecuencias.
• Un histograma se construye a partir de la tabla estadística,
representando sobre cada intervalo, un rectángulo que tiene a este
segmento como base
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
109
Ing. Freddy Burgos Robalino, MDGPT
HISTOGRAMA
Cuando las variables son continuas, utilizamos como diagramas
diferenciales los histogramas y los polígonos de frecuencias.
Un histograma se construye a partir de la tabla estadística,
representando sobre cada intervalo, un rectángulo que tiene a este
segmento como base
Xi fi
[1,70 , 1,80) 5
[1,80 , 1,90) 4
[1,90 , 2,00) 3
[2,00 , 2,10) 3
∑ 15
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
111
Ing. Freddy Burgos Robalino, MDGPT
POLÍGONOS DE FRECUENCIA
Son diagramas de línea que se obtienen al unir los puntos medios del
lado superior de cada rectángulo del histograma correspondiente.
El histograma y el polígono de frecuencias son gráficos que se utilizan
para representar distribuciones de frecuencias para datos agrupados.
Xi
Marca de
clase
fi
[1,70 , 1,80) 1,75 5
[1,80 , 1,90) 1,85 4
[1,90 , 2,00) 1,95 3
[2,00 , 2,10) 2,05 3
∑ 15
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
113
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE TALLOS Y HOJAS
El diagrama "tallo y hojas permite obtener simultáneamente una
distribución de frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último dígito de la
derecha (que constituye la hoja) del bloque de cifras restantes (que
formará el tallo).
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE TALLOS Y HOJAS
Se tiene los siguientes datos edad correspondiente a 20
personas, construir el diagrama de tallos y hojas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE TALLOS Y HOJAS
Se tiene los siguientes datos edad correspondiente a 20 personas,
construir el diagrama de tallos y hojas.
Ing. Freddy Burgos Robalino, MDGPT
Generalidades
1.4.1
Gráfico de
Sectores
1.4.1
Gráfico de
barras.
1.4.2
Histograma
s
1.4.3
Polígonos
1.4.4
Gráfico de
tallo y
hojas.
1.4.5
Diagrama
de caja.
117
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE CAJAS
Los diagramas de Caja-Bigotes son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo
de los datos, sobre un rectángulo, alineado horizontal o verticalmente.
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero(recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman
bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier
dato o caso que no se encuentre dentro de este rango es marcado e identificado
individualmente
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE CAJAS
Se tiene los siguientes datos edad correspondiente a 20 personas,
construir el diagrama de tallos y hojas.
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE CAJAS
Ing. Freddy Burgos Robalino, MDGPT
DIAGRAMA DE CAJAS
Ing. Freddy Burgos Robalino, MDGPT.
Bioestadística
ESTADÍSTICA DESCRIPTIVA
Medidas de tendencia central:
Media, mediana y moda
SEMANA 6
Bioestadística
Ing. Freddy Burgos Robalino, MDGPT.
Generalidades
LA MEDIA ARITMÉTICA LA MEDIANA LA MODA
123
Ing. Freddy Burgos Robalino, MDGPT.
Unidades
Experimentales
(Muestra)
Es una porción de la
información a analizar.
Ejemplo: muestra
compuesta por ocho
personas.
Ing. Freddy Burgos Robalino, MDGPT.
Media (promedio)
La media es la suma de todas las observaciones
dividida entre el número de observaciones.
Por ejemplo, el tiempo de espera (en minutos) de
cinco clientes de un banco es: 3, 2, 4, 1 y 2. El
tiempo medio de espera es:
En promedio, un cliente espera 2.4 minutos para ser
atendido en el banco.
Ing. Freddy Burgos Robalino, MDGPT.
Media Aritmética
La media aritmética es el valor promedio de las muestras y es
independiente de las amplitudes de los intervalos.
La media aritmética es el valor que se obtiene al sumar todos los datos
que tenemos y dividir el resultado entre el número total de esos datos
es el símbolo de la media aritmética.
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de datos no agrupados
Los pesos de seis amigos son
84, 91, 72, 68, 87 y 78 kg.
Hallar el peso medio
Ing. Freddy Burgos Robalino, MDGPT.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión
de la media es:
Ing. Freddy Burgos Robalino, MDGPT.
Ejercicio de media aritmética
En un test realizado a un grupo de
42 personas se han obtenido las
puntuaciones que muestra la
tabla.
Calcule la puntuación media
xi fi
[10, 20) 15 1
[20, 30) 25 8
[30,40) 35 10
[40, 50) 45 9
[50, 60 55 8
[60,70) 65 4
[70, 80) 75 2
Ing. Freddy Burgos Robalino, MDGPT.
Ejercicio…
En primer lugar vamos a calcular la
sumatoria de xi · fi, crearemos una
nueva columna para los productos
de la variable por su frecuencia
absoluta y lo sumaremos todo
También tenemos que calcular N
que es la sumatoria de las
frecuencias absolutas
xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
 42 1820
Ing. Freddy Burgos Robalino, MDGPT.
Media Geométrica
La media geométrica es un tipo de media que se
calcula como la raíz del producto de un conjunto
de números estrictamente positivos.
La media geométrica se calcula como un
producto conjunto. Es decir, que todos los valores
se multiplican entre sí. De modo que si uno de
ellos fuera cero, el producto total sería cero.
(verificar números que sean únicamente
positivos.)
La media geométrica se utiliza con más
frecuencia para calcular la tasa de crecimiento
porcentual promedio de algunas series dadas, a
través del tiempo.
Ing. Freddy Burgos Robalino, MDGPT.
Fórmula de la media geométrica
Donde.
N: Se trata del número total de observaciones. Por ejemplo, si tenemos el
crecimiento de los beneficios de una empresa durante 4 periodos, N será 4.
x: La variable X es sobre la que calculamos la media geométrica. Siguiendo el
ejemplo anterior, el crecimiento de los beneficios estará expresado en porcentaje y
será la variable X.
i: Representa la posición de cada observación. En este ejemplo, podríamos ponerle
un número cada periodo. Un 1, al periodo 1, un 2 al periodo 2, etc. De manera que
x1 es el crecimiento de los beneficios en el periodo 1, x2 el crecimiento de los
beneficios en el periodo 2, x3 el crecimiento de los beneficios en el periodo 3 y x4
el crecimiento de los beneficios en el periodo 4.
132
Ing. Freddy Burgos Robalino, MDGPT.
Fórmula de la media geométrica…
Se hace énfasis en que este tipo de media es adecuada para calcular
variables en porcentaje o índices. Una de sus principales ventajas es
que es menos sensible a valores extremos (muy grandes o muy
pequeños) que podrían alterar la media de una muestra estadística. Por
el contrario, su principal desventaja es que no puede utilizarse con
números negativos.
133
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de media geométrica
Supongamos los resultados de una
empresa. La empresa ha generado
un 20% de rentabilidad el primer
año, un 15% el segundo año, un 33%
el tercer año y un 25% el cuarto año.
Lo fácil, en este caso sería sumar las
cantidades y dividir entre cuatro. Sin
embargo esto no es correcto.
Para calcular la media de varios
porcentajes debemos hacer uso de la
media geométrica. Aplicado al caso
anterior, tendríamos lo siguiente:
134
Ing. Freddy Burgos Robalino, MDGPT.
Resultado del Ejemplo:
El resultado es 1,23, que
expresado en porcentaje es un
23%. Lo que quiere decir que en
promedio, cada año la empresa
ha ganado un 23%. Dicho de
otra forma, si cada año hubiese
ganado un 23%, hubiera ganado
lo mismo que ganando un 20%
el primer año, un 15% el
segundo, un 33% el tercero y un
25% el último año.
NOTA: Si las rentabilidades fueran
negativas, no se pondrían números
negativos. Si la rentabilidad es del -
20%, el número a multiplicar sería
0,80. Si la rentabilidad es del -5%, el
número a multiplicar sería 0,95. En
conclusión si las rentabilidades son
positivas, a uno le sumamos el
porcentaje en tanto por uno.
Mientras que, si las rentabilidades o
porcentajes son negativos, a 1 le
restamos el porcentaje en tanto por
uno.
135
Tomado de https://economipedia.com/definiciones/media-geometrica.html
Ing. Freddy Burgos Robalino, MDGPT.
Mediana
La mediana es el valor que cumple que la mitad de los valores de la
variable son inferiores a él y la otra mitad son superiores. Si el número
de datos en la muestra es impar será el valor central de la muestra
ordenada (muestra en la que las unidades experimentales aparecen
ordenadas según el valor que toman). Si el número de datos es par la
mediana se define como la media de los dos valores centrales de la
muestra ordenada.
Ing. Freddy Burgos Robalino, MDGPT.
Mediana
Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los
valores es menor que o igual a 13 y el 50% de los valores es mayor que
o igual a 13.
Si se ordenan todos los datos, de menor a mayor, la mediana es el
valor que ocupa la posición central. Si el número de datos es par, la
mediana es la media aritmética de los dos centrales
Ing. Freddy Burgos Robalino, MDGPT.
Mediana para Datos no agrupados
Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden
creciente y designando la mediana como Me, distinguimos dos casos:
Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una
vez que los datos han sido ordenados (en orden creciente o
decreciente), porque este es el valor central. Es decir: Me= x(n+1)/2.
Por ejemplo, si tenemos 5 datos, que ordenados son: x1=3, x2=6,
x3=7, x4=8, x5=9 => El valor central es el tercero: x(5+1)/2= x3=7. Este
valor, que es la mediana de ese conjunto de datos, deja dos datos por
debajo x1, x2 y otros dos por encima de él x4, x5.
Ing. Freddy Burgos Robalino, MDGPT.
Mediana para Datos no agrupados…
Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden
creciente y designando la mediana como Me, distinguimos dos casos:
b. Si n es par, la mediana es la media aritmética de los dos valores
centrales. Cuando n es par, los dos datos que están en el centro de
la muestra ocupan las posiciones n/2 y (n/2)+1. Es decir: Me=((x
n/2)+(x n/2+1)/2.
Por ejemplo, si tenemos 6 datos, que ordenados son: x1=3, x2=6, x3=7,
x4=8, x5=9, x6=10. Aquí dos valores que están por debajo del
x6/2=x3=7 y otros dos que quedan por encima del siguiente dato
x(6/2+1)=x4=8. Por tanto, la mediana de este grupo de datos es la
media aritmética de estos dos datos: Me=)x3+x4)/2=(7+8)/2=7,5.
Ing. Freddy Burgos Robalino, MDGPT.
Fórmula y cálculo de la mediana para datos agrupados
La mediana se encuentra en el
intervalo donde la frecuencia
acumulada llega hasta la mitad de
la suma de las frecuencias
absolutas.
Es decir tenemos que buscar el
intervalo en el que se encuentre.
Li es el límite inferior de la clase
donde se encuentra la mediana
N/2 es la semisuma de las
frecuencias absolutas
fi es la frecuencia absoluta de la
clase mediana
Fi - 1 es la frecuencia acumulada
anterior a la clase mediana
ai es la amplitud de la clase
La mediana es independiente de
las amplitudes de los intervalos
𝑀𝑒 = 𝐿𝑖 +
𝑁
2
− 𝐹𝑖 −1
𝑓𝑖
. 𝑎𝑖
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de cálculo de la mediana para distribución
estadística
Calcular la mediana de una distribución
estadística que viene dada por la siguiente
tabla
En primer lugar crearemos una nueva
columna con los valores de la frecuencia
acumulada:
En la primera casilla colocamos la primera
frecuencia absoluta. En la segunda casilla
sumamos el valor de la frecuencia
acumulada anterior más la frecuencia
absoluta correspondiente y así
sucesivamente hasta la última, que tiene que
se igual a N(100)
fi Fi
[60 , 63) 5 5
[63 , 66) 18 23
[66 , 69) 42 65
[69 , 72) 27 92
[72 , 75) 8 100
 100
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de cálculo de la mediana para distribución estadística
Buscamos el intervalo donde se encuentra
la mediana, para ello dividimos la N por 2
porque la mediana es el valor central
100/2 = 50. Buscamos en la columna de
las frecuencias acumuladas Fi el intervalo
que contiene a 50
Clase de la mediana: [66 , 69)
Aplicaremos la fórmula para el cálculo de
la mediana para datos agrupados,
extrayendo los siguientes datos:
fi Fi
[60 , 63) 5 5
[63 , 66) 18 23
[66 , 69) 42 65
[69 , 72) 27 92
[72 , 75) 8 100
 100
142
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo de cálculo de la mediana para distribución estadística
Li = 66
N/2 = 100/2 = 50
fi = 42
Fi - 1 = 23
ai = 3
Me = 66 + ((100/2 - 23) / 42) * 3
Me = 67,92
143
fi Fi
[60 , 63) 5 5
[63 , 66) 18 23
[66 , 69) 42 65
[69 , 72) 27 92
[72 , 75) 8 100
 100
𝑀𝑒 = 𝐿𝑖 +
𝑁
2
− 𝐹𝑖 −1
𝑓𝑖
. 𝑎𝑖
Ing. Freddy Burgos Robalino, MDGPT.
Moda
La moda es el valor que ocurre con más frecuencia en un conjunto de
observaciones. Mientras que la media y la mediana requieren un
cálculo, la moda se obtiene simplemente contando el número de veces
que cada valor ocurre en un conjunto de datos.
La moda puede ser única o no.
Ing. Freddy Burgos Robalino, MDGPT.
Unimodal
La calificaciones de los alumnos
de quinto año son:
2, 9, 5, 8, 9, 7, 3, 7, 6, 7.
Hallar la moda.
• Para resolver el problema
contamos cuántas veces se
repite cada valor.
Ing. Freddy Burgos Robalino, MDGPT.
Bimodal
La calificaciones de los alumnos
de sexto año son:
4, 9, 5, 8, 9, 7, 9, 7, 6, 7
Hallar la moda.
Ing. Freddy Burgos Robalino, MDGPT.
Gráficas de media, mediana y moda
En distribuciones simétricas la media aritmética, mediana y moda
coinciden.
Ing. Freddy Burgos Robalino, MDGPT.
Graficas de media, mediana y moda
Las distribuciones asimétricas pueden ser:
Asimétrica hacia la izquierda. Asimétrica hacia la derecha.
Ing. Freddy Burgos Robalino, MDGPT.
Moda de datos agrupados
Se calcula considerando la siguiente fórmula:
donde:
Li es el límite inferior
fi es la frecuencia del iésimo valor
fi+1 es la frecuencia del iésimo valor más uno, es decir, el siguiente
fi-1 es la frecuencia del iésimo valor menos uno, es decir, el anterior
ai es la amplitud de ese intervalo
Nota: Se debe tomar en la frecuencia absoluta el número más mayor.
149
𝑀𝑜 = 𝐿𝑖 +
𝑓𝑖 − 𝑓𝑖 −1
(𝑓𝑖 −𝑓𝑖−1)+(𝑓𝑖−𝑓𝑖+1)
. 𝑎𝑖
Ing. Freddy Burgos Robalino, MDGPT.
Relación empírica entre Media, Mediana y Moda
En las estadísticas, existe una relación entre la media, la mediana y el moda
que se basa empíricamente. Las observaciones de innumerables conjuntos
de datos han demostrado que la mayoría de las veces la diferencia entre la
media y la moda es tres veces mayor que la diferencia entre la media y la
mediana. Esta relación en forma de ecuación es:
Fórmula:
Media – Moda = 3(Media-Mediana)
Se puede despejar de la siguiente forma:
Moda = Media – 3(Media – Mediana)
El contraste con lo teórico es la forma empírica de adquirir conocimiento.
150
Ing. Freddy Burgos Robalino, MDGPT.
Ejemplo:
En un Banco se tomo la muestra de 40 personas que realizan sus
diferentes movimientos, para el banco es de gran importancia atender
a sus clientes lo más pronto posible. Desean saber aproximadamente
cuanto tiempo se tardan en realizar sus operaciones los resultados son
los siguientes que se presentan a continuación comprueba la relación
empírica.
151
Ing. Freddy Burgos Robalino, MDGPT
Bioestadística
ESTADÍSTICA DESCRIPTIVA
Medidas de posición:
Cuartiles, Percentiles, Deciles
SEMANA 6
Bioestadística
Ing. Freddy Burgos Robalino, MDGPT
GENERALIDADES
4.1. LOS CUARTILES 4.2 LOS DECILES 4.3 LOS PERCENTILES
Ing. Freddy Burgos Robalino, MDGPT
Cuartil
Los cuartiles son los tres valores de la
variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al
75% de los datos. dividen al conjunto de
datos ordenados en cuatro partes
porcentualmente iguales.
Q2 coincide con la mediana
El primer cuartil, es el valor en el cual o por
debajo del cual queda un cuarto (25%) de
todos los valores de la sucesión (ordenada);
el tercer cuartil, es el valor en el cual o por
debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Ing. Freddy Burgos Robalino, MDGPT
Cuartil Para Datos No Agrupados
• Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:
• Para el primer cuartil:
• Cuando n es par:
• Cuando n es impar:
• Para el tercer cuartil
• Cuando n es par:
• Cuando n es impar:
Ing. Freddy Burgos Robalino, MDGPT
Para Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos
un número grande de datos y tenemos en cuenta que en estos casos
generalmente los datos son resumidos en una tabla de frecuencia. La
fórmula para el cálculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:
K = 1, 2, 3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Ing. Freddy Burgos Robalino, MDGPT
Si se desea calcular cada cuartil individualmente, mediante otra
fórmula se tiene lo siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de
los datos; es decir, aquel valor de la variable que supera 25% de las
observaciones y es superado por el 75% de las observaciones.
Fórmula de Q1, para series de Datos agrupados:
Donde:
Li = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
Ing. Freddy Burgos Robalino, MDGPT
Para Q2:
El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md),
es el menor valor que es mayor que la mitad de los datos, es decir el 50% de
las observaciones son mayores que la mediana y el 50% son menores.
Fórmula de Q2, para series de Datos agrupados:
Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
Ing. Freddy Burgos Robalino, MDGPT
Para Q3:
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes
de los datos, es decir aquel valor de la variable que supera al 75% y es
superado por el 25% de las observaciones.
Fórmula de Q3, para series de Datos agrupados:
Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Ing. Freddy Burgos Robalino, MDGPT
DECILES
Los deciles son ciertos números que dividen la sucesión de datos
ordenados en diez partes porcentualmente iguales. Son los nueve
valores que dividen al conjunto de datos ordenados en diez partes
iguales, son también un caso particular de los percentiles. Los deciles
se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para
fijar el aprovechamiento académico. En estadística descriptiva, un decil
es cualquiera de los nueve valores que dividen a un grupo de datos
ordenados en diez partes iguales, de manera que cada parte representa
1/10 de la muestra o población.
Ing. Freddy Burgos Robalino, MDGPT
DECILES
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:
• Cuando n es par:
• Cuando n es impar:
Siendo A el número del decil.
Ing. Freddy Burgos Robalino, MDGPT
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil
k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Ing. Freddy Burgos Robalino, MDGPT
Otra fórmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las
observaciones y es superado por el 60% de las observaciones.
El quinto decil corresponde a la mediana.
Donde (para todos):
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Ing. Freddy Burgos Robalino, MDGPT
PERCENTIL
Los percentiles son los 99 valores que dividen la serie
de datos en 100 partes iguales. Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
Ing. Freddy Burgos Robalino, MDGPT
Percentil
Son usadas por los pediatras para
para valorar el desarrollo de los
niños en función de unos valores
de referencia admitidos de
antemano como normales para
niños de una misma edad, sexo y
raza.
Las tablas se dividen en curvas de
crecimiento para niños de 0 a 2
años y de 2 a 14 años y son
diferentes para niños y para niñas.
Ing. Freddy Burgos Robalino, MDGPT
Percentil Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:
k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Ing. Freddy Burgos Robalino, MDGPT
EJEMPLO: Determinación del primer cuartil, el séptimo decil y el
30 percentil, de la siguiente tabla:
Como son datos agrupados, se utiliza la fórmula
Salarios No. De Fa
(I. De Clases) Empleados (fi)
200-300 85 85
300-400 90 175
400-500 120 295
500-600 70 365
600-700 62 427
700-800 36 463
• Siendo, La posición del primer
cuartil.
• La posición del 7 decil.
• La posición del percentil 30.
Ing. Freddy Burgos Robalino, MDGPT
EJEMPLO:
Entonces,
El primer cuartil:
115.75 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90
463
4
= 115,75
Ing. Freddy Burgos Robalino, MDGPT
EJEMPLO:
El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posición:
138.9 – 85 = 53.9
Li= 300, fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $
334; que bajo 541.57 gana el 70% de los empleados y sobre $359.88, gana el 70% de los
empleados.

Weitere ähnliche Inhalte

Ähnlich wie 557907062-Examen-de-Bio.pdf

1. estadistica y planificacion prof gino giorgianni
1. estadistica y planificacion   prof gino giorgianni1. estadistica y planificacion   prof gino giorgianni
1. estadistica y planificacion prof gino giorgianni
Reina Hadas
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
reycol04
 
Conceptos.. salud
Conceptos.. salud Conceptos.. salud
Conceptos.. salud
Ayd Quizmex
 
Estadística-Conceptos Básicos
Estadística-Conceptos Básicos Estadística-Conceptos Básicos
Estadística-Conceptos Básicos
InEs' Rodriguez
 

Ähnlich wie 557907062-Examen-de-Bio.pdf (20)

1. estadistica y planificacion
1. estadistica y planificacion1. estadistica y planificacion
1. estadistica y planificacion
 
Investigación cuantitativa, metodología, Nataly Guerrero, Ramiro Zapata
Investigación cuantitativa, metodología, Nataly Guerrero, Ramiro ZapataInvestigación cuantitativa, metodología, Nataly Guerrero, Ramiro Zapata
Investigación cuantitativa, metodología, Nataly Guerrero, Ramiro Zapata
 
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
1. Est Des 1.1 y 1.2 Fundamentos_1 (1).docx
 
1. estadistica y planificacion prof gino giorgianni
1. estadistica y planificacion   prof gino giorgianni1. estadistica y planificacion   prof gino giorgianni
1. estadistica y planificacion prof gino giorgianni
 
Biometría i
Biometría iBiometría i
Biometría i
 
Importancia de la estadística: Unidad I
Importancia de la estadística: Unidad IImportancia de la estadística: Unidad I
Importancia de la estadística: Unidad I
 
Estudios estadisticos
Estudios estadisticosEstudios estadisticos
Estudios estadisticos
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
Investigacion cuantitativa
Investigacion cuantitativaInvestigacion cuantitativa
Investigacion cuantitativa
 
Estadistica descriptiva
Estadistica descriptivaEstadistica descriptiva
Estadistica descriptiva
 
Presentacion conceptos basicos
Presentacion conceptos basicosPresentacion conceptos basicos
Presentacion conceptos basicos
 
ACTUALIZADO BASES O FUNDAMENTOS DE INVESTIGACION DE ACUERDO AL ENFOQUE DE INV...
ACTUALIZADO BASES O FUNDAMENTOS DE INVESTIGACION DE ACUERDO AL ENFOQUE DE INV...ACTUALIZADO BASES O FUNDAMENTOS DE INVESTIGACION DE ACUERDO AL ENFOQUE DE INV...
ACTUALIZADO BASES O FUNDAMENTOS DE INVESTIGACION DE ACUERDO AL ENFOQUE DE INV...
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Conceptos.. salud
Conceptos.. salud Conceptos.. salud
Conceptos.. salud
 
TAREA 1. BIOESTADÍSTICA.pptx
TAREA 1. BIOESTADÍSTICA.pptxTAREA 1. BIOESTADÍSTICA.pptx
TAREA 1. BIOESTADÍSTICA.pptx
 
Introduccion a la bioestadistica
Introduccion a la bioestadisticaIntroduccion a la bioestadistica
Introduccion a la bioestadistica
 
Estadistica Unam
Estadistica UnamEstadistica Unam
Estadistica Unam
 
Estadística-Conceptos Básicos
Estadística-Conceptos Básicos Estadística-Conceptos Básicos
Estadística-Conceptos Básicos
 
Ines
InesInes
Ines
 
1. la estadística y conceptos básicos
1. la estadística y conceptos básicos1. la estadística y conceptos básicos
1. la estadística y conceptos básicos
 

Mehr von RichardPalaciosCastr (7)

Presentacion 1 Problemas de Medidas de tendencia Central.pptx
Presentacion 1 Problemas de Medidas de tendencia  Central.pptxPresentacion 1 Problemas de Medidas de tendencia  Central.pptx
Presentacion 1 Problemas de Medidas de tendencia Central.pptx
 
Subgrupo 1- ELA .pptx
Subgrupo 1- ELA .pptxSubgrupo 1- ELA .pptx
Subgrupo 1- ELA .pptx
 
insuficiencia valvular cardio.pptx
insuficiencia valvular cardio.pptxinsuficiencia valvular cardio.pptx
insuficiencia valvular cardio.pptx
 
Subgrupo 1 - Neurosemiología.pptx
Subgrupo 1 - Neurosemiología.pptxSubgrupo 1 - Neurosemiología.pptx
Subgrupo 1 - Neurosemiología.pptx
 
Diapsotivas - Grupo 2.pdf
Diapsotivas - Grupo 2.pdfDiapsotivas - Grupo 2.pdf
Diapsotivas - Grupo 2.pdf
 
LEUCEMIA MIELOIDE AGUDA.pptx
LEUCEMIA MIELOIDE AGUDA.pptxLEUCEMIA MIELOIDE AGUDA.pptx
LEUCEMIA MIELOIDE AGUDA.pptx
 
Caso clinico TBC 2023 - RICHARD PALACIOS.pdf
Caso clinico TBC 2023  - RICHARD PALACIOS.pdfCaso clinico TBC 2023  - RICHARD PALACIOS.pdf
Caso clinico TBC 2023 - RICHARD PALACIOS.pdf
 

Kürzlich hochgeladen

Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Fernando Solis
 

Kürzlich hochgeladen (20)

PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
activ4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdfactiv4-bloque4 transversal doctorado.pdf
activ4-bloque4 transversal doctorado.pdf
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
 
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.pptFUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
FUERZA Y MOVIMIENTO ciencias cuarto basico.ppt
 
prostitución en España: una mirada integral!
prostitución en España: una mirada integral!prostitución en España: una mirada integral!
prostitución en España: una mirada integral!
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 2º de la ESO
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
La Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración AmbientalLa Sostenibilidad Corporativa. Administración Ambiental
La Sostenibilidad Corporativa. Administración Ambiental
 
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...Louis Jean François Lagrenée.  Erotismo y sensualidad. El erotismo en la Hist...
Louis Jean François Lagrenée. Erotismo y sensualidad. El erotismo en la Hist...
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 

557907062-Examen-de-Bio.pdf

  • 1. Ing. Freddy Burgos Robalino UNIVERSIDAD DE GUAYAQUIL Bioestadística FUNDAMENTOS DE BIOESTADÍSTICA Definiciones e Ideas Básicas 1 SEMANA 1
  • 2. Ing. Freddy Burgos Robalino Estadística • La estadística deriva su nombre del hecho de haber sido aplicada en primer lugar a la recolecciòn de datos que permitieran la administración de los estados, con propósitos militares e impositivos. 2
  • 3. Ing. Freddy Burgos Robalino Estadística • La estadística es una ciencia y una rama de las matemáticas a través de la cual se recolecta, analiza, describe y estudia una serie de datos a fin de establecer comparaciones o variabilidades que permitan comprender un fenómeno en particular. • La estadística se vale, en gran medida, de la observación para la recolección de datos que posteriormente serán analizados y comparados a fin de obtener un resultado. 3
  • 4. Ing. Freddy Burgos Robalino Estadística • La Estadística estudia los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sean una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. 4
  • 5. Ing. Freddy Burgos Robalino Transversalidad de la Estadística • Una de las características fundamentales de la estadística es su transversalidad. Su metodología es aplicable al estudio de diversas disciplinas tales como: biología, física, economía, sociología, etc. • La estadística ayuda a obtener conclusiones relevantes para el estudio de todo tipo de agentes como: humanos, animales, plantas, etc. 5
  • 6. Ing. Freddy Burgos Robalino Ramas de la Estadística Estadística descriptiva Se refiere a los métodos de recolección,organización, resumen y presentación de un conjunto de datos. Se trata principalmente de describir las características fundamentales de los datos y para ellos se suelen utilizar indicadores, gráficos y tablas. Estadística inferencial Se trata de un paso más allá de la mera descripción. Se refiere a los métodos utilizados para poder hacer predicciones, generalizaciones y obtener conclusiones a partir de los datos analizados teniendo en cuenta el grado de incertidumbre existente. 6
  • 7. Ing. Freddy Burgos Robalino Diseño de Experimentos • ¿Qué es un experimento? • Es el cambio en las condiciones de operación de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio en una o varias variables del producto. Ello nos permite aumentar el conocimiento acerca del sistema o del proceso. • ¿Qué es un diseño de experimento? • Es la planificación de un conjunto de pruebas experimentales, de forma que los datos generados puedan analizarse estadísticamente para obtener conclusiones válidas y objetivas acerca del problema establecido. • Diseño de experimentos (DOE, Design of Experiments) es el estudio simultáneo de varias variables del proceso. Combinando varias variables en un estudio en vez de estudiarlas por separado. 7
  • 8. Ing. Freddy Burgos Robalino Razones para realizar un experimento Determinar las principales causas de la variación en una respuesta medida. Para encontrar las condiciones que dan lugar a un máximo o mínimo de respuesta 8
  • 9. Ing. Freddy Burgos Robalino Razones para realizar un experimento Para comparar las respuestas logradas con diferentes ajustes de variables controlables. Para obtener un modelo matemático que permita predecir respuestas futuras. 9
  • 10. Ing. Freddy Burgos Robalino Estadística Descriptiva • La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos. • La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto. 10 La estadística descriptiva proporciona los métodos para recabar información acerca de una determinada población que se desea conocer o investigar con fines específicos, entonces es importante obtener muestras adecuadas que permitan inferir el comportamiento de dicha población
  • 11. Ing. Freddy Burgos Robalino Metodología 11 Selección y determinación de la muestra. Obtención de los datos. Clasificación y organización de los datos. Análisis descriptivo de los datos. Representación gráfica de los datos. Contraste de hipótesis, si procede. Conclusiones
  • 12. Ing. Freddy Burgos Robalino Tablas y gráficos en la Estadística Descriptiva 12 Histogramas Gráficos de Barras Gráficos de Sectores Tablas de probabilidad Tablas bidimensionales Gráficos de cajas
  • 13. Ing. Freddy Burgos Robalino Inferencia Estadística • La inferencia estadística es el conjunto de métodos que permiten inducir, a través de una muestra estadística, el comportamiento de una determinada población. • La inferencia estadística, estudia entonces como, a través de la aplicación de dichos métodos sobre los datos de una muestra, se pueden extraer conclusiones sobre los parámetros de la población de datos. De la misma manera estudia también el grado de fiabilidad de los resultados extraídos del estudio. 13
  • 14. Ing. Freddy Burgos Robalino Para entender el concepto es necesario conocer: Inferencia Extraer juicios o conclusiones a partir de ciertos supuestos, sean estos generales o particulares. Población Una población de datos, es el conjunto total de datos que existen sobre un variable. Muestra estadística Una muestra es una parte de la población de datos. 14
  • 15. Ing. Freddy Burgos Robalino Bioestadística • La bioestadística es una disciplina científica que se encarga de la aplicación del análisis estadístico a diferentes cuestiones vinculadas a la biología, a las ciencias de la naturaleza, entre las que se encuentran todas las ciencias de la salud. Puede decirse que la bioestadística es un área o una especialización de la estadística, la ciencia dedicada al estudio cuantitativo de todo tipo de variables. • La Bioestadística envuelve el desarrollo y aplicación de técnicas estadísticas a la investigación en campos relacionados a la salud incluyendo medicina, epidemiología, salud pública y también en áreas de estudios ambientales, investigación agrícola y biología. 15
  • 16. Ing. Freddy Burgos Robalino Componente práctico de la Bioestadística Siendo una rama de la estadística, la Bioestadística abarca diferentes aspectos relacionados con el diseño de experimentos, la recogida de datos, y el análisis e interpretación de los mismos. En la fase de diseño de una investigación, la Bioestadística juega un papel importante a la hora de determinar el número de sujetos u observaciones que se deben incluir en el estudio, cómo van a seleccionarse los participantes y, si procede, la forma en la que estos deben ser asignados a los diferentes tratamientos o condiciones que van a investigarse. La Bioestadística proporciona las herramientas de análisis necesarias para describir y resumir los datos obtenidos y representarlos gráficamente. 16
  • 17. Ing. Freddy Burgos Robalino Componente teórico de la Bioestadística La Bioestadística tiene además un componente teórico. En los últimos años se ha producido un gran auge de la investigación en Bioestadística, mediante el desarrollo de nuevos métodos de análisis específicamente orientados a la resolución de problemas prácticos relacionados con las ciencias de la vida. Esto ha contribuido a mejorar la capacidad de extraer inferencias válidas a partir de los datos observados y avanzar así en una investigación de calidad en estos campos. 17
  • 18. Ing. Freddy Burgos Robalino Aplicaciones de la Bioestadística • El campo de aplicación de la Bioestadística es muy extenso. Los tratamientos médicos actuales se seleccionan en base a los resultados de ensayos clínicos que son diseñados y analizados de acuerdo con principios de la Bioestadística. • En el campo de la medicina, el análisis bioestadístico de estudios observacionales puede también ayudar a identificar factores de riesgo relacionados con el desarrollo de diferentes enfermedades, o a determinar la validez y fiabilidad de las pruebas utilizadas para el diagnóstico de diversas patologías. • La Bioestadística también se utiliza en la investigación de riesgos medioambientales, y ha sido empleada en el campo de la agricultura para mejorar los cultivos y la cría de animales. 18
  • 19. Ing. Freddy Burgos Robalino Población • Es el conjunto de todos los elementos o individuos cuyas propiedades o características (variables de estudio) se van a estudiar • Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). • "Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974). 19
  • 20. Ing. Freddy Burgos Robalino Tipos de Población POBLACIÓN DIANA Esta definida por los objetivos de estudio POBLACIÓN FINITA Cuando se conoce el tamaño de la población POBLACIÓN INFINITA Cuando no se conoce el tamaño de la población
  • 21. Ing. Freddy Burgos Robalino Muestra • Es un subconjunto de casos o individuos de la población de estudio; es el grupo de personas que realmente se estudiaran. • Debe ser representativa de la población y para lograr esto se tiene que tener bien definido los criterios de inclusión y exclusión así como la realización de una buena técnica de muestreo. • Una muestra representativa indica que reúne aproximadamente las características de la población que son importantes para la investigación. 21
  • 22. Ing. Freddy Burgos Robalino Porque y cuando calcular el tamaño de la Muestra ¿Por qué calcular el tamaño de la muestra? • Una muestra puede estudiarse con mayor rapidez que una población. • El estudio de una muestra es menos costoso. • Toma menos tiempo el estudio a realizar. • Los resultados son mas precisos. ¿Cuándo calcular el tamaño de la muestra? • Cuando no se puede estudiar toda la población • Cuando se quieren estudiar dos o mas grupos y establecer diferencias. • Cuando se quieren estimar parámetros, prevalencia, promedio, porcentajes y tasas.
  • 23. Ing. Freddy Burgos Robalino Muestreo • El muestreo es el proceso mediante el cual el investigador podrá seleccionar a los pacientes o a los sujetos de estudio a partir de la muestra calculada previamente. • Es la técnica empleada para la selección de elementos (unidades de análisis o de investigación) representativos de la población de estudio que conformarán una muestra y que será utilizada para hacer inferencias (generalización) a la población de estudio.
  • 24. Ing. Freddy Burgos Robalino Tipos de Muestreo • Probabilístico (Aleatorio) • No probabilístico
  • 25. Ing. Freddy Burgos Robalino Muestreo Probabilístico • Su principal característica es que todos los sujetos de la población de estudio tienen la misma probabilidad de ser seleccionados para formar parte de la muestra. Muestreo No Probabilístico • En este tipo de muestreo hay uno o mas criterios de selección por parte del investigador, para que uno o mas sujetos pueda formar parte del estudio. No todos los sujetos tienen la misma posibilidad para ser elegidos.
  • 26. Ing. Freddy Burgos Robalino Variables • El término variable refiere a cosas que son susceptibles de ser modificadas (de variar), de cambiar en función de algún motivo determinado o indeterminado. Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB • En estadística, es una característica o cualidad de un individuo que está propensa a adquirir diferentes valores. (Estos valores, se caracterizan por poder medirse). • Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una persona, son variables estadísticas 26
  • 27. Ing. Freddy Burgos Robalino Variables estadísticas • Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. • Las variables estadísticas son fundamentales para lograr estudiar eventos y circunstancias que tienen a oscilar en diferentes resultados o soluciones 27
  • 28. Ing. Freddy Burgos Robalino Clasificación de las Variables Estadísticas • Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC • Cualitativas: Serán cualitativas aquellas que expresen características o cualidades diferentes; • Cuantitativas: Serán cuantitativas cuando expresen argumentos numéricos Fuente: https://concepto.de/variable/#ixzz6RNUaF5GQ 28
  • 29. Ing. Freddy Burgos Robalino UNIVERSIDAD DE GUAYAQUIL Bioestadística FUNDAMENTOS DE BIOESTADÍSTICA Definiciones e Ideas Básicas 29 SEMANA 2 Bioestadística
  • 30. Ing. Freddy Burgos Robalino Variables • El término variable refiere a cosas que son susceptibles de ser modificadas (de variar), de cambiar en función de algún motivo determinado o indeterminado. Fuente: https://concepto.de/variable/#ixzz6RN4eKBMB • En estadística, es una característica o cualidad de un individuo que está propensa a adquirir diferentes valores. (Estos valores, se caracterizan por poder medirse). • Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una persona, son variables estadísticas 30
  • 31. Ing. Freddy Burgos Robalino Variables estadísticas • Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. • Las variables estadísticas son fundamentales para lograr estudiar eventos y circunstancias que tienen a oscilar en diferentes resultados o soluciones 31
  • 32. Ing. Freddy Burgos Robalino Clasificación de las Variables Estadísticas Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC • Cualitativas: Serán cualitativas aquellas que expresen características o cualidades diferentes; • Cuantitativas: Serán cuantitativas cuando expresen argumentos numéricos • Fuente: https://concepto.de/vari able/#ixzz6RNUaF5GQ 32
  • 33. Ing. Freddy Burgos Robalino Variables Cualitativas • Son aquellas que expresan características, cualidades o atributos, y no pueden ser medidas con números. Pueden ser ordinales o nominales. • Ejemplos de Variables cualitativas: • Red social preferida por los millenials. • El color de ojos de los actores de una película. • Posición en la que llega un corredor en la prueba de 100 metros planos. • El curso favorito de tus amigos. • Series de Netflix más vistas en tu país. • La tienda de ropa preferida por los habitantes de una ciudad. 33
  • 34. Ing. Freddy Burgos Robalino Variables Cuantitativas • Son aquellas que se expresan mediante un número, por tanto, se puede realizar operaciones aritméticas con ellas. Puede ser discretas o continuas. • Ejemplos de Variables cuantitativas: • El peso de las vacas de una granja. • Estatura de los habitantes de una ciudad. • El número de hijos en una familia. • Número de clientes atendidos en una tienda. • Velocidad a la que avanza un tren. • Número de personas que visitan el campus virtual de la UG en un día. • Cantidad de goles anotados en un partido de fútbol. 34
  • 35. Ing. Freddy Burgos Robalino Método Descriptivo • El método descriptivo es uno de los métodos cualitativos que se utilizan en investigaciones que tienen el objetivo de evaluar algunas características de una población o situación particular. • En la investigación descriptiva, el objetivo es describir el comportamiento o estado de un número de variables. El método descriptivo orienta al investigador en el método científico. 35
  • 36. Ing. Freddy Burgos Robalino Características • Suele atender a un método cualitativo • Es un primer abordaje al objeto que se esta estudiando y funciona como un catalizador de nuevas investigaciones • Hace posible la consecución de muchos datos sobre el objeto que se estudia • Implica una observación atenta y hay un registro fiel de lo que se observa • No implica generalizaciones ni proyecciones 36
  • 37. Ing. Freddy Burgos Robalino Escalas de Medición en Estadística • Escalas de medición: son una sucesión de medidas que permiten organizar datos en orden jerárquico. • Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables. • Las escalas de medición ofrecen información sobre la clasificación de variables discretas o continuas, también más conocidas como escalas grandes o pequeñas. 37
  • 38. Ing. Freddy Burgos Robalino Escalas de Medición en Estadística • La medición es un proceso inherente y consustancial a toda investigación, sea esta cualitativa y cuantitativa. • Se mide principalmente variables considerando tres elementos básicos: • La validez, consistencia y confiabilidad de los datos medidos dependen, en buena parte, de la escala de medición que se adopte. 38 El instrumento de medición La escala de medición El sistema de unidades de medición
  • 39. Ing. Freddy Burgos Robalino Nivel de Escala o medición • La medición puede definirse como la asignación de numerales a objetos o sucesos siguiendo ciertas reglas, Stevens (1946). El autor de esta definición desarrolló un método para clasificar los diferentes resultados de las mediciones en lo que llamó niveles de medición. • Un nivel de medición es la escala que representa una jerarquía de precisión dentro de la cual una variable puede evaluarse, en función de las características que rigen las escalas. 39
  • 40. Ing. Freddy Burgos Robalino Escalas de Medición Variables Cualitativas o Categóricas Ordinal Los datos pueden usarse para jerarquizar u ordenar las observaciones Nominal Los datos son etiquetas o categorías que se usan para definir un atributo de un elemento Variables Cuantitativas o Numéricas Intervalo Los datos tienen las propiedades de los datos ordinales, pero a su vez la separación entre las variables tiene sentido. El valor cero no indica la ausencia de la propiedad Razón Posee un cero absoluto (es indispensable que exista) y determina la igualdad de relaciones o proporciones. 40
  • 41. Ing. Freddy Burgos Robalino Por ejemplo, la variable estatura puede analizarse en diferentes niveles de medida • Un conjunto de personas pueden clasificarse en altos y bajos, A y B, creando dos grupos. Para ello no es necesario recurrir a ninguna cinta métrica, simplemente basta observar quienes destacan sobre los demás (el grupo de altos) y el resto completarán el grupo de bajos. El nivel de medición que corresponde a esta forma de medir es nominal. • También podrían alinearse a los sujetos y ordenarlos según su altura, el primero sería el más alto y el último el más bajo, de forma que cada persona tuviese delante a uno más alto y detrás a uno más bajo. El nivel de medición en este caso es ordinal. Hasta el momento no es posible decir cuánto es una persona más alta que otra.
  • 42. Ing. Freddy Burgos Robalino Por ejemplo, la variable estatura puede analizarse en diferentes niveles de medida • A través del número de personas que hay entre dos sujetos, por ejemplo, Andrea y Juan en la fila ordenada anteriormente. En este caso además del orden se conoce la magnitud de la altura. Si en lugar de utilizar el número de personas se recurre a una regla se puede ofrecer otra medida de la altura. Esta forma de medir es propia del nivel de intervalos, que permite saber la magnitud de los elementos comparando unos con otros. • La cuarta posibilidad es utilizar un metro que sitúa el cero en el mismo suelo y, por lo tanto, la altura se define en función de la distancia desde la cabeza al suelo (valor cero absoluto donde se sitúa la ausencia de altura). Una característica de esta clasificación es que las propiedades de una escala se cumplen en el nivel superior.
  • 43. Ing. Freddy Burgos Robalino Ejemplos: Escala Nominal • El sexo de una persona es un dato nominal no numérico. • El numero de seguro de salud de una persona es un dato nominal numérico. 43 Sexo: Masculino ( 1 ) Femenino ( 2 ) Tipos de Pacientes: Consulta externa (40) Emergencia (15) Internados (60)
  • 44. Ing. Freddy Burgos Robalino Ejemplos: Escala Ordinal • El estado de salud de un paciente son datos ordinales no numéricos. Estado de Salud Muy Saludable 5 Medianamente saludable 4 Saludable X 3 Poco Saludable 2 No Saludable 1 44
  • 45. Ing. Freddy Burgos Robalino Ejemplos: Escala Intervalo • La temperatura (en grados centígrados) media de una ciudad. • En esta escala, los número mayores corresponden a temperaturas mayores. Es decir, el orden importa, pero a la vez la diferencias entre las temperaturas importa. 45
  • 46. Ing. Freddy Burgos Robalino Ejemplos: Escala Razón • Variables como la edad, la distancia, la altura, el peso y el tiempo se miden con una escala de razón. 46
  • 47. Ing. Freddy Burgos Robalino Datos Cualitativos • Datos que se expresan en forma de palabras o textos que ayudan a comprender ciertas acciones y actitudes de los encuestados que no son cuantificables, por lo que su uso es muy importante para fundamentar cualquier investigación seria. • Este tipo de datos tienen como principal característica que no se pueden medir, ni expresarse con número, deben ser interpretados. • Los datos cualitativos son utilizados principalmente como el primer acercamiento al problema, ya que nos aporta información acerca de la existencia de una realidad en la que están involucrados nuestros participantes. 47
  • 48. Ing. Freddy Burgos Robalino Datos Cualitativos: Variables politómicas • Son aquellos que no se pueden expresa numéricamente. • Representan una cualidad o atributo que clasifica a cada sujeto en una de varias categorías. • Los valores para grupos de individuos generalmente se tabulan utilizando tablas de contingencia: • Ejemplo: 48 Médicos según Servicios UCI Cirugía Consulta Externa Medidas de aislamiento Lavado de manos Mascarillas Uso de guantes
  • 49. Ing. Freddy Burgos Robalino Datos Cualitativos: Variables dicotómicas • Son aquellos que no se pueden expresar numéricamente. • Representan una cualidad o atributo que clasifica a cada sujeto en una de varias categorías. • Ejemplo: 49 Vivo/ Muerto Este es el ejemplo más claro (por lo menos no se conocen muchos casos de estados intermedios entre la vida y la muerte). Sano/ Enfermo Requiere una definición para la condición de enfermo.
  • 50. Ing. Freddy Burgos Robalino Datos Cuantitativos • El concepto “datos cuantitativos” hace referencia a la información tangible, la que es obtenida mediante algún método de investigación. La manera de cuantificar los datos obtenidos en nuestro estudio nos dará la pauta de hacia qué rumbo dirigirse, de ahí la importancia de su correcto análisis para poder demostrar si estamos en lo correcto o no, en la hipótesis planteada. • Hay dos tipos de datos cuantitativos, que también se conocen como datos numéricos: continuo y discreto. Como regla general, los recuentos son discretos y las mediciones son continuas. 50
  • 51. Ing. Freddy Burgos Robalino Datos Cuantitativos: Datos Continuos • Se refiere al flujo constante de valores posibles de la variable, estos datos no se restringen a valores enteros (aunque normalmente son reducidos a valores enteros por aproximación). • Los datos continuos se miden en lugar de contarse. Además tienen entre sus características que pueden dividirse. • Son aquellos datos que pueden tomar cualquier valor (dentro de un rango) • Los datos continuos pueden tomar un número infinito de valores y no tiene categorías naturales. • Ejemplo: 51 Medir la altura de una persona Medir la altura en metros, centímetros y hasta dar una medida en milímetros, es decir, los datos son continuos Edad Definir una edad en años, meses y hasta día
  • 52. Ing. Freddy Burgos Robalino Datos Cuantitativos: Datos Discretos • Los datos discretos tiene un número finito de categorías naturales. • Prácticamente hablamos de números enteros, por valores completos. • Se cuentan, no se miden. • Ejemplo: 52 Número de hijos, adultos o mascotas en su familia. Son datos discretos, porque se cuentan por números indivisibles: no se puede tener 2,5 hijos, o 1,3 mascotas. Cantidad de empleados que trabajan en una tienda. Son datos discretos, porque se cuentan por números indivisibles: no se puede tener 20,5 empleados.
  • 55. UNIVERSIDAD DE GUAYAQUIL DISTRIBUCIÓN DE FRECUENCIA Generalidades
  • 56. Generalidades La organización de los datos constituye la primera etapa de su tratamiento, puesto que facilita los cálculos posteriores y evita posibles confusiones. Cuando no existían los computadores, o ni siquiera calculadoras, era necesario que los datos tuvieran alguna estructura que permitiera resumirlos y comprenderlos de una forma más o menos sencilla. La organización va a depender del número de observaciones distintas que se tengan y de las veces que se repitan cada una de ellas. En base a lo anterior, se pueden estructurar los datos de maneras diferentes.
  • 57. Generalidades… Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos En estadística y por consiguiente en bioestadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos.
  • 58. Recordemos: Variables en Estadística Variable Discreta Una variable discreta es aquella que no puede tomar algunos valores dentro de un mínimo conjunto numerable, quiere decir, no acepta cualquier valor, únicamente aquellos que pertenecen al conjunto. Ejemplos: número de empleados de una fábrica; número de hijos; Variable Continua Una variable continua es aquella que puede adoptar cualquier valor en el marco de un intervalo que ya está predeterminado. Ejemplos: temperaturas registradas en un observatorio; tiempo en recorrer una distancia en una carrera; contenido de alcohol en un cuba-libre; estatura
  • 59. Tipos de Frecuencia Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir, recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. Estos números se denominan frecuencias.
  • 60. Tipos de Frecuencia… FRECUENCIA ABSOLUTA Cuantas veces se repite un evento ( fi ) FRECUENCIA RELATIVA
  • 61. Frecuencia Absoluta La frecuencia absoluta es una medida estadística que nos da información acerca de la cantidad de veces que se repite un suceso al realizar un número determinado de experimentos aleatorios. Esta se representa mediante las letras fi. La letra f se refiere a la palabra frecuencia y la letra i se refiere a la realización i-ésima del experimento aleatorio. (En otros textos las encontraran como ni)
  • 62. Ejemplo de Frecuencia Absoluta (Variable Discreta) Supongamos que tenemos el número de miembros de una familia y los datos son los siguientes: 1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10. Xi = Variable aleatoria estadística, número de miembros de una familia. N = 20 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, el número de miembros de cada familia). Xi fi 1 1 2 2 3 1 4 1 5 4 6 2 7 2 8 3 9 1 10 3 ∑ 20
  • 63. Ejemplo de Frecuencia Absoluta (Variable continua) Supongamos que la altura de 15 personas que se presentan a los postulantes del cuerpo de policía nacional son las siguientes: 1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, 1,95, 1,73. Para elaborar la tabla de frecuencias, los valores se ordenan de menor a mayor, pero en este caso dado que la variable es continua y podría tomar cualquier valor de un espacio continuo infinitesimal, hay que agrupar las variables por intervalos. Por tanto tendremos: Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de policía nacional. N = 15 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, las alturas que se encuentran dentro de un determinado intervalo). Xi fi [1,70 , 1,80) 5 [1,80 , 1,90) 4 [1,90 , 2,00) 3 [2,00 , 2,10) 3 ∑ 15
  • 64. Frecuencia Relativa La frecuencia relativa es una medida estadística que se calcula como el cociente de la frecuencia absoluta de algún valor de la población/muestra (fi) entre el total de valores que componen la población/muestra (N) Para calcular la frecuencia relativa es necesario antes calcular la frecuencia absoluta. Sin ella no podríamos obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi y su fórmula de cálculo es la siguiente: Donde N = Tamaño de la muestra
  • 65. Para calcular la Frecuencia Relativa… hi = Frecuencia relativa de la observación i-ésima fi = Frecuencia absoluta de la observación i-ésima N = Número total de observaciones de la muestra De la fórmula de cálculo de la frecuencia relativa se desprenden dos conclusiones: La frecuencia relativa va a estar acotada entre 0 y 1, debido a que la frecuencia de los valores de la muestra, siempre va a ser menor al tamaño de la muestra. La suma de todas las frecuencias relativas va a ser 1 si se mide en tanto por 1, o 100 si se mide en tanto por ciento. Por consiguiente la frecuencia relativa nos informa acerca de la proporción o el peso que tiene algún valor u observación en la muestra. Esto la hace de especial utilidad, dado que a diferencia de la frecuencia absoluta, la frecuencia relativa nos va a permitir hacer comparaciones entre muestras de tamaños distintos. Esta se puede expresar como un valor decimal, como fracción o como porcentaje.
  • 66. Ejemplo de Frecuencia Relativa (Variable Discreta) Supongamos que tenemos el número de miembros de una familia y los datos son los siguientes: 1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10. Xi = Variable aleatoria estadística, número de miembros de una familia. N = 20 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, el número de miembros de una familia). hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la muestra). Xi fi hi 1 1 5% 2 2 10% 3 1 5% 4 1 5% 5 4 20% 6 2 10% 7 2 10% 8 3 15% 9 1 5% 10 3 15% ∑ 20 100%
  • 67. Ejemplo de Frecuencia Relativa (Variable continua) Supongamos que la altura de 15 personas que se presentan a las oposiciones del cuerpo de policía nacional son las siguientes: 1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, 1,95, 1,73. Para elaborar la tabla de frecuencias, los valores se ordenan de menor a mayor, pero en este caso dado que la variable es continua y podría tomar cualquier valor de un espacio continuo infinitesimal, hay que agrupar las variables por intervalos. Por tanto tendremos: Xi = Variable aleatoria estadística, altura de los opositores al cuerpo de policía nacional. N = 15 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, las alturas que se encuentran dentro de un determinado intervalo). hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la muestra) Xi fi hi [1,70 , 1,80) 5 33% [1,80 , 1,90) 4 27% [1,90 , 2,00) 3 20% [2,00 , 2,10) 3 20% ∑ 15 100%
  • 68. Ejemplo Personas Activas Número Familias Xi fi fi/N hi 1 16 16/50 32% 2 20 20/50 40% 3 9 9/50 18% 4 5 5/50 10% Total 50 100%
  • 69. APLICACIONES INFORMÁTICAS PARA OBTENER LA TABLA DE FRECUENCIAS USO DE FÓRMULAS DE EXCEL USO DE ANÁLISIS DE DATOS
  • 72. Ing. Freddy Burgos Robalino, MDGPT UNIVERSIDAD DE GUAYAQUIL Bioestadística DISTRIBUCIONES SEMANA 4 Bioestadística 72
  • 73. Ing. Freddy Burgos Robalino, MDGPT Generalidades FRECUENCIA ABSOLUTA ACUMULADA FRECUENCIA RELATIVA ACUMULADA 73
  • 74. Ing. Freddy Burgos Robalino, MDGPT DISTRIBUCIÓN DE FRECUENCIA ACUMULADA Generalidades 74
  • 75. Ing. Freddy Burgos Robalino, MDGPT Tipos de Frecuencia Acumulada FRECUENCIA ABSOLUTA ACUMULADA Sumatoria del número de veces que se repite el suceso (Fi) FRECUENCIA RELATIVA ACUMULADA Sumatoria de la proporción que representa el valor i- ésimo en la muestra (Hi) 75
  • 76. Ing. Freddy Burgos Robalino, MDGPT Frecuencia Acumulada La frecuencia acumulada es el resultado de sumar sucesivamente las frecuencias absolutas o relativas, desde el menor al mayor de sus valores 76
  • 77. Ing. Freddy Burgos Robalino, MDGPT Frecuencia Absoluta Acumulada La frecuencia absoluta acumulada es el resultado de ir sumando las frecuencias absolutas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Fi. Para calcular la frecuencia absoluta acumulada, hay que calcular primero la frecuencia absoluta (fi) de la población o muestra. Para ello, los datos se ordenan de menor a mayor y se colocan en una tabla. Una vez hecho esto, la frecuencia absoluta acumulada se obtiene de ir sumando las frecuencias absolutas de una clase o grupo de la muestra con la anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así sucesivamente hasta llegar a acumular del primer grupo al último). 77
  • 78. Ing. Freddy Burgos Robalino, MDGPT Ejemplo de Frecuencia Absoluta Acumulada (Variable Discreta) Supongamos que tenemos el número de miembros de una familia y los datos son los siguientes: 1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10. Xi = Variable aleatoria estadística, miembros de una familia. N = 20 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, los miembros de la familia). Fi= Frecuencia absoluta acumulada (sumatorio del número de veces que se repite el suceso, en este caso miembros de una familia) Xi fi Fi 1 1 1 2 2 3 (1+2) 3 1 4 (3+1) 4 1 5 (4+1) 5 4 9 (5+4) 6 2 11 (9+2) 7 2 13 (11+2) 8 3 16 (13+3) 9 1 17 (16+1) 10 3 20 (17+3) ∑ 20 78
  • 79. Ing. Freddy Burgos Robalino, MDGPT Ejemplo de Frecuencia Absoluta Acumulada (Variable continua) Supongamos que la altura de 15 personas que se presentan a las postulaciones del cuerpo de policía nacional son las siguientes: 1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, 1,95, 1,73. Para elaborar la tabla de frecuencias, los valores se ordenan de menor a mayor, pero en este caso dado que la variable es continua y podría tomar cualquier valor de un espacio continuo infinitesimal, hay que agrupar las variables por intervalos. Por tanto tenemos: Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de policía nacional. N = 15 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, las alturas que se encuentran dentro de un determinado intervalo). Fi = Sumatorio del número de veces que se repite el suceso (en este caso, las alturas que se encuentran dentro de un determinado intervalo). Xi fi Fi [1,70 , 1,80) 5 5 [1,80 , 1,90) 4 9 (5+4) [1,90 , 2,00) 3 12 (9+3) [2,00 , 2,10) 3 15 (12+3) ∑ 15 79
  • 80. Ing. Freddy Burgos Robalino, MDGPT Frecuencia Relativa Acumulada La frecuencia relativa acumulada es el resultado de ir sumando las frecuencias relativas de las observaciones o valores de una población o muestra. Esta se representa por las siglas Hi. Para calcular la frecuencia relativa acumulada, hay que calcular primero la frecuencia absoluta (fi) y la frecuencia relativa (hi) de los valores de la población o muestra Para ello, los datos se ordenan de menor a mayor y se colocan en una tabla. Una vez hecho esto, la frecuencia relativa acumulada se obtiene de ir sumando las frecuencias relativas de una clase o grupo de la muestra con la anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer grupo y así sucesivamente hasta llegar a acumular del primer grupo al último). 80
  • 81. Ing. Freddy Burgos Robalino, MDGPT Ejemplo de Frecuencia Relativa Acumulada (Variable Discreta) Supongamos que tenemos el número de miembros de una familia y los datos son los siguientes : 1, 2, 8, 5, 8, 3, 8, 5, 6, 10, 5, 7, 9, 4, 10, 2, 7, 6, 5, 10. Xi = Variable aleatoria estadística, miembros de una familia. N = 20 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, miembros de una familia). hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la muestra). Hi = Frecuencia relativa acumulada (Sumatorio de la proporción que representa el valor i-ésimo en la muestra) Xi fi hi Hi 1 1 5% 5% 2 2 10% 15%(5+10) 3 1 5% 20%(15+5) 4 1 5% 25%(20+5) 5 4 20% 45%(25+20) 6 2 10% 55%(45+10) 7 2 10% 65%(55+10) 8 3 15% 80%(65+15) 9 1 5% 85%(80+5) 10 3 15% 100%(85+15) ∑ 20 100% 81
  • 82. Ing. Freddy Burgos Robalino, MDGPT Ejemplo de Frecuencia Relativa Acumulada (Variable continua) Supongamos que la altura de 15 personas que se presentan a las postulaciones del cuerpo de policía nacional son las siguientes: 1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, 1,95, 1,73. Para elaborar la tabla de frecuencias, los valores se ordenan de menor a mayor, pero en este caso dado que la variable es continua y podría tomar cualquier valor de un espacio continuo infinitesimal, hay que agrupar las variables por intervalos. Por tanto tenemos: Xi = Variable aleatoria estadística, altura de los postulantes al cuerpo de policía nacional. N = 15 fi = Frecuencia absoluta = Número de veces que se repite el suceso (en este caso, las alturas que se encuentran dentro de un determinado intervalo). hi = Frecuencia relativa (proporción que representa el valor i-ésimo en la muestra). Hi = Sumatorio de la proporción que representa el valor i-ésimo en la muestra. Xi f i hi Hi [1,70 , 1,80) 5 33% 33% [1,80 , 1,90) 4 27% 60%(33+27) [1,90 , 2,00) 3 20% 80%(50+20) [2,00 , 2,10) 3 20% 100%(80+20) ∑ 15 100% 82
  • 83. Ing. Freddy Burgos Robalino, MDGPT Ejemplo: Personas Activas Número Familias Xi fi fi/N hi Fi Fi/N Hi 1 16 16/50 32% 16 16/50 32% 2 20 20/50 40% 36 36/50 72% 3 9 9/50 18% 45 45/50 90% 4 5 5/50 10% 50 50/50 100% Total 50 100% 83
  • 84. Ing. Freddy Burgos Robalino, MDGPT Distribución de frecuencias agrupadas O tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. 84
  • 85. Ing. Freddy Burgos Robalino, MDGPT Distribución de frecuencias agrupadas… No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; se sugiere cuando el número total datos (N) es igual o superior de 50 e y además el rango o recorrido de la serie de datos es mayor de 20, entonces se utilizará la distribución de frecuencias para datos agrupados, también se utilizara este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva. 85
  • 86. Ing. Freddy Burgos Robalino, MDGPT Distribución de frecuencias agrupadas… La razón fundamental para utilizar la distribución de frecuencias de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, considerar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. 86
  • 87. Ing. Freddy Burgos Robalino, MDGPT Clase y Determinación del número de clases. Concepto: Es el número de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar mediante una letra, un número o alguna característica del subconjunto. El número de clases en que se agrupan los datos se determina con la raíz cuadrada del número de datos cuando este es menor de 200. Número de clases = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 Para muestras con 200 o más datos el número de clases se determina con la raíz cúbica del número de datos. Número de clases = 3 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. 87
  • 88. Ing. Freddy Burgos Robalino, MDGPT Fórmula de Sturges Este es otra forma para calcular el intervalo de la clase: La fórmula de Sturges, determina un número aproximado de intervalos "k". Aunque ésta no siempre resulta muy adecuada, es una relación muy utilizada: k = 1 + 3.322 log (n). Donde: n es el número de datos a condensar en la tabla. 88
  • 89. Ing. Freddy Burgos Robalino, MDGPT Intervalo de clase y Cómo calcular el intervalo de clase Concepto: Es un conjunto de elementos que forman a una clase, conteniendo un límite inferior y un límite superior. Como calcular el intervalo de la clase: Calcular el rango de datos. El rango es la diferencia entre los puntos de datos más altos y más bajos. Determinar el número de clases del tamaño de la muestra. Como regla general, se utilizan de cinco a siete clases para un tamaño de la muestra de hasta 50, de ocho a 10 clases para un tamaño de la muestra entre 50 y 100, 10 a 15 clases para un tamaño de la muestra entre 100 y 250 y de 15 a 20 clases para un tamaño de la muestra mayor a 250. Calcula el intervalo de clase utilizando la siguiente fórmula: intervalo de clase = rango/número de clases. 89
  • 90. Ing. Freddy Burgos Robalino, MDGPT Tamaño de clase y Cálculo del tamaño de clase. Concepto: Es la diferencia entre dos límites inferiores o superiores de clases sucesivas. Para determinar el tamaño de clase es necesario conocer el rango de la muestra, que se obtiene con la diferencia entre el dato mayor y el dato menor de la muestra y se representa con la letra R. R = dato mayor - dato menor El tamaño de clase se obtiene al dividir el rango entre el número de clases, y se representa con la letra c. Tamaño de clase = rango /número de clases c= R/ 𝑛𝑢𝑚𝑒𝑟𝑜𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 90
  • 91. Ing. Freddy Burgos Robalino, MDGPT Amplitud y Marca de Clase La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase (tamaño de la clase) La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. 91
  • 92. Ing. Freddy Burgos Robalino, MDGPT Elaboración de intervalos. El tamaño de clase indica el número de datos que conforman a cada intervalo, considerando los valores extremos llamados límites. En cada intervalo aparece un límite inferior (LI) y un límite superior (LS). Cada intervalo se forma sumando al límite inferior (LI) un número menos que el tamaño de clase para obtener el límite superior (LS) 92
  • 93. Ing. Freddy Burgos Robalino, MDGPT APLICACIONES INFORMÁTICAS PARA OBTENER LA TABLA DE FRECUENCIAS USO DE FÓRMULAS DE EXCEL USO DE ANÁLISIS DE DATOS 93
  • 94. Ing. Freddy Burgos Robalino, MDGPT Bioestadística GRÁFICOS SEMANA 5 Bioestadística
  • 95. Ing. Freddy Burgos Robalino, MDGPT ¿Qué es un gráfico? Generalidades: Un grafico es la representación de datos, generalmente numéricos , mediante líneas, superficies o símbolos, para ver la relación que esos datos guardan entre si y facilitar su interpretación. La utilización de gráficos hace mas sencilla e inmediata la interpretación de los datos. La calidad de un gráfico estadístico consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que: • Induzca a pensar en el contenido más que en la apariencia. • No distorsione la información proporcionada por los datos. • Presente mucha información (números) en poco espacio. • Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal)
  • 96. Ing. Freddy Burgos Robalino, MDGPT Elementos de un gráfico Área del gráfico: Área que se encuentra definida por el marco del gráfico y que incluye todas sus partes. Título del gráfico: Texto descriptivo del gráfico que se coloca en la parte superior. Series de datos: Son los puntos de datos relacionados entre sí trazados en un gráfico. Cada serie de datos tiene un color exclusivo. Un gráfico puede tener una o más series de datos a excepción de los gráficos circulares que solamente pueden tener una serie de datos. Ejes: Línea que sirve como referencia de medida. El eje Y es conocido como el eje vertical y generalmente contiene datos. El eje X es conocido también como el eje horizontal y suele contener las categorías del gráfico. Líneas de división: Son líneas opcionales que extienden los valores de los ejes de manera que faciliten su lectura e interpretación. Título de eje: Texto descriptivo que se alinea automáticamente al eje correspondiente. Leyenda: Recuadro que ayuda a identificar los colores asignados a las series de datos.
  • 97. Ing. Freddy Burgos Robalino, MDGPT Elementos de un gráfico
  • 98. Ing. Freddy Burgos Robalino, MDGPT Elementos de un gráfico
  • 99. Ing. Freddy Burgos Robalino, MDGPT Representaciones gráficas de datos cualitativos En cuanto a la representación gráfica de las variables cualitativas destacamos dos tipos de gráfico por ser los que se utilizan con mayor frecuencia. • Diagrama de sectores. • Gráfico de barras.
  • 100. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 100
  • 101. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE SECTORES • El diagrama de sectores, se utiliza para visualizar de forma sencilla las frecuencias relativas de las variables. • En los gráficos de sectores se divide una figura, habitualmente de forma circular, de forma que el área correspondiente a cada posible respuesta de la variable será proporcional a la frecuencia relativa de la variable.
  • 102. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE SECTORES Ejemplo: Se ha encuestado a 30 personas sobre el color de sus ojos, obteniendo los siguientes resultados. 102 Marrón Verde Verde Azul Marrón Azul Marrón Marrón Azul Marrón Azul Marrón Verde Verde Marrón Azul Verde Marrón Marrón Azul Marrón Verde Marrón Verde Verde Marrón Marrón Marrón Azul Marrón
  • 103. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE SECTORES CATEGORIA fi hi Grados 30 --> 360° Marrón 15 0.50 180 Verde 8 0.27 96 Azul 7 0.23 84 N 30 1.00 360 Marrón 0,50 50% Verde 0,27 27% Azul 0,23 23% Diagrama de sectores: Color de ojos Marrón Verde Azul
  • 104. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 104
  • 105. Ing. Freddy Burgos Robalino, MDGPT GRÁFICO DE BARRAS En este tipo de gráfico se representa una barra vertical u horizontal para cada una de las categorías de la variable de altura proporcional a su frecuencia absoluta o relativa. 15 8 7 0 2 4 6 8 10 12 14 16 Marrón Verde Azul Diagrama de barras: Color de ojos - fi
  • 106. Ing. Freddy Burgos Robalino, MDGPT Representaciones gráficas de datos cuantitativos Estas representaciones nos ayudarán a visualizar los datos y a conocer sus principales características. Entre las principales representaciones gráficas tenemos: • Gráfico de barras • Histograma • Polígonos de frecuencia • Diagrama de tallos y hojas • Diagrama de cajas
  • 107. Ing. Freddy Burgos Robalino, MDGPT GRÁFICO DE BARRAS Se usan también para representar la distribución de frecuencias de variables discretas. Cada categoría se representa por una barra cuyo largo indica la frecuencia de observaciones de dicha categoría. 1 2 1 1 4 2 2 3 1 3 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 1 2 3 4 5 6 7 8 9 10 CANTIDAD DE ESTUDIANTES NOTAS GRÁFICO DE BARRAS: NOTAS DE EXÁMES - FI Xi fi 1 1 2 2 3 1 4 1 5 4 6 2 7 2 8 3 9 1 10 3 ∑ 20
  • 108. Ing. Freddy Burgos Robalino, MDGPT Gráficos estadísticos: Variables cuantitativas continuas Generalidades: • Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias. • Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base
  • 109. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 109
  • 110. Ing. Freddy Burgos Robalino, MDGPT HISTOGRAMA Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias. Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base Xi fi [1,70 , 1,80) 5 [1,80 , 1,90) 4 [1,90 , 2,00) 3 [2,00 , 2,10) 3 ∑ 15
  • 111. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 111
  • 112. Ing. Freddy Burgos Robalino, MDGPT POLÍGONOS DE FRECUENCIA Son diagramas de línea que se obtienen al unir los puntos medios del lado superior de cada rectángulo del histograma correspondiente. El histograma y el polígono de frecuencias son gráficos que se utilizan para representar distribuciones de frecuencias para datos agrupados. Xi Marca de clase fi [1,70 , 1,80) 1,75 5 [1,80 , 1,90) 1,85 4 [1,90 , 2,00) 1,95 3 [2,00 , 2,10) 2,05 3 ∑ 15
  • 113. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 113
  • 114. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE TALLOS Y HOJAS El diagrama "tallo y hojas permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para construirlo basta separar en cada dato el último dígito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formará el tallo).
  • 115. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE TALLOS Y HOJAS Se tiene los siguientes datos edad correspondiente a 20 personas, construir el diagrama de tallos y hojas. 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
  • 116. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE TALLOS Y HOJAS Se tiene los siguientes datos edad correspondiente a 20 personas, construir el diagrama de tallos y hojas.
  • 117. Ing. Freddy Burgos Robalino, MDGPT Generalidades 1.4.1 Gráfico de Sectores 1.4.1 Gráfico de barras. 1.4.2 Histograma s 1.4.3 Polígonos 1.4.4 Gráfico de tallo y hojas. 1.4.5 Diagrama de caja. 117
  • 118. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE CAJAS Los diagramas de Caja-Bigotes son una presentación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente. Construcción: Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
  • 119. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE CAJAS Se tiene los siguientes datos edad correspondiente a 20 personas, construir el diagrama de tallos y hojas.
  • 120. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE CAJAS
  • 121. Ing. Freddy Burgos Robalino, MDGPT DIAGRAMA DE CAJAS
  • 122. Ing. Freddy Burgos Robalino, MDGPT. Bioestadística ESTADÍSTICA DESCRIPTIVA Medidas de tendencia central: Media, mediana y moda SEMANA 6 Bioestadística
  • 123. Ing. Freddy Burgos Robalino, MDGPT. Generalidades LA MEDIA ARITMÉTICA LA MEDIANA LA MODA 123
  • 124. Ing. Freddy Burgos Robalino, MDGPT. Unidades Experimentales (Muestra) Es una porción de la información a analizar. Ejemplo: muestra compuesta por ocho personas.
  • 125. Ing. Freddy Burgos Robalino, MDGPT. Media (promedio) La media es la suma de todas las observaciones dividida entre el número de observaciones. Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3, 2, 4, 1 y 2. El tiempo medio de espera es: En promedio, un cliente espera 2.4 minutos para ser atendido en el banco.
  • 126. Ing. Freddy Burgos Robalino, MDGPT. Media Aritmética La media aritmética es el valor promedio de las muestras y es independiente de las amplitudes de los intervalos. La media aritmética es el valor que se obtiene al sumar todos los datos que tenemos y dividir el resultado entre el número total de esos datos es el símbolo de la media aritmética.
  • 127. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo de datos no agrupados Los pesos de seis amigos son 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio
  • 128. Ing. Freddy Burgos Robalino, MDGPT. Media aritmética para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
  • 129. Ing. Freddy Burgos Robalino, MDGPT. Ejercicio de media aritmética En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcule la puntuación media xi fi [10, 20) 15 1 [20, 30) 25 8 [30,40) 35 10 [40, 50) 45 9 [50, 60 55 8 [60,70) 65 4 [70, 80) 75 2
  • 130. Ing. Freddy Burgos Robalino, MDGPT. Ejercicio… En primer lugar vamos a calcular la sumatoria de xi · fi, crearemos una nueva columna para los productos de la variable por su frecuencia absoluta y lo sumaremos todo También tenemos que calcular N que es la sumatoria de las frecuencias absolutas xi fi xi · fi [10, 20) 15 1 15 [20, 30) 25 8 200 [30,40) 35 10 350 [40, 50) 45 9 405 [50, 60 55 8 440 [60,70) 65 4 260 [70, 80) 75 2 150  42 1820
  • 131. Ing. Freddy Burgos Robalino, MDGPT. Media Geométrica La media geométrica es un tipo de media que se calcula como la raíz del producto de un conjunto de números estrictamente positivos. La media geométrica se calcula como un producto conjunto. Es decir, que todos los valores se multiplican entre sí. De modo que si uno de ellos fuera cero, el producto total sería cero. (verificar números que sean únicamente positivos.) La media geométrica se utiliza con más frecuencia para calcular la tasa de crecimiento porcentual promedio de algunas series dadas, a través del tiempo.
  • 132. Ing. Freddy Burgos Robalino, MDGPT. Fórmula de la media geométrica Donde. N: Se trata del número total de observaciones. Por ejemplo, si tenemos el crecimiento de los beneficios de una empresa durante 4 periodos, N será 4. x: La variable X es sobre la que calculamos la media geométrica. Siguiendo el ejemplo anterior, el crecimiento de los beneficios estará expresado en porcentaje y será la variable X. i: Representa la posición de cada observación. En este ejemplo, podríamos ponerle un número cada periodo. Un 1, al periodo 1, un 2 al periodo 2, etc. De manera que x1 es el crecimiento de los beneficios en el periodo 1, x2 el crecimiento de los beneficios en el periodo 2, x3 el crecimiento de los beneficios en el periodo 3 y x4 el crecimiento de los beneficios en el periodo 4. 132
  • 133. Ing. Freddy Burgos Robalino, MDGPT. Fórmula de la media geométrica… Se hace énfasis en que este tipo de media es adecuada para calcular variables en porcentaje o índices. Una de sus principales ventajas es que es menos sensible a valores extremos (muy grandes o muy pequeños) que podrían alterar la media de una muestra estadística. Por el contrario, su principal desventaja es que no puede utilizarse con números negativos. 133
  • 134. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo de media geométrica Supongamos los resultados de una empresa. La empresa ha generado un 20% de rentabilidad el primer año, un 15% el segundo año, un 33% el tercer año y un 25% el cuarto año. Lo fácil, en este caso sería sumar las cantidades y dividir entre cuatro. Sin embargo esto no es correcto. Para calcular la media de varios porcentajes debemos hacer uso de la media geométrica. Aplicado al caso anterior, tendríamos lo siguiente: 134
  • 135. Ing. Freddy Burgos Robalino, MDGPT. Resultado del Ejemplo: El resultado es 1,23, que expresado en porcentaje es un 23%. Lo que quiere decir que en promedio, cada año la empresa ha ganado un 23%. Dicho de otra forma, si cada año hubiese ganado un 23%, hubiera ganado lo mismo que ganando un 20% el primer año, un 15% el segundo, un 33% el tercero y un 25% el último año. NOTA: Si las rentabilidades fueran negativas, no se pondrían números negativos. Si la rentabilidad es del - 20%, el número a multiplicar sería 0,80. Si la rentabilidad es del -5%, el número a multiplicar sería 0,95. En conclusión si las rentabilidades son positivas, a uno le sumamos el porcentaje en tanto por uno. Mientras que, si las rentabilidades o porcentajes son negativos, a 1 le restamos el porcentaje en tanto por uno. 135 Tomado de https://economipedia.com/definiciones/media-geometrica.html
  • 136. Ing. Freddy Burgos Robalino, MDGPT. Mediana La mediana es el valor que cumple que la mitad de los valores de la variable son inferiores a él y la otra mitad son superiores. Si el número de datos en la muestra es impar será el valor central de la muestra ordenada (muestra en la que las unidades experimentales aparecen ordenadas según el valor que toman). Si el número de datos es par la mediana se define como la media de los dos valores centrales de la muestra ordenada.
  • 137. Ing. Freddy Burgos Robalino, MDGPT. Mediana Para estos datos ordenados, la mediana es 13. Es decir, el 50% de los valores es menor que o igual a 13 y el 50% de los valores es mayor que o igual a 13. Si se ordenan todos los datos, de menor a mayor, la mediana es el valor que ocupa la posición central. Si el número de datos es par, la mediana es la media aritmética de los dos centrales
  • 138. Ing. Freddy Burgos Robalino, MDGPT. Mediana para Datos no agrupados Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos: Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque este es el valor central. Es decir: Me= x(n+1)/2. Por ejemplo, si tenemos 5 datos, que ordenados son: x1=3, x2=6, x3=7, x4=8, x5=9 => El valor central es el tercero: x(5+1)/2= x3=7. Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo x1, x2 y otros dos por encima de él x4, x5.
  • 139. Ing. Freddy Burgos Robalino, MDGPT. Mediana para Datos no agrupados… Sean x1, x2, x3,…, xn los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos: b. Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando n es par, los dos datos que están en el centro de la muestra ocupan las posiciones n/2 y (n/2)+1. Es decir: Me=((x n/2)+(x n/2+1)/2. Por ejemplo, si tenemos 6 datos, que ordenados son: x1=3, x2=6, x3=7, x4=8, x5=9, x6=10. Aquí dos valores que están por debajo del x6/2=x3=7 y otros dos que quedan por encima del siguiente dato x(6/2+1)=x4=8. Por tanto, la mediana de este grupo de datos es la media aritmética de estos dos datos: Me=)x3+x4)/2=(7+8)/2=7,5.
  • 140. Ing. Freddy Burgos Robalino, MDGPT. Fórmula y cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre. Li es el límite inferior de la clase donde se encuentra la mediana N/2 es la semisuma de las frecuencias absolutas fi es la frecuencia absoluta de la clase mediana Fi - 1 es la frecuencia acumulada anterior a la clase mediana ai es la amplitud de la clase La mediana es independiente de las amplitudes de los intervalos 𝑀𝑒 = 𝐿𝑖 + 𝑁 2 − 𝐹𝑖 −1 𝑓𝑖 . 𝑎𝑖
  • 141. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo de cálculo de la mediana para distribución estadística Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla En primer lugar crearemos una nueva columna con los valores de la frecuencia acumulada: En la primera casilla colocamos la primera frecuencia absoluta. En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta correspondiente y así sucesivamente hasta la última, que tiene que se igual a N(100) fi Fi [60 , 63) 5 5 [63 , 66) 18 23 [66 , 69) 42 65 [69 , 72) 27 92 [72 , 75) 8 100  100
  • 142. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo de cálculo de la mediana para distribución estadística Buscamos el intervalo donde se encuentra la mediana, para ello dividimos la N por 2 porque la mediana es el valor central 100/2 = 50. Buscamos en la columna de las frecuencias acumuladas Fi el intervalo que contiene a 50 Clase de la mediana: [66 , 69) Aplicaremos la fórmula para el cálculo de la mediana para datos agrupados, extrayendo los siguientes datos: fi Fi [60 , 63) 5 5 [63 , 66) 18 23 [66 , 69) 42 65 [69 , 72) 27 92 [72 , 75) 8 100  100 142
  • 143. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo de cálculo de la mediana para distribución estadística Li = 66 N/2 = 100/2 = 50 fi = 42 Fi - 1 = 23 ai = 3 Me = 66 + ((100/2 - 23) / 42) * 3 Me = 67,92 143 fi Fi [60 , 63) 5 5 [63 , 66) 18 23 [66 , 69) 42 65 [69 , 72) 27 92 [72 , 75) 8 100  100 𝑀𝑒 = 𝐿𝑖 + 𝑁 2 − 𝐹𝑖 −1 𝑓𝑖 . 𝑎𝑖
  • 144. Ing. Freddy Burgos Robalino, MDGPT. Moda La moda es el valor que ocurre con más frecuencia en un conjunto de observaciones. Mientras que la media y la mediana requieren un cálculo, la moda se obtiene simplemente contando el número de veces que cada valor ocurre en un conjunto de datos. La moda puede ser única o no.
  • 145. Ing. Freddy Burgos Robalino, MDGPT. Unimodal La calificaciones de los alumnos de quinto año son: 2, 9, 5, 8, 9, 7, 3, 7, 6, 7. Hallar la moda. • Para resolver el problema contamos cuántas veces se repite cada valor.
  • 146. Ing. Freddy Burgos Robalino, MDGPT. Bimodal La calificaciones de los alumnos de sexto año son: 4, 9, 5, 8, 9, 7, 9, 7, 6, 7 Hallar la moda.
  • 147. Ing. Freddy Burgos Robalino, MDGPT. Gráficas de media, mediana y moda En distribuciones simétricas la media aritmética, mediana y moda coinciden.
  • 148. Ing. Freddy Burgos Robalino, MDGPT. Graficas de media, mediana y moda Las distribuciones asimétricas pueden ser: Asimétrica hacia la izquierda. Asimétrica hacia la derecha.
  • 149. Ing. Freddy Burgos Robalino, MDGPT. Moda de datos agrupados Se calcula considerando la siguiente fórmula: donde: Li es el límite inferior fi es la frecuencia del iésimo valor fi+1 es la frecuencia del iésimo valor más uno, es decir, el siguiente fi-1 es la frecuencia del iésimo valor menos uno, es decir, el anterior ai es la amplitud de ese intervalo Nota: Se debe tomar en la frecuencia absoluta el número más mayor. 149 𝑀𝑜 = 𝐿𝑖 + 𝑓𝑖 − 𝑓𝑖 −1 (𝑓𝑖 −𝑓𝑖−1)+(𝑓𝑖−𝑓𝑖+1) . 𝑎𝑖
  • 150. Ing. Freddy Burgos Robalino, MDGPT. Relación empírica entre Media, Mediana y Moda En las estadísticas, existe una relación entre la media, la mediana y el moda que se basa empíricamente. Las observaciones de innumerables conjuntos de datos han demostrado que la mayoría de las veces la diferencia entre la media y la moda es tres veces mayor que la diferencia entre la media y la mediana. Esta relación en forma de ecuación es: Fórmula: Media – Moda = 3(Media-Mediana) Se puede despejar de la siguiente forma: Moda = Media – 3(Media – Mediana) El contraste con lo teórico es la forma empírica de adquirir conocimiento. 150
  • 151. Ing. Freddy Burgos Robalino, MDGPT. Ejemplo: En un Banco se tomo la muestra de 40 personas que realizan sus diferentes movimientos, para el banco es de gran importancia atender a sus clientes lo más pronto posible. Desean saber aproximadamente cuanto tiempo se tardan en realizar sus operaciones los resultados son los siguientes que se presentan a continuación comprueba la relación empírica. 151
  • 152. Ing. Freddy Burgos Robalino, MDGPT Bioestadística ESTADÍSTICA DESCRIPTIVA Medidas de posición: Cuartiles, Percentiles, Deciles SEMANA 6 Bioestadística
  • 153. Ing. Freddy Burgos Robalino, MDGPT GENERALIDADES 4.1. LOS CUARTILES 4.2 LOS DECILES 4.3 LOS PERCENTILES
  • 154. Ing. Freddy Burgos Robalino, MDGPT Cuartil Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Q2 coincide con la mediana El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
  • 155. Ing. Freddy Burgos Robalino, MDGPT Cuartil Para Datos No Agrupados • Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: • Para el primer cuartil: • Cuando n es par: • Cuando n es impar: • Para el tercer cuartil • Cuando n es par: • Cuando n es impar:
  • 156. Ing. Freddy Burgos Robalino, MDGPT Para Datos Agrupados Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: K = 1, 2, 3 Donde: Lk = Límite real inferior de la clase del cuartil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k
  • 157. Ing. Freddy Burgos Robalino, MDGPT Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo siguiente: El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones. Fórmula de Q1, para series de Datos agrupados: Donde: Li = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase
  • 158. Ing. Freddy Burgos Robalino, MDGPT Para Q2: El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores. Fórmula de Q2, para series de Datos agrupados: Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase
  • 159. Ing. Freddy Burgos Robalino, MDGPT Para Q3: El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones. Fórmula de Q3, para series de Datos agrupados: Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase.
  • 160. Ing. Freddy Burgos Robalino, MDGPT DECILES Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento académico. En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un grupo de datos ordenados en diez partes iguales, de manera que cada parte representa 1/10 de la muestra o población.
  • 161. Ing. Freddy Burgos Robalino, MDGPT DECILES Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: • Cuando n es par: • Cuando n es impar: Siendo A el número del decil.
  • 162. Ing. Freddy Burgos Robalino, MDGPT Datos Agrupados Para datos agrupados los deciles se calculan mediante la fórmula. k= 1,2,3,... 9 Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k
  • 163. Ing. Freddy Burgos Robalino, MDGPT Otra fórmula para calcular los deciles: El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones. El quinto decil corresponde a la mediana. Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase.
  • 164. Ing. Freddy Burgos Robalino, MDGPT PERCENTIL Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
  • 165. Ing. Freddy Burgos Robalino, MDGPT Percentil Son usadas por los pediatras para para valorar el desarrollo de los niños en función de unos valores de referencia admitidos de antemano como normales para niños de una misma edad, sexo y raza. Las tablas se dividen en curvas de crecimiento para niños de 0 a 2 años y de 2 a 14 años y son diferentes para niños y para niñas.
  • 166. Ing. Freddy Burgos Robalino, MDGPT Percentil Datos Agrupados Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula: k= 1,2,3,... 99 Donde: Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k
  • 167. Ing. Freddy Burgos Robalino, MDGPT EJEMPLO: Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla: Como son datos agrupados, se utiliza la fórmula Salarios No. De Fa (I. De Clases) Empleados (fi) 200-300 85 85 300-400 90 175 400-500 120 295 500-600 70 365 600-700 62 427 700-800 36 463 • Siendo, La posición del primer cuartil. • La posición del 7 decil. • La posición del percentil 30.
  • 168. Ing. Freddy Burgos Robalino, MDGPT EJEMPLO: Entonces, El primer cuartil: 115.75 – 85 = 30.75 Li = 300, Ic = 100 , fi = 90 463 4 = 115,75
  • 169. Ing. Freddy Burgos Robalino, MDGPT EJEMPLO: El 7 decil: Posición: 324.1 – 295 = 29.1 Li = 500, fi = 70 El percentil 30 Posición: 138.9 – 85 = 53.9 Li= 300, fi = 90 Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334; que bajo 541.57 gana el 70% de los empleados y sobre $359.88, gana el 70% de los empleados.