SlideShare una empresa de Scribd logo
1 de 15
Descargar para leer sin conexión
Informe estadístico
correspondiente a los
seminarios de
Estadística bivariada
José Manuel De los Santos López
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
2 | P á g i n a
Contenido
1. Introducción. ........................................................3
2. Objetivo................................................................4
3. Metodología .........................................................5
3.1- Población de estudio. Muestra .......................5
3.2- Variables a analizar: ......................................5
3.3- Análisis de datos:............................................5
4. Resultados ............................................................6
5. Conclusiones. .....................................................15
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
3 | P á g i n a
Informe estadístico correspondiente a los seminarios de Estadística
bivariada
1. Introducción.
La estadística descriptiva bivariada aborda el estudio de los sucesos en los que
intervienen dos variables simultáneamente. Cuando queremos describir conjuntamente
dos variables estadísticas se utilizan estos procedimientos y técnicas para responder a la
cuestión de si los valores en una variable cuantitativa están sistemáticamente
relacionados con los de otra variable cuantitativa, o bien de una variable cuantitativa
con una cualitativa o dos variables cualitativas. Los pares de valores formados
constituyen la distribución bidimensional. Los datos se organizan en tablas de
contingencia, consiste en una tabla de doble entrada en la que se recogen las frecuencias
de cada una de las variables. La estadística bivariada se utiliza para saber si dos
variables tienen relación entre sí.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
4 | P á g i n a
2. Objetivo
- General: Utilizar la estadística bivariada para establecer la asociación entre dos
variables denuestro fichero de datos, dando respuesta a hipótesis de investigación
específicas.
- Específicos: Los dos ejercicios que realizaré son:
2. Queremos conocer si existe asociación entre las variables del archivo
“activossalud.Rdata” “sexo” y Consumo de fruta (“fruta”):“Nunca o casi
nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”,
4- “Tres o más veces a la semana”, 5 “A diario. Para ello y usando el software
“Rcommander”:
a. Describe y representa los datos en una tabla
b. Establece una hipótesis adecuada para el estudio
c. Utiliza la prueba más adecuada para contrastar tu hipótesis
d. Interpreta los resultados
4. Determina que si existe asociación entre las variables “practica deporte” y
“escalaas”. Para ello y usando el software “Rcommander”:
a. Describe y representa los datos gráficamente
b. Establece una hipótesis adecuada para el estudio
c. Utiliza la prueba más adecuada para contrastar tu hipótesis
d. Interpreta los resultados
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
5 | P á g i n a
3. Metodología
3.1- Población de estudio. Muestra
El estudio se realizó mediante encuestas realizadas a 291 estudiantes de primero de
enfermería de la Universidad de Sevilla, centros propios y adscritos para conocer sus
estilos de vida y activos en salud.
3.2- Variables a analizar:
o “Sexo”: variable tipo factor con dos categorías (dicotómica): 1-Varón, 2 –
Mujer.
o “Fruta”: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o
dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”.
o “Practicadeporte”: variable tipo factor con dos categorías(dicotómica): 1- Sí,
2-No.
o “escalaas”: Escala cuantitativa, formada sumando la puntuación obtenida en las
siguientes variables: botellón, horarecogida, consumotabaco, tabaco, cerveza,
vino, combinados, hachis, parejassexuales, proteccionpreservativo, marchaatras,
pildoradiadespues, fruta, verduras, embutidos, dulces, refrescos, practicadeporte,
horapracticadeportiva. A más puntuación en la escala, más saludable es la vida
de la persona encuestada (activos en salud).
3.3- Análisis de datos:
En este caso para el análisis de los datos he utilizado el software estadístico R y dentro
de este he empleado el paquete RCommander.
Respecto a los análisis estadístico el empleado en el primer ejercicio será Chi-cuadrado,
debido a que son dos variables cualitativas, una de ellas dicotómica, sin embargo,
debemos estudiar si las frecuencias esperadas son menores que 5 en cuyo caso no
podremos utilizar Chi-cuadrado aunque podríamos utilizar el test exacto de Fisher o
incluso agrupar valores de forma que tenga sentido para que las frecuencias esperadas
sean por tanto mayores a 5 y poder utilizar Chi-cuadrado, si aun agrupándolas las
frecuencias esperadas son menores a 5 utilizaremos el test exacto de Fisher.
En el segundo ejercicio se analiza una variable cualitativa dicotómica y otra cuantitativa
por tanto emplearemos para este análisis T de Student, para ello primero debemos
observar si hay normalidad o no, en caso de no cumplirla se utilizaría Wilcoxon, y
estudiar la homocedasticidad.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
6 | P á g i n a
4. Resultados
2. ¿Existe asociación entre las variables del archivo “activossalud.Rdata” “sexo”
y Consumo de fruta (“fruta”)?
a)Describe y representa los datos en una tabla
xi(Sexo) ni f1 % N1 F1 P1
Varón 51 0.1753 17.53 51 0.1753 17.53
Mujer 240 0.8247 82.47 291 1 100
Total 291 1 100
xi(fruta) n1 f1 % N1 F1 P1
Nunca o casi nunca 32 0.1103 11.03 32 0.1103 11.03
Menos de una vez
por
32 0.1103 11.03 64 0.2206 22.06
Una o dos veces a la
semana
67 0.2310 23.10 131 0.4517 45.17
Tres o más veces a la
semana pero no a
diario
66 0.2276 22.76 227 0.7827 78.27
A diario 93 0.3207 32.07 290 1 100
Total 290 1 100
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
7 | P á g i n a
Tabla de frecuencias en el que se muestra el consumo de fruta por sexo:
Podemos observar en la variable “Sexo” que la mayoría de las personas
encuestadas son mujeres (240 frente a 51 hombres).
Respecto a la variable “fruta” podemos ver que el mayor porcentaje es de
aquellos que consumen a diario.
b) Establece una hipótesis adecuada para el estudio
H0: No existe asociación entre el consumo de frutas y el sexo.
H1: Existe asociación entre el consumo de frutas y el sexo.
c) Utiliza la prueba más adecuada para contrastar tu hipótesis
Teniendo en cuenta que son dos variables cualitativas y una de ellas es
dicotómica utilizaré Chi Cuadrado para contrastar mi hipótesis, siempre y
cuando cumpla los requisitos de que las frecuencias esperadas no sean menores
de 5, si las frecuencias esperadas son menores de 10 habría que utilizar la
corrección de Yates.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
8 | P á g i n a
d) Interpreta los resultados
Teniendo en cuenta que como observamos, en la tabla que obtenemos a partir de
Rcommander, las frecuencias esperadas son mayores de 5, por tanto podemos
emplear el análisis estadístico de Chi cuadrado, y no es necesario utilizar el test
exacto de Fisher. Observando el valor de p a partir del análisis de Chi cuadrado
podemos aceptar la hipótesis nula (H0) pues el p-valor obtenido de Chi cuadrado
(0,1072) es mayor que 0,05, nuestro nivel de significación, es decir, diríamos
que no existe asociación entre el consumo de frutas y el sexo.
4. ¿Existe asociación entre las variables “practica deporte” y “escalaaa”?
a. Describe y representa los datos gráficamente
Podemos observar que la mayoría tienen un nivel de bienestar que la suma llega
a unos 50, y se asemeja a la curva normal.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
9 | P á g i n a
Al ser una variable cualitativa dicotómica la variable “practica deporte” he
decidido realizar un gráfico de sectores donde se vea si se practica o no deporte.
A pesar de que está igualado podemos observar que hay un mayor porcentaje de
aquellos que si practican deporte.
b. Establece una hipótesis adecuada para el estudio
H0: No existe asociación entre la práctica de deporte y el nivel de bienestar.
H1: Existe asociación entre la práctica de deporte y el nivel de bienestar.
c. Utiliza la prueba más adecuada para contrastar tu hipótesis
Al ser una variable cualitativa dicotómica y otra cuantitativa utilizaremos T de
Student aunque para ello antes debemos tener en cuenta si las dos variables son
normales y siguen la homocedasticidad, si no sigue la normalidad alguna de las
dos utilizaré Wilcoxon.
Voy a estudiar la normalidad de ambas variables:
Para la variable práctica de deporte al ser cualitativa lo que hare será separar la
práctica de deportes creando dos bases de datos en la que en una estudiaré la
normalidad de las “escalaas” cuando si practican deporte y cuando no lo
practican, en las distintas bases de datos.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
10 | P á g i n a
Base de datos de los que si practican deporte, a partir del
cual estudiaré la normalidad de “escalaas”
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
11 | P á g i n a
A simple vista parece normal, aunque en el histograma puede haber cierta asimetría.
Para asegurarme voy a realizar el test de Shapiro Wilk, para dicho test las hipótesis son:
H0: es normal.
H1: no es normal.
Como el p-valor obtenido en la prueba de Shapiro Wilk es mayor a 0,05 nos quedamos
con la hipótesis nula, es decir, H0 por tanto podríamos decir que la variable “escalaas”
respecto a los que si practican deporte es normal.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
12 | P á g i n a
Ahora voy a estudiar si la variable “escalaas” es normal entre los que no practican
deporte, para ello creo otra base de datos filtrando la variable práctica de deporte.
Base de datos de los que no practican deporte, a partir
del cual estudiaré la normalidad de “escalaas”
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
13 | P á g i n a
A la vista de los gráficos aunque hay asimetría en el histograma, a partir del gráfico q-q
y el diagrama de cajas podríamos decir que es normal. Para asegurarme voy a realizar el
test de ShapiroWilk, para dicho test las hipótesis son:
H0: es normal.
H1: no es normal.
Como el p-valor obtenido en la prueba de ShapiroWilk es mayor a 0,05 nos quedamos
con la hipótesis nula, es decir, H0 por tanto podríamos decir que la variable “escalaas”
respecto a los que no practican deporte es normal.
Ahora que ya sabemos que las variables son normales, estudiaremos la
homocedasticidad para saber si podemos emplear T de Student. Vamos a observar la
homocedasticidad de la variable “escalaas” y “practicadeporte”.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
14 | P á g i n a
En este estudio las hipótesis que tenemos son:
H0: igualdad de varianzas.
H1: varianzas distintas.
Por tanto como nuestro p-valor es 0,2879 y es mayor que 0,05 aceptamos la H0, por
tanto hay homocedasticidad.
Al haber normalidad y homocedasticidad podemos utilizar T de Student.
d. Interpreta los resultados
Las hipótesis de T de Student serían:
H0: No existe asociación entre la práctica de deporte y el nivel de bienestar.
H1: Existe asociación entre la práctica de deporte y el nivel de bienestar.
Como la p-valor es menor a 0,05 tomaríamos como hipótesis cierta la H1, por
tanto si existe asociación entre la práctica de deporte y el nivel de bienestar.
José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15
15 | P á g i n a
5. Conclusiones.
En el primer ejercicio que he realizado podemos concluir que el número de mujeres
encuestadas (240) es mucho mayor que el número de hombres (51), además casi todos
consumen frutas, pues tan solo el 11,03% de personas no consumen o casi nunca
consumen fruta que corresponden a 32 personas, mientras que las personas que
consumen a diario corresponde al 32.07%, es decir, 93 personas. Además, tras realizar
el estudio podemos saber que no existe relación entre el consumo de frutas y el sexo,
pero no podemos extrapolarlo a la población en general, pues tendríamos que elegir una
muestra más grande y estar seguros de que la muestra se escoja de forma aleatoria.
Respecto al segundo ejercicio podemos observar que la mayoría practican deportes, sin
embargo, hay un amplio porcentaje que no realizan deporte. Respecto a escalas indica el
nivel de bienestar de las personas. Podemos ver que existe asociación entre la práctica
de deporte, pues el nivel de bienestar aumenta con la práctica de deporte.

Más contenido relacionado

Similar a Trabajo2 racabado

Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, PosgradoEstadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
Álvaro Miguel Carranza Montalvo
 
Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado
aliciaaguilares
 

Similar a Trabajo2 racabado (20)

Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1
 
Estadistica bivariada
Estadistica bivariadaEstadistica bivariada
Estadistica bivariada
 
Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, PosgradoEstadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
Estadística, Chat, Bolivia, Medicina, Estética, Salud, CEPI, Estudios, Posgrado
 
Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado Informe estadístico seminarios de estadística descriptiva realizado
Informe estadístico seminarios de estadística descriptiva realizado
 
Análisis bivariado con variables cualitativas
Análisis bivariado con variables cualitativasAnálisis bivariado con variables cualitativas
Análisis bivariado con variables cualitativas
 
Estadistica 1
Estadistica 1Estadistica 1
Estadistica 1
 
Bioestadistica ma13106 2013
Bioestadistica ma13106 2013Bioestadistica ma13106 2013
Bioestadistica ma13106 2013
 
Análisis bivariado
Análisis bivariadoAnálisis bivariado
Análisis bivariado
 
Estadisticabivariada
EstadisticabivariadaEstadisticabivariada
Estadisticabivariada
 
Informe e. bivariada
Informe e. bivariadaInforme e. bivariada
Informe e. bivariada
 
Bivariado
BivariadoBivariado
Bivariado
 
Bioestadistica s14
Bioestadistica s14Bioestadistica s14
Bioestadistica s14
 
Bioestadistica s14
Bioestadistica s14Bioestadistica s14
Bioestadistica s14
 
Formula para el calculo de la muestra en investigaciones en salud
Formula para el calculo de la muestra en investigaciones en saludFormula para el calculo de la muestra en investigaciones en salud
Formula para el calculo de la muestra en investigaciones en salud
 
Bioestadistica s14
Bioestadistica s14Bioestadistica s14
Bioestadistica s14
 
Bioestadistica ma13155
Bioestadistica ma13155Bioestadistica ma13155
Bioestadistica ma13155
 
Hablemos de estadística parte I
Hablemos de estadística parte IHablemos de estadística parte I
Hablemos de estadística parte I
 
Estadística Bivariada
Estadística BivariadaEstadística Bivariada
Estadística Bivariada
 

Último

(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
UDMAFyC SECTOR ZARAGOZA II
 
Dedo con deformidad en ojal o “boutonnière”
Dedo con deformidad en ojal o “boutonnière”Dedo con deformidad en ojal o “boutonnière”
Dedo con deformidad en ojal o “boutonnière”
AdyPunkiss1
 
diapositivas planos quirúrgicos enfermeria 1239llll4
diapositivas planos quirúrgicos enfermeria 1239llll4diapositivas planos quirúrgicos enfermeria 1239llll4
diapositivas planos quirúrgicos enfermeria 1239llll4
LeidyCota
 
seminario patología de los pares craneales 2024.pptx
seminario patología de los pares craneales 2024.pptxseminario patología de los pares craneales 2024.pptx
seminario patología de los pares craneales 2024.pptx
ScarletMedina4
 
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdfLIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
Franc.J. Vasquez.M
 
11-incisiones-y-cierre-de-pared-abdominal.ppt
11-incisiones-y-cierre-de-pared-abdominal.ppt11-incisiones-y-cierre-de-pared-abdominal.ppt
11-incisiones-y-cierre-de-pared-abdominal.ppt
yuhelipm
 
Sistema Nervioso Periférico (1).pdf
Sistema Nervioso Periférico      (1).pdfSistema Nervioso Periférico      (1).pdf
Sistema Nervioso Periférico (1).pdf
NjeraMatas
 
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materalDiabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
f5j9m2q586
 

Último (20)

Microorganismos presentes en los cereales
Microorganismos presentes en los cerealesMicroorganismos presentes en los cereales
Microorganismos presentes en los cereales
 
Cuadro comparativo de las biomoléculas.pptx
Cuadro comparativo de las biomoléculas.pptxCuadro comparativo de las biomoléculas.pptx
Cuadro comparativo de las biomoléculas.pptx
 
10. Protocolo de atencion a victimas de violencia sexual.pptx
10. Protocolo de atencion a victimas de violencia sexual.pptx10. Protocolo de atencion a victimas de violencia sexual.pptx
10. Protocolo de atencion a victimas de violencia sexual.pptx
 
ANAMNESIS Y EXAMEN FISICO DEL SISTEMA RENAL.pptx
ANAMNESIS Y EXAMEN FISICO DEL SISTEMA  RENAL.pptxANAMNESIS Y EXAMEN FISICO DEL SISTEMA  RENAL.pptx
ANAMNESIS Y EXAMEN FISICO DEL SISTEMA RENAL.pptx
 
1. Anatomía funcional de los organos reproductivos en animales menores
1. Anatomía funcional de los organos reproductivos en animales menores1. Anatomía funcional de los organos reproductivos en animales menores
1. Anatomía funcional de los organos reproductivos en animales menores
 
(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
(2024-04-29)Actualización en profilaxis PrEP frente a VIH. (DOC)
 
Dedo con deformidad en ojal o “boutonnière”
Dedo con deformidad en ojal o “boutonnière”Dedo con deformidad en ojal o “boutonnière”
Dedo con deformidad en ojal o “boutonnière”
 
infografía seminario.pdf.................
infografía seminario.pdf.................infografía seminario.pdf.................
infografía seminario.pdf.................
 
diapositivas planos quirúrgicos enfermeria 1239llll4
diapositivas planos quirúrgicos enfermeria 1239llll4diapositivas planos quirúrgicos enfermeria 1239llll4
diapositivas planos quirúrgicos enfermeria 1239llll4
 
seminario patología de los pares craneales 2024.pptx
seminario patología de los pares craneales 2024.pptxseminario patología de los pares craneales 2024.pptx
seminario patología de los pares craneales 2024.pptx
 
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdfLIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
LIBRO LA MEJOR PSICOTERAPIA, PROLOGO - copia.pdf
 
Dermis, Hipodermis y receptores sensoriales de la piel-Histología.pptx
Dermis, Hipodermis y receptores sensoriales de la piel-Histología.pptxDermis, Hipodermis y receptores sensoriales de la piel-Histología.pptx
Dermis, Hipodermis y receptores sensoriales de la piel-Histología.pptx
 
TRIPtico que es la eda , que lo causa y como prevenirlo
TRIPtico que es la eda , que lo causa y como prevenirloTRIPtico que es la eda , que lo causa y como prevenirlo
TRIPtico que es la eda , que lo causa y como prevenirlo
 
11-incisiones-y-cierre-de-pared-abdominal.ppt
11-incisiones-y-cierre-de-pared-abdominal.ppt11-incisiones-y-cierre-de-pared-abdominal.ppt
11-incisiones-y-cierre-de-pared-abdominal.ppt
 
1 mapa mental acerca del virus VIH o sida
1 mapa mental acerca del virus VIH o sida1 mapa mental acerca del virus VIH o sida
1 mapa mental acerca del virus VIH o sida
 
Sistema Nervioso Periférico (1).pdf
Sistema Nervioso Periférico      (1).pdfSistema Nervioso Periférico      (1).pdf
Sistema Nervioso Periférico (1).pdf
 
SISTEMA NERVIOSO ORGANIZADOR GRAFICO.pdf
SISTEMA NERVIOSO ORGANIZADOR GRAFICO.pdfSISTEMA NERVIOSO ORGANIZADOR GRAFICO.pdf
SISTEMA NERVIOSO ORGANIZADOR GRAFICO.pdf
 
Historia Clínica y Consentimiento Informado en Odontología
Historia Clínica y Consentimiento Informado en OdontologíaHistoria Clínica y Consentimiento Informado en Odontología
Historia Clínica y Consentimiento Informado en Odontología
 
REACCION ANTIGENO ANTICUERPOS INMUNOLOGIA pptx
REACCION ANTIGENO ANTICUERPOS INMUNOLOGIA pptxREACCION ANTIGENO ANTICUERPOS INMUNOLOGIA pptx
REACCION ANTIGENO ANTICUERPOS INMUNOLOGIA pptx
 
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materalDiabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
 

Trabajo2 racabado

  • 1. Informe estadístico correspondiente a los seminarios de Estadística bivariada José Manuel De los Santos López
  • 2. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 2 | P á g i n a Contenido 1. Introducción. ........................................................3 2. Objetivo................................................................4 3. Metodología .........................................................5 3.1- Población de estudio. Muestra .......................5 3.2- Variables a analizar: ......................................5 3.3- Análisis de datos:............................................5 4. Resultados ............................................................6 5. Conclusiones. .....................................................15
  • 3. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 3 | P á g i n a Informe estadístico correspondiente a los seminarios de Estadística bivariada 1. Introducción. La estadística descriptiva bivariada aborda el estudio de los sucesos en los que intervienen dos variables simultáneamente. Cuando queremos describir conjuntamente dos variables estadísticas se utilizan estos procedimientos y técnicas para responder a la cuestión de si los valores en una variable cuantitativa están sistemáticamente relacionados con los de otra variable cuantitativa, o bien de una variable cuantitativa con una cualitativa o dos variables cualitativas. Los pares de valores formados constituyen la distribución bidimensional. Los datos se organizan en tablas de contingencia, consiste en una tabla de doble entrada en la que se recogen las frecuencias de cada una de las variables. La estadística bivariada se utiliza para saber si dos variables tienen relación entre sí.
  • 4. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 4 | P á g i n a 2. Objetivo - General: Utilizar la estadística bivariada para establecer la asociación entre dos variables denuestro fichero de datos, dando respuesta a hipótesis de investigación específicas. - Específicos: Los dos ejercicios que realizaré son: 2. Queremos conocer si existe asociación entre las variables del archivo “activossalud.Rdata” “sexo” y Consumo de fruta (“fruta”):“Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario. Para ello y usando el software “Rcommander”: a. Describe y representa los datos en una tabla b. Establece una hipótesis adecuada para el estudio c. Utiliza la prueba más adecuada para contrastar tu hipótesis d. Interpreta los resultados 4. Determina que si existe asociación entre las variables “practica deporte” y “escalaas”. Para ello y usando el software “Rcommander”: a. Describe y representa los datos gráficamente b. Establece una hipótesis adecuada para el estudio c. Utiliza la prueba más adecuada para contrastar tu hipótesis d. Interpreta los resultados
  • 5. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 5 | P á g i n a 3. Metodología 3.1- Población de estudio. Muestra El estudio se realizó mediante encuestas realizadas a 291 estudiantes de primero de enfermería de la Universidad de Sevilla, centros propios y adscritos para conocer sus estilos de vida y activos en salud. 3.2- Variables a analizar: o “Sexo”: variable tipo factor con dos categorías (dicotómica): 1-Varón, 2 – Mujer. o “Fruta”: 1- “Nunca o casi nunca”, 2- “Menos de una vez por semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”. o “Practicadeporte”: variable tipo factor con dos categorías(dicotómica): 1- Sí, 2-No. o “escalaas”: Escala cuantitativa, formada sumando la puntuación obtenida en las siguientes variables: botellón, horarecogida, consumotabaco, tabaco, cerveza, vino, combinados, hachis, parejassexuales, proteccionpreservativo, marchaatras, pildoradiadespues, fruta, verduras, embutidos, dulces, refrescos, practicadeporte, horapracticadeportiva. A más puntuación en la escala, más saludable es la vida de la persona encuestada (activos en salud). 3.3- Análisis de datos: En este caso para el análisis de los datos he utilizado el software estadístico R y dentro de este he empleado el paquete RCommander. Respecto a los análisis estadístico el empleado en el primer ejercicio será Chi-cuadrado, debido a que son dos variables cualitativas, una de ellas dicotómica, sin embargo, debemos estudiar si las frecuencias esperadas son menores que 5 en cuyo caso no podremos utilizar Chi-cuadrado aunque podríamos utilizar el test exacto de Fisher o incluso agrupar valores de forma que tenga sentido para que las frecuencias esperadas sean por tanto mayores a 5 y poder utilizar Chi-cuadrado, si aun agrupándolas las frecuencias esperadas son menores a 5 utilizaremos el test exacto de Fisher. En el segundo ejercicio se analiza una variable cualitativa dicotómica y otra cuantitativa por tanto emplearemos para este análisis T de Student, para ello primero debemos observar si hay normalidad o no, en caso de no cumplirla se utilizaría Wilcoxon, y estudiar la homocedasticidad.
  • 6. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 6 | P á g i n a 4. Resultados 2. ¿Existe asociación entre las variables del archivo “activossalud.Rdata” “sexo” y Consumo de fruta (“fruta”)? a)Describe y representa los datos en una tabla xi(Sexo) ni f1 % N1 F1 P1 Varón 51 0.1753 17.53 51 0.1753 17.53 Mujer 240 0.8247 82.47 291 1 100 Total 291 1 100 xi(fruta) n1 f1 % N1 F1 P1 Nunca o casi nunca 32 0.1103 11.03 32 0.1103 11.03 Menos de una vez por 32 0.1103 11.03 64 0.2206 22.06 Una o dos veces a la semana 67 0.2310 23.10 131 0.4517 45.17 Tres o más veces a la semana pero no a diario 66 0.2276 22.76 227 0.7827 78.27 A diario 93 0.3207 32.07 290 1 100 Total 290 1 100
  • 7. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 7 | P á g i n a Tabla de frecuencias en el que se muestra el consumo de fruta por sexo: Podemos observar en la variable “Sexo” que la mayoría de las personas encuestadas son mujeres (240 frente a 51 hombres). Respecto a la variable “fruta” podemos ver que el mayor porcentaje es de aquellos que consumen a diario. b) Establece una hipótesis adecuada para el estudio H0: No existe asociación entre el consumo de frutas y el sexo. H1: Existe asociación entre el consumo de frutas y el sexo. c) Utiliza la prueba más adecuada para contrastar tu hipótesis Teniendo en cuenta que son dos variables cualitativas y una de ellas es dicotómica utilizaré Chi Cuadrado para contrastar mi hipótesis, siempre y cuando cumpla los requisitos de que las frecuencias esperadas no sean menores de 5, si las frecuencias esperadas son menores de 10 habría que utilizar la corrección de Yates.
  • 8. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 8 | P á g i n a d) Interpreta los resultados Teniendo en cuenta que como observamos, en la tabla que obtenemos a partir de Rcommander, las frecuencias esperadas son mayores de 5, por tanto podemos emplear el análisis estadístico de Chi cuadrado, y no es necesario utilizar el test exacto de Fisher. Observando el valor de p a partir del análisis de Chi cuadrado podemos aceptar la hipótesis nula (H0) pues el p-valor obtenido de Chi cuadrado (0,1072) es mayor que 0,05, nuestro nivel de significación, es decir, diríamos que no existe asociación entre el consumo de frutas y el sexo. 4. ¿Existe asociación entre las variables “practica deporte” y “escalaaa”? a. Describe y representa los datos gráficamente Podemos observar que la mayoría tienen un nivel de bienestar que la suma llega a unos 50, y se asemeja a la curva normal.
  • 9. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 9 | P á g i n a Al ser una variable cualitativa dicotómica la variable “practica deporte” he decidido realizar un gráfico de sectores donde se vea si se practica o no deporte. A pesar de que está igualado podemos observar que hay un mayor porcentaje de aquellos que si practican deporte. b. Establece una hipótesis adecuada para el estudio H0: No existe asociación entre la práctica de deporte y el nivel de bienestar. H1: Existe asociación entre la práctica de deporte y el nivel de bienestar. c. Utiliza la prueba más adecuada para contrastar tu hipótesis Al ser una variable cualitativa dicotómica y otra cuantitativa utilizaremos T de Student aunque para ello antes debemos tener en cuenta si las dos variables son normales y siguen la homocedasticidad, si no sigue la normalidad alguna de las dos utilizaré Wilcoxon. Voy a estudiar la normalidad de ambas variables: Para la variable práctica de deporte al ser cualitativa lo que hare será separar la práctica de deportes creando dos bases de datos en la que en una estudiaré la normalidad de las “escalaas” cuando si practican deporte y cuando no lo practican, en las distintas bases de datos.
  • 10. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 10 | P á g i n a Base de datos de los que si practican deporte, a partir del cual estudiaré la normalidad de “escalaas”
  • 11. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 11 | P á g i n a A simple vista parece normal, aunque en el histograma puede haber cierta asimetría. Para asegurarme voy a realizar el test de Shapiro Wilk, para dicho test las hipótesis son: H0: es normal. H1: no es normal. Como el p-valor obtenido en la prueba de Shapiro Wilk es mayor a 0,05 nos quedamos con la hipótesis nula, es decir, H0 por tanto podríamos decir que la variable “escalaas” respecto a los que si practican deporte es normal.
  • 12. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 12 | P á g i n a Ahora voy a estudiar si la variable “escalaas” es normal entre los que no practican deporte, para ello creo otra base de datos filtrando la variable práctica de deporte. Base de datos de los que no practican deporte, a partir del cual estudiaré la normalidad de “escalaas”
  • 13. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 13 | P á g i n a A la vista de los gráficos aunque hay asimetría en el histograma, a partir del gráfico q-q y el diagrama de cajas podríamos decir que es normal. Para asegurarme voy a realizar el test de ShapiroWilk, para dicho test las hipótesis son: H0: es normal. H1: no es normal. Como el p-valor obtenido en la prueba de ShapiroWilk es mayor a 0,05 nos quedamos con la hipótesis nula, es decir, H0 por tanto podríamos decir que la variable “escalaas” respecto a los que no practican deporte es normal. Ahora que ya sabemos que las variables son normales, estudiaremos la homocedasticidad para saber si podemos emplear T de Student. Vamos a observar la homocedasticidad de la variable “escalaas” y “practicadeporte”.
  • 14. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 14 | P á g i n a En este estudio las hipótesis que tenemos son: H0: igualdad de varianzas. H1: varianzas distintas. Por tanto como nuestro p-valor es 0,2879 y es mayor que 0,05 aceptamos la H0, por tanto hay homocedasticidad. Al haber normalidad y homocedasticidad podemos utilizar T de Student. d. Interpreta los resultados Las hipótesis de T de Student serían: H0: No existe asociación entre la práctica de deporte y el nivel de bienestar. H1: Existe asociación entre la práctica de deporte y el nivel de bienestar. Como la p-valor es menor a 0,05 tomaríamos como hipótesis cierta la H1, por tanto si existe asociación entre la práctica de deporte y el nivel de bienestar.
  • 15. José Manuel De los Santos López Informe Estadística Grupo 4 Enfermería Subgrupo 15 15 | P á g i n a 5. Conclusiones. En el primer ejercicio que he realizado podemos concluir que el número de mujeres encuestadas (240) es mucho mayor que el número de hombres (51), además casi todos consumen frutas, pues tan solo el 11,03% de personas no consumen o casi nunca consumen fruta que corresponden a 32 personas, mientras que las personas que consumen a diario corresponde al 32.07%, es decir, 93 personas. Además, tras realizar el estudio podemos saber que no existe relación entre el consumo de frutas y el sexo, pero no podemos extrapolarlo a la población en general, pues tendríamos que elegir una muestra más grande y estar seguros de que la muestra se escoja de forma aleatoria. Respecto al segundo ejercicio podemos observar que la mayoría practican deportes, sin embargo, hay un amplio porcentaje que no realizan deporte. Respecto a escalas indica el nivel de bienestar de las personas. Podemos ver que existe asociación entre la práctica de deporte, pues el nivel de bienestar aumenta con la práctica de deporte.