SlideShare ist ein Scribd-Unternehmen logo
1 von 7
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 1
PRUEBA DE PREPARACIÓN Nº2
DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN
Y REGRESIÓN
A lo largo de este tema cada vez que hablemos de variables, supondremos que se
tratan de variables de carácter cuantitativo y discreto, todas tomadas de una misma
población. El hecho de que sean rasgos de una misma población nos hará
preguntarnos si existe una posible dependencia o relación entre los mismos.
Dependencia funcional y estadística de una variable estadística bidimensional (X,Y)
Decimos que existe dependencia funcional de Y sobre X cuando a cada valor xi
se le asigna un único valor yj (y = f(x)), es decir, que el valor de una de las
variables determina exactamente en valor de la otra. Según como se
encuentren los puntos la relación será lineal, exponencial, parabólica…
Las variables X e Y serán independientes si el valor de una variable no influye
sobre la otra, sino que sus distribuciones coinciden.
El resto de casos se trata de dependencia o relación estadística, que será más
o menos intensa según si el diagrama de puntos que formen se aproxime más o
menos a la representación imaginaria de una función. Las relaciones pueden
ser:
o directa, si cuando crece o decrece la una, hace lo mismo la otra,
o inversa, si cuando crece o decrece la una, la otra hace lo contrario.
Diagrama de dispersión
Para descubrir estas relaciones entre variables (X e Y) usamos frecuentemente el
diagrama de dispersión o “nube de puntos”, por ser capaz de informarnos de la clase
de dependencia que poseen.
Considerando que:
xi toma los valores x1, x2,…, xr.
yj toma los valores y1, y2,…, yp.
Entonces definimos nij como el número de individuos que toman el valor xi (para X) y el
valor yj (para la variable Y).
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 0.2 0.4 0.6 0.8
Dependencia lineal funcional
(directa)
Todos estos datos se organizan fácilmente en tablas de doble entrada.
Así representaremos en el plano cartesiano cada uno de los puntos (xi, yj) con
frecuencia no nula. Los valores de la variable X estarán situados en el eje de abscisas y
los de Y en el de ordenadas. En realidad, en abscisas procuraremos colocar de las dos
variables, la “explicativa” o independiente, siempre que esto se cumpla.
0
0.1
0.2
0.3
0.4
0.5
0 0.2 0.4 0.6
Dependencia lineal estadística
débil (directa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0 0.2 0.4 0.6
Dependencia lineal
estadística débil (inversa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 0.2 0.4 0.6 0.8
Dependencia lineal funcional
(inversa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0 0.2 0.4 0.6 0.8
Dependencia lineal estadística
fuerte (directa)
0
0.2
0.4
0.6
0.8
1
1.2
0 0.5 1
Dependencia lineal estadística
fuerte (inversa)
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 3
Antes de sacar conclusiones, debemos tener en cuenta si:
Las variables definidas nos hacen intuir la existencia de una posible relación.
Existen numerosos datos y la nube de puntos sugiere alguna clase de
dependencia.
Los valores observados se han obtenido de la población o de una muestra.
Existen posibles influencias de otras variables sobre las estudiadas.
No olvidemos que causalidad implica correlación, pero no al revés. Es decir: una
relación causa-efecto tiene, por ende, que deberse a una relación entre las variables;
sin embargo, dos variables dependientes no tienen que tener una relación causa-
efecto.
Covarianza
Para estudiar la relación entre dos variables se calcula la denominada covarianza (Sxy),
que nos indica el grado de variación conjunta de ambas variables así como el sentido
de la misma:
directa o positiva (ambas varían en el mismo sentido).
inversa o negativa (varían conjuntamente pero en sentido contrario).
En resumen, nos permite cuantificar la dependencia estadística entre las variables.
Covarianza poblacional:
Covariancia muestral:
La varianza, al ser una suma de valores al cuadrado, tiene siempre valores positivos.
En cambio, la covarianza puede tener resultados negativos ya que en el producto de
dos diferencias, si una es negativa, el producto final será también negativo. Este es el
caso de multiplicar valores de X por encima de la media (+) por valores de Y por debajo
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 4
de la misma (-). Existen otros casos en los que los valores positivos compensan a los
negativos haciendo que el valor de la covarianza tienda a cero.
Entonces tenemos que la covarianza tendrá:
Valores positivos si la relación entre las variables es directa.
Valores negativos si la relación de las variables es inversa.
De cero si no existe relación entre las variables o la que la relación que la
explica no es ninguna de las estudiadas.
La covarianza depende pues de:
La intensidad de la relación (el valor absoluto de la covarianza será mayor
cuanto mayor sea la intensidad de la misma).
Las unidades de medida usadas. Al variar la unidad de medida de la varianza,
ésta cambia exponencialmente. Por otro lado, si alteramos las unidades de la
covarianza, el resultado cambia proporcionalmente.
La varianza de las dos variables estudiadas.
Coeficiente de correlación lineal de Pearson
El coeficiente de correlación lineal (r) mide la intensidad de la relación entre X e Y.
;
Características:
Sólo en relaciones de tipo lineal.
Se nombra con ρ cuando pertenece a la población, y r si pertenece a una
muestra.
No tiene unidades: el cambio de las unidades de medida, al contrario que la
varianza y la covarianza, no afecta a su resultado.
Su valor oscila entre 1 y -1.
o 1 cuando la correlación es perfecta y directa.
o 0 cuando no existe correlación.
o -1 cuando es perfecta e inversa.
Pruebas de hipótesis: relación entre dos variables cuantitativas
Normalmente en el estudio usamos una muestra de la población (r), es decir, una
estimación del valor auténtico, de la relación real (ρ).
Por ello debemos construir las siguientes hipótesis:
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 5
H0: ρ=0. No existe relación entre las variables.
H1: ρ≠0 (ρ <0 ó ρ >0). Existe relación entre las variables.
Se sabe que siguen una distribución “t” de Student-Fischer con n-2 grados de libertad
si las dos variables siguen la ley normal y no están relacionadas. Entonces, según el
valor de “t” obtenido:
Si t ≤ tαν, no se puede rechazar la hipótesis de independencia de las dos
variables en la población origen de la muestra.
Si t > tαν, se afirma la hipótesis de que existe relación entre las dos variables en
la población origen de la muestra.
Regresión
Para predecir los valores de una de las variables a partir de la otra utilizamos las rectas
de regresión:
de Y sobre X, para hallar los valores de Y conocida X.
de X sobre Y, para hallar los valores de X conocida Y.
En algunos casos, un valor de X se corresponde a un único valor de Y (modelo lineal).
En ellos α representa un valor constante que sitúa la recta, y β es la pendiente de la
misma. En otros casos, a un mismo valor de X no siempre le corresponde un único
valor de Y, sino un intervalo de los mismos. Pero, para ambos casos, podemos
recurrir a la misma expresión ya que nos permite simplificar, comprender y predecir
la relación existente entre las variables:
y = α + βx
Con esto deducimos que habrá un cierto margen de error en la aproximación de la
nube de puntos a una sola recta. Por ello flexibilizamos la fórmula de la siguiente
forma: y = α + βx + e. “e” se corresponde a la parte de la variable Y no explicable por la
variable X, debido a la acción de otras variables auxiliares. Entonces “e” se considera
un efecto residual.
y = α + βx + e
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 6
Este modelo combina el efecto científico, esperable, determinista de la variable con el
efecto aleatorio, azaroso, debido a la combinación de variables desconocidas o no
medidas que ejercen su influencia.
Para hallar una recta que se adapte adecuadamente a los valores observados es
necesario estimar α y β poblacionales, que serán sustituidos respectivamente por a y
b.
y = a + bx + e
Tenemos entonces los valores reales “y” y los ajustados “y*”. La diferencia entre
ambos “e” se corresponde a la discrepancia, el margen de error o valor residual para
un individuo entre el valor observado y el calculado:
y = y* + e
Ahora debemos utilizar el método de los mínimos cuadrados para minimizar la suma
de los residuos al cuadrado.
A partir de esta expresión obtenemos las estimaciones de a y b. Este último equivale
al coeficiente de regresión.
;
Una vez hallados ambos valores, hay que contrastar la recta de regresión mediante el
coeficiente de correlación o averiguar si el coeficiente de regresión “b” es semejante al
especificado por la hipótesis nula.
H0: β=0. No existe relación.
H1: β≠0. Existe relación.
Si H0 es cierta, entonces seguirá la distribución “t” de Student-Fisher, por lo que
podremos resolver la prueba de hipótesis con normalidad.
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 7
Cálculo de la recta de regresión
Consiste en la sustitución de la nube de puntos por una función que represente la
relación existente entre las variables.
Representatividad de la recta de regresión
Es necesario buscar un criterio para evaluar la representatividad de la recta de
regresión (función) que hemos hallado, evaluar la corrección del ajuste realizado.
Si la varianza de los valores residuales es pequeña, el ajuste será bueno, próximo a la
realidad. Sin embargo, si la varianza es grande, la representatividad de la recta será
escasa.
A partir de la definición anterior: y = y* + e, obtenemos que:
Sy
2
= Sy*
2
+ Se
2
Coeficiente de determinación
El coeficiente de determinación “R2
” es una medida de la proporción en que la
variación total medida por Sy
2
viene explicada por su componente Sy*
2
, es decir, mide
la representatividad que la recta de regresión tiene de la realidad.
Características:
Su valor es siempre positivo (<0).
Su valor se sitúa entre 0 y 1.
o Si R2
= 1, la relación entre las variables es perfecta, y la
representatividad de la recta es máxima. No existen valores residuales.
o Si R2
= 0, la recta de regresión no explica en absoluto la relación entre
las variables.
No posee unidades.
Equivale al cuadrado del coeficiente de correlación lineal de Pearson (R2
= r2
).

Weitere ähnliche Inhalte

Was ist angesagt?

Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
aramirez
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
alerioz
 
Prueba Chi-Cuadrado
Prueba Chi-CuadradoPrueba Chi-Cuadrado
Prueba Chi-Cuadrado
Julio Rivera
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlación
Alejandro Ruiz
 
Coeficiente de correlacion de pearson
Coeficiente de correlacion de pearsonCoeficiente de correlacion de pearson
Coeficiente de correlacion de pearson
luis gonzalez
 

Was ist angesagt? (20)

Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Correlacion y regresion lineal
Correlacion y regresion linealCorrelacion y regresion lineal
Correlacion y regresion lineal
 
Derivacion implicita
Derivacion implicitaDerivacion implicita
Derivacion implicita
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Coeficientes determinacion y correlacion
Coeficientes determinacion y correlacionCoeficientes determinacion y correlacion
Coeficientes determinacion y correlacion
 
Prueba Chi-Cuadrado
Prueba Chi-CuadradoPrueba Chi-Cuadrado
Prueba Chi-Cuadrado
 
Pruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadisticaPruebas de Hipótesis para dos medias y proporciones.estadistica
Pruebas de Hipótesis para dos medias y proporciones.estadistica
 
Coeficiente de asimetría de pearson
Coeficiente de asimetría de pearsonCoeficiente de asimetría de pearson
Coeficiente de asimetría de pearson
 
Intervalos de confianza 2018
Intervalos de confianza 2018Intervalos de confianza 2018
Intervalos de confianza 2018
 
Estadistica MI-23
Estadistica MI-23Estadistica MI-23
Estadistica MI-23
 
Regresion lineal multiple
Regresion lineal multipleRegresion lineal multiple
Regresion lineal multiple
 
Estadistica parametrica y no parametrica
Estadistica parametrica y no parametricaEstadistica parametrica y no parametrica
Estadistica parametrica y no parametrica
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlación
 
Trabajo contraste de hipotesis
Trabajo contraste de hipotesisTrabajo contraste de hipotesis
Trabajo contraste de hipotesis
 
Coeficiente de correlacion de pearson
Coeficiente de correlacion de pearsonCoeficiente de correlacion de pearson
Coeficiente de correlacion de pearson
 
Solucionario Manuel Cordova Zamora. Ejercicios de Probabilidad.
Solucionario Manuel Cordova Zamora. Ejercicios de Probabilidad.Solucionario Manuel Cordova Zamora. Ejercicios de Probabilidad.
Solucionario Manuel Cordova Zamora. Ejercicios de Probabilidad.
 
Regresion por mínimos cuadrados
Regresion por mínimos cuadradosRegresion por mínimos cuadrados
Regresion por mínimos cuadrados
 

Ähnlich wie DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB

Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
AlejandraViteri6
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Edgar López
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
MaradelosngelesSalaz1
 
Tema 3 acabado!.
Tema 3 acabado!.Tema 3 acabado!.
Tema 3 acabado!.
pabloteba
 
Coeficiente de Correlacion
Coeficiente de CorrelacionCoeficiente de Correlacion
Coeficiente de Correlacion
lmldaniellml
 

Ähnlich wie DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB (20)

Clase 2 De Octubre 2009
Clase 2 De Octubre 2009Clase 2 De Octubre 2009
Clase 2 De Octubre 2009
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Tema 6
Tema 6Tema 6
Tema 6
 
Bidimensional
BidimensionalBidimensional
Bidimensional
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionales
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
 
Coeficientes de correlación
Coeficientes de correlaciónCoeficientes de correlación
Coeficientes de correlación
 
Correlacion y regresion
Correlacion y regresionCorrelacion y regresion
Correlacion y regresion
 
Estadística y probabilidad
Estadística y probabilidadEstadística y probabilidad
Estadística y probabilidad
 
Tema 3 acabado!.
Tema 3 acabado!.Tema 3 acabado!.
Tema 3 acabado!.
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdf
 
PPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptxPPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptx
 
Pearson y de Sperman
Pearson y de Sperman Pearson y de Sperman
Pearson y de Sperman
 
análisis estadistico.pptx
análisis estadistico.pptxanálisis estadistico.pptx
análisis estadistico.pptx
 
Coeficiente de Correlacion
Coeficiente de CorrelacionCoeficiente de Correlacion
Coeficiente de Correlacion
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 

Mehr von Lola FFB

Mehr von Lola FFB (20)

PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
 
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFBTema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
 
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFBTemas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
 
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFBDIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
 
TOS FERINA. Pediatría. LolaFFB
TOS FERINA. Pediatría. LolaFFBTOS FERINA. Pediatría. LolaFFB
TOS FERINA. Pediatría. LolaFFB
 
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFBMALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
 
FIBROSIS QUÍSTICA. Pediatría. LolaFFB
FIBROSIS QUÍSTICA. Pediatría. LolaFFBFIBROSIS QUÍSTICA. Pediatría. LolaFFB
FIBROSIS QUÍSTICA. Pediatría. LolaFFB
 
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFBCARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
 
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFBETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
 
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFBVIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
 
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFBHISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
 
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFBESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
 
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFBMODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
 
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFBTÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
 
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFBPRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
 
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFBMEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
 
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFBVARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
 
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFBFUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
 
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFBUSOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
 
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFBCONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
 

Kürzlich hochgeladen

Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdfClase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
garrotamara01
 
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
UDMAFyC SECTOR ZARAGOZA II
 
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdfClase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
garrotamara01
 
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOSplan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
sharmelysullcahuaman
 

Kürzlich hochgeladen (20)

Cuadernillo de depresion. ejercicios practicos
Cuadernillo de depresion. ejercicios practicosCuadernillo de depresion. ejercicios practicos
Cuadernillo de depresion. ejercicios practicos
 
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOSFARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
FARMCOCINÉTICA Y FARMACODINAMIA DE LOS MEDICAMENTOS TÓPICOS
 
asma bronquial- nuevo enfoque GINA y GEMA
asma bronquial- nuevo enfoque  GINA y GEMAasma bronquial- nuevo enfoque  GINA y GEMA
asma bronquial- nuevo enfoque GINA y GEMA
 
casos clínicos hidrocefalia que es tratamiento sintomas
casos clínicos hidrocefalia que es tratamiento sintomascasos clínicos hidrocefalia que es tratamiento sintomas
casos clínicos hidrocefalia que es tratamiento sintomas
 
ESCALAS DE VALORACION EN ENFERMERIA.pptx
ESCALAS DE VALORACION EN ENFERMERIA.pptxESCALAS DE VALORACION EN ENFERMERIA.pptx
ESCALAS DE VALORACION EN ENFERMERIA.pptx
 
ANATOMÍA DE PERINÉ ..................pdf
ANATOMÍA DE PERINÉ ..................pdfANATOMÍA DE PERINÉ ..................pdf
ANATOMÍA DE PERINÉ ..................pdf
 
MAPA EnfermedadesCerebrovasculares...pdf
MAPA EnfermedadesCerebrovasculares...pdfMAPA EnfermedadesCerebrovasculares...pdf
MAPA EnfermedadesCerebrovasculares...pdf
 
musculos cara. Miologia de cabeza y cuello
musculos cara. Miologia de cabeza y cuellomusculos cara. Miologia de cabeza y cuello
musculos cara. Miologia de cabeza y cuello
 
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdfClase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
Clase 16 Artrologia mmii 2 de 3 (Rodilla y Tobillo) 2024.pdf
 
PATTON Estructura y Funcion del Cuerpo Humano (2).pdf
PATTON Estructura y Funcion del Cuerpo Humano (2).pdfPATTON Estructura y Funcion del Cuerpo Humano (2).pdf
PATTON Estructura y Funcion del Cuerpo Humano (2).pdf
 
asincronias ventilatorias-ventilacion mecanica
asincronias ventilatorias-ventilacion mecanicaasincronias ventilatorias-ventilacion mecanica
asincronias ventilatorias-ventilacion mecanica
 
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
 
(2024-09-05) Mutilacion genital femenina (DOC).docx
(2024-09-05) Mutilacion genital femenina (DOC).docx(2024-09-05) Mutilacion genital femenina (DOC).docx
(2024-09-05) Mutilacion genital femenina (DOC).docx
 
10847862 LA HOMEOPATIA, DEFINICON DE .ppt
10847862 LA HOMEOPATIA, DEFINICON DE .ppt10847862 LA HOMEOPATIA, DEFINICON DE .ppt
10847862 LA HOMEOPATIA, DEFINICON DE .ppt
 
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENOLA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
 
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdfClase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
Clase 17 Artrologia MMII 3 de 3 (Pie) 2024 (1).pdf
 
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOSplan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
plan de gestion DE LA UNIDAD DE CUIDADOS INTENSIVOS
 
HIPOCALCEMIA NEONATAL EN PEDIATRIA .pptx
HIPOCALCEMIA NEONATAL EN PEDIATRIA .pptxHIPOCALCEMIA NEONATAL EN PEDIATRIA .pptx
HIPOCALCEMIA NEONATAL EN PEDIATRIA .pptx
 
Anatomia y fisiologia del pancreas medicina
Anatomia y fisiologia del pancreas medicinaAnatomia y fisiologia del pancreas medicina
Anatomia y fisiologia del pancreas medicina
 
Recién Nacido y escalas para determinar la edad gestacional
Recién Nacido y escalas para determinar la edad gestacionalRecién Nacido y escalas para determinar la edad gestacional
Recién Nacido y escalas para determinar la edad gestacional
 

DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB

  • 1. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 1 PRUEBA DE PREPARACIÓN Nº2 DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN A lo largo de este tema cada vez que hablemos de variables, supondremos que se tratan de variables de carácter cuantitativo y discreto, todas tomadas de una misma población. El hecho de que sean rasgos de una misma población nos hará preguntarnos si existe una posible dependencia o relación entre los mismos. Dependencia funcional y estadística de una variable estadística bidimensional (X,Y) Decimos que existe dependencia funcional de Y sobre X cuando a cada valor xi se le asigna un único valor yj (y = f(x)), es decir, que el valor de una de las variables determina exactamente en valor de la otra. Según como se encuentren los puntos la relación será lineal, exponencial, parabólica… Las variables X e Y serán independientes si el valor de una variable no influye sobre la otra, sino que sus distribuciones coinciden. El resto de casos se trata de dependencia o relación estadística, que será más o menos intensa según si el diagrama de puntos que formen se aproxime más o menos a la representación imaginaria de una función. Las relaciones pueden ser: o directa, si cuando crece o decrece la una, hace lo mismo la otra, o inversa, si cuando crece o decrece la una, la otra hace lo contrario. Diagrama de dispersión Para descubrir estas relaciones entre variables (X e Y) usamos frecuentemente el diagrama de dispersión o “nube de puntos”, por ser capaz de informarnos de la clase de dependencia que poseen. Considerando que: xi toma los valores x1, x2,…, xr. yj toma los valores y1, y2,…, yp. Entonces definimos nij como el número de individuos que toman el valor xi (para X) y el valor yj (para la variable Y).
  • 2. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 0.2 0.4 0.6 0.8 Dependencia lineal funcional (directa) Todos estos datos se organizan fácilmente en tablas de doble entrada. Así representaremos en el plano cartesiano cada uno de los puntos (xi, yj) con frecuencia no nula. Los valores de la variable X estarán situados en el eje de abscisas y los de Y en el de ordenadas. En realidad, en abscisas procuraremos colocar de las dos variables, la “explicativa” o independiente, siempre que esto se cumpla. 0 0.1 0.2 0.3 0.4 0.5 0 0.2 0.4 0.6 Dependencia lineal estadística débil (directa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0 0.2 0.4 0.6 Dependencia lineal estadística débil (inversa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 0.2 0.4 0.6 0.8 Dependencia lineal funcional (inversa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0 0.2 0.4 0.6 0.8 Dependencia lineal estadística fuerte (directa) 0 0.2 0.4 0.6 0.8 1 1.2 0 0.5 1 Dependencia lineal estadística fuerte (inversa)
  • 3. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 3 Antes de sacar conclusiones, debemos tener en cuenta si: Las variables definidas nos hacen intuir la existencia de una posible relación. Existen numerosos datos y la nube de puntos sugiere alguna clase de dependencia. Los valores observados se han obtenido de la población o de una muestra. Existen posibles influencias de otras variables sobre las estudiadas. No olvidemos que causalidad implica correlación, pero no al revés. Es decir: una relación causa-efecto tiene, por ende, que deberse a una relación entre las variables; sin embargo, dos variables dependientes no tienen que tener una relación causa- efecto. Covarianza Para estudiar la relación entre dos variables se calcula la denominada covarianza (Sxy), que nos indica el grado de variación conjunta de ambas variables así como el sentido de la misma: directa o positiva (ambas varían en el mismo sentido). inversa o negativa (varían conjuntamente pero en sentido contrario). En resumen, nos permite cuantificar la dependencia estadística entre las variables. Covarianza poblacional: Covariancia muestral: La varianza, al ser una suma de valores al cuadrado, tiene siempre valores positivos. En cambio, la covarianza puede tener resultados negativos ya que en el producto de dos diferencias, si una es negativa, el producto final será también negativo. Este es el caso de multiplicar valores de X por encima de la media (+) por valores de Y por debajo
  • 4. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 4 de la misma (-). Existen otros casos en los que los valores positivos compensan a los negativos haciendo que el valor de la covarianza tienda a cero. Entonces tenemos que la covarianza tendrá: Valores positivos si la relación entre las variables es directa. Valores negativos si la relación de las variables es inversa. De cero si no existe relación entre las variables o la que la relación que la explica no es ninguna de las estudiadas. La covarianza depende pues de: La intensidad de la relación (el valor absoluto de la covarianza será mayor cuanto mayor sea la intensidad de la misma). Las unidades de medida usadas. Al variar la unidad de medida de la varianza, ésta cambia exponencialmente. Por otro lado, si alteramos las unidades de la covarianza, el resultado cambia proporcionalmente. La varianza de las dos variables estudiadas. Coeficiente de correlación lineal de Pearson El coeficiente de correlación lineal (r) mide la intensidad de la relación entre X e Y. ; Características: Sólo en relaciones de tipo lineal. Se nombra con ρ cuando pertenece a la población, y r si pertenece a una muestra. No tiene unidades: el cambio de las unidades de medida, al contrario que la varianza y la covarianza, no afecta a su resultado. Su valor oscila entre 1 y -1. o 1 cuando la correlación es perfecta y directa. o 0 cuando no existe correlación. o -1 cuando es perfecta e inversa. Pruebas de hipótesis: relación entre dos variables cuantitativas Normalmente en el estudio usamos una muestra de la población (r), es decir, una estimación del valor auténtico, de la relación real (ρ). Por ello debemos construir las siguientes hipótesis:
  • 5. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 5 H0: ρ=0. No existe relación entre las variables. H1: ρ≠0 (ρ <0 ó ρ >0). Existe relación entre las variables. Se sabe que siguen una distribución “t” de Student-Fischer con n-2 grados de libertad si las dos variables siguen la ley normal y no están relacionadas. Entonces, según el valor de “t” obtenido: Si t ≤ tαν, no se puede rechazar la hipótesis de independencia de las dos variables en la población origen de la muestra. Si t > tαν, se afirma la hipótesis de que existe relación entre las dos variables en la población origen de la muestra. Regresión Para predecir los valores de una de las variables a partir de la otra utilizamos las rectas de regresión: de Y sobre X, para hallar los valores de Y conocida X. de X sobre Y, para hallar los valores de X conocida Y. En algunos casos, un valor de X se corresponde a un único valor de Y (modelo lineal). En ellos α representa un valor constante que sitúa la recta, y β es la pendiente de la misma. En otros casos, a un mismo valor de X no siempre le corresponde un único valor de Y, sino un intervalo de los mismos. Pero, para ambos casos, podemos recurrir a la misma expresión ya que nos permite simplificar, comprender y predecir la relación existente entre las variables: y = α + βx Con esto deducimos que habrá un cierto margen de error en la aproximación de la nube de puntos a una sola recta. Por ello flexibilizamos la fórmula de la siguiente forma: y = α + βx + e. “e” se corresponde a la parte de la variable Y no explicable por la variable X, debido a la acción de otras variables auxiliares. Entonces “e” se considera un efecto residual. y = α + βx + e
  • 6. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 6 Este modelo combina el efecto científico, esperable, determinista de la variable con el efecto aleatorio, azaroso, debido a la combinación de variables desconocidas o no medidas que ejercen su influencia. Para hallar una recta que se adapte adecuadamente a los valores observados es necesario estimar α y β poblacionales, que serán sustituidos respectivamente por a y b. y = a + bx + e Tenemos entonces los valores reales “y” y los ajustados “y*”. La diferencia entre ambos “e” se corresponde a la discrepancia, el margen de error o valor residual para un individuo entre el valor observado y el calculado: y = y* + e Ahora debemos utilizar el método de los mínimos cuadrados para minimizar la suma de los residuos al cuadrado. A partir de esta expresión obtenemos las estimaciones de a y b. Este último equivale al coeficiente de regresión. ; Una vez hallados ambos valores, hay que contrastar la recta de regresión mediante el coeficiente de correlación o averiguar si el coeficiente de regresión “b” es semejante al especificado por la hipótesis nula. H0: β=0. No existe relación. H1: β≠0. Existe relación. Si H0 es cierta, entonces seguirá la distribución “t” de Student-Fisher, por lo que podremos resolver la prueba de hipótesis con normalidad.
  • 7. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 7 Cálculo de la recta de regresión Consiste en la sustitución de la nube de puntos por una función que represente la relación existente entre las variables. Representatividad de la recta de regresión Es necesario buscar un criterio para evaluar la representatividad de la recta de regresión (función) que hemos hallado, evaluar la corrección del ajuste realizado. Si la varianza de los valores residuales es pequeña, el ajuste será bueno, próximo a la realidad. Sin embargo, si la varianza es grande, la representatividad de la recta será escasa. A partir de la definición anterior: y = y* + e, obtenemos que: Sy 2 = Sy* 2 + Se 2 Coeficiente de determinación El coeficiente de determinación “R2 ” es una medida de la proporción en que la variación total medida por Sy 2 viene explicada por su componente Sy* 2 , es decir, mide la representatividad que la recta de regresión tiene de la realidad. Características: Su valor es siempre positivo (<0). Su valor se sitúa entre 0 y 1. o Si R2 = 1, la relación entre las variables es perfecta, y la representatividad de la recta es máxima. No existen valores residuales. o Si R2 = 0, la recta de regresión no explica en absoluto la relación entre las variables. No posee unidades. Equivale al cuadrado del coeficiente de correlación lineal de Pearson (R2 = r2 ).