1. REGRESIÓN Y CORRELACIÓN
Introducción:
Muchos estudios se basan en la creencia
de que pueden identificar y cuantificar
alguna relación funcional entre dos o más
variables. La correlación mide la fuerza de
una relación entre variables; la regresión
da lugar a una ecuación que describe
dicha relación en términos matemáticos.
Y es una función de X Y=f(X)
2. Variable dependiente: Es la variable que se desea
explicar o predecir; también se le denomina
regresando o variable de respuesta.
Variable independiente: Es la variable que es
independiente y que también se le denomina
variable explicativa o regresor.
Regresión simple: Es la que establece que Y es una
función de sólo una variable independiente y que
con frecuencia se le denomina regresión divariada
porque sólo hay dos variables.
3. Regresión múltiple: Aquí se toma a Y como una
función de dos o más variables independientes por
ejemplo Y= f (X1, X2, X3, …, Xk)
Tipos de regresión: Lineal (su representación
gráfica es una línea recta) y curvilínea.
Diagramas de dispersión: Son las que representan
las observaciones para X y Y.
4.
5. Modelo de regresión lineal simple:
Y= b0 + b1X
donde b0 es el intercepto con el eje vertical y b1 es
la pendiente de la recta
Relación entre variables: Determinísticas o
estocásticas (aleatorias)
6. Un modelo lineal con base en datos muestrales:
donde b0 y b1 son estimaciones del coeficiente real
y e es el término aleatorio residual
El modelo de regresión estimada:
En donde es el valor estimado de Y y b0 y b1 son
el intercepto con el eje vertical y la pendiente de la
recta de regresión estimada.
eXbbY 10
XbbY 10
ˆ
Yˆ
7. Mínimos cuadrados ordinarios (MCO):
Es el procedimiento matemático utilizado para
estimar los valores de b0 y b1
Para determinar la recta de mejor ajuste, MCO
requiere que se calcule la suma de cuadrados y
productos cruzados.
Suma de los cuadrados de X
Suma de los cuadrados de Y
n
X
XXXSCx i
2
22
n
Y
YYYSCY i
2
22
8. Suma de los productos cruzados de X y Y
La pendiente de la recta de regresión
El intercepto de la recta de regresión
n
YX
XYYYXXSCxy ii
SCx
SCxy
b1
XbYb 10
9. El error estándar de estimación (Se): Es una medida
del grado de dispersión de los valores Yi alrededor
de la recta de regresión.
Error estándar:
Cuadrado medio del error:
La suma de cuadrados del error:
2
ˆ 2
n
YY
Se ii
CMESe
2n
SCE
CME
SCx
SCxy
SCySCE
2