Professional Documents
Culture Documents
Nombres habituales:
X: entrada independiente -
exgena
Y: salida - dependiente - endgena
El Modelo de Regresin Lineal establece
una relacin entre ambas variables a
travs de la ecuacin:
Y=f(x)+
donde
f(x) = E(Y/X=x) = 0+1x
funcin lineal
Regresin Lineal?
Y= 0+1x +
parmetros
poblacionales
22
20
18
16
14
12
y
10
0
0 2 4 5 7
x
Estimacin de la funcin de
regresin.
El mtodo ms usado para hacer la estimacin es el de mnimos
cuadrados y consiste en minimizar la suma de cuadrados de los
errores, con respecto a los parmetros, as de (1) tenemos
i=Yi(0+1Xi)
n
Q 0 , 1 i2 (Yi 0 1 X i ) 2
i 1
e Yi Y
2 2
i
SCE i 1
CME i 1
n2 n2 n2
24 24
22 22
20 20
18 18
16 16
14 14
12 12
Y
Y
10 10
8 8
6 6
4 4
2 2
0 0
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
X X
Descomposicin ...
Observar que se tiene la siguiente igualdad:
Y Y Y Y Y Y
i i i i
Y Y
n n n
Y Y
2 2
Yi Yi
2
i i
i 1 i 1 i 1 EJERCICIO
25 25
20 20
15 15
y
y
10 10
5 5
0 0
-5 -5
0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8
x x
Anlisis de Residuos
Los residuos son estimaciones de los errores del
modelo, con ellos verificaremos los supuestos sobre
los errores, si estos no se cumplen nos ayudarn a
explorar el por qu del mal ajuste del modelo.
Si la distribucin de los errores es normal y sin
outliers.
Si la varianza de los errores es constante y si se
Yt = 0 + 1 Xt + t
t = t-1 + ut
Cor(t,t-1)= Cor(t,t-s)= s
Test de Durbin-Watson
Yt=0+1Xt+t
t = t-1 + ut
Diagnstico.
Grfico de residuos versus variables predictoras.
Grfico de residuos absolutos o cuadrticos versus variables
predictoras.
Grficos de residuos versus valores ajustados (estimados).
Grficos de residuos versus tiempo u otra secuencia.
Grfico de residuos versus variables predictoras omitidas en el
modelo.
Box-plot de los residuos.
Grfico normal de probabilidades de los residuos.
Lineales
Casos
Regresin polinomial.
k variables predictoras.
Variables cualitativas (ejemplo sexo,
categora nutricional).
Transformar variables.
Efecto de interaccin.
Combinacin de casos.
REGRESION LOGISTICA.
Regresin Lineal Mltiple.
La regresin lineal mltiple trata de explicar el
comportamiento de la variable respuesta con
ms de una variable predictora a travs de
una funcin lineal.
Algunas alternativas para mejorar un modelo
cuando se tiene una sola variable predictora
son:
Transformar la variable predictora, o la variable
de respuesta Y, o ambas y usar luego un modelo
lineal.
Usar regresin polinmica con una variable
predictora.
Otra alternativa es conseguir ms
variables de entrada y realizar una
regresin lineal mltiple.
2
K
Y X
Los supuestos para obtener estimadores de los
parmetros son que E()=0 y Var( )=2In. Es inmediato
que E(Y)=X y Var(Y)=2In.
Estimacin por mnimos
cuadrados.
Como en el caso univariado minimizaremos la
suma de los errores al cuadrado:
n
Q( ) i2 ' (Y X )' (Y X )
i 1
Q( ) (Y ' ' X ' )(Y X ) Y 'Y Y ' X ' X 'Y ' X ' X
( X ' X ) X 'Y
1
Para k variables.
Resumen
H 0 : 1 2 ... k 0
H1: no todos los i son ceros, i=1,,k.
o al menos unos de los coeficientes es
distinto de cero.
El coeficiente de determinacin mltiple est
dado por:
SC R SCE
R
2
1
SCT SCT