Professional Documents
Culture Documents
1. El modelo propuesto es lineal (es decir existe relacin entre la variable explicativa y la
variable explicada, y esta relacin es lineal). Es decir se asume que: , siendo el termino independiente (constante o intercept), el coeficiente b de regresin de la variable explicativa (pendiente o slope) y es una variable aleatoria que se llama error residual.
2. La variable explicativa se ha medido sin error. 3. El valor esperado de del modelo es cero. 4. La varianza de (y por lo tanto de la variable respuesta) es constante. 5. Los son independientes entre si. 6. Si se desean realizar contrastes de hiptesis sobre los parmetros (coeficientes) o sobre el
modelo, tambin es necesario que la distribucin de sea normal.
Para estudiar la validez del modelo es necesario confirmar estas hiptesis mediantes el estudio de los residuos (valores observados valores predichos): normalidad, tendencias, etc. Cuando no se cumplen los criterios de aplicacin es necesario realizar transformaciones a las variables, o bien para obtener una relacin lineal o bien para homogeneizar la varianza. Regresin lineal simple. Tiene como objeto estudiar como los cambios en una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne el valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr: ( ) Donde a y son los coeficientes de regresin.
De manera equivalente, otra formulacin del modelo de regresin lineal simple seria: si X i es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces: ( ) es el error o desviacin aleatoria de Definicin valor medio. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetra en la funcin de densidad, puede interpretarse que dicha constante nos seala la zona donde se sitan los valores de mxima probabilidad de la variable aleatoria. El valor medio o valor esperado de una variable aleatoria X se define como:
Relacin lineal.
: Pendiente de la lnea. Por cada unidad que aumenta la , la : Intercepto en . Valor de cuando
cambia
unidades.
Modelo
variable independiente (imput). variable dependiente (output o respuesta). error relativo. intercepto en Y. pendiente.
Son independientes. Tiene una media igual a 0. Tienen la misma varianza . Tienen una distribucin Normal (requerido para la prueba F). Por los tanto, para cada valor de X, existe una poblacin de Ys. Independientes unas de otras. Con una distribucin Normal con media Una misma varianza . ( )
( )( ) ( )
Ejemplo:
Existe alguna relacin entre los gastos de una familia y sus ingresos? Para estudiar esta relacin se escogieron 10 familias y se obtuvo sus gastos anuales (en miles) y sus ingresos anuales (en miles). Ingresos (en miles) $30 35 28 42 32 50 45 36 48 40 Gastos (en miles) $40 44 36 56 41 63 55 48 58 50
)(
Para llevar a cabo la prueba de hiptesis utilizamos la tabla de ANOVA. Tenemos tres fuentes de variacin:
Error. TOTAL
n 2. (SSE) n 1. (SST) ( )
( ) (MSE)
)( )
gl 1 8 9
MS 680.88 275
F 247.40
F (crit) 5.32