You are on page 1of 18

CICLO 2012-II Mdulo:I

Unidad:II Semana:4

ESTADISTICA Y PROBABILIDADES

Lic.Mat. Jos G. Suyn


Vilcherrez.

29/09/2017 1
REGRESIN LINEAL SIMPLE

(SLO ANLISIS DESCRIPTIVO)

29/09/2017 2
ORIENTACIONES
En este capitulo estudiaremos el
calculo de regresin lineal simple, que
tiene como base los mtodos y
tcnicas de la descripcin numrica de
variables estudiadas en el capito III.
Entender los diferentes mtodos y
procedimientos de aplicacin de la
regresin lineal simple.

29/09/2017 3
CONTENIDOS TEMTICOS
Introduccin.
Estadstica de dos variables (X, Y)
en parejas
La covarianza.
Regresin Lineal Simple
Interpretacin del Coeficiente de
determinacin.
Conclusiones-actividad.
29/09/2017 4
Estadstica de dos variables (X, Y) en parejas

Dada una muestra de n pares de datos (xi, yi) valores


de (X,Y)
El objetivo es:
1. Hallar la lnea recta: Y=a+bX que mejor se ajuste a
la muestra a fin de pronosticar Y a partir de X .
Esto se denomina regresin lineal

2. Medir el nivel de asociacin entre las variables X, Y.


Esto se denomina Correlacin

29/09/2017 5
La covarianza
Adems de las medidas descriptivas en cada
variable, en los datos en parejas, aparece la
medida de varianza conjunta de X e Y
La covarianza de n pares de datos ( x1 , y1 ),..., ( xn , yn )
valores de (X,Y) es el nmero:
n n
( xi x )( yi y) xi yi
i 1 i 1
Cov( X , Y ) ( x )( y )
n n

La covarianza a diferencia de la varianza,


puede ser negativa.
29/09/2017 6
Correlacin entre X e Y
El coeficiente de correlacin lineal de Pearson entre
las variables X, Y es el nmero real:

Cov( X , Y )
r
s X sY
Se comprueba que 1 r 1
r=1 indica correlacin muestral perfecta
r= 0 indica que no existe correlacin muestral
A mayor valor (absoluto) de r, mayor correlacin
entre X e Y.
29/09/2017 7
Regresin Lineal Simple
El objetivo es:
Hallar lnea de recta: Y=a+bX (llamado modelo de
regresin lineal simple) que mejor se ajuste a la muestra
de n valores (xi,yi) de (X, Y)

Si el modelo es adecuado nos permitir realizar


pronsticos vlidos de Y a partir de X .

El mtodo para hallar la recta es denominado el mtodo


de Mnimos cuadrados

29/09/2017 8
Mtodo de mnimos cuadrados
Es trata de minimizar las distancias di
Y Y = a + bX
^
yi
di
^
yi

>X
xi

Se minimiza entonces, la suma de cuadrados de error ( SCE)


n n n
SCE d i2 ( yi y i ) 2 ( yi a bxi ) 2
i 1 i 1 i =1
29/09/2017 9
Mtodo de mnimos cuadrados
Los valores de a y b que minimizan SCE se obtienen
resolviendo las ecuaciones normales:

y na b x
xy a x b x 2
Las soluciones de la ecuacin son:

n xy x y Cov( X , Y )
b o b
n x ( x)
2 2
S X2
a y bx
29/09/2017 10
Ejemplo 1
Se quiere obtener un modelo de regresin para predecir el nmero
de unidades de un producto vendidos semanalmente (Y) en
funcin del tiempo en minutos de publicidad semanal por radio
(X). Para esto se tiene la siguiente muestra:

Semana 1 2 3 4 5 6 7 8 9 10 11
X 20 30 30 40 50 54 60 60 60 70 80
Y 50 73 69 87 108 -- 128 135 132 148 140

a) Trace el diagrama de dispersin, e indique la tendencia.


b) Obtenga el modelo de regresin lineal de mnimos cuadrados

29/09/2017 11
Continuacin del ejemplo 1

c) Obtenga por prediccin el nmero de unidades


vendidas en la sexta semana
d) Qu opina del nivel de de correlacin entre las
dos variables?
e) En cuanto se incrementara el nmero de
unidades vendidas si en una semana cualquiera se
incrementa la publicidad en 1 min?, en 10 min?,
en c minutos?

29/09/2017 12
Anlisis de la validez del moldelo obtenido
(Particin de la varianza de Y)
( y y ) 2
La varianza de Y es : sY2 i
n .
Y
yi

^
yi

_
y

_ X
x

yi y ( yi y i ) ( y i y )
Error tota l Error no explicado Error explicado
29/09/2017 13
Particin de la varianza de Y
Coeficiente de determinacin

Entonces, ( yi y) 2 ( yi yi ) 2 ( yi y) 2

SCT SCE SCR


Al escribir estas tres varianzas en porcentajes (se
divide entre SCT), se tiene:

1 (1 r 2 ) r 2
SCR
Donde r
2
, es el coeficient e de determinac in.
SCT
29/09/2017 14
Interpretacin del Coeficiente de determinacin

1. 0 r 2 1.
2. r2 =1, slo si, y i y i , o si todos los yi estn en la
recta de regresin.
Entonces, existe correlacin perfecta entre X e Y.
3. r2 =0, slo si, yi y , o si todos los yi son iguales.
Entonces, no existe correlacin entre X e Y.
4. El r2, es una medida del nivel de ajuste de la recta
de regresin. Cuanto mayor sea el valor de r2,
mejor ser el ajuste y ms til la recta de regresin
como instrumento de prediccin.
29/09/2017 15
Ejemplo 2
En un estudio de la relacin lineal de la produccin (Y) y la
demanda (X) (diaria en kilogramos) de un producto, una muestra
de 15 das ha dado las siguientes estadsticas:
x 110, y 100, SX 10, SY 5, r 0.9778
a) Cuntos kilos del producto sobran en promedio diariamente?
b) Cree usted que la variabilidad de la demanda es mayor que la
variabilidad de la produccin?. Justifique su respuesta
c) Obtenga la ecuacin de regresin lineal, cuntas kgs se
venderan si en un da cualquiera la demanda es de 150 kg?
d) Cree usted que la lnea de regresin obtenida se ajusta
adecuadamente a los datos y por lo tanto es adecuada para
pronosticar la produccin diaria del producto?. por qu?
29/09/2017 16
CONCLUSIONES Y/O ACTIVIDADES DE
INVESTIGACIN SUGERIDAS
Al estudiar la relacin entre las estaturas en
centmetros de padres (X) e hijos adultos (Y), de una
muestra se obtuvo la siguiente informacin:
x 170, y 172, SX=10, SY=4.6875, Cov(X,Y)45
a) Obtenga la ecuacin de regresin lineal simple
b) Qu opina del ajuste del modelo obtenido a los
datos?
c) Predecir la estatura de un hijo adulto cuyo padre
1.64 m

29/09/2017 17
GRACIAS

29/09/2017 18

You might also like