You are on page 1of 33

ANALSIS DE

REGRESIN
SIMPLE

El Anlisis de Regresin se usa cuando el investigador


sabe que existe una relacin entre las variables porque hay
una teora o investigaciones previas que la han descubierto.
El Anlisis de Regresin se usa cuando se quiere establecer
la relacin entre una variable dependiente (Y) cuantitativa
y un variable independiente (X) cuantitativa.
Aqu se trata de predecir o explicar el comportamiento o
resultado de una variable (Y) en funcin de otras variables
(X), as como investigar si ellas estn asociadas o
correlacionadas entre s
Suele escribirse como Y = f (X)

Diagrama de dispersin:

Ajuste de curvas
Una lnea recta puede ser obtenida por el mtodo de los mnimos
cuadrados
1.- En RLS tenemos un conjunto de observaciones pareadas (X,Y)
2.- graficamos la pareja ordenada en un plano cartesiano, podemos
obtener diversos diagramas de dispersin,

Diagramas de Dispersin para datos Bidimensionales.


Y

A. Relacin lneal positiva

B. Relacin lneal negativa

X
C. Relacin No lneal

X
D. Sin relacin defnida, incorrelacin

Regresin Simple:
El propsito de la regresin simple es estimar la relacin
que existe entre dos variables X e Y, que se expresan como:
Y = f(X) que se lee Y depende de X
Y = Variable dependiente, predictando o explicada
X = Variable independiente, predictor o explicativa

EJEMPLO 1 Supongamos que se quiere estimar la


relacin entre ingreso y consumo. Para el efecto se eligi
una muestra de 6 familias.
Dados los datos, se define la variable dependiente (y =
Consumo) y la variable independiente (x = Ingreso)
INGRESO
x
35
40
38
55
42
60

CONSUMO
y
30
35
30
50
35
50

270

230

INGRESO
x
35
40
38
55
42
60

CONSUMO
y
30
35
30
50
35
50

xy

x2

y2

1050
1400
1140
2750
1470
3000

1225
1600
1444
3025
1764
3600

900
1225
900
2500
1225
2500

270

230

10810

12658

9250

xy

x2

y2

6(10810) 270(230)
6(12658)2 - (270)2

= 0.9055

(230)12658 270(10810)
6(12658) - (270)2

= - 2.4147

luego la recta de regresin es y* = -2,4147 + 0,9055 x

ERROR ESTNDAR DE ESTIMACIN:


Es una medida de esparcimiento alrededor de una lnea
de regresin.
Se = Syx=

Syx=

y2 - a y - b xy
n-2

9250 (- 2.4147)(230) (0.9055) (10810)


6-2

Syx =

16.926
4

Syx =

2.05706

CLCULO DEL COEFICIENTE DE


DETERMINACIN
El coeficiente de determinacin se calcula como:
R2 = SCR
STC
que si se expresa en tanto por ciento, representa el
porcentaje de informacin que explica el modelo; es
decir, mide la proximidad del ajuste de la ecuacin de
regresin de la muestra a los valores observados de Y.
tambin se interpreta como el porcentaje de la variacin
total en los yi es explicada por la regresin.

PRUEBA DE HIPOTESIS:
El coeficiente de correlacin de una muestra tiene su
contraparte en la poblacin, denominado (Rho). En
forma similar, la poblacin de todos los puntos X Y
posee un coeficiente de determinacin 2. Como siempre
debe tenerse presente que la informacin de la muestra
produce estadsticas de muestra que permiten al
pronosticador hacer inferencias sobre las relaciones
existentes entre X y Y junto con todos los puntos de
datos de la poblacin. Una prueba estadstica que se
podra considerar es:
Ho : = 0

PRUEBA DE HIPOTESIS PARA LA PENDIENTE


MEDIANTE LA ESTADISTICA t:
Hiptesis:
H0: = 0
Ha: 0
Nivel de significancia. .
Prueba estadstica:
t =

b-
Sb

t n 2 grados de libertad.

Donde:
Sb =

SY/X
Xi2 - nX2

Regla de decisin. Se rechaza H0 si el valor calculado de t es


mayor o igual que el valor critico de t(, n-2)
se concluye que la pendiente de la recta de regresin verdadera es
diferente de cero

H0: = 0
H0: 0
Sb =

t =

2.05706

= 0.09127

12658 6(45)2
0.9055 - 0
0.09127

t(0.01, 6-2)= 3.355


t(0.05, 6-2)= 2.306

= 9.9211
Se rechaza la hiptesis nula H0

Conclusin. El valor de la pendiente aporta a la


ecuacin. Podemos decir que entre las dos variables
ingreso y consumo existe una relacin lineal directa.

PRUEBA DE HIPOTESIS MEDIANTE LA ESTADSTICA


F:
A partir de los tres trminos de la suma de cuadrados y
los grados de libertad asociados puede elaborarse la
tabla de anlisis de varianza (ANOVA) como se indica en
la siguiente tabla:
Fuente de
Variacin

Suma de
Cuadrados

grados de
libertad

Regresin lneal
Residual

SCR
SEC

1
n2

Total

STC

n1

cuadrado
medio
CMR=SCR/1
CME=SEC/n-2

R.V
CMR/CME

STC= yi2 SCR= b2


STC=

( yi)2
n
xi2 - ( xi)2
n

9250 - (230)2 = SCT = 433.3333


6

SCR= (0.9055)

SEC =

12658 - (270)2
6

= 416.5245

STC - SCR

SEC = 433.3333 - 416.5246 = 16.8087

Calculo de la estadstica de prueba. La sustitucin de los


valores adecuados en la tabla ANOVA proporcionar F.
Fuente de
Variacin
Regresin lneal
Residual
Total

Suma de
Cuadrados
416.5246
16.8087

STC

grados de cuadrado
libertad
medio
1
CMR= 416.5246
62
CME= 4.2022

R.V
99.1206

61

Se rechaza H0 ya que F= 99.1206 y es mayor al valor


critico de F(1,6-2)=7.71
se rechaza la hiptesis nula (H0)
El modelo lneal proporciona un buen ajuste para los

b t(1 - /2) Sb
Donde:
Sb =

SY/X
Xi2 n X2

Syx=

y2 - a y - b xy
n-2

Ejemplo: calcular el intervalo de confianza del 95 por


ciento para

b t(1 - /2) Sb

Sb =

2.05706

= 0.09127

12658 6(45)2
9250

Syx=

(- 2.4147)(230) (0.9055) (1081


6-2

0.9055 (2.5706)0.09127
0.6709 1.1401
Este intervalo se interpreta en la forma habitual.
Desde el punto de vista probabilstico, se dice que al
repetir el muestreo, el 95 por ciento de los intervalos
que se obtienen de esta forma incluyen a . La
interpretacin practica es que se tiene el 95 por ciento
de confianza de que el nico intervalo que se obtenga
incluir a .

CORRELACIN LINEAL:
La correlacin expresa el grado de asociacin o
afinidad entre las variables consideradas; la
correlacin tambin explica el grado de la bondad
del ajuste de las lneas de regresin
Denota la interdependencia entre datos cuantitativos
o cualitativos

COEFICIENTE
DE
RECTILINEA

CORRELACIN

El Coeficiente de correlacin, es el
estadgrafo que expresa o mide el grado de
asociacin o afinidad entre las variables
relacionadas, se denota por R y se define
como:
R=

SCR
STC

Ejemplo, calcular el coeficiente de correlacin para


el ejercicio anterior:
R=

SCR
STC

R = 0.9804

R=

416.5246
433.3333

PROPIEDADES DE R
Como R2 es siempre positivo resulta que la
propiedad fundamental del coeficiente de
correlacin es:
-1 R +1
De donde se deduce que:
a) Si R > 0, entonces existe correlacin directa positiva
b) Si R < 0, se trata de una correlacin inversa negativa
c) Si R2 = 1 los datos forman una lnea recta, en el caso de
correlacin rectilnea
d) Si R = +1, hay una correlacin perfecta positiva
e) Si R = - 1, hay una correlacin perfecta negativa
f) Si R = 0, los datos son incorrelacionados.

Otro mtodo:

R =

Xi Yi n X Y
Xi2 n X 2

R =

Yi2 n Y2

10810 6(45)(38.3333)
12658 6 (45)2

9250 6(38.3333)2

R = 0.980426

El coeficiente de correlacin de la poblacin es la


raz cuadrada de 2 el coeficiente de determinacin
de la poblacin previamente estudiada, y dado que
ste toma valores entre 0 y 1 inclusive, puede
tomar cualquier valor entre -1 y +1.
El signo de siempre ser igual al signo de
(poblacin o b para la muestra), la dependiente de la
recta de regresin de la poblacin para X e Y.

PRUEBA DE HIPOTESIS PARA


Si se desea verificar que el valor de la muestra de R
tiene una magnitud suficiente para indicar que en la
poblacin las dos variables estn correlacionadas se
debe probar su hiptesis.
Procedimiento:
Paso 1.
Suposiciones. Se supone que el modelo de
regresin lneal simple y las suposiciones que lo
fundamentan son aplicables.

Paso 2:
Hiptesis
H0: = 0
Ha: 0
Paso 3:
nivel de significancia .
Paso 4:
Estadstica de Prueba: Cuando =0, es
posible mostrar que la estadstica de prueba es:
t= R

n2
1- R2

Paso 5:
Distribucin de la estadstica de prueba.
Cuando H0 es verdadera y se cumplen las
suposiciones, la estadstica de prueba sigue una
distribucin t de student con n-2 grados de libertad.
Paso 6:
Regla de decisin. Si | t | t(1-/2,n-2), entonces se
rechaza H0
Paso 7:
Calculo de la estadstica de prueba t.

Paso 8:
Conclusin. Si t > t(1-/2, n-1) se concluye que las
variables estn correlacionadas.
Ejemplo: De ejm. dado anteriormente sobre ingreso y
consumo de las familias, verificar que el valor de la
muestra de R tiene una magnitud suficiente para indicar
que en la poblacin las dos variables estn
correlacionadas.

Paso 1.
Suposiciones. Se supone que el modelo de
regresin lneal simple y las suposiciones que lo
fundamentan son aplicables.
Paso 2:
Hiptesis
H0: = 0
Ha: 0
Paso 3:
nivel de significancia 0.05.

Paso 4:
Estadstica de Prueba:

t= R

n2
1- R2

Paso 5:
Distribucin de la estadstica de prueba.
t(, n-2)= t(0.05, 6-2)= 2.7764

Paso 6:
Regla de decisin. Si | t | t(1-0.05/2,6-2), entonces se
rechaza H0
Paso 7:
Calculo de la estadstica de prueba t.
t = 0.9804

62
1- 0.9612

t= 9.954

Paso 8:
Conclusin. Como 9.954 > 2.7764 se rechaza la
hiptesis nula y se concluye que las variables estn
correlacionadas.

You might also like