You are on page 1of 8

Este proyecto tiene como finalidad ayudar a facilitar las estrategias en un negocio

por medio de la regresión lineal.

La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar


para solucionar problemas comunes en los negocios.

Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria,
afectan a una variable aleatoria, en el caso de existir una relación funcional entre
ambas variables que puede ser establecida por una expresión lineal, es decir, su
representación gráfica es una línea recta.

Cuando la relación lineal concierne al valor medio o esperado de la variable


aleatoria, estamos ante un modelo de regresión lineal simple.
La regresión es una de las herramientas más poderosas y versátiles que se puede
utilizar para solucionar problemas comunes en los negocios. Muchos estudios se
basan en la creencia de que se puede identificar y cuantificar alguna relación
funcional entre dos o más variables, Se dice que una variable depende de la otra.
Por ejemplo Y depende de X . Esto se puede escribir así

Y es una función de X

Y  f  x

Y depende de X , por lo que podemos decir que Y es la variable dependiente y


X es la variable independiente. Esto es importante en el modelo de regresión,
reconocer la variable dependiente y la independiente. Es importante saber
entonces los siguientes conceptos.

Variable dependiente.- Es la variable que se desea explicar o predecir; también se


la denomina variable de respuesta.

Variable independiente.- es la variable independiente, también se le denomina


variable explicativa o regresor.

El primero en desarrollar en el análisis de regresión fue el científico inglés Sir


Francis Galton (1822 – 1911). Sus primeros experimentos con regresión
comenzaron con un intento de analizar los patrones de crecimiento hereditarios de
los guisantes. Se debe diferenciar entre la regresión simple y la regresión múltiple.
En la regresión simple, se establece que Y es una función de solo una variable
independiente. En un modelo de regresión múltiple, Y es una función de dos o
más variables independientes. Un modelo de regresión de k variables se puede
expresar así

Y es una función de dos o más variables independientes


Y  f  x1 , x2 , x3 ,..., xk 

En donde x1 , x2 , x3 ,..., xk son variables independientes que permiten explicar Y .

También es necesario hacer una distinción entre la regresión lineal y la no lineal.


En el modelo de regresión lineal, la relación entre X y Y puede representarse por
medio de una línea recta. Es decir que a medida que X cambia, Y cambia en
una cantidad constante. La regresión no lineal utiliza una curva para expresar la
relación entre X y Y . Es decir que a medida que X cambia, Y cambia en una
cantidad diferente cada vez.

Determinación del modelo de regresión simple

Una forma razonable de la relación entre la variable respuesta y el regresor es la


relación lineal:

Y  0  1 x

Donde  0 es la intercepción y 1 es la pendiente. Si la relación es exacta, es una


relación determinística pero en la vida real normalmente nos encontramos con
modelos probabilísticos o no determinísticos en este caso usamos regresión
simple. La idea de la regresión simple es buscar la mejor relación entre Y y x ,
cuantificando la fortaleza de la relación y usando métodos que permiten la
predicción de los valores respuesta, dados valores del regresor x . Un análisis de
la relación entre Y y x requiere establecer un modelo estadístico. El modelo

debe incluir el conjunto  i i


 x , y  ;1, 2, , n de datos que involucren n pares de
valores
 x, y  . Hay que tener presente que el valor yi depende del valor xi por
una estructura lineal que tiene un componente aleatorio involucrado. La respuesta
Y esta relacionada con la variable independiente x por la ecuación

Y  0  1 x  

 0 y 1 son los parámetros desconocidos de la pendiente y la intercepción


mientras  es una variable aleatoria que se asume que está distribuida con
E    0Var     2
La cantidad  es conocida como la varianza residual. De
2
y
este modelo se deduce que Y es aleatoria, mientras que x no lo es pero es
medida con error,  es el error aleatorio con varianza constante.
Un aspecto importante de este análisis es estimar los parámetros  0 y 1 .
Supongamos que se denota b0 para  0 y b1 para 1 . Luego la recta de regresión
estimada está dada por

y  b0  b1 x

Donde y es el valor predicho.

El error en el ajuste vendrá dado por

ei  yi  yi

Los parámetros se los estima de tal forma que la suma de los cuadrados de los
errores sea mínima.

 
n n n
SCE    ei    yi  yi    yi  b0  b1 xi 
2 2 2

i 1 i 1 i 1

Derivando SCE con respecto a b0 y b1 tenemos

SCE n
 2  yi  b0  b1 xi 
b0 i 1

SCE n
 2  yi  b0  b1 xi  xi
b0 i 1

Igualando cada derivada a 0, se obtiene


n n
nb0  b1  xi   yi
i 1 i 1
n n n
b0  xi  b1  xi2   xi yi
i 1 i 1 i 1

Estas dos últimas ecuaciones se resuelven simultáneamente para determinar los


valores de los parámetros.
 n  n 
  x  x  y  y 
n n
n xi yi    xi   yi  i i
b1  i 1  i 1  i 1   i 1

  x  x
2 n
n
 n  2
n xi    xi 
2
i
i 1  i 1  i 1

n n

 yi  b xi
b0  i 1 i 1
 y  b1 x
n

EJEMPLO

Los residentes de un pueblo pequeño están preocupados sobre el incremento en


los costos de vivienda de la zona. El alcalde considera que los precios de las
viviendas fluctúan con los valores de la tierra. Los datos sobre 10 casas vendidas
recientemente y el costo del terreno sobre el cual se construyeron se observan en
la siguiente tabla en miles de dólares. Se trata el costo de las casas como la
variable dependiente. Haga e interprete el modelo de regresión.

Valores de la tierra (x) Costo de la casa (y)

7 67

6.9 63

5.5 60

3.7 54

5.9 58

3.8 36

8.9 76

9.6 87

9.9 89

10 92
Con ayuda de Excel se determinó que

 x  71.2
i

 y  682
i

 x y  5225.2
i i

 x  559.18
2
i

Reemplazando en las expresiones


n
 n  n 
n xi yi    xi   yi 
b1  i 1  i 1  i 1   10  5225.2   71.2  682   7.071
10  559.18    71.2 
2 2
n
 n 
n xi    xi 
2

i 1  i 1 
n n

 y  b x i i
682  7.071 71.2 
b0  i 1 i 1
  17.85
n 10

El modelo sería:

y  7.071  17.82x
Haber realizado este proyecto, nos llevo a conocer de una mejor
forma la aplicación del análisis de regresión simple, lo cual nos
permitirá reconocer la relación que existe entre una variable
independiente y otra dependiente, utilizando el modelo de
regresión.
El coeficiente de determinación es una medida de la bondad de
ajuste para la ecuación de regresión; este puede interpretar como
la proporción de la variación de la variable dependiente explicada
por la ecuación de regresión.

Se consideró la correlación como una medida descriptiva de la


intensidad de una relación lineal entre dos variables.

http://www.udc.es/dep/mate/estadistica2/cap6.html

Libro de Estadística para la Administración y Economía.

You might also like