You are on page 1of 5

REGRESIÓN LINEAL

Correlación

La correlación trata de establecer la relación o dependencia que existe


entre las dos variables que intervienen en una relación bidimensional;
es decir, determinar si los cambios en una variable influyen en los
cambios de la otra. En caso de que suceda diremos que las variables
están correlacionadas entre ellas.

Coeficiente de correlación

Conviene cuantificar de forma más precisa la idea de correlación


mediante un parámetro. Este parámetro se denomina coeficiente de
correlación lineal.

Este coeficiente podemos calcular mediante la fórmula


(COEFICIENTE DE PEARSON):

∑ ∑ ∑
√[ ∑ (∑ ) ] [ ∑ (∑ ) ]

REGRESIÓN LINEAL
El coeficiente de correlación lineal es un número real comprendido
entre -1 y 1.

Observa la relación que existe entre el diagrama de dispersión y el


coeficiente de correlación lineal mediante los siguientes casos.

3 BGU 1
Recta de regresión Calculando los valores de a y b se tiene:

Una vez comprobada la existencia de una fuerte correlación entre las b = - 0,2853 y a = 102,27.
variables X e Y que componen una variable bidimensional, es
interesante encontrar la recta que mejor se ajuste al conjunto de De donde la ecuación de la regresión lineal es y = 102,27 - 0,2853x.
puntos.
La gráfica de los puntos (nube de puntos) y la recta de regresión se
Esta recta de regresión está dada por y = a + bx donde: muestra a continuación:

∑ ∑ ∑ 98
̅ ̅
(∑ ) ∑ 96

Tomado de: Desafíos, 3 Bachillerato, Editorial Santillana, 2015 94


92

Prueba
Ejemplo: 90
88
Suponga que en una empresa toman una prueba para medir la
agilidad manual. Se tiene la impresión de que la edad de los 86
empleados está relacionada con las calificaciones de las pruebas. 84
Diez empleados reportaron sus calificaciones de la prueba de agilidad
82
manual. ¿Existe alguna correlación entre la edad de los empleados y 0 10 20 30 40 50 60 70
las calificaciones de la prueba?
Edad
Empleado Edad Prueba
1 35 93

REGRESIÓN LINEAL
2 25 96 El coeficiente de correlación es r = - 0.971591.
3 52 87
4 40 90 Conclusión: Sí existe una alta correlación entre la edad de los
5 26 94 empleados y la calificación de la prueba de agilidad
6 55 86
7 61 84
manual.
8 30 93
9 47 91
10 66 84

3 BGU 2
EJERCICIOS 4. De un muelle cuelgan pesas, obteniéndose los siguientes alargamientos:

1. Dado el siguiente conjunto de pares de datos:


X 7 10 9 13 7 11 13 a) Calcular e interpretar el coeficiente de correlación entre estas dos
variables.
Y 1 2 4 3 3 4 5
b) Estimar el alargamiento del muelle si se cuelga una pesa de 50 gramos.
Sol: a) r = 0.9951, b) 2.51 cm
Construya una gráfica de dispersión.
Determine la ecuación de regresión 5. Una persona se somete a una dieta de adelgazamiento durante 5 semanas. A
Use la ecuación obtenida para predecir el valor de Y si X = 12. continuación se detalla su peso al término de cada una de esas semanas

2. Un agrónomo ha analizado la relación entre la cantidad de agua aplicada (en


m3) y el correspondiente rendimiento de cierta cosecha (en toneladas por
hectárea) obteniendo los siguientes datos:
a) Calcular el coeficiente de correlación lineal e interpretarlo.
b) ¿Qué peso es de esperar que alcance esa persona si sigue la dieta 2
semanas más? Sol: a) r = – 0,9898, b) 74,8 kg

6. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:


Utilizando regresión lineal, obtener el rendimiento que cabe esperar si la Estatura (x) 186 189 190 192 193 193 198 201 203 205
cantidad de agua aplicada es de 12 m3. Sol: 4.29 ton/h Peso (y) 85 85 86 90 87 91 93 103 100 101

Calcular:
3. El número de horas dedicadas al estudio de una asignatura y la calificación
a) La recta de regresión de Y sobre X.
obtenida en el examen correspondiente de cinco personas, es: b) El coeficiente de correlación.
c) El peso estimado de un jugador que mide 208 cm.

REGRESIÓN LINEAL
7. Una de las atracciones de una feria es el puesto donde el señor Clarividente
(un brillante estudiante de Estadística con una moralidad un tanto
a) Calcular el coeficiente de correlación lineal e interpretar su valor. cuestionable) afirma que puede adivinar el peso de las mujeres con un error de
b) Calcular la recta de regresión de Y sobre X. 1 kg, al estudiar las líneas de las manos y los dedos. Él apuesta que si se
c) Calcular la calificación estimada para una persona que hubiese estudiado equivoca, la mujer podrá elegir cualquiera de los animales de peluche del
28 horas. Sol: a) r = 0,9453; b) Y = 0,157 X + 3,0667 ; c) 7,46 puesto. Sin embargo, si adivina el peso, como recompensa por sus poderes la
mujer debe pagar $ 2. Lo que no perciben las mujeres que aceptan la apuesta
3 BGU 3
es que el señor Clarividente mide la longitud del dedo índice de la mano 10. Un centro comercial sabe en función de la distancia, en kilómetros, a la que se
izquierda. Las damas tampoco conocen, pero el Clarividente si, la siguiente sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran
relación enre el peso de las mujeres y la longitud de los dedos índices: en la tabla:

Longitud dedo índice 5,6 6,2 6 5,4 Número de Clientes (x) 8 7 6 4 2 1


(cm) Distancia (y) 15 19 25 23 34 40
Peso (kg) 79 83,5 82 77,5
a) Calcular el coeficiente de correlación lineal.
b) Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
a) Si usted contara con toda esta información, apostaría con el señor c) Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe
Clarividente. situarse?
b) ¿cuál es la ecuación de regresión?
c) Con la ecuación hallada, si el dedo índice de una mujer mide 5,7 cm ¿cuál Los ejercicios 11 - 15 deben ser realizados en Excel, y enviados al siguiente
correo iemoyota@sfelipeneri.edu.ec. Los archivos deben ser enviados con el
sería la predicción acerca de su peso? siguiente formato en el nombre del archivo: Paralelo-Numerodelista-
8. En un cierto artículo de un periódico se informa que “entre los entrenadores Inicialprimernombre-Apellido. Por ejemplo F-01-I-Moyota
de la NBA existe una fuerte correlación entre continuidad y éxito”. El artículo
se baso en los siguientes datos: 11. Se usa un reactivo químico para obtener un precipitado de una sustancia en
Antigüedad (x) 9 8 6 6 4 4 4 una solución dada. Los datos son los siguientes:
Reactivo 7,2 4,8 5,2 4,9 5,4 6,4 6,8 8,0
Record (% de juegos ganados 79 84 70 70 68 51 48
Y) Precipitado 8,4 5,4 6,3 6,8 8,0 11,1 12,3 13,3

¿Es verdad lo que dice el artículo? Reactivo 6,0 6,7 7,0 8,0 7,3 4,6 4,2
Obtenga la recta de regresión
Precipitado 8,4 9,5 10,4 12,7 10,3 7,0 5,1
9. El tiempo que tarda un sistema informático en red en ejecutar una instrucción

REGRESIÓN LINEAL
depende del número de usuarios conectados a él. Si no hay usuarios el tiempo
a) Haga un diagrama de dispersión.
es 0. Tenemos los siguientes datos:
b) Determine la ecuación de la recta por el método de mínimos cuadrados y
Número de usuarios 10 15 20 20 25 30
represéntela en el diagrama.
Tiempo de ejecución 1 1,2 2 2,1 2,2 2 c) ¿Cuál es la cantidad de precipitado estimada si se usa 7.1 de reactivo?

Realice el diagrama de dispersión, halle la ecuación de regresión lineal y el 12. Los siguientes datos muestran la cantidad de papel y plástico (en kg) que
coeficiente de correlación. reciclaron varias familias de cierta ciudad a lo largo de un año.

3 BGU 4
a) Realice un diagrama de dispersión.
b) Halle la ecuación de regresión lineal

a) Gráficamente, ¿se observa algún tipo de relación entre la cantidad de 15. El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de
plástico y de papel que recicla cada familia? Inglaterra y Galés en el período de 1970-72. Cada grupo está formado por
b) Establecer la ecuación de regresión lineal trabajadores de la misma profesión (médicos, decoradores, trabajadores
c) Predecir cuánto plástico reciclará aproximadamente una familia que textiles,...etc.), en cada uno de los veinticinco grupos muestreados se han
recicló 55 kg de papel. observado dos variables:el índice de estandarizado de consumo de cigarrillos
x y el índice de muertes por cáncer de pulmón Y. Se desea estudiar la relación
13. Se ha estudiado el tiempo en minutos que dedica a consultas telefónicas y el entre estas dos variables.
tiempo que dedica a consultas personales cada uno de los empleados de una
Gestoría. Los datos obtenidos se encuentran en la siguiente tabla:

a) Realice el diagrama de dispersión.


b) Halle la ecuación de regresión lineal.
c) Halle el coeficiente de correlación ¿qué puede concluir?
a) Halle la ecuación de regresión lineal.
b) Halle el coeficiente de correlación ¿qué puede concluir?
Tomado de:
14. Una compañía de seguros desea determinar el grado de relación que existe
http://www.edu.xunta.gal/centros/iesmos/system/files/ejercicios+regr
entre el ingreso familiar y el monto del seguro de vida del jefe de familia. Con

REGRESIÓN LINEAL
base a una muestra aleatoria de 18 familias, se obtuvo la siguiente
esion.pdf
información. (en miles de dólares)
http://webdelprofesor.ula.ve/ingenieria/franz/index.html/MN/regresio
n%20lineal.pdf

3 BGU 5

You might also like