You are on page 1of 18

Estadística General

Docente: Mg. César Iván Torres Sotelo


Email: cesar.sotelo@movistar.pe
Hoy aprenderemos a realizar predicciones a
partir de una muestra aleatoria usando
regresión y correlación lineal simple.
Contenidos

1. Análisis de regresión y correlación lineal


2. Regresión lineal simple
2.1. Definición
2.2. Diagrama de dispersión
2.3. Método de los mínimos cuadrados
3. Correlación lineal simple
3.1. Definición, cálculo e interpretación del coeficiente de correlación.
4. Ejemplo
5. Práctica Grupal
Llegada de turistas
en función
de la inversión que se realiza en publicidad.
Saberes previos

Medidas de posición y de dispersión:


σ 𝑥𝑖
𝑥ҧ =
𝑛
σ 𝑥 − 𝑥ҧ 2
2 𝑖
𝑠 =
𝑛
𝑠 = 𝑠2
𝒙𝒊 − 𝒙ഥ 𝒚𝒊 − 𝒚

𝐶𝑜𝑣𝑥𝑦 =
𝒏
1. Análisis de Regresión y correlación lineal

En muchas aplicaciones estadísticas se deben resolver problemas que contienen


un conjunto de variables y que se sabe existe alguna asociación entre ellas.
Existen dos formas distintas pero relacionadas del estudio de la asociación entre
variables a partir de una muestra aleatoria.
1. Análisis de regresión, que nos permite determinar una relación funcional de
la variable dependiente 𝒚 con respecto a una o más variables independientes
con el fin de predecir valores de 𝒚.
2. Análisis de correlación, que nos permite cuantificar el grado de relación entre
dos o más variables.
Para ambos casos existen dos tipos de análisis, el simple y el múltiple.
2. Regresión lineal simple

2.1. Definición.
Dada una muestra de 𝒏 datos 𝒙𝟏 , 𝒚𝟏 , 𝒙𝟐 , 𝒚𝟐 , … , 𝒙𝒏 , 𝒚𝒏 observados de la
variable bidimensional 𝒙, 𝒚 .
La regresión lineal simple de la variable dependiente 𝒚 con respecto a la variable
independiente 𝒙, consiste en obtener la ecuación de la recta o modelo de
regresión:
𝒚 = 𝒂 + 𝒃𝒙

que mejor se ajuste a los valores de la muestra, con el fin de poder predecir o
pronosticar los valores de 𝒚 dado 𝒙.
2.2. Diagrama de dispersión.
Es el primer paso en el análisis de regresión.
Consiste en diseñar una gráfica de los datos muestrales en el plano coordenado
𝑋𝑌.

El diagrama de dispersión indica frecuentemente el tipo de tendencia de 𝒚 con


respecto a 𝒙.
2.3. Método de mínimos cuadrados.
Método que usa los datos muéstrales para hallar la ecuación de regresión
estimada:
𝒚 = 𝒂 + 𝒃𝒙
donde
𝒚: valor estimado de la variable dependiente.
σ 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝒃=
σ 𝑥𝑖 − 𝑥ҧ 2
𝒂 = 𝑦ത − 𝑏𝑥ҧ
𝒙: valor de la variable independiente.
3. Correlación lineal simple

3.1. Definición.
El coeficiente o índice de correlación lineal de Pearson de los 𝑛 datos
𝒙𝟏 , 𝒚𝟏 , 𝒙𝟐 , 𝒚𝟐 , … , 𝒙𝒏 , 𝒚𝒏 de una variable bidimensional 𝒙, 𝒚 es el número
abstracto o relativo 𝒓 que se calcula por:
ഥ 𝒚𝒊 − 𝒚
𝒙𝒊 − 𝒙 ഥ
𝑪𝒐𝒗𝒙𝒚 𝒏
𝒓= =
𝑺𝒙 . 𝑺𝒚 𝑺𝒙 . 𝑺𝒚
Interpretación:
Si 𝒓 = 𝟏, se dice que hay una correlación lineal perfecta positiva.
Si 𝒓 = −𝟏, se dice que hay una correlación lineal perfecta negativa.
Si 𝒓 = 𝟎, se dice que no hay correlación entre las dos variables.
4. Ejemplo de aplicación

Un trabajo estadístico asignado a un grupo de estudio consiste en obtener un


modelo de regresión lineal a nivel descriptivo para predecir el número de turistas
que visitaran Lunahuana en función a la inversión hecha en publicidad.
La información recogida se resume en la siguiente tabla:
Enero Febrero Marzo Abril Mayo Junio Julio
Inversión (S/) 2800 4100 3520 4800 5100 4600 3857
N° Turistas 420 715 505 740 752 720 718

a) Elaborar un diagrama de dispersión, obtener una ecuación de regresión lineal


simple usando el método de mínimos cuadrados y pronostique el número de
turistas que llegarían a Lunahuana si se invirtiera S/ 6000 en publicidad.
b) Calcule el coeficiente de correlación.
Solución:
Diagrama de dispersión.

x y
2800 420
4100 540
3520 505
4800 647
5100 752
4600 620
3857 618
Ecuación de regresión: 𝒚 = 𝒂 + 𝒃𝒙 , donde:

σ 𝑥𝑖 −𝑥ҧ 𝑦𝑖 −𝑦ത
𝒃= σ 𝑥𝑖 −𝑥ҧ 2
y = 69.29940109 + (0.125687326)x
y = 69.29940109 + (0.125687326)(6000)
𝒂 = 𝑦ത − 𝑏𝑥ҧ
y = 823.4233571 = 823 turistas
x y 𝑥 𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥 𝑖 − 𝑥ҧ 2
2800 420 -1311 -166 217626 1718721
4100 540 -11 -46 506 121
3520 505 -591 -81 47871 349281
4800 647 689 61 42029 474721
5100 752 989 166 164174 978121
4600 620 489 34 16626 239121
3857 618 -254 32 -8128 64516
28777 4102 480704 3824602
Coeficiente de correlación.
x y 𝑥 𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥 𝑖 − 𝑥ҧ 2 𝑦𝑖 − 𝑦ത 2
2800 420 -1311 -166 217626 1718721 27556
4100 540 -11 -46 506 121 2116
3520 505 -591 -81 47871 349281 6561
4800 647 689 61 42029 474721 3721
5100 752 989 166 164174 978121 27556
4600 620 489 34 16626 239121 1156
3857 618 -254 32 -8128 64516 1024
28777 4102 480704 3824602 69690

ഥ 𝒚𝒊 − 𝒚
𝒙𝒊 − 𝒙 ഥ
𝑪𝒐𝒗𝒙𝒚 𝒏
𝒓= =
𝑺𝒙 . 𝑺𝒚 𝑺𝒙 . 𝑺𝒚

El valor de 𝒓 cercano a 𝟏, indica una correlación positiva entre 𝒙 ∧ 𝒚.


Con uso de software IBM SPSS, se obtiene:
4. Práctica grupal

Indicaciones:
En grupos de 3 alumnos, resolver las pregunta 1, 4, 6, 8 y 10 de la separata de
problemas propuestos.
Tiempo: 30 minutos.
Presentación: cuadernillo de hojas cuadriculadas.
5. Resumen

Regresión lineal, sirve para determinar la relación que existe entre las variables.
Puede ser simple o múltiple.
Correlación lineal, cuantifica el grado de relación entre las variables. Puede ser
simple o múltiple.
Ecuación de regresión lineal simple, sirve para realizar predicciones o
pronósticos acerca de la variable dependiente en función de la variable
independiente.
Método de mínimos cuadrados, sirve para obtener la ecuación de regresión
lineal simple.
Coeficiente o índice de correlación lineal simple, es la medida del nivel de
relación entre dos variables.

You might also like