You are on page 1of 107

REGRESIÓN LINEAL

CORRELACIÓN DE
PEARSON
HIPOTESIS:

• SI P>=0.05 SE TOMA H0.


• SI P<0.05 SE TOMA LA H1.
HIPOTESIS: NULA O ALTERNA
• HO=NO existe correlación entre las dos
variables. (independientes)
• Ejemplo: No existe correlación entre el
tiempo de servicios y el grado de estrés
laboral.

• H1=Existe correlación entre el tiempo de


servicios y el grado de estrés laboral.
(dependientes).
¿RELACIÓN ENTRE VARIABLES?
• H0.-NO EXISTE RELACIÓN CUANDO EL
VALOR DE X CAMBIA, LA OTRA
VARIABLE NO CAMBIA O PERMANCE
IGUAL.

• H1.-SI EXISTE RELACIÓN CUANDO EL


VALOR DE X CAMBIA, LA OTRA
VARIABLE Y TAMBIEN CAMBIA.
EJEMPLO DE RELACIÓN

• VARIABLE X • VARIABLE Y
• VARIABLE X • VARIABLE Y
EJEMPLO DE QUE NO EXISTE
RELACIÓN
• VARIABLE 1 • VARIABLE 2
CORRELACIÓN

• MEDICIÓN DE LA RELACIÓN QUE


EXISTE ENTRE LAS DOS VARIABLES.
MAYORMENTE SE MIDE VARIABLES
CUANTITATIVAS.
Tipos de MEDICIÓN

• Forma gráfica (Dispersión de puntos.) –


subjetivo.
• Forma analítica. (estadísticamente.)
método objetivo.
DIAGRAMA DE DISPERSIÓN
(NUBES DE PUNTOS)
•Eje X: Variable independiente.
•Eje Y: variable dependiente.

•Cada punto representa a un sujeto o


un dato, y señala la intersección de
su valor en X y en Y.
EJEMPLOS DE NUBES DE
PUNTOS:

Hay ausencia de relación Existe asociación lineal positiva (varían


(independencia). en general en el mismo sentido)

c) Existe asociación lineal negativa d) Existe fuerte asociación, pero no


(varían en sentido contrario). lineal.
Tipos de relación:
¿Cómo saber que tan fuerte es la
relación en una gráfica de
Dispersión?
• Respta. Por el ancho de la nube de puntos.

• Si se acerca a la forma de una línea, existe


más una relación lineal, mientras si no
existiera relación los puntos estarían
totalmente dispersos, por lo tanto la forma
sería un tanto circular.
Ejemplo de una relación lineal
• Cuando los puntos
están mas cerca a la
línea nos indica que
existe una relación
muy fuerte.
• Además que la nube
de puntos tiene una
forma lineal.
TIPOS DE CORRELACIONES:

Ponderadp (gramos) Grado Academico


Coeficiente de Correlación de
Pearson
• Cuantifica la correlación que existe entre
dos variables cuantitativas, cuando ésta
existe.

r de Pearson
Notas.-las variables cuantitativas deben
distribuir de forma normal.
Coeficiente de Correlación de
Pearson

• Magnitud
• Dirección
o Fuerza

Estos dos elementos son muy importantes


Magnitud o Fuerza

• El valor numérico indica la magnitud o


fuerza de la correlación.
+- 0 +- 0.2 +- 0.4 +- 0.6 +- 0.8 +1
-
SIN CORRELACIÓN

CORRELACIÓN
PERFECTA
CORRELACIÓN CORRELACIÓN CORRELACIÓN CORRELACIÓN CORRELACIÓN
Mínima Baja Moderada Buena muy Buena

-1 0 +1
Indicadores mediante signo + o -
Variable “A” variable “B”
• Signo positivo(+), (aumenta las dos variables)
nos indica que la
relación es Variable “A” variable “B”
DIRECTA, es decir (disminuye una variable
disminuye la otra variable)
al aumentar una
variable aumenta
también la otra
HIPOTESIS:

• HO= Las variables • H1=Las variables X


X y Y, son y Y, son
INDEPENDIENTES, DEPENDIENTES
DECISIÓN ESTADISTICA.
• Dado que p valor es
de 0.000 es menor
que el valor de
significancia (0.05);
podemos decir que
existe evidencia
significativa para
rechazar la H0, y se
toma la H1 (variables
dependientes).
CONCLUSIÓN.
• Se concluye que las
dos variables están
asociadas
(relacionadas o
dependientes); ya
que su correlación
es de 0.591, indica
que existe una
correlación
moderada.
• El valor de R2 es de 0.317; podemos decir
que las variables influirán en 31.7%. Y
presenta una correlación de tipo
moderada.
Ejercicio:
• Una empresa de mensajería de entrega puerta a
puerta, con el fin de mejorar la prestación del
servicio desea establecer la relación que puede
existir entre el tiempo empleado y la distancia
recorrida para la entre de un producto.
Distancia 825 225 1070 550 480 920 1350 325 670 1215
/Km)
Tiempo 3,5 1 4 2 1 3 4,5 1,5 3 5
(días)
a.-Realice un diagrama de dispersión a partir de los datos obtenidos.
b.-Realizar la correlación correspondiente y determinar una decisión
estadística y una conclusión.
c.-Estimar el tiempo a tardar si recorre una distancia de 1000 Km.
Regresión – Correlaciones:
Y=a+bx

Y=0.119+0.004*1000 Respuesta tardara 4 días.


Y=4.119
Ejercicio 2:
• Variables: gramos de
nutrientes y peso en
gramos.
SUPUESTOS DE LA REGRESIÓN:

• Linealidad
• Normalidad
• Independencia
Existe una regresión lineal.
NORMALIDAD
• H0: Los datos de la variables siguen una
distribución Normal.

• H1: Los datos de la variable NO siguen una


distribución normal.

• Si el P valor de sig. Es < 0.05 se RECHAZA “HO”.


• Si el P valor de sig. Es >=0.05 se ACEPTA la “HO”.
Normalidad
Prueba de Normalidad

En Prueba de Normalidad se tomara en cuenta Shapiro por los datos que


son menores a 50, pero sin embargo podemos decir que las variables
llevan una distribución NORMAL; porque el valores de P son mayores a
0.05.
CORRELACIONES

• La correlación de
Pearson es de 0.652,
que indica que existe
una buena correlación y
el valor de P es menor a
0.05 por lo tanto se
tomará en cuenta la H1.
existe dependencia
entre las variables.
(gramos_nutrientes y
gramos de Peso)
Analizar / regresión /lineal
Note que este valor es el
mismo a l de correlación de
Pearson, donde indica si El R2 es 0.425 esto indica que el
esta cerca al valor 1 existe modelo lineal simple es de 42.5%.
muy buena correlación.

Y=a+b X
Y=-143.090+0.374x
FIN
REGRESION LINEAL

PROF. MARTIN HUAMAN


CONCEPTOS
• REGRESION LINEAL.-Es un método causal en que una
variable (conocida como variable dependiente), esta
relacionada con una o mas variables independientes por
medio de una ecuación lineal.

• Variable Dependiente.-variable que se desea pronosticar


(su comportamiento depende de las variables
independientes).

• Variable Independiente: Variables que se influyen en la


variable dependiente y por ende, son la “causa” de los
resultados obtenidos en el pasado.
PROF. MARTIN HUAMAN
Existe dos clases:
• Regresión Lineal simple: Una sola variable
independiente explica el comportamiento de
la variable dependiente.

• Regresión Lineal Múltiple: Dos o mas


variables independientes explican el
comportamiento de la variable dependiente.
(es la más utilizada)

PROF. MARTIN HUAMAN


MEDIDAS FUNDAMENTALES:
• COEFICIENTE DE CORRELACIÓN (R): Es
una medida que indica el nivel de asociación
entre las variables dependiente e
independiente en un modelo de regresión
lineal.

• COEFICIENTE DE DETERMINACIÓN (R2): Es


un medida que indica porcentualmente el
cambio de la variable dependiente respecto
la independiente.
PROF. MARTIN HUAMAN
Ubicación de las variables
DEPENDIENTES
Variable Y

INDEPENDIENTES
Variable X
PROF. MARTIN HUAMAN
Diagramas de dispersión (incluir
dibujos)
• Un diagrama de
dispersión es una
representación gráfica
de la relación entre dos
variables, muy utilizada
en las fases de
Comprobación de teorías
e identificación de
causas raíz y en el
Diseño de soluciones y
mantenimiento de los
resultados obtenidos.

PROF. MARTIN HUAMAN


COEFICIENTE DE CORRELACIÓN
• El coeficiente de correlación es un número
comprendido entre -1 y +1 cuyo signo coincide con
la pendiente de la recta de regresión y cuya
magnitud esta relacionada con el grado de
dependencia lineal entre dos variables.

PROF. MARTIN HUAMAN


NIVEL DE MEDICIÓN

• INTERVALOS O DE RAZON
• INTERPRETACIÓN

PROF. MARTIN HUAMAN


NIVEL DE MEDICIÓN

PROF. MARTIN HUAMAN


ECUACIÓN REGRESIÓN LINEAL:
Y=a+bX

• Y=Valor de la variable dependiente


que se desea predecir.
• a=intersección, ordenada al origen
• b=pendiente o inclinación
• X=valor que fijamos a la variable
independiente.

PROF. MARTIN HUAMAN


EJEMPLO:
• Se realizó un estudio de correlación y
regresión comparando las tallas de padres y
sus hijos.
Talla de 174 170 167 171 168 178 171 168 159 176
padres
(cm)
Talla de 176 168 168 169 166 178 172 169 161 173
hijos
(cm)

PROF. MARTIN HUAMAN


Insertamos los datos a SPSS

PROF. MARTIN HUAMAN


1ERO HALLAR EL GRAFICO DE
DISPERSIÓN

PROF. MARTIN HUAMAN


PROF. MARTIN HUAMAN
RESULTADO: NUBES DE PUNTOS

AHORA PARA MOSTRAR LA


LINEA DE REGRESIÓN
HAGA DOBLE CLICK EN EL
GRAFICO MUESTRA LO
SIGUIENTE (DIAPOSTIVA
SIGUIENTE).

PROF. MARTIN HUAMAN


HAGA CLICK EN EL 5TO ICONO Y
CERRAR.
• A ESTO SE LE
CONOCE COM
RELACIÓN GRAFICA

PROF. MARTIN HUAMAN


RESULTADO

• A ESTO DE LE
CONOCE COMO
RELACIÓN GRAFICA.

PROF. MARTIN HUAMAN


HALLAR LA PRUEBA DE
NORMALIDAD
LLEVAR LAS DOS VARIABLES
PRUEBA DE NORMALIDAD-
SHAPIRO WILK

• SE TOMA SHAPIRO WILK PORQUE SU DATOS SON


MENORES A 50, Y SE PUEDE OBSERVAR QUE EL
VALOR DE P, ES MAYOR A 0.05, POR LO TANTO ME
QUEDO CON LA H0; QUE INDICA QUE LAS
VARIABLES LLEVAN UNA DISTRIBUCIÓN NORMAL.
AHORA LA RELACIÓN NUMERICA

PROF. MARTIN HUAMAN


COM INDICA LA IMAGEN:
OPCIONES

PROF. MARTIN HUAMAN


• COMO LA
CORRELACIÓN
SALIO 0.936; ESTO
QUIERE DECIR QUE
LA RELACCIÓN
SERA POSITIVA MUY
FUERTE, PORQUE
ESTA CERCA AL
VALOR 1.
PROF. MARTIN HUAMAN
AHORA PARA VER CUANTO ESTA
INFLUENCIADO LA TALLA DE LOS
PADRES CON LOS HIJOS.

PROF. MARTIN HUAMAN


ACTIVAR COMO INDICA LA
IMAGEN

PROF. MARTIN HUAMAN


* OBSERVAMOS QUE R
CUADRADO ES DE 0.876; A ESO
LO MULTIPLICAMOS POR 100
(0.876X100=87.6%); ENTONCES
PODEMOS DECIR QUE LA
TALLA DE LOS PADRES
INFLUIRA EN LA TALLA DE LOS
HIJOS EN UN 87.6%

PROF. MARTIN HUAMAN


APLICACIÓN DE LA FORMULA DE
REGRESIÓN
¿Qué TALLA SE ESPERARÍA DE UN HIJO
CON UN PADRE DE 180 CM DE ESTATURA

RESPUESTA: QUE LA TALLA


Y=A +BX PROBABLE DE U HIJO CON UN
PADRE QUE MIDE 180 SERÁ DE
Y=22,174+(0.869)(180) 176.97 CM.

Y=176.97 PROF. MARTIN HUAMAN


EJERCICIO
1. Una empresa requiere saber
si existe una relación
confiable entre las
inversiones en publicidad y
las ventas que se obtiene, a
fin de poder estimar las
ventas que recibirán si hacen
una inversión en publicidad
de $8000 dólares, para el
11vo periodo de producción.
(cuanto será las ventas
obtenidas para el 11vo mes).
PROF. MARTIN HUAMAN
Hallando las variables:
dependientes – independientes.

PROF. MARTIN HUAMAN


En spss: Menu grafico/ generador
de graficos.

X: la variable inversión
Y la variable Ventas

PROF. MARTIN HUAMAN


resultado

PROF. MARTIN HUAMAN


Insertar la línea: doble clic en el
grafico /click 5to icono / y cerrar

PROF. MARTIN HUAMAN


Seguir los pasos como indica la
imagen

PROF. MARTIN HUAMAN


PROF. MARTIN HUAMAN
Coeficiente de determinación:

PROF. MARTIN HUAMAN


• Activar las
opciones
como indica
la imagen.

PROF. MARTIN HUAMAN


resultado

PROF. MARTIN HUAMAN


0.979 x 100 = 97.9%
Coeficiente de determinación

Formula:
Y=a+b(x)
a=3116084
B=32819
X=es el valor de 8000
Por lo tanto:
Y=3116084+ 32819(8000)
Y=

PROF. MARTIN HUAMAN


RESPUESTA:
• Entonces se cumple
una buena
determinación lineal
con un buen
coeficiente de
determinación y
• Para el 11vo mes
será un pronostico
de 265,668,084 de
ventas.
PROF. MARTIN HUAMAN
EJERCICIO 2:

• Cinco niños de 2, 3, 5, 7 y 8 años de


edad pesan, respectivamente, 14, 20, 32,
42 y 44 kilos.
• 1.-Hallar la ecuación de la recta de
regresión de la edad sobre el peso.
• 2 ¿Cuál sería el peso aproximado de un
niño de seis años?
PROF. MARTIN HUAMAN
EJERCICIO 3:
• 2Un centro comercial sabe en función de la
distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en
cientos, que figuran en la tabla:
HALLAR:
1.-Calcular el coeficiente de correlación lineal.
2.-Si el centro comercial se sitúa a 2 km,
¿cuántos clientes puede esperar?
3.-Si desea recibir a 5 clientes, ¿a qué distancia
del núcleo de población debe situarse?
PROF. MARTIN HUAMAN
CORRELACIÓN DE
SPEARMAN

PROF. MARTIN HUAMAN


Cuando utiliza spearman

• R DE PEARSON EN DATOS ESCALARES


• R DE SPEARMAN EN DATOS
ORDINALES O NOMINALES.
CUÁNDO USAR SPEARMAN
• NOTA.-SI TIENE UNA
DISTRIBUCIÓN NORMAL
SE UTILIZA EL
COEFCIENTE DE
CORRELACIÓN DE
PEARSON.
• CUANTITATIVAS
DISCRETAS SON
AQUELLAS QUE NO
PUEDEN TOMAR
DECIMALES
EJEMPLO:NRO. DE
HIJOS. Y
• CUANTITATIVAS
CONTINUA SI PUEDEN
TOMAR DECIMALES
EJEMPLO: SALARIO.
PROF. MARTIN HUAMAN
PASOS
• Importar el archivo correlación spearman.xls a spss.
• y trabajar con las variables 3 y 4
(Percepciónsobrelacalidaddeenseñanzaenmatemática Y
Percepciónsobrelacalidaddeenseñanzaeninformatica)

4
3

PROF. MARTIN HUAMAN


ANALIZAR : CORRELACIONAR /
BIVARIADAS

PROF. MARTIN HUAMAN


RESULTADO: CONCLUSIÓN

PROF. MARTIN HUAMAN


INTERPRETACIÓN
• SI EL P VALOR O SIG
(BILATERAL)ES MENOR
QUE 0.05, EL NIVEL SERA
SIGNIFICADO. Y COMO EL
SIGNO ES POSITIVO
(0.591**), MIENTRAS
MEJORE LA PRECISION DE
CALIDAD DE ENSEÑANZA
INFLUYE LA PERCEPCIÓN
EN LA CALIDAD DE
ENSEÑANZA EN
INFORMATICA.

PROF. MARTIN HUAMAN


HALLAR LA HIPOTESIS: NULA O
ALTERNA
• HO (X,Y =son Independientes).-NO existe
correlación entre calidad de enseñanza en
matemática esta relacionado significativamente
con la percepción sobre la calidad de enseñanza
en informática.

• H1=(X,Y =son dependientes).-Existe correlación


entre calidad de enseñanza en matemática esta
relacionado significativamente con la percepción
sobre la calidad de enseñanza en informática.

PROF. MARTIN HUAMAN


PRUEBA DE HIPOTESIS:
• SI P>=0.05 SE TOMA H0: RSPEARMAN .
• SI P<0.05 SE TOMA LA H1: RSPEARMAN.

• Dado que el p valor es menor a 0.05, rechazamos la hipótesis nula


por consiguiente existe suficiente evidencia estadística para
afirmar que la percepción sobre la calidad de enseñanza en
matemática esta relacionado significativamente con la percepción
sobre la calidad de enseñanza en informática.
• Por otra parte el coeficiente de correlación de Spearman =0.591, lo
cual indica una relación positiva moderada, a mejor percepción
sobre la calidad de enseñanza en matemática se tendrá también
una mejor percepción sobre la calidad de enseñanza en
informática.

PROF. MARTIN HUAMAN


EJERCICIO 2:
• ABRIR EL ARCHIVO: CORRELACION DE ESTRÉS-TIEMPO;
HALLAR SU CORRELACIÓN DE SPEARMAN E
INTERPRETACIÓN;

PROF. MARTIN HUAMAN


REGRESION LINEAL
MULTIPLE
Y= a + b1.X + b2.X

PROF. MARTIN HUAMAN


EJERCICIOS:
• Una empresa fabricante de muebles, ha observado que sus ventas
han disminuido, al pasar los meses. Hay directivos que opinan
que se debe al aumento de los aranceles que impuso el gobierno
para la importación de materias primas lo cual encarece el precio
de sus productos y por tanto el mercado compra menos.

• Otros indican que se debe al aumento en el valor del dólar que


genera tanto sobre costos en la compras de materias primas y
desestimula las exportaciones, haciendo que sus productos sean
mas costosos y con menos oportunidades de venderse al exterior.
• La dirección requiere saber cual factor es mas importante para
priorizar medidas. Además de pronostica el valor de ventas para
el próximo trimestre

PROF. MARTIN HUAMAN


DATOS

PROF. MARTIN HUAMAN


Pronosticar el valor de ventas para
el próximo trimestre tomando en
cuenta los siguientes datos
• La dirección requiere saber cual factor es más importante
para priorizar medidas. Además de pronosticar el valor de
ventas para el próximo trimestres, si el arancel y el dólar se
comportan así:

PROF. MARTIN HUAMAN


Información:
• Abrir el archivo:
correlación multiple.sav
Notas variables independientes:
Arancel y dólar.
Variable dependiente: ventas

PROF. MARTIN HUAMAN


Grafico:
Grafico:
Solución:

PROF. MARTIN HUAMAN


Se tomará en
cuenta R-
cuadrado
ajustado=0.891 =
89.1%
• FORMULA:

Y= a + b1.X + b2.X

PROF. MARTIN HUAMAN


USAR LA FORMULA PARA SU
RESULTADO

PROF. MARTIN HUAMAN


Y=a+b1.X+b2.X

RESULTADO FINAL: PRONOSTICO PARA EL


PROXIMO TRIMESTRES.
PROF. MARTIN HUAMAN
IMPORTANTE: ARANCEL X VENTAS R2
CUADRADO:. SE VE POR SEPARADO
REGRESION LINEAL (ARANCEL –
VENTAS) Y (DÓLAR-VENTAS)
SIMPLE Y EL ÚLTIMO MULTIPLE

R2 CUADRADO AJUSTADO: DOLAR X VENTAS


R2 CUADRADO AJUSTADO:
ARANCEL,DÓLAR, VENTAS

• SI R2 CUADRADO AJUSTADO HUBIERA DISMINUIDO ES PORQUE


ALGUNA DE LAS VARIABLE NO LE AGREGA VALOR POR LO
TANTO HAY QUE ELIMINAR UNAS DE ELLAS.

PROF. MARTIN HUAMAN


EJERCICIO:
• Una inmobiliaria especializada en alquilar aparta-estudios a
estudiantes universitarios ha observado con preocupación
que al pasar de los semestres han alquilado menos
unidades habitacionales.
• El gerente de la inmobiliaria afirma que se debe al aumento
de inseguridad del pero también piensa que se puede
deber al aumento en los costos en las matriculas que
pagan los estudiantes, generando que busquen
alternativas de viviendas mas económicas.
• El gerente a suministrado la siguiente información a un
ingeniero al que contrato para explicar el fenómeno y para
que genere un pronostico para el próximo año.

PROF. MARTIN HUAMAN


Datos:

PROF. MARTIN HUAMAN


PRONOSTICAR TOMAR EN CUENTA
LOS SIGUIENTES VALORES
• INDICE DE SEGURIDAD Y COSTO DE VIDA

¿?
¿?

PROF. MARTIN HUAMAN


Ejercicio 3

You might also like