Professional Documents
Culture Documents
---------------------------------------------------------------------------------------------------------------------------------------------------------------
12
7
6
13
10
10
14
6
7
6
10
4
4
7
5
6
4
10
10
11
2
5
5
2
3
2
1
7
4
4
2
5
5
2
5
3
5
3
3
1
1
2
1
1
1
1
1
2
2
2
1
1
1
2
1
2
1
1
1
1
alcohol
caf
antiacid
1
2
3
0
0
2
1
1
2
3
3
1
3
3
4
4
4
2
1
4
4
3
3
4
2
2
5
4
4
4
3
3
2
2
0
2
3
4
4
3
44
37
69
16
44
61
31
25
49
58
62
93
76
77
71
62
90
41
38
66
respuest
-.809**
.000
alcohol
-.663**
.001
cafe
-.507*
.022
antiac
.474*
.035
20
-.809**
.000
20
1
20
.192
.417
20
.102
.668
20
-.181
.445
N
Correlacin de Pearson
Sig. (bilateral)
20
-.663**
.001
20
.192
.417
20
1
20
.658**
.002
20
-.558*
.010
cafe
N
Correlacin de Pearson
Sig. (bilateral)
20
-.507*
.022
20
.102
.668
20
.658**
.002
20
1
20
-.493*
.027
antiac
N
Correlacin de Pearson
Sig. (bilateral)
20
.474*
.035
20
-.181
.445
20
-.558*
.010
20
-.493*
.027
20
1
20
20
20
20
Reaparic
Correlacin de Pearson
Sig. (bilateral)
respuest
N
Correlacin de Pearson
Sig. (bilateral)
alcohol
N
20
**. La correlacin es significativa al nivel 0,01 (bilateral).
*. La correlacin es significante al nivel 0,05 (bilateral).
Si centramos la atencin en la relacin entre la variable respuesta REAPARIC y cada una de las
independientes, podemos observar que la mxima asociacin lineal corresponde a la variable
tiempo de respuesta RESPUEST (r = - 0.809). Para determinar si es significativa, podemos
contrastar la hiptesis nula de que las variables REAPARIC y RESPUEST estn incorrelacionadas.
Ho: Reap,Resp = 0 (incorrelacionadas)
Ha: Reap,Resp 0 (correlacionadas)
Podemos observar que en la fila sig. p = 0.000 < = 0.01. Por lo tanto se rechaza Ho. Por lo tanto
estn correlacionadas. A mayor tiempo de respuesta, menor el tiempo de reaparicin
OJO: Contine analizando las dems correlaciones
2
b) Regresin Simple:
Dado que el mayor grado de asociacin lineal esta dado por REAPARIC (Y) y RESPUEST
(X), Realicemos una regresin lineal entre estas dos variables.
Seleccione Analizar Regresion Lineales.
tpica
Reaparic
8.10
3.093
20
respuest
3.45
1.638
20
Correlaciones
Correlacin de Pearson
Sig. (unilateral)
N
Reaparic
respuest
Reaparic
respuest
Reaparic
respuest
Reaparic
1.000
-.809
.
.000
20
20
respuest
-.809
1.000
.000
.
20
20
Variables introducidas/eliminadasb
Modelo
Variables
Variables
introducidas
eliminadas
Mtodo
1
respuesta
. Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: Reaparic
dimension0
Estadsticos de cambio
R
R cuadrado Error tp. de la Cambio en R
R
cuadrado
corregida
estimacin
cuadrado
1
.809a
.655
.636
1.866
.655
a. Variables predictoras: (Constante), respuest
b. Variable dependiente: Reaparic
dimension0
Sig.
Cambio
Cambio en
en F
gl1 gl2
F
34.196
1 18
.000
DurbinWatson
1.008
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
119.105
62.695
gl
1
18
181.800
Media
cuadrtica
119.105
3.483
F
34.196
Sig.
.000a
19
Coeficientesa
Modelo
Intervalo de
Coeficientes no Coeficientes
confianza de
Estadsticos de
estandarizados tipificados
95.0% para B
Correlaciones
colinealidad
Error
Lmite Lmite Orden
Semi Toleran
B
tp.
Beta
t
Sig. inferior superior cero Parcial parcial
cia
FIV
1 (Constante) 13.375 .994
13.457 .000 11.287 15.463
respuest
-1.529 .261
a. Variable dependiente: Reaparic
-.809
-5.848 .000
-2.078
-.980
-.809
-.809
-.809
1.000
1.000
respuest
Correlaciones
respuest
1.000
Covarianzas
respuest
.068
Diagnsticos de colinealidada
Modelo
Dimensin
Autovalores
dime
nsion
dimension1
ndice de
Proporciones de la varianza
condicin
(Constante)
respuest
1.908
1.000
.05
.05
.092
4.543
.95
.95
Mximo
Media
tpica
2.67
11.85
8.10
2.504
20
Residual
-3.317
3.328
.000
1.817
20
-2.168
1.496
.000
1.000
20
Residuo tp.
-1.777
1.783
.000
.973
20
El cuadro de estadsticas descriptivas muestra solamente los promedios, las desviaciones estndar y
el total de datos de las variables en estudio las cuales pueden ser interpretadas.
b
Variables Entered/Removed
Model
1
Variables
Entered
Tiempo dea
respuesta
Variables
Removed
.
Method
Enter
Model Summaryb
Model
1
R
.809a
R
Square
.655
Adjust
ed R
Square
.636
Std. Error
of the
Estimate
1.87
Change Statistics
R Square
Change
.655
F Change
34.196
df1
1
df2
18
Sig. F
Change
.000
Durbin-W
atson
1.008
Regression
Residual
Total
Sum of
Squares
119.105
62.695
181.800
df
1
18
19
Mean
Square
119.105
3.483
F
34.196
Sig.
.000a
Unstandardized
Coefficients
Model
1
(Constant)
Tiempo de
respuesta
B
13.375
Std. Error
.994
-1.529
.261
Beta
t
13.457
Sig.
.000
-5.848
.000
-.809
95% Confidence
Interval for B
Lower
Upper
Bound
Bound
11.287
15.463
-2.078
-.980
Predicted
Value
Residual
Std.
Predicted
Value
Std.
Residual
Mean
Std.
Deviation
Minimum
Maximum
2.67
11.85
8.10
2.50
20
-3.32
3.33
1.78E-16
1.82
20
-2.168
1.496
.000
1.000
20
-1.777
1.783
.000
.973
20
Charts
Histogram
Dependent Variable: Tiempo de reaparicin
5
Frequency
0
-2.00 -1.50 -1.00 -.50
0.00
.50
1.00
1.50
2.00
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
El estadstico de Darwin Watson mide el grado de autocorrelacin. Si su valor es prximo a dos, los
residuos esta incorrelacionados, si se aproxima a -2, estarn negativamente autocorrelacionados , y
si se aproxima a 0, estarn positivamente autocorrelacionados (tambin esto puede verse mas
exactamente usado la tabla de Darwin watson). En el ejemplo existe incorrelacin.
Las varianzas de las distribuciones de la variable dependiente ligada a los distintos valores de las
variables independientes deben ser iguales: los residuos no deben presentar ningn patrn
sistemtico respecto a las predicciones o respecto a cada uno de las variables independientes. Para
analizar la homogeneidad de varianzas utilizaremos el grfico siguiente.
Scatterplot
Dependent Variable: Tiempo de reaparicin
2
-1
-2
-3
-2
-1
Este grafico muestra los residuos tipificados frente a las estimaciones tipificadas. Si la varianza de
los residuos fuera constante, la nube de puntos estara concentrada en una banda, centrada en el cero
y paralela al eje de abscisas. En nuestro caso, existe una dispersin en aumento, es decir, a mayor
valor en la estimacin del tiempo de reaparicin se sntomas, mayor es la dispersin de los residuos.
PRUEBA DE LEVENE Y TRANSFORMACIONES PARA ESTABILIZAR LA VARIANAZA
Confirmemos mediante la prueba de LEVENE.(permite contrastar la hiptesis de que la varianza de
una variable Y en K subpoblaciones o grupos es la misma).
H o 12 22 32 42 .... k2
10
Continue Ok.
Entre otros resultados aparece:
Test of Homogeneity of Variancea
Levene
Statistic
Tiempo de
reaparicin
df1
1.895
df2
4
Sig.
33
.135
.2
0.0
-.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
Level
* Plot of LN of S pread vs LN of Level
S lope = .737 Power for trans formation = .263
11
df1
1.000
df2
4
Sig.
33
.422
Observe que p = 0.422 (aumenta ), es decir que existe mayor posibilidad de no rechazar Ho.
Al seleccionar Raiz cuadrada, Continue OK. los resultados son:
Test of Homogeneity of Variancea
Levene
Statistic
Tiempo de
reaparicin
1.189
df1
df2
4
Sig.
33
.334
Observe que p = 0.334 (aumenta ), es decir que existe mayor posibilidad de no rechazar Ho. La
transformacin con raz cuadrada traera mayor estabilidad en varianzas.
Al ocurrir, la transformacin logaritmica, tiene necesariamente que transformarse los datos y
determinar un nuevo modelo de regresin que vendr expresado como: REAPARIC e B0 B1RESPUEST
12
REGRESIN MULTIPLE
DUPLICANDO LOS DATOS DEL EJERCICIO
En SPSS:
Statistics Regresin- linear.
Seleccione la variable respuesta: REAPARIC y las dems independientes y el mtodo ENTER
Regression
Model Summary
Model
1
R
.989a
R Square
.978
Adjusted
R Square
.975
Std. Error
of the
Estimate
.48
Regression
Residual
Total
Sum of
Squares
355.656
7.944
363.600
df
5
34
39
Mean
Square
71.131
.234
F
304.430
Sig.
.000a
13
Coefficientsa
Model
1
(Constant)
Consumo
de Alcohol
Consumo
de
anticidos
Consumo
de caf
Tiempo
de
respuesta
Paciente
ha dejado
de fumar
Unstandardized
Coefficients
B
Std. Error
17.884
.521
Standardi
zed
Coefficien
ts
Beta
t
34.327
Sig.
.000
-7.46E-02
.006
-.507
-13.167
.000
.199
.085
.074
2.343
.025
-8.96E-02
.086
-.038
-1.037
.307
-1.185
.053
-.627
-22.469
.000
-1.512
.191
-.230
-7.898
.000
Viendo las t, concluimos que el consumo de caf no es significativo. Veamos que pasa con los
mtodos de seleccin de la mejor ecuacin.
SPSS tiene varios mtodos de seleccin, veamos alguno de ellos
STEPWISE
En SPSS:
Statistics Regresin- linear.
Seleccione la variable respuesta: REAPARIC y las dems independientes y el mtodo STEPWISE
Regression
Model Summary
Model
1
2
3
4
R
.809a
.961b
.986c
.989d
R Square
.655
.923
.973
.977
Adjusted
R Square
.646
.919
.971
.975
Std. Error
of the
Estimate
1.82
.87
.52
.48
El mas alto valor de R2 se presenta con el modelo 4 (0.977) que incluye a la constante.
14
Regression
Residual
Total
Regression
Residual
Total
Regression
Residual
Total
Regression
Residual
Total
Sum of
Squares
238.210
125.390
363.600
335.557
28.043
363.600
353.763
9.837
363.600
355.405
8.195
363.600
Mean
Square
238.210
3.300
df
1
38
39
2
37
39
3
36
39
4
35
39
F
72.191
Sig.
.000a
167.779
.758
221.371
.000b
117.921
.273
431.533
.000c
88.851
.234
379.456
.000d
Model
1
(Constant)
Tiempo
de
respuesta
(Constant)
Tiempo
de
respuesta
Consumo
de Alcohol
(Constant)
Tiempo
de
respuesta
Consumo
de Alcohol
Paciente
ha dejado
de fumar
(Constant)
Tiempo
de
respuesta
Consumo
de Alcohol
Paciente
ha dejado
de fumar
Consumo
de
anticidos
Unstandardized
Coefficients
B
Std. Error
13.375
.684
Standardi
zed
Coefficien
ts
Beta
-.809
t
19.553
Sig.
.000
-8.497
.000
37.051
.000
-1.529
.180
17.023
.459
-1.338
.088
-.708
-15.223
.000
-7.76E-02
.007
-.527
-11.333
.000
18.935
.362
52.318
.000
-1.188
.056
-.629
-21.265
.000
-8.45E-02
.004
-.574
-20.135
.000
-1.573
.193
-.239
-8.162
.000
17.877
.521
34.280
.000
-1.175
.052
-.622
-22.624
.000
-7.81E-02
.005
-.530
-17.012
.000
-1.584
.178
-.241
-8.878
.000
.220
.083
.081
2.648
.012
Este cuadro muestra los coeficientes incluidos en cada uno de los modelos
15
Model
1
Beta In
Consumo
de Alcohol
Consumo
de
anticidos
Consumo
de caf
Paciente
ha dejado
de fumar
Consumo
de
anticidos
Consumo
de caf
Paciente
ha dejado
de fumar
Consumo
de
anticidos
Consumo
de caf
Consumo
de caf
t
a
-.527
.338
-.429
-.120
.075
-.155
-.239
.081
-.058
-.038
Sig.
Partial
Correlation
Collinearit
y Statistics
Tolerance
-11.333
.000
-.881
.963
4.182
.000
.567
.967
-6.434
.000
-.727
.990
-1.210
.234
-.195
.914
1.371
.179
.223
.682
-2.789
.008
-.422
.567
-8.162
.000
-.806
.876
2.648
.012
.409
.682
-1.521
.137
-.249
.497
-1.037
.307
-.175
.471
Este cuadro muestra las variables excluidas en cada uno de los modelos
METODO BACKWARE.
16
Model
1
Variables
Entered
Paciente
ha
dejado
de fumar,
Consumo
de
anticido
s,
Tiempo de
respuest
a,
Consumo
de caf,
Consumo a
de Alcohol
Variables
Removed
Method
Enter
Backward
(criterion:
Probability
of
F-to-remo
ve >=
.100).
Consumo
de caf
Model Summary
Model
1
2
R
.989a
.989b
R Square
.978
.977
Adjusted
R Square
.975
.975
Std. Error
of the
Estimate
.48
.48
ANOVAc
Model
1
Regression
Residual
Total
Regression
Residual
Total
Sum of
Squares
355.656
7.944
363.600
355.405
8.195
363.600
df
5
34
39
4
35
39
Mean
Square
71.131
.234
88.851
.234
F
304.430
Sig.
.000a
379.456
.000b
17
Model
1
(Constant)
Consumo
de Alcohol
Consumo
de
anticidos
Consumo
de caf
Tiempo
de
respuesta
Paciente
ha dejado
de fumar
(Constant)
Consumo
de Alcohol
Consumo
de
anticidos
Tiempo
de
respuesta
Paciente
ha dejado
de fumar
Unstandardized
Coefficients
B
Std. Error
17.884
.521
Standardi
zed
Coefficien
ts
Beta
t
34.327
Sig.
.000
-7.46E-02
.006
-.507
-13.167
.000
.199
.085
.074
2.343
.025
-8.96E-02
.086
-.038
-1.037
.307
-1.185
.053
-.627
-22.469
.000
-1.512
.191
-.230
-7.898
.000
17.877
.521
34.280
.000
-7.81E-02
.005
-.530
-17.012
.000
.220
.083
.081
2.648
.012
-1.175
.052
-.622
-22.624
.000
-1.584
.178
-.241
-8.878
.000
Excluded Variablesb
Model
2
Beta In
Consumo
de caf
t
a
-.038
Sig.
-1.037
.307
Partial
Correlation
Collinearit
y Statistics
Tolerance
-.175
.471
Ejercicio.
La tesis presentada por Wilfredo Ramos presenta datos acerca de la produccin de quinua y
medidas biometricas, trabajo de investigacin realizado en la ciudad de ILAVE. Los datos se
muestran en la tabla:
a) obtenga la mejor ecuacin utilizando y analizando cada una de las tcnicas de seleccin de la
mejor ecuacin.
produccin
Cantidad de
hojas
Altura de la
planta
Dimetro de la Longitud de la
planta
panoja
Dimetro de la
panoja
9.4
127
74.2
5.1
23.3
18
83
96.4
30.4
4.6
5.7
139
86.4
18.4
3.6
4.2
101
85.6
19.1
3.3
10.1
82
84.9
24.3
4.9
5.1
123
73.4
19.6
3.9
6.5
91
81.8
22.4
4.6
6.9
137
91.4
18.6
3.6
5.9
43
85.2
19.6
3.5
3.3
49
62.4
11.8
3.1
7.8
138
101.1
19.4
4.7
2.4
81
71.9
14.1
2.8
5.4
142
78.4
26.4
3.9
3.3
83
65.9
17.1
3.1
3.9
110
71.7
15.2
3.2
2.6
51
63.7
9.4
2.8
6.3
103
85.4
18.6
3.8
3.8
54
67.6
18.9
3.4
3.6
64
66.4
13.8
2.8
9.4
127
74.2
23.3
5.1
83
96.4
30.4
4.6
5.7
139
86.4
18.4
3.6
4.2
101
85.6
19.1
3.3
10.1
82
84.9
24.3
4.9
5.1
123
73.4
19.6
3.9
6.5
91
81.8
22.4
4.6
19