Professional Documents
Culture Documents
Diseños factoriales 2k
Licenciatura en Estadística
2015
Dr. José Alberto Pagura
Lic. Lucía N. Hernández
Dra. Daniela F. Dianda
Diseños 2k
• Una clase especial de diseños factoriales
equilibrados, lo constituyen los diseños conocidos
como 2k
• En ellos, se ensayan k factores, cada uno a dos
niveles
• Su nombre se deriva de la cantidad de tratamientos
ensayados o de experimentos elementales que se
realizan.
• Una réplica completa comprende 2x2x...x2 (kveces)
observaciones.
• Si el experimento es sin replicación, 2k será el total
de pruebas.
1
Diseños 2k
• Particularmente útil en las primeras fases del trabajo
experimental, cuando posiblemente haya muchos
factores que investigar.
• Es el diseño factorial completo con menor número de
tratamientos para estudiar los efectos de k factores
• Se debe suponer que la respuesta es
aproximadamente lineal en el espacio experimental
elegido (se consideran 2 niveles para cada factor)
Diseños 2k
Los métodos de análisis que se
estudiarán consideran que los efectos
son fijos, que los diseños son
completamente aleatorizados y que se
satisface el supuesto usual de
normalidad
2
Diseños 2k
• Los análisis estadísticos se hacen a partir
de la descomposición de la Sctotal en una
serie de términos asociados a cada
efecto investigado (todos ortogonales) +
un término debido al error que recoge
todo efecto de factores no controlados
Notación
• Los efectos se indican con letras latinas
mayúsculas, A es el efecto de ese factor,
AB es el efecto de la interacción entre
ambos factores
• Los niveles de cada factores se designan
como inferior y superior y se representan
con – y +
3
Notación
• Los tratamientos se representan con
* (1)Aquel que tiene todos los factores a nivel –
* Con letras latinas minúsculas para los factores
a nivel + y ninguna letra para los que están a
nivel -. Si se tienen 5 factores, el tratamiento
acd es la combinación de A, C y D a nivel +
y B, E a nivel -
4
Ortogonalidad
• Dos efectos principales son ortogonales si
en las pruebas del diseño experimental, en
cada una de las variantes de un factor,
aparecen en idénticas proporciones las
variantes del otro.
• Inmediatamente se puede extender la
definición, a otros efectos.
• En los diseños factoriales equilibrados,
todos los efectos son ortogonales.
5
Resultados
niveles réplica rendimiento
profundidad nitrógeno tratamientos
codificados 1 2 promedio
18 n0 (1) - - 4,54 4,64 4,59
28 n0 a + - 4,77 4,73 4,75
18 n1 b - + 5,32 5,4 5,36
28 n1 ab + + 5,59 5,67 5,63
5,36 5,63
1
Efectos y coeficientes estimados para rendimiento
(unidades codificadas)
Término Efecto
dosis de nitrogeno profundidad 0,21500
dosis de nitrogeno 0,82500
profundidad*dosis de nitrogeno 0,05500
4,59 4,75
-1
-1 1
profundidad
6
Análisis de los resultados
5,4 5,50
5,3
5,25
5,2
Media
Media
5,1
5,00
5,0
4,9
4,75
4,8
4,7
4,50
4,6 -1 1
-1 1 -1 1 dosis de nitrogeno
vs. ajustes
Gráfica de probabilidad normal (la respuesta es rendimiento)
(la respuesta es rendimiento)
99 0,050
95
90 0,025
80
70
Porcentaje
Residuo
60
0,000
50
40
30
20
-0,025
10
-0,050
1
-0,10 -0,05 0,00 0,05 0,10 4,50 4,75 5,00 5,25 5,50 5,75
Residuo Valor ajustado
7
Análisis de los resultados
Efectos y coeficientes estimados para rendimiento (unidades codificadas)
8
Diseño 23
• Se busca estudiar efectos de 3 factores
sobre una variable respuesta, considerando
dos niveles o variantes para cada factor.
9
Efectos principales
• El efecto promedio de un factor se define
como el cambio en la respuesta producido
por el cambio en el nivel de ese factor,
promediado sobre los niveles del otro
factor
10
Estimación de la interacción
• Se dice que hay interacción entre dos
factores cuando el efecto de uno de ellos es
diferente, según el nivel al que está el otro
• ¿Cómo se puede cuantificar la interacción?
• Pensemos en la interacción entre B y C
• El efecto de B cuando C está a nivel + y
cuando está C a nivel - es:
(7) (8) (5) (6) B / C (3) (4) (1) (2)
B / C
2 2 2 2
Efecto interacción
• Se define el efecto interacción BxC a la mitad
de la diferencia entre: el efecto de B cuando C
está a nivel + y el efecto de B cuando C está a
nivel –, es decir:
1
BxC (B / C B / C )
2
• Daría lo mismo haber definido la interacción
tomando los efectos de C con B+ y B-
• Si observamos, cada efecto estimado es un
contraste: promedio ponderado con
ponderaciones que suman cero
11
Signos de los contrastes
• La forma de definir el diseño denominando a
los niveles de cada factor con (+) y (-), hace
más fácil e intuitiva la “aritmética” para
calcular los efectos y comprobar su
ortogonalidad
• Los signos de los niveles de los factores,
definen los contrastes que permiten estimar
cada efecto, ya sea uno principal o una
interacción
• ¿Cómo están definidos los de la interacción?
12
Notaciones para la matriz de
diseño
Experimento T C K T C K
1 - - - 1 0 0 0
2 + - - t 1 0 0
3 - + - c 0 1 0
4 + + - tc 1 1 0
5 - - + k 0 0 1
6 + - + tk 1 0 1
7 - + + ck 0 1 1
8 + + + tck 1 1 1
Los datos
Temperatura Concentración Catalizador Producción
T C K y
- - - 60
+ - - 72
- + - 54
+ + - 68
- - + 52
+ - + 83
- + + 45
+ + + 80
13
Cálculo de los Efectos
• ¿Efectos principales?
Temperatura
Concentración
Catalizador
• ¿Interacciones?
Temperatura*Concentración
Temperatura*Catalizador
Concentración*Catalizador
Temperatura*Concentración*Catalizador
14
Cálculo de interacciones dobles
Representación geométrica
15
Más sobre el cálculo de los
efectos
• Otro método utilizado para el cálculo de
los efectos es el algoritmo de Yates
• Este se aplica a las observaciones puestas
en orden estándar
• En el diseño 23 se construyen tres
columnas adicionales cuyos valores se
calculan como sigue:
16
Algoritmo de Yates para un diseño 23
Segunda y Tercera columna
• Columna (2): sus valores se obtienen a
partir de la columna (1) y el procedimiento
para calcular cada valor es el mismo que se
definió para la columna (1) pero en lugar
de hacer a partir de los valores de “y” se
hace a partir de los de (1)
• Columna (3): de la misma manera que las
columnas anteriores pero a partir de (2)
17
Algoritmo de Yates. Cálculos en el
ejemplo
Tratamiento y (1) (2) (3) Divisor Estimación Identificación
del efecto
1 60 132 254 514 8 64.25 Media
2 72 122 260 92 4 23.0 T
3 54 135 26 -20 4 -5.0 C
4 68 125 66 6 4 1.5 TC
5 52 12 -10 6 4 1.5 K
6 83 14 -10 40 4 10.0 TK
7 45 31 2 0 4 0.0 CK
8 80 35 4 2 4 0.5 TCK
Sumas de cuadrados
2k
• Un efecto es un contraste de la forma C c y i i.
i 1
n ci2
i 1
18
Sumas de cuadrados
• Teniendo en cuenta que el conjunto de 2k-1
contrastes ortogonales descomponen la
suma de cuadrados debida a los
tratamientos en esa misma cantidad de
componentes independientes, la diferencia
de la suma de cuadrados total y la suma de
las SCc será la SCresidual
Sumas de Cuadrados
• La SC de un efecto, principal o
interacción, se puede escribir como:
• SCefecto = (nº de datos/4) Efecto2
• Recordar que el efecto siempre es la
diferencia de dos promedios: el de las
pruebas asociadas a signos + y el de las
pruebas asociadas a signos –
19
Más sobre el ejemplo
• Un detalle omitido hasta aquí, es que los
ocho valores de producción son en realidad
la media de dos experimentos elementales
replicados. Esto permite el cálculo de las
variancias para completar un análisis de los
datos.
20
Condición óptima
• La condición óptima será
• Temperatura a nivel +
• Concentración a nivel –
• Catalizador ¿a que nivel?
Predicción de la respuesta en
condiciones óptimas halladas
Media del experimento 64,25
Efecto de T+ (23/2) 11,50
Efecto de C- (5/2) 2,50
Efecto de K+ (1,5/2) 0,75
Efecto de (TK)+ (10/2) 5,00
21
Intervalo de confianza para la
predicción media
• Un intervalo del 95% confianza para la
media se puede calcular como:
CM residual
Pr edicción t gl1,1 1 gl 2
N
CMerror resulta igual a 6,73 y el IC para la
predicción es:
84 ± t11;0,95 *((6,73/16)*(1+4))1/2
84 ±2,2001*1,45 ; 84 ± 3,19
Tabla ANOVA
22
Experimentos sin replicación
• En los experimentos 2k sin réplicas, si se quieren
probar TODOS los efectos, no quedan grados de
libertad para el error. Por lo tanto, se suelen desechar
de entrada las interacciones de orden elevado
(probablemente no significativas) que serán
“confundidas” con el error
• Siempre se aconseja que para hacer un ANOVA los
grados de libertad del error no sean tan pequeños, para
tener suficiente potencia (no menor que 4). Alrededor
de 10 sería recomendable
23
Gráfico de Daniel
• Ese gráfico es conocido como “gráfico de
Daniel” y permitirá visualizar aquellos
efectos no significativos, los que “unirán”
al error en el ANOVA permitiendo test con
mayor potencia
90 A F actor N ame
A T
80 B C
AC C K
70
Percent
60
50
40
30
20
10 B
5
1
-5 0 5 10 15
Standardized Effect
24
Bloques en diseño factorial 2k
• Se va a realizar un experimento 23.
• El material experimental es un compuesto
y es deseable que se mezclen las materias
primas (que pueden provenir de diferentes
proveedores, diferentes lotes, etc.)
• Sin embargo, no se puede conseguir
material homogéneo más que para cuatro
experimentos.
5 6
1 2
25
Bloques en diseño factorial 2k
• Los tratamientos 1,4,6 y 7 se probaron con
el compuesto 1
• Los tratamientos 2, 3, 5 y 8 se probaron
con el compuesto 2
• Si hay efecto aditivo de los compuestos,
quedará cancelado al calcular los efectos
principales y las interacciones dobles
Confusión
• Observar que se ha confundido
deliberadamente la interacción triple con el
efecto de los compuestos
• A cambio, los efectos principales y las
interacciones dobles se pueden medir con
mayor precisión que si no se hubiesen
utilizado bloques.
26
Confusión
• En este ejemplo, puede pensarse que la variable
bloque es un cuarto factor que llamamos 4.
• Este factor tiene la particularidad de no
interactuar con los demás factores
• Si la asignación de los niveles del factor 4 a los
tratamientos se definió en base a hacer coincidir
los signos + y – con los de la interacción se puede
decir que el bloque está “generado” por la
relación 4=123
27