You are on page 1of 27

Diseño de Experimentos

Diseños factoriales 2k
Licenciatura en Estadística
2015
Dr. José Alberto Pagura
Lic. Lucía N. Hernández
Dra. Daniela F. Dianda

Diseños 2k
• Una clase especial de diseños factoriales
equilibrados, lo constituyen los diseños conocidos
como 2k
• En ellos, se ensayan k factores, cada uno a dos
niveles
• Su nombre se deriva de la cantidad de tratamientos
ensayados o de experimentos elementales que se
realizan.
• Una réplica completa comprende 2x2x...x2 (kveces)
observaciones.
• Si el experimento es sin replicación, 2k será el total
de pruebas.

1
Diseños 2k
• Particularmente útil en las primeras fases del trabajo
experimental, cuando posiblemente haya muchos
factores que investigar.
• Es el diseño factorial completo con menor número de
tratamientos para estudiar los efectos de k factores
• Se debe suponer que la respuesta es
aproximadamente lineal en el espacio experimental
elegido (se consideran 2 niveles para cada factor)

Diseños 2k
Los métodos de análisis que se
estudiarán consideran que los efectos
son fijos, que los diseños son
completamente aleatorizados y que se
satisface el supuesto usual de
normalidad

2
Diseños 2k
• Los análisis estadísticos se hacen a partir
de la descomposición de la Sctotal en una
serie de términos asociados a cada
efecto investigado (todos ortogonales) +
un término debido al error que recoge
todo efecto de factores no controlados

Notación
• Los efectos se indican con letras latinas
mayúsculas, A es el efecto de ese factor,
AB es el efecto de la interacción entre
ambos factores
• Los niveles de cada factores se designan
como inferior y superior y se representan
con – y +

3
Notación
• Los tratamientos se representan con
* (1)Aquel que tiene todos los factores a nivel –
* Con letras latinas minúsculas para los factores
a nivel + y ninguna letra para los que están a
nivel -. Si se tienen 5 factores, el tratamiento
acd es la combinación de A, C y D a nivel +
y B, E a nivel -

Efectos que pueden estimarse


• En un diseño 2k es posible descomponer la
SCtotal en 2k-1 efectos, c/u con 1 grado de
libertad:
• K efectos simples
• (K en 2) interacciones dobles
• (k en 3) interacciones triples
• ........
• (k en k)=1 interacción de orden k
• En la práctica, es difícil tener interés en estudiar
interacciones de orden superior a dos

4
Ortogonalidad
• Dos efectos principales son ortogonales si
en las pruebas del diseño experimental, en
cada una de las variantes de un factor,
aparecen en idénticas proporciones las
variantes del otro.
• Inmediatamente se puede extender la
definición, a otros efectos.
• En los diseños factoriales equilibrados,
todos los efectos son ortogonales.

El caso más sencillo: diseño 22


• Se desea estudiar el efecto del uso de
nitrógeno y la profundidad de labranza,
sobre el rendimiento de azúcar en kg/ha en
remolachas.
• Nitrógeno: sin y 336,33 kg./ha de sulfato
de amonio
• Profundidad: 18 y 28 cms.

5
Resultados
niveles réplica rendimiento
profundidad nitrógeno tratamientos
codificados 1 2 promedio
18 n0 (1) - - 4,54 4,64 4,59
28 n0 a + - 4,77 4,73 4,75
18 n1 b - + 5,32 5,4 5,36
28 n1 ab + + 5,59 5,67 5,63

Gráfica de cubos (medias de los datos) para rendimiento

5,36 5,63
1
Efectos y coeficientes estimados para rendimiento
(unidades codificadas)

Término Efecto
dosis de nitrogeno profundidad 0,21500
dosis de nitrogeno 0,82500
profundidad*dosis de nitrogeno 0,05500

4,59 4,75
-1
-1 1
profundidad

Estimación de los efectos


• Asocie el cálculo de las estimaciones de
los efectos, a la representación gráfica de
los ensayos en un cuadrado.
• Asocie el cálculo de los efectos, a los
signos que representan los niveles de los
factores

6
Análisis de los resultados

Gráfica de efectos principales para rendimiento Gráfica de interacción para rendimiento


Medias de datos
Medias de datos
5,75 profundidad
profundidad dosis de nitrogeno
-1
5,5 1

5,4 5,50

5,3
5,25
5,2

Media
Media

5,1
5,00
5,0

4,9
4,75
4,8

4,7
4,50
4,6 -1 1
-1 1 -1 1 dosis de nitrogeno

Análisis de los resultados


Fuente GL SC CM F P
profundidad 1 0,09245 0,09245 30,31 0,005
dosis de nitrogeno 1 1,36125 1,36125 446,31 0,000
Interacción 1 0,00605 0,00605 1,98 0,232
Error 4 0,01220 0,00305
Total 7 1,47195

vs. ajustes
Gráfica de probabilidad normal (la respuesta es rendimiento)
(la respuesta es rendimiento)
99 0,050

95
90 0,025
80
70
Porcentaje

Residuo

60
0,000
50
40
30
20
-0,025
10

-0,050
1
-0,10 -0,05 0,00 0,05 0,10 4,50 4,75 5,00 5,25 5,50 5,75
Residuo Valor ajustado

7
Análisis de los resultados
Efectos y coeficientes estimados para rendimiento (unidades codificadas)

Término Efecto Coef SE Coef T P


Constante 5,08250 0,01953 260,30 0,000
profundidad 0,21500 0,10750 0,01953 5,51 0,005
dosis de nitrogeno 0,82500 0,41250 0,01953 21,13 0,000
profundidad*dosis de nitrogeno 0,05500 0,02750 0,01953 1,41 0,232

¿Cuantas pruebas se hubiesen necesitado estudiando de un factor


por vez, para estimar los efectos con la misma precisión que en
el diseño factorial?
con esa estrategia: ¿se hubiese podido determinar la
significación estadística de la interacción o estimar su efecto?

Respuesta media esperada


• La respuesta para condiciones definidas
por alguno de los tratamientos
experimentados, se estimará con la
respuesta media obtenida para ese
tratamiento.
• Se completará dicha estimación puntual,
con una estimación por intervalo de
acuerdo al procedimiento que se presenta
más adelante

8
Diseño 23
• Se busca estudiar efectos de 3 factores
sobre una variable respuesta, considerando
dos niveles o variantes para cada factor.

Diseño: Variedad de “tratamientos”


Prueba Factor Factor Factor
A B C
1 C está a nivel –
- - - A está 2 veces –
2 + - - 2 veces +
B está 2 veces –
3 - + - 2 veces +
4 + + -
5 - - + C está a nivel +
6 + - + A está 2 veces –
2 veces +
7 - + + B está 2 veces –
8 2 veces +
+ + +

9
Efectos principales
• El efecto promedio de un factor se define
como el cambio en la respuesta producido
por el cambio en el nivel de ese factor,
promediado sobre los niveles del otro
factor

Estimación de un efecto principal


• El efecto producido por un factor (C) se
puede cuantificar mediante la diferencia
del nivel medio de la variable respuesta
cuando A está a nivel + y el nivel medio de
la misma cuando A está a nivel -
(5)  (6)  (7)  (8) (1)  (2)  (3)  (4)
C 
4 4
• El número entre paréntesis indica el valor
medio de la respuesta para ese número de
prueba, para la matriz del diseño en orden
estándar.

10
Estimación de la interacción
• Se dice que hay interacción entre dos
factores cuando el efecto de uno de ellos es
diferente, según el nivel al que está el otro
• ¿Cómo se puede cuantificar la interacción?
• Pensemos en la interacción entre B y C
• El efecto de B cuando C está a nivel + y
cuando está C a nivel - es:
(7)  (8) (5)  (6) B / C   (3)  (4)  (1)  (2)
B / C  
2 2 2 2

Efecto interacción
• Se define el efecto interacción BxC a la mitad
de la diferencia entre: el efecto de B cuando C
está a nivel + y el efecto de B cuando C está a
nivel –, es decir:
1
BxC  (B / C   B / C  )
2
• Daría lo mismo haber definido la interacción
tomando los efectos de C con B+ y B-
• Si observamos, cada efecto estimado es un
contraste: promedio ponderado con
ponderaciones que suman cero

11
Signos de los contrastes
• La forma de definir el diseño denominando a
los niveles de cada factor con (+) y (-), hace
más fácil e intuitiva la “aritmética” para
calcular los efectos y comprobar su
ortogonalidad
• Los signos de los niveles de los factores,
definen los contrastes que permiten estimar
cada efecto, ya sea uno principal o una
interacción
• ¿Cómo están definidos los de la interacción?

Ejemplo de un diseño factorial 23

En una planta piloto, se investigó el efecto de


temperatura(T), concentración(C) y
catalizador(K) sobre la producción en
gramos (Box, Hunter y Hunter, pág. 318)
Una tabla con la combinación de niveles a
experimentar como la que sigue se conoce
como matriz de diseño

12
Notaciones para la matriz de
diseño
Experimento T C K T C K
1 - - - 1 0 0 0
2 + - - t 1 0 0
3 - + - c 0 1 0
4 + + - tc 1 1 0
5 - - + k 0 0 1
6 + - + tk 1 0 1
7 - + + ck 0 1 1
8 + + + tck 1 1 1

Los datos
Temperatura Concentración Catalizador Producción
T C K y
- - - 60
+ - - 72
- + - 54
+ + - 68
- - + 52
+ - + 83
- + + 45
+ + + 80

Temperatura Concentración Catalizador


- 160 - 20 - A
+ 180 + 40 + B

13
Cálculo de los Efectos
• ¿Efectos principales?
Temperatura
Concentración
Catalizador
• ¿Interacciones?
Temperatura*Concentración
Temperatura*Catalizador
Concentración*Catalizador
Temperatura*Concentración*Catalizador

Cálculo de efectos principales


Representación geométrica

14
Cálculo de interacciones dobles
Representación geométrica

Cálculo de interacciones triples


Representación geométrica

15
Más sobre el cálculo de los
efectos
• Otro método utilizado para el cálculo de
los efectos es el algoritmo de Yates
• Este se aplica a las observaciones puestas
en orden estándar
• En el diseño 23 se construyen tres
columnas adicionales cuyos valores se
calculan como sigue:

Algoritmo de Yates para un diseño 23


Primera columna
• Columna (1):
Sus valores se obtienen a partir de las
respuestas “y”
Los primeros cuatro números se obtienen
sumando los cuatro pares
Los segundos cuatro números se obtienen
restando el número de arriba del de debajo
de cada pareja.

16
Algoritmo de Yates para un diseño 23
Segunda y Tercera columna
• Columna (2): sus valores se obtienen a
partir de la columna (1) y el procedimiento
para calcular cada valor es el mismo que se
definió para la columna (1) pero en lugar
de hacer a partir de los valores de “y” se
hace a partir de los de (1)
• Columna (3): de la misma manera que las
columnas anteriores pero a partir de (2)

Algoritmo de Yates para un diseño 23


Cálculo de los efectos
• Los efectos se obtienen dividiendo los valores
de la columna (3) por los denominadores
adecuados: 8 para la primera fila (media
general) y 4 para las siguientes.
• En el caso del diseño 2k, habrá k columnas
que se generarán sumando y restando
adecuadamente parejas de números. El primer
divisor será 2k y los restantes 2k-1

17
Algoritmo de Yates. Cálculos en el
ejemplo
Tratamiento y (1) (2) (3) Divisor Estimación Identificación
del efecto
1 60 132 254 514 8 64.25 Media
2 72 122 260 92 4 23.0 T
3 54 135 26 -20 4 -5.0 C
4 68 125 66 6 4 1.5 TC
5 52 12 -10 6 4 1.5 K
6 83 14 -10 40 4 10.0 TK
7 45 31 2 0 4 0.0 CK
8 80 35 4 2 4 0.5 TCK

Sumas de cuadrados
2k
• Un efecto es un contraste de la forma C  c y i i.
i 1

Dividido por (k-1) donde ci son los coeficientes que


2k
en este caso serán iguales a 1 o –1 y: c  0 i
i 1

La suma de cuadrados de un contraste en el caso


2
balanceado es:   2k
cy   i i. 
SCc   2k 
i 1

n ci2
i 1

con un solo grado de libertad

18
Sumas de cuadrados
• Teniendo en cuenta que el conjunto de 2k-1
contrastes ortogonales descomponen la
suma de cuadrados debida a los
tratamientos en esa misma cantidad de
componentes independientes, la diferencia
de la suma de cuadrados total y la suma de
las SCc será la SCresidual

Sumas de Cuadrados
• La SC de un efecto, principal o
interacción, se puede escribir como:
• SCefecto = (nº de datos/4) Efecto2
• Recordar que el efecto siempre es la
diferencia de dos promedios: el de las
pruebas asociadas a signos + y el de las
pruebas asociadas a signos –

19
Más sobre el ejemplo
• Un detalle omitido hasta aquí, es que los
ocho valores de producción son en realidad
la media de dos experimentos elementales
replicados. Esto permite el cálculo de las
variancias para completar un análisis de los
datos.

Estimaciones de los efectos


Term Effect Coef SE Coef T P
Constant 64,250 0,7071 90,86 0,000
T 23,000 11,500 0,7071 16,26 0,000
C -5,000 -2,500 0,7071 -3,54 0,008
K 1,500 0,750 0,7071 1,06 0,320
T*C 1,500 0,750 0,7071 1,06 0,320
T*K 10,000 5,000 0,7071 7,07 0,000
C*K 0,000 0,000 0,7071 0,00 1,000
T*C*K 0,500 0,250 0,7071 0,35 0,733

20
Condición óptima
• La condición óptima será
• Temperatura a nivel +
• Concentración a nivel –
• Catalizador ¿a que nivel?

Predicción de la respuesta en
condiciones óptimas halladas
Media del experimento 64,25
Efecto de T+ (23/2) 11,50
Efecto de C- (5/2) 2,50
Efecto de K+ (1,5/2) 0,75
Efecto de (TK)+ (10/2) 5,00

Producción media prevista 84,00

21
Intervalo de confianza para la
predicción media
• Un intervalo del 95% confianza para la
media se puede calcular como:
CM residual
Pr edicción  t gl1,1 1  gl 2
N
CMerror resulta igual a 6,73 y el IC para la
predicción es:
84 ± t11;0,95 *((6,73/16)*(1+4))1/2
84 ±2,2001*1,45 ; 84 ± 3,19

Tabla ANOVA

Source DF Seq SS Adj SS Adj MS F P


T 1 2116,00 2116,00 2116,00 314,54 0,000
C 1 100,00 100,00 100,00 14,86 0,003
K 1 9,00 9,00 9,00 1,34 0,272
T*K 1 400,00 400,00 400,00 59,46 0,000
Error 11 74,00 74,00 6,73
Total 15 2699,00

22
Experimentos sin replicación
• En los experimentos 2k sin réplicas, si se quieren
probar TODOS los efectos, no quedan grados de
libertad para el error. Por lo tanto, se suelen desechar
de entrada las interacciones de orden elevado
(probablemente no significativas) que serán
“confundidas” con el error
• Siempre se aconseja que para hacer un ANOVA los
grados de libertad del error no sean tan pequeños, para
tener suficiente potencia (no menor que 4). Alrededor
de 10 sería recomendable

Experimentos con muchos factores


• Cuando no hay suficientes grados de libertad,
por haber muy pocas pruebas o porque se
quieren probar varias interacciones, se puede
usar un método gráfico
• Si no hubiera efectos reales significativos, los
efectos diferirían de cero sólo por azar, con
variabilidad igual a 2/N
• Por lo tanto los efectos deberían estar sobre una
recta en un gráfico sobre papel normal

23
Gráfico de Daniel
• Ese gráfico es conocido como “gráfico de
Daniel” y permitirá visualizar aquellos
efectos no significativos, los que “unirán”
al error en el ANOVA permitiendo test con
mayor potencia

Plot de Daniel para el ejemplo


Normal Probability Plot of the Standardized Effects
(response is y, Alpha = ,05)
99
Effect Ty pe
Not Significant
95 Significant

90 A F actor N ame
A T
80 B C
AC C K
70
Percent

60
50
40
30
20

10 B
5

1
-5 0 5 10 15
Standardized Effect

24
Bloques en diseño factorial 2k
• Se va a realizar un experimento 23.
• El material experimental es un compuesto
y es deseable que se mezclen las materias
primas (que pueden provenir de diferentes
proveedores, diferentes lotes, etc.)
• Sin embargo, no se puede conseguir
material homogéneo más que para cuatro
experimentos.

Bloques en diseño factorial 2k


• El diseño 23 puede dividirse en bloques
como se indica:
2 7
3 8
1 4
3
Factores

5 6

1 2

25
Bloques en diseño factorial 2k
• Los tratamientos 1,4,6 y 7 se probaron con
el compuesto 1
• Los tratamientos 2, 3, 5 y 8 se probaron
con el compuesto 2
• Si hay efecto aditivo de los compuestos,
quedará cancelado al calcular los efectos
principales y las interacciones dobles

Confusión
• Observar que se ha confundido
deliberadamente la interacción triple con el
efecto de los compuestos
• A cambio, los efectos principales y las
interacciones dobles se pueden medir con
mayor precisión que si no se hubiesen
utilizado bloques.

26
Confusión
• En este ejemplo, puede pensarse que la variable
bloque es un cuarto factor que llamamos 4.
• Este factor tiene la particularidad de no
interactuar con los demás factores
• Si la asignación de los niveles del factor 4 a los
tratamientos se definió en base a hacer coincidir
los signos + y – con los de la interacción se puede
decir que el bloque está “generado” por la
relación 4=123

Cómo construir esquemas más


complejos
• La idea expuesta nos permitirá derivar esquemas
de bloques más complejos.
• En esos casos deberá ponerse cuidado cuidado
especial en la definición de modo que las
variables de bloques no se confundan con
interacciones que podrían ser significativas y lo
mismo con las posibles interacciones entre
variables de bloqueo.

27

You might also like