You are on page 1of 12

Republica Bolivariana de Venezuela

Universidad de los Andes


Facultad de Ingeniería
Escuela de Sistemas
Departamento de Investigación de Operaciones
Cátedra: Estocástica 3
Profesor: Franklin Dávila

Diseño Factorial 2K
y
Diseño Factorial Fraccionado 2K- P

Br. Castellano, Anyer C.I: 16.528.334

Mérida, 14 de Julio de 2007.


Introducción

Los diseños factoriales son a ampliamente utilizados en experimentos en los que


intervienen varios factores para estudiar el efecto conjunto de estos sobre una
respuesta. Existen varios casos especiales del diseño factorial general que resultan
importantes porque se usan ampliamente en el trabajo de investigación, y porque
constituyen la base para otros diseños de gran valor práctico.

El más importante de estos casos especiales ocurre cuando se tienen k factores, cada
uno con dos niveles. Estos niveles pueden ser cuantitativos como sería el caso de
dos valores de temperatura presión o tiempo. También pueden ser cualitativos como
sería el caso de dos máquinas, dos operadores, los niveles "superior" e "inferior" de
un factor, o quizás, la ausencia o presencia de un factor.

Una réplica completa de tal diseño requiere que se recopilen 2 x 2 x .... x 2 = 2k


observaciones y se conoce como diseño general 2k.El segundo caso especial es el de
k factores con tres niveles cada uno, conocido como diseño factorial 3 k.
Se supone que:

a) los factores son fijos.

b) los diseños son completamente aleatorios.

c) se satisface la suposición usual de normalidad.

El diseño 2k es particularmente útil en las primeras fases del trabajo experimental,


cuando es probable que haya muchos factores por investigar.
Conlleva el menor número de corridas con las cuales pueden estudiarse k factores en
un diseño factorial completo. Debido a que sólo hay dos niveles para cada factor,
debe suponerse que la respuesta es aproximadamente lineal en el intervalo de los
niveles elegidos de los factores.

Los experimentos fraccionados 2K - P tienen por objetivo determinar la significación de


los efectos principales y de las interacciones de 2 o 3 factores.

Por ejemplo: un experimento con 7 factores, requiere identificar 7 + 21 = 28 efectos


por lo que necesita 29 tratamientos (en vez de los 128 del experimento 27 completo).

A estos diseños se les llama Screening Designs. Su intención es determinar de una


lista grande de factores cuáles son aquellos sobre los que se realizará un experimento
posterior con un diseño experimental no fraccionado (experimentación secuencial).
Un experimento factorial fraccionado es uno en el que solo se observa una fracción de
las condiciones experimentales. La fracción es ½, ¼, 1/8, 1/16, … del experimento sin
fraccionar.
Diseño Factorial

Los diseños factoriales estadísticos involucran la combinación de dos o más factores,


cada uno a distintos niveles, lo que conduce a distintos tratamientos. Los factores son
variables independientes de las cuales nos interesa medir su efecto sobre una
variable dependiente o respuesta; los niveles son las categorías en las cuales se
puede dividir un factor. El objetivo general de los diseños factoriales es determinar si
existe efecto de los factores estudiados y también si existe interacción entre ellos.

Un Diseño Factorial es aquel en el que se investigan todas las posibles


combinaciones de los niveles de los factores en cada ensayo completo o replica del
experimento.

Diseños factoriales fraccionales. Es un método estadístico de gran utilidad debido a


que reduce tiempo y recursos al estudiar las interacciones de mayor importancia de un
diseño experimental completo

Específicamente el diseño factorial 2K completo es el que estudia k factores con dos


niveles cada uno, y donde se evalúan los 2K posibles tratamientos. Se dice que son
útiles principalmente cuando el numero de factores esta entre 2 y 5, rango en el cual
su tamaño se encuentra entre 4 y 32 tratamientos. Si el número de factores es mayor
a 5 se recomienda usar un factorial fraccionado.

Para facilitar el entendimiento de un diseño factorial 2 K estudiemos el diseño más


simple de la familia de 2K, el diseño 22.

Diseño Factorial 22

Este modelo estudia el efecto de dos factores considerando dos niveles en cada uno.
Cada replica de este diseño consiste de 2x2=4 combinaciones o tratamientos que se
pueden denotar de diferentes maneras.

Algoritmo de Yates. Es un método numérico que simplifica efectos e interacciones


entre los factores manejados a sus diferentes niveles

La notación de Yates tiene un significado diferente a las demás: con ella se representa
el total o suma de las observaciones en cada tratamiento, mas que el tratamiento
mismo. En la notación de Yates la lógica es la siguiente: si una letra minúscula esta
presente, entonces el factor correspondiente se encuentra en su nivel alto; si esta
ausente, el factor esta en su nivel bajo. Este hecho hace que la notación de Yates
simplifique la escritura de las expresiones de los efectos a estudiar.

Ejemplo:

Tabla 1. Notación de Yates


A B Notación de Yates
Tratamiento 1 -1 -1 (1)
Tratamiento 2 1 -1 a
Tratamiento 3 -1 1 b
Tratamiento 4 1 1 ab
¿Como se calculan los efectos?

En el caso de este diseño hay tres efectos de interés: los dos efectos principales (A y
B) y el efecto de interacción (AB). Con el uso de la notación de Yates como los totales
de las n repeticiones en cada punto de diseño, se tiene que en el nivel alto del factor A
se mide a y ab y en el nivel bajo del mismo se observa b y (1). La media en el nivel
alto de A es entonces (a+ab)/2n y en el nivel bajo es (b+(1))/2n, donde la constante 2n
sale del hecho de que en cada nivel del factor se están sumando 2n datos, que son la
mitad de los datos del experimento. Entonces:

EfectoA =
1
[ a + ab − b − (1)] = [ a + ab ] − [ b + (1)]
2n 2n 2n

EfectoB =
1
[ b + ab − a − (1)] = [ b + ab] − [ a + (1)]
2n 2n 2n

El efecto de interacción entre los dos factores A y B esta dado por la diferencia entre
el efecto de A en el nivel alto de B y el efecto de A en el nivel bajo de B.

EfectoAB =
1
[ ab + (1) − a − b] = [ ab − b] − [ a − (1)]
2n 2n 2n

Análisis de Varianza

Aunque los efectos calculados sean números distintos de cero, esto no implica que el
efecto correspondiente sea estadísticamente diferente de cero. Para poder afirmar
que tales efectos contribuyen a explicar el comportamiento de la respuesta, se debe
hacer un Análisis de Varianza.

Contraste
2K
Es una combinación de la forma c = ∑c i Yi con ∑c i =0
i =1

Donde lo ci son los coeficientes.


En el caso del diseño 22 los contrastes correspondientes a los tres efectos A, B, AB
son:
Contraste A = [a + ab - b - (1)]

Contraste B = [b + ab – a - (1)]

Contraste AB = [ab + (1) – a - b]

Son contrastes por el hecho de que son combinaciones lineales donde los coeficientes
suman cero (1 + 1 – 1 – 1 = 0). Una vez obtenido el contraste, el efecto
correspondiente se obtiene dividiéndolo entre la constante que lo convierta en una
diferencia de medias. En el factorial 2K con n replicas los contrastes se dividen por
n2(K-1) para estimar los efectos. Lo que indica que para el diseño 22 se divide por n2(2-1)
= 2n.

Métodos para calcular contrastes

La tabla de signos es una manera práctica de calcular contrastes de cualquier efecto.


Se construye a partir de la matriz de diseño multiplicando las columnas que
intervienen en la interacción calculada. Para el diseño 22:

Tabla 2. Matriz de Diseño para el diseño 22


A B AB Yates
- - + (1)
+ - - a
- + - b
+ + + ab

El calculo de contrastes se complica en la medida de que el numero de factores crece,


dado que se incrementa rápido el numero de términos que contiene el contraste.

Pasos para llegar al ANOVA

CONTRASTES

EFECTOS

SUMAS DE CUADRADOS

ANOVA

Para investigar cuales de los tres efectos están activos o son significativos se procede
a probar las hipótesis dadas por:

Efecto A = 0
Ho: Efecto B = 0
Efecto AB = 0

Cada una contra la alternativa de que el efecto en cuestión es diferente de cero.

Tabla 3. ANOVA para el diseño 22


FV SC GL CM Fo P-Value
A SCA 1 CMA CMA/CME P(F>Fo)
B SCB 1 CMB CMB/CME P(F>Fo)
AB SCAB 1 CMAB CMAB/CME P(F>Fo)
Error SCE 4(n-1) CME
Total SCT n22-1

Diseño factorial 2K
Una vez obtenida la tabla de signos, el cálculo de contrastes es más fácil. La tabla de
signos se construye haciendo todas las posibles combinaciones de los K factores.
Como se menciono anteriormente los diseños factoriales 2K son recomendados en
experimentos cuyos factores son menor o igual a 5, para un numero mayor de
factores se recomienda usar los diseños factoriales fraccionados 2K-P.

Para el diseño factorial 25 se tendrán 32 tratamientos, es decir, 32 posibles


combinaciones entre los 5 factores en 2 niveles. Una vez construida la tabla se signos,
el contraste de cada efecto se obtiene al multiplicar su columna de signos por la
columna de totales expresados en la notación de Yates. Con los contrastes se
procede a estimar los efectos mediante la formula:

1
EfectoABC .... K = [contrasteA BC .... K ]
n 2 K −1

Para la cual su suma de cuadrados con un grado de libertad esta dada por:

1
SC AB .... K = [contrasteA B.... K ]
n2 K

Si en la tabla de ANOVA se incluyen el total de efectos que se pueden estimar con el


factorial completo 2K será necesario realizar cuando menos dos replicas del
experimento para poder estimar una suma de cuadrados del error. Sin embargo, en la
mayoría de los casos interesa solo estudiar a los efectos principales y las
interacciones dobles. Esto hace que cuando el número de factores es mayor o igual a
cuatro (K≥4) no sea estrictamente necesario realizar replicas, puesto que se puede
construir una suma de cuadrados del error aproximada, utilizando las sumas de
cuadrados de las interacciones triples o de mayor orden que generalmente son
pequeñas.
Diseño Factorial 2K no replicado
Al aumentar el numero de factores en el diseño 2 K crece rápido el numero de
tratamientos y por lo tanto el numero de corridas experimentales. Si se realiza dos
repeticiones en cada punto se tiene que hacer 2x2K corridas experimentales, lo cual
puede consumir muchos recursos para mas de cuatro factores (K≥5), ya que serian 64
o mas corridas. El diseño 25 es el factorial mas grande que todavía se puede correr
con dos replicas, lo que implica hacer 32 corridas del proceso, pero incluso con una
replica (16 pruebas) de este diseño es muchas veces suficientes para estudiar los 10
efectos de interés como se muestra en la tabla 4.

Tabla 4. Tabla de signos del diseño factorial 2K


Notació A B C D E AB AC AD AE BC BD BE CD CE DE
n de
Yates
(1) - - - - - + + + + + + + + + +
a + - - - - - - - - + + + + + +
b - + - - - - + + + - - - + + +
ab + + - - - + - - - - - - + + +
c - - + - - + - + + - + + - - +
ac + - + - - - + - - - + + - - +
bc - + + - - - - + + + - - - - +
abc + + + - - + + - - + - - - - +
d - - - + - + + - + + - + - + -
ad + - - + - - - + - + - + - + -
bd - + - + - - + - + - + - - + -
abd + + - + - + - + - - + - - + -
cd - - + + - + - - + - - + + - -
acd + - + + - - + + - - - + + - -
bcd - + + + - - - - + + + - + - -
abad + + + + - + + + - + + - + - -
e - - - - + + + + - + + - + - -
ae + - - - + - - - + + + - + - -
be - + - - + - + + - - - + + - -
abe + + - - + + - - + - - + + - -
ce - - + - + + - + - - + - - + -
ace + - + - + - + - + - + - - + -
bce - + + - + - - + - + - + - + -
abce + + + - + + + - + + - + - + -
de - - - + + + + - - + - - - - +
ade + - - + + - - + + + - - - - +
bde - + - + + - + - - - + + - - +
abde + + - + + + - + + - + + - - +
cde - - + + + + - - - - - - + + +
acde + - + + + - + + + - - - + + +
bcde - + + + + - - - - + + + + + +
abcde + + + + + + + + + + + + + + +

La siguiente tabla muestra las replicas recomendadas en la familia de diseños 2K.


Tabla 5. Replicas en la familia de diseños 2K
Diseño Replicas recomendadas Numero de corridas
22 3o4 12, 16
23 2 16
24 1o2 16, 32
25 Fracción 25-1 o 1 16, 32
26 Fracción 26-2 o fracción 26-1 16, 32
27 Fracción 27-3 o fracción 27-2 16, 32

Ninguno de los diseños listados en la tabla tiene más de 32 corridas, sin contar las
posibles repeticiones al centro que se explicaran mas adelante. Se puede afirmar que
la mayoría de los experimentos factoriales 2K o fracciones de ellos que se utilizan en la
practica requieren a lo mas 32 corridas experimentales, y con ellas se pueden
estudiar hasta una cantidad grande de factores (K>8).

Una sola replica del factorial 2K completo es una estrategia adecuada cuando se
tienen cuatro o mas factores, considerando que a partir de K=4 se comienza a tener
mucha información con el diseño factorial completo. Esta información extra se refleja
en que los efectos de interés primario, como lo son los efectos principales y las
interacciones dobles, se estiman con gran precisión, por ejemplo en el caso de K=5,
estos efectos se estimarían como la diferencia de medias de 16 datos cada una. Pero
además se pueden estimar interacciones de alto orden, las cuales generalmente no
son significativas. Tales interacciones de alto orden pueden utilizarse para estimar un
error que permita construir un ANOVA aproximado.

Se deben eliminar o mandar al error al menos 8 efectos pequeños para que tenga
mayores posibilidades de estar bien estimado. Puede haber efectos con los que no es
nada claro si se deben o no mandar al error.

¿Como decidir cuales efectos mandar al error?

Existen varia técnicas que ayudan a detectar con bastante seguridad los efectos que
pueden utilizarse para conformar el error. El uso de tales técnicas es lo que permite
construir un cuadrado medio del error los mas apegado posible a la realidad. Si
mandamos al error un efecto que no se debe al azar, que es un efecto real, este
puede inflar el CME lo que reduciría la potencia del ANOVA para detectar efectos
significativos; por otro lado, si el error resulta exageradamente pequeño, se estaría
detectando como significativos efectos que no lo son, lo cual puede llevar a decisiones
incorrectas.

Las técnicas para decidir que efectos mandar al error no funcionan bien cuando los
efectos que tiene el diseño son pocos. Por ejemplo, los diseños 22 y 23 no tendrían
suficientes efectos para que estos métodos realmente tengan utilidad práctica. Pero
estos diseños se corren frecuentemente con replicas suficientes para construir el
análisis de varianza directamente, evitando la necesidad de construir un error hasta
cierto punto arbitrario.

 Grafico de efectos en papel normal (Daniel’s plot)


Este grafico permite visualizar cuales efectos pueden ser significativos: entre mas se
aleje un punto de la línea, más importante será el correspondiente efecto.

o Papel probabilístico medio normal (half normal)


Es una grafica basada solo en la parte positiva de la distribución normal,
que cuando se tienen efectos positivos y negativos da una mejor
perspectiva de los efectos que pueden ser significativos.

 Diagrama de Pareto de efectos

El Pareto representa la realidad observada de los efectos de manera descriptiva sin


considerar supuestos distribucionales. Es un grafico de barras que representa los
efectos ordenados en forma ascendente de acuerdo con su magnitud absoluta.

Factoriales 2K con punto al centro

Punto al centro es un tratamiento formado por la combinación del nivel intermedio o


medio de todos los factores. Hay dos razones por las que es deseable correr el punto
central con cierto número de replicas:

1. Obtener grados de libertad adicionales para el error en la tabla de ANOVA, sin


perjudicar el balance en la estimación de los efectos de interés.
2. Las repeticiones al centro permiten detectar la posible presencia de curvatura
en al menos uno de los factores objeto de estudio.

Factoriales 2K en bloques

El objetivo del experimento repartido en bloques es estudiar el efecto de los k factores


sobre la respuesta; no es el objetivo estudiar el efecto de los factores de bloques, pero
una vez incluidos en el experimento se puede evaluar su efecto sobre la respuesta y
conocer la pertinencia de haberlo considerado. Algunos casos típicos son los
siguientes:

1. No es posible correr el factorial completo 2K en el mismo día, ya sea por lo lento


de las corridas o del proceso de medición, o por la cantidad de las corridas. Si
se considera el factor día puede afectar los resultados del estudio, entonces se
decide incorporarlo en el experimento como factor de bloque. Si el proceso
estudiado es sensible a los cambios de turno dentro del mismo día, los turnos
deberían considerarse como el factor de bloque.
2. Cuando un lote de material no alcanza para hacer todas las corridas
experimentales y se sospecha que las diferencias entre lotes podrían sesgar
los resultados, entonces es necesario repartir adecuadamente las corridas
experimentales en varios lotes (bloques). O bien cuando el material de prueba
tiene dos o más características distintivas que pueden sesgar las conclusiones
del estudio, de no considerarse.

No se trata de pretender bloquear activamente en el experimento todas las posibles


fuentes de variación, sino aquellas que puedan tener algún impacto importante sobre
la respuesta de interés.
Diseños factoriales fraccionados 2K-P

Los diseños factoriales fraccionados son una parte o una fracción de los diseños
factoriales completos, permiten reducir el numero de corridas experimentales, y al
mismo tiempo obtener la información acerca de los efectos considerados de antemano
relevantes. La teoría de diseños factoriales fraccionados se basa en una
jerarquización de los efectos: son mas importantes los efectos principales, seguido por
las interacciones dobles, luego las triples, cuádruples, etc.

La tabla 6 muestra el numero de efectos potencialmente de mayor interés para


diferentes diseños factoriales 2K, de ahí se observa que el primer diseño factorial
completo que genera un importante exceso de información es el factorial completo 25.

Tabla 6. Efectos en lo factoriales 2K


Diseño 2K Total de efectos Efectos no Efectos
ignorables ignorables
22 3 3 0
23 7 6 1
24 15 10 5
25 31 15 16
26 63 21 42
27 127 28 99

Cuando k≥5 el numero de efectos ignorables supera el numero de efectos no


ignorables o potencialmente importantes, lo cual indica que estos diseños se pueden
fraccionar muchas veces sin perder información valiosa. Mientras mas grande es el
valor de k, el diseño admite un grado de fraccionamiento mayor.

Al correr solo una fracción del diseño factorial completo ocurren dos hechos:

1. se pierde información, ya que habrán efectos que no podrán estimarse y se


tienen menos grados de libertad disponibles para el error.
2. los efectos que si se pueden estimar tienen al menos un alias. El que un efecto
sea alias de otro significa que son en realidad el mismo efecto con nombres
distintos, y al estimar a uno de ellos se estima al mismo tiempo el otro, de
manera que no se pueden separar

Diseño factorial fraccionado 2K-1


La notación 2K-1 significa una fracción a la mitad del diseño factorial completo 2K.

No tiene sentido fraccionar a la mitad el diseño 22 porque prácticamente desaparece.


Cuando se tienen cinco factores en adelante, al fraccionar a la mitad el diseño factorial
completo, se pierde poca información relevante.

Diseño factorial fraccionado 23-1


Si se quiere fraccionar a la mitad este diseño, entonces es necesario seleccionar
cuatro de entre los ocho tratamientos. Se sabe que existen 70 posibles maneras de
elegir una fracción a la mitad del diseño factorial 2 3, por lo que surge la interrogante
sobre cual o cuales de esas 70 posibles fracciones son las más adecuadas. Es
adecuada aquella que permita estimar los efectos considerados importantes. Con el
diseño 23 completo se pueden estimar 7 efectos: A, B, C, AB, AC, BC y ABC. De
acuerdo a su jerarquía, el efecto menos importante a priori es la interacción triple
ABC, así que este es el efecto mas sacrificable para generar la fracción a la mitad de
manera que se pierda un mínimo de información. La generación de la fracción se hace
en base a los signos del contraste ABC: los signos “+” del contraste ABC señalan a los
tratamientos que conforman la llamada fracción principal, y los signos “-“ señalan la
fracción complementaria. De aquí que el efecto no estimable ABC se llama generador
de la fracción, puesto que su contraste es la base para construir las dos fracciones.

Tabla 7. Diseño factorial completo 23 y contraste ABC


A B C ABC
-1 -1 -1 -
1 -1 -1 +
-1 1 -1 +
1 1 -1 -
-1 -1 1 +
1 -1 1 -
-1 1 1 -
1 1 1 +

Tabla 8. Dos posibles diseños fraccionados 23-1


fracción 1 fracción 2
(I= +ABC) (I= -ABC)
A B C A B C
1 -1 -1 a -1 -1 -1 (1)
-1 1 -1 b 1 1 -1 ab
-1 -1 1 c 1 -1 1 ac
1 1 1 abc -1 1 1 bc

La estructura de alias consiste en escribir explícitamente cuales son los alias de cada
efecto, y esta estructura se deduce finalmente del generador de la fracción,
considerando el signo utilizado. Por ejemplo:
De la tabla 8:

Contraste A = (a + abc – b - c)

Mientras que al multiplicar las columnas BxC:

Contraste BC = (a + abc – b – c)

Lo que indica que los efectos A y BC son alias, porque al estimar el efecto A también
se estima el efecto B.

La estructura alias de un diseño factorial fraccionado se puede obtener de la relación


definidora del diseño. En este caso la relación definidora coincide con el generador
I=ABC. Multiplicando cada efecto por esta relación, con el uso de multiplicación
modulo 2, se obtiene directamente la estructura de alias. La multiplicación modulo 2
significa que al multiplicar cualquier efecto por la identidad es igual al efecto, y al
multiplicar un efecto por si mismo es igual a la identidad; por ejemplo, aplicando esto
para el efecto A, se tiene que AxI=A y que AXA(mod2)=A2=I. Entonces el alias de A se
obtiene al multiplicar por A ambos lados de la relación I=ABC, y resulta:

AxI=AxABC=A2BC=BC

Interpretación de los efectos alias

Para interpretar los efectos alias es necesario suponer que solo uno de ellos es el
responsable del efecto observado y que los demás efectos son nulos. Por ejemplo, si
se utilizara el diseño 23-1 con estructura de alias dada, los efectos alias se interpretan
atribuyendo (por jerarquía) el efecto observado al efecto principal de cada grupo,
considerando nulas las interacciones dobles. En general resulta bastante riesgoso
suponer a priori que las interacciones dobles no afectan, de aquí que no se
recomienda usar este diseño, a menos que el costo experimental no permita correr el
factorial completo. En general no es buena estrategia utilizar diseños fraccionados
donde se alían dos efectos que son potencialmente importantes, como son los efectos
principales y las interacciones dobles.

Resolución

Un diseño factorial fraccionado es de resolución R si los efectos formados por la


interacción de P factores no son alias de efectos de interacción que tengan menos de
R – P factores. A mayor resolución se observa más claramente lo que sucede con los
efectos potencialmente importantes.

1. Diseños de resolución III. Es cuando los efectos principales no son alias


entre ellos, pero existen efectos principales que son alias de interacciones
dobles.
2. Diseños de resolución IV. Es cuando los efectos principales no tienen alias
entre ellos ni con las interacciones dobles, pero algunas interacciones dobles
son alias entre ellas.
3. Diseños de resolución V. Es cuando los efectos principales y las
interacciones dobles están alias con interacciones triples o de mayor orden.

Construcción de fracciones 2K-1


Una manera de construir en dos pasos diseños fraccionados 2K-1 con la más alta
resolución posible es la siguiente:

1. se lista el diseño factorial completo para K – 1 factores, y de esta forma se


obtienen las k – 1 columnas de la fracción deseada.
2. la columna faltante (la k-exima) se construye multiplicando entre si las
columnas previas. Si se quiere la fracción complementaria se cambian los
signos de esta última columna. El diseño que resulta es un diseño factorial
fraccionado 2K-1 con resolución máxima R=K.

You might also like