Professional Documents
Culture Documents
OBJETIVO
Objetivo general del mdulo. Que los asistentes actualicen los conocimientos
necesarios para disear, analizar y obtener inferencias sobre experimentos conducentes a
la mejora de productos y procesos en la industria y que sean capaces de aplicar la mejor
estrategia experimental para resolver un problema de desarrollo de productos, o de
calidad en los productos.
Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS......................................3
1.1 Aplicaciones del diseo de experimentos...................................................4
Definicin de experimento, diseo de experimentos y eficiencia de un experimento
.......................................................................................................................7
1. 2 Principios bsicos del diseo de experimentos.........................................7
1.3. Metodologa general para realizar un experimento.................................9
1.4. Aplicaciones del diseo de experimentos................................................14
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)..........................16
2.1 Introduccin...............................................................................................16
2.2 Tipos de variacin y sumas de cuadrados................................................17
2.3 Uso de Excel:............................................................................................20
2.4 Uso de Minitab..........................................................................................23
2.5 Grafica de residuos contra el valor ajustado de y ij ..................................27
2.6 Ejercicios...................................................................................................32
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2 VIAS)34
3.1 Introduccin...............................................................................................34
3.2 Ejemplos con clculo manual...................................................................34
3.3 Procedimiento en Excel............................................................................36
3.4 ANOVA en Minitab.....................................................................................38
ESTADSTICA APLICA
MACETAS HERNNDEZ
4. DISEOS FACTORIALES..............................................................................44
4.1 Principios y definiciones bsicas..............................................................44
Ventajas de los diseos factoriales.............................................................47
4.2 Diseo factorial de dos niveles (2^K)........................................................48
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES.......57
5.1 Concepto de replicacin fraccionada........................................................57
5.2 Fraccin un medio del diseo 2k...............................................................58
5.3 Resolucin del diseo...............................................................................63
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS..................65
6.1 Diseo factorial completo de 2 factores....................................................65
6.2 Anlisis Estadstico del Modelo de Efectos Fijos......................................67
7. DISEO DE EXPERIMENTOS TAGUCHI.....................................................76
7.1 Introduccin...............................................................................................76
7.2 Arreglos ortogonales para experimentos a dos niveles............................77
7.3 Caso menor es mejor................................................................................79
8. REGRESIN Y CORRELACIN LINEAL......................................................87
8.1 Introduccin...............................................................................................87
8.2 Ejemplo manual........................................................................................90
8.3 Uso de Excel.............................................................................................93
8.4 Uso de Minitab..........................................................................................95
8.5 Ejercicios:..................................................................................................97
Pgina 2 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 3 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Algunas de las variables del proceso x1, x2,..., xk son controlables, mientras que otras z1,
z2,...,zk son incontrolables (aunque pueden ser controlables para los fines de prueba).
Entre los objetivos del experimento pueden incluirse:
1. Determinar cules variables tiene mayor influencia en la respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo que y tenga casi
siempre un valor cercano a valor nominal deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo que la variabilidad de
y sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo que se minimicen los
efectos de las variables no controlables z1, z2,...zq.
Lo mtodos de diseo experimental tiene un propsito que puede ser desarrollar un
proceso consistente o robusto; esto es, un proceso que no sea afectado por
fuentes de variabilidad externas o ruido (las zi).
En el diseo de experimentos se plantean varias preguntas importantes:
1. Son estas dos soluciones los nicos medios para lograr la respuesta de inters?
2. Existen otros factores que pueden afectar la respuesta de las muestras y que
deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de templado?
4. En qu forma debe asignarse cada muestra a los tratamientos, y en qu orden
deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?
Pgina 4 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 5 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
F1
F2
F11
F21
F12
F22
CARACTERISTICA
DE C ALIDAD
F41
F31
F32
F42
F4
F3
Mediante un experimento podemos inducir cambios en uno varios factores (F 2l. F33 y F11
por ejemplo) y analizar estadsticamente si el cambio en los factores afecta o no el
resultado o efecto del proceso.
Pgina 6 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
conclusiones vlidas y tiles. Se entiende por validez estadstica, el que los resultados se
puedan repetir consistentemente sobre todo en la operacin a gran escala o masiva.
Eficiencia de un experimento
Un experimento es eficiente cuando:
1. Se obtiene la informacin requerida.
2. Con el mnimo consumo de recursos.
Esto es, un experimento eficiente debe ser lo ms simple y econmico posible pero
efectivo. Las tcnicas del diseo de experimentos pretenden que los experimentos sean
eficientes.
1. 2 Principios bsicos del diseo de experimentos
Pgina 7 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
ii)
2.2
3.4
2.8
3.9
3.2
4.3
3.6
4.7
2.95
4.07
evitar lavando
perfectamente el material, lo cual puede no ser fsicamente posible. "En lugar de esto
podemos confundir, anular o igualar este efecto, realizando las pruebas en orden
aleatorio bajo las dos temperaturas.
En una diagrama causa-efecto con un gran nmero de factores afectando la caracterstica
de calidad, si se desea analizar el efecto de uno o varios factores, se debera controlar y
medir todos los otros factores y aun as no eliminara el error aleatorio, en lugar de esto se
puede "confundir" o anular el efecto de estos factores no controlables al efectuar las
pruebas siguiendo un orden aleatorio o al azar.
Pgina 8 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
ii)
Valida las pruebas estadsticas al hacer que los errores experimentales sean
estadsticamente independientes.
Anlisis por bloques. Es una tcnica que se usa para incrementar la precisin
del experimento. Un bloque es una porcin del material experimental que sea ms
homognea que el total del material o cuando las condiciones son ms
homogneas. Al realizar un experimento por bloques se hacen las comparaciones
entre las condiciones de inters del experimento dentro de cada bloque.
Pgina 9 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Cuantitativa
Precisa.
Pgina 10 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
cualitativo. Por ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.
Pgina 11 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
3. Definir el diseo del experimento. Esto imp1ica definir de qu manera se efectuaran las
pruebas y qu modelo matemtico describe mejor el experimento. En el resto de este
material se describen varios tipos de experimentos de los cuales se tomar el que mejor
se ajuste a la situacin particular.
4. Efectuar el experimento. Esto de acuerdo a lo que se defina en el paso 3.
5. Anlisis de los datos. Estos son bsicamente anlisis estadsticos.
6. Conclusiones y toma de decisiones.
Una metodologa (alterna) desarrollada por Douglas C. Montgomery es la siguiente:
Para usar un enfoque estadstico al disear y analizar un experimento se requiere que
todos los participantes en l tengan de antemano una idea clara de qu es exactamente lo
que se va a estudiar, cmo se van a recopilar los datos y, al menos, una idea cualitativa
de cmo se van a analizar. A continuacin, se ofrece una gua del procedimiento
recomendado:
1. Comprensin y planteamiento del problema.
Este punto pudiera parecer obvio; sin embargo, en la prctica no es sencillo darse cuenta
de que existe un problema que requiere experimentacin, ni disear un planteamiento
claro y aceptable del mismo. Es necesario desarrollar todas las ideas sobre los objetivos
del experimento. Suele ser importante solicitar la opinin de todas las partes implicadas.
Un planteamiento claro del problema contribuye a menudo en forma sustancial a un mejor
conocimiento del fenmeno y de la solucin final del problema.
2. Eleccin de factores y niveles.
El experimentador debe elegir los factores que variarn en el experimento, los intervalos
de dicha variacin y los niveles especficos de inters a los cuales se har el experimento.
Tambin debe considerarse la forma en que se controlarn estos factores para
Pgina 12 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
mantenerlos en los valores deseados, y cmo se les medir. Para ello es necesario
conocer el proceso de manera prctica y terica.
3. Seleccin de la variable de respuesta.
Al seleccionar la respuesta o variable dependiente, el experimentador debe estar seguro
de que la respuesta que se va a medir realmente provea informacin til acerca del
proceso de estudio. Con mayor frecuencia, el promedio o la desviacin estndar (o
ambos) de la caracterstica medida sern la variable de respuesta. No son raras las
respuestas mltiples. La capacidad de medicin (o el error de medicin) tambin es un
factor importante. Si la capacidad de medicin es deficiente, slo puede esperarse que el
experimento detecte efectos relativamente grandes de los factores; en caso contrario
deben hacerse repeticiones.
4. Eleccin del diseo experimental.
Para elegir el diseo es necesario considerar el tamao muestral (nmero de
repeticiones), seleccionar un orden adecuado para los ensayos experimentales, y
determinar si hay implicado bloqueo u otras restricciones de aleatorizacin.
Es importante tener presente los objetivos experimentales al seleccionar el diseo, se
tiene inters en identificar qu factores causan diferencias en estimar la magnitud del
cambio de la respuesta. En otras situaciones habr ms inters en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de produccin A y 8,
siendo A la estndar y B una alternativa de menor costo. El investigador estar interesado
en demostrar que no hay diferencia en cuanto a la productividad (por ejemplo), entre las
dos condiciones.
5. Realizacin del experimento.
Cuando se realiza el experimento, es vital vigilar el proceso cuidadosamente para
asegurar que todo se haga conforme a lo planeado. En esta fase, los errores en el
procedimiento suelen anular la validez experimental. La planeacin integral es decisiva
para el proceso. En un complejo entorno de manufactura o investigacin y desarrollo, es
Pgina 13 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
validez
de
los
resultados.
Los
mtodos
estadsticos,
aplicados
Pgina 14 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
proveedores producen
Es necesario tener claros y en todo caso revisar los siguientes conceptos estadsticos
antes de seguir:
Qu es control estadstico?.
Qu es nivel de significancia?.
Pgina 15 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
2.1 Introduccin
El anlisis de la varianza de un factor (ANOVA) es una metodologa para analizar la
variacin entre muestras y la variacin al interior de las mismas mediante la
determinacin de varianzas. Es llamado de una va porque analiza un variable
independiente o Factor ejemplo: Velocidad. Como tal, es un mtodo estadstico til
para comparar dos o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:
H 0 1 2 3 .... k
H 1 : Al menos dos medias poblaciona les son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras
independientes son:
1. Ambas poblaciones son normales.
2
2
2. Las varianzas poblacionales son iguales, esto es, 1 2 .
Fc
sb2
sw2
F , ( k 1), k ( n 1))
Donde el nmero de grados de libertad para el numerador (Sb 2 > Sw2) es k-1 y para el
denominador es k(n-1), siendo el nivel de significancia.
k = nmero de muestras.
Pgina 16 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Por ejemplo:
Ejemplo: Se tienen 14 empleados seleccionados al azar que se someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2 y Programa 3.
Como los empleados se seleccionan aleatoriamente para cada programa
el diseo se denomina DISEO COMPLETAMENTE ALEATORIZADO
Se observa el aprovechamiento de los empleados en los programas:
TRATAMIENTOS
I
r=1
r=2
r=3
r=4
r=5
Medias
c=1
c=2
Programa
c=3
Programa 1 2
Programa 3
85
80
82
72
84
80
83
81
85
80
78
90
**
82
88
80.00
81.00
85.00
Xj
Media de medias o media
total
82.14
SCT
i 1
( Xij X )
j 1
Pgina 17 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
SCTR rj ( X j X ) 2
j 1
SCE
i 1
(X
j 1
ij
X j )2
186
4. Grados de libertad
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 = 11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c
Pgina 18 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
19.4
16.9
1.946745562
Grfica de distribucin
F, df1=2, df2=11
1.0
Densidad
0.8
0.6
0.4
Regin de
0.2
0.0
0.05
0
3.98
Regin de
Como Fc es menor a F no se rechaza Ho y las medias son iguales.
7. Valor de P Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO, LAS MEDIAS
DE LOS TRATAMIENTOS SON IGUALES
Pgina 19 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE
GRADOS DE
CUADRADOS
LIBERTAD
c-1
CMTR
n-c
CME
Variacin total
n-1
CMT
SCT
CUADRADO
MEDIO
VALOR F
CMTR/CME
Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
2.3 Uso de Excel:
Alfa = 0.05
Pgina 20 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
4
5
5
320
405
425
Grado
Varianza
32.66666
80
81
85
7
5
17
Promedio
ANLISIS DE VARIANZA s de
de
Suma
liberta
Variaciones
Entre
grupos
Dentro de
grupos
Total
cuadrados
65.7142857
Probabilid
Cuadrados
Fc
ad
F crtica
32.857142 1.943164 0.1893773 3.9822979
86
16.909090
186
251.714285
11
91
13
Pgina 21 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 22 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
SC
MC
Programa 1 4 80.000
5.715 (------------*------------)
Programa 2 5 81.000
2.236
Programa 3 5 85.000
4.123
(----------*-----------)
(-----------*----------)
----+---------+---------+---------+----77.0
80.5
84.0
87.5
Pgina 23 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
-6.451 1.000
8.451
Programa 3
-2.451 5.000
12.451
--------+---------+---------+---------+Programa 2
(------------*-----------)
Programa 3
(-----------*------------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Se rest Programa 2 a:
Inferior Centro Superior
Programa 3
-3.025 4.000
11.025
--------+---------+---------+---------+Programa 3
(-----------*----------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0
Pgina 24 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Programa 1
85
72
83
80
**
2
80
84
81
78
82
Programa 3
82
80
85
90
88
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 26 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
gl
Media
cuadrtica
65,714
32,857
186,000
11
16,909
251,714
13
Pgina 27 de 95
Sig.
1,943
,189
ESTADSTICA APLICA
MACETAS HERNNDEZ
contra los valores ajustados y ij (debe recordarse que para el modelo en un sentido y ij - yi. ,
el promedio del tratamiento i-simo). En esta grafica no debe revelarse ningn patrn
obvio en la siguiente figura se grafican los residuos contra los valores ajustados de los
datos de la resistencia a la tensin del ejemplo 2.3 Ningn patrn inusual es evidente.
Pgina 28 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
2.6 Ejercicios
1. Cuatro catalizadores que pueden afectar la concentracin de un componente en una
mezcla lquida de tres componentes estn siendo investigado.
Se obtienen las siguientes concentraciones:
Catalizado
A
58.2
57.2
58.4
55.8
54.9
r
B
56.3
54.5
57
55.3
C
50.1
54.2
55.4
D
52.9
49.9
50
51.7
Determine cuales son los grupos en los cuales existen diferencias a un 95% de nivel de
confianza.
A
75
93
78
71
63
76
B
78
91
97
82
85
77
C
55
66
49
64
70
68
D
64
72
68
77
56
95
B
71
75
73
74
69
82
C
59
64
62
69
75
67
Pgina 29 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
B
8.7
7.4
9.4
10.1
9.2
9.8
C
11.1
10.3
9.7
10.3
9.2
8.8
D
9.9
12.8
12.1
10.8
11.3
11.5
Pgina 30 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
3.1 Introduccin
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora
agregando el clculo por renglones adicional al de columnas donde se incluye la
variable de bloqueo. El bloqueo es completamente al azar.
Se trata de bloquear un factor externo que probablemente tenga efecto en la
respuesta pero que no hay inters en probar su influencia, slo se bloquea para
minimizar la variabilidad de este factor externo, evitando que contamine la prueba de
igualdad entre los tratamientos.
Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque
indica condiciones similares de los sujetos al experimentar con diferentes
tratamientos.
Las hiptesis son:
Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna es diferente
Ho: No hay diferencia en las medias de la variable de rengln
Ha: Al menos una media de la variable de rengln es diferente
3.2 Ejemplos con clculo manual
Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres diferentes mquinas es igual,
tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.
Experiencia
de ops. En
aos
Mquinas
Maq 1
Maq 2
Maq 3
Pgina 31 de 95
Promedios
ESTADSTICA APLICA
MACETAS HERNNDEZ
1
2
3
4
5
Promedios
27
31
42
38
45
36.6
21
33
39
41
46
36
25
35
39
37
45
36.2
24.33333
33
40
38.66667
45.33333
36.26667
TABLA ANOVA
SCTR=
SCBL=
SCE =
SCT =
SS
0.933333
764.9333
41.06667
806.9333
GL
2
4
8
14
CM
CMTR= 0.466667
CMBL= 191.2333
CME= 5.133333
CMT= 57.6381
Fc
Ftr = 0.09
Fbl = 37.25
Falfa
4.46
3.84
1
73
73
75
73
2
68
67
68
71
Rollo
3
74
75
78
75
Pgina 32 de 95
4
71
72
73
75
5
67
70
68
69
ESTADSTICA APLICA
MACETAS HERNNDEZ
Alfa = 0.05
Pgina 33 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 34 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Columna 1
Columna 2
Columna 3
Columna 4
Columna 5
1
3
3
2.92
1.67
4
4
4
4
4
294
274
302
291
274
73.5
68.5
75.5
72.75
68.5
9.3
9.3
19.3
6.8
ANLISIS DE VARIANZA
F
Fuente
de
Grados Cuadrado
Suma de
Cuadrado
variacin
Filas
Columna
de
s
libertad
12.95
3
s
medios
4.32
Probabilida tabla
Fc
2.38
d
Valor P
0.12
3.49
s
157
4
39.25
21.61
2.06E-05 3.26
Error
21.8
12
1.82
Total
191.75
19
Total
231
24
En la tabla observamos que el estadstico de prueba Fc es menor al valor crtico para F
2.38<3.49, por lo cual no rechazamos al Hiptesis nula H 0. No tenemos evidencia
estadstica para afirmar que el agente qumico tenga influencia en la respuesta.
Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta
(P<0.05).
3.4 ANOVA en Minitab
Utilice 0.05 para calcular si hay diferencias entre los efectos de las columnas y los
renglones.
Pgina 35 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Introducir los datos arreglados con las respuestas en una sola columna e indicando a que
rengln y columna pertenece cada uno de estos, como sigue:
Column
Resp
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69
a
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
Fila
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
Instrucciones:
Estadstica > ANOVA > Dos factores
Respuesta Respuesta,
Mostrar
Medias Seleccionar Almacenar Residuos
Almacenar ajustes
95%
Grficas
Seleccionar Grfica normal de residuos
OK
Pgina 36 de 95
Nivel de confianza
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 37 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Resultados:
La grfica normal de residuos debe mostrar los residuos aproximados por una recta para
validar el modelo:
Los residuos se aproximan a la distribucin normal por lo cual se concluye que se est
utilizando un modelo vlido.
Normal Probability Plot of the Residuals
(response is Resp)
99
95
90
Percent
80
70
60
50
40
30
20
10
5
-3
-2
-1
0
Residual
Pgina 38 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
DF
SS
MS
Error
12 21.80 1.8167
Total
19 191.75
Pooled StDev
70.6 (----------*----------)
71.4
72.4
72.6
(----------*----------)
(----------*----------)
(----------*----------)
---+---------+---------+---------+-----69.6
70.8
72.0
73.2
73.50
(-----*-----)
68.50 (-----*-----)
75.50
72.75
68.50 (-----*-----)
(-----*-----)
(-----*-----)
--+---------+---------+---------+------67.5
70.0
72.5
75.0
Pgina 39 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 40 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
4. DISEOS FACTORIALES
Factor B
B1
B2
A1
20
30
A2
40
52
Factor A
40 52
2
20 30
2
21
Pgina 41 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
30 52
2
20 40
11
Si los factores tienen ms de dos niveles, el procedimiento anterior debe ser modificado
ya que las diferencias entre las respuestas promedio pueden expresarse de muchas
formas.
En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los
niveles de un factor no es la misma en todos los niveles de los otros factores. Cuando
esto ocurre existe una interaccin entre los factores. Por ejemplo, considrense los datos
de la Tabla 2.
Factor B
B1
B2
A1
20
40
A2
50
12
Factor A
Pgina 42 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
que no hay interaccin entre los factores. De manera similar, en la Fig. 2 se presenta una
grfica de la respuesta de los datos de la Tabla 2.
60
B2
50
B1
40
30
20
10
B2
B1
A1
Factor A
A2
60
50
40
B1
B2
30
20
10
B1
A1
B2
Factor A
A2
Pgina 43 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
A
50 12
2
20 40
2
El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un efecto
debido a A. Sin embargo, cuando se examin el efecto de A en niveles diferentes de B se
concluy que ste no era el caso. El factor A tiene un efecto, pero depende del nivel del
factor B. En otras palabras, es ms til conocer la interaccin AB que el efecto principal.
Una interaccin significativa oculta a menudo el significado de los efectos principales.
Pgina 44 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
B2
A1
A1B1
A1B2
A2
A2B1
12
Factor A
Los diseos factoriales son necesarios cuando alguna interaccin puede estar
presente, para evitar hacer conclusiones engaosas.
Ejemplo 1 Considrese una investigacin llevada a cabo para estudiar el efecto que tiene
la concentracin de un reactivo y la presencia de un catalizador sobre el tiempo de
reaccin de un proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el nivel alto o superior
denota el uso de dos sacos de catalizador y el nivel bajo o inferior denota el uso de un
solo saco. El experimento se realiza (replica o repite) tres veces, y los datos son como
sigue:
Pgina 45 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Combinacin de
Replica
tratamientos
I
28
36
18
31
A baja, B baja
A alta, B baja
A baja, B alta
A alta, B alta
II
25
32
19
30
III
27
32
23
29
Total
80
100
60
90
Alto (2 sacos) +
bajo (1 saco) -
b = 60(18+19+23)
ab = 90(31+30+19)
(1) = 80(28+25+27)
a = 100(36+32+32)
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
Figura 1: Combinaciones de tratamiento en el diseo factoriall
Fig.
3
Las cuatro combinaciones de tratamientos en el diseo pueden representarse por letras
minsculas, cono se muestra en la figura 3. En esta figura se aprecia que el nivel superior
de cualquier factor de una combinacin de tratamientos est representado por la
presencia de la letra minscula correspondiente, mientras que la ausencia de esta ultima
representa el nivel inferior del factor.
As
Pgina 46 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Por convencin (1) se usa para representar a ambos factores en el nivel inferior.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan para
representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras que el
nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades se obtiene:
1
2n
ab b a (1)
ab a b (1)
2n
1
2n
ab a b (1)
1
2n
ab b - a (1)
AB
1
2n
ab b a (1)
1
2n
ab (1) a (b)
Pgina 47 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B en el
nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El efecto
de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y A+, puesto que es la
respuesta promedio para las combinaciones de tratamientos a las que A que se encuentra
en el nivel alto) y las dos combinaciones de tratamientos en la mitad izquierda (o Y A). Esto
es,
A YA YA
ab a
2n
1
2n
b (1)
2n
ab a b (1)
B YB YB
ab b
2n
a (1)
2n
Pgina 48 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
2n
ab b a (1)
ab (1)
AB
2n
1
2n
ab
2n
ab (1) a b
Con los datos que aparecen en la figura 1, las estimaciones de los efectos promedio son:
1
2(3)
1
2(3)
AB
90 100 60 80 8.33
90 60 100 80 5.00
1
2(3)
90 80 100 60 1.67
Pgina 49 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
ContrasteA ab a b (1)
Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera ecuacin,
puede apreciarse que tambin se utilizan contraste para estimar B y AB. Adems, estos
tres contrastes son ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:
aciyi. 2
SSc 1
2
n a
a ci
ab a b (1)
SSA
n*4
ab b a (1)
SSB
n*4
ab (1) a b
SSAB
n*4
Pgina 50 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Con los datos de la figura 3, las sumas de cuadrados se pueden calcular aplicando las
ecuaciones anteriores, obtenindose:
SSA
SSB
50
2
208.33
4(3)
30
SSAB
4(3)
10
75.00
4(3)
8.33
SS T i21 2j1 n
k 1 Y ijk
2
Y ...
4n
En general SST tiene 4n 1 grados de libertad. La suma de cuadrados del error, con 4(n-1)
G.L. se puede calcular en la forma usual, por diferencia, mediante.
2
2 2 3
Y
2
SS E Yijk
9398.00 9075.00 323.00
i1j1k 1
4(3)
SS E SS T SS A SS B SS AB
ESTADSTICA APLICA
MACETAS HERNNDEZ
Efectos
A:
(1)
-1
a
+1
b
-1
Ab
+1
B:
-1
-1
+1
+1
AB:
+1
-1
-1
+1
SS
208.33
B
AB
Error
Total
G.L.
1
MS
208.33
Fo
75.00
75.00
19.13a
8.33
8.33
2.13
31.34
3.92
53.15a
323.00
11
significativo al 1%
Efecto Factorial
De
Tratamientos
I A B AB
(1)
+ - - +
+ + - -
+ - + -
ab
+ + + +
Observe que los coeficientes de los contrastes usados para estimar la interaccin son
iguales al producto de los coeficientes correspondientes a los dos efectos principales. Los
coeficientes de los contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos para determinar el
signo apropiado de cada combinacin de tratamientos. En el encabezado de las columnas
de tabla y se encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se observa que la
Pgina 52 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
1
2n
ab b a (1)
1
2n
ab a b (1)
Los tipos ms sencillos de diseos factoriales implican slo dos factores o conjuntos de
tratamientos. Haya a niveles del factor A y b niveles del factor B, dispuestos en un
diseo factorial; esto es, cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.
Pgina 53 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
condiciones
experimentales, lo que implica que al hacer una replicacin por celda de todo el
experimento requiere un total de 128 observaciones. Si se decide tomar dos replicas por
celda, entonces serian necesarias 256 observaciones, lo cual es una cantidad excesiva de
pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento con 7 factores por
que se deben evaluar 127 posibles efectos (que son los grados de libertad totales en 128
observaciones) de estos efectos 7 son los factores principales, 21 interacciones de 2
factores, 35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k factores tomados r
en r es:
Pgina 54 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
K!
r! (k r)!
El concepto de replicacin fraccionada parte de las siguientes hiptesis:
1. Las interacciones de tres o ms factores son sumamente raras en la prctica, por
lo que en general se pueden suponer como no existentes.
2. En un experimento de varios factores lo ms probable es que solo algunos de ellos
sean relevantes para la variable de respuesta.
3. La mayor parte del efecto se debe a los factores principales y algunas
interacciones de dos factores.
Lo anterior implica que por ejemplo para siete factores son necesarios probablemente
solo 28 grados de libertad (7 factores principales y 21 interacciones de dos factores), y
esto equivale a solo 29 unidades de informacin y no 128 como en el experimento
original. Esto quiere decir que no es necesario el correr una replicacin completa de todo
el experimento cuando el nmero de factores crece, sino solamente algunas casillas o
condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se dice que se tiene una
replicacin fraccionada del experimento.
Las preguntas que surgen son:
1. Cuntas y cuales casillas probar?
2. Cmo analizar los resultados?
3. Qu informacin se pierde?
El responder a estas preguntas es uno de los objetivos de la replicacin fraccionaria.
5.2 Fraccin un medio del diseo 2k
Pgina 55 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
onsidrese el caso en el que se estudian tres factores de dos niveles cada uno,
pero en el que los experimentadores no pueden costear las 2 3 = 8
combinaciones de tratamientos, sin embargo, si se puede costear 4
Pgina 56 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Notacin 1
a
b
c
abc
Notacin 2
+ - - + - - +
+ + +
Efecto factorial
Combinacin de
Tratamientos
I
+
+
+
+
+
+
+
+
a
b
c
abc
ab
ac
bc
(1)
A
+
+
+
+
-
B
+
+
+
+
-
C
+
+
+
+
-
AB
+
+
+
+
AC
+
+
+
+
BC
+
+
+
+
ABC
+
+
+
+
-
bc
ac
ab
B
A
(1 )
Pgina 57 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Las combinaciones de tratamientos del diseo 2 3-1 producen 3 G.L. que pueden usase
para estimar los efectos principales. En la tabla 1 se muestra que las combinaciones
lineales de las observaciones que se utilizan para estimar los efectos principales A, B, y C
son:
LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es imposible distinguir
entre A y BC, entre B y AC y entre C y AB. De hecho, es posible mostrar que cuando se
estima A, B y C, en realidad, lo que s esta haciendo es estimar A + BC, CB + AC y C +
AB, respectivamente. Dos o ms efectos que tienen esta propiedad se conoce como
alias. En este ejemplo, A y BC, B y AC y C y AB son alias. Esto se indica empleando la
notacin:
LA A BC,
LB B AC
LC C AB
La estructura de los alias de este diseo pueden determinarse fcilmente con la relacin I
= ABC, multiplicando cualquier efecto por la relacin que define al diseo, modulo 2, da
como resultado los alias de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A2BC
Pgina 58 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Notacin 2
(1)
ab
ac
abc
--+++-+
-++
L' A A BC
L' B B AC
L' C C AB
Por lo tanto, en realidad se est estimando A BC, B AC y C AB al estimar A, B y C
con esta fraccin. En la prctica, no importa cual de las dos fracciones se utilice.
Generalmente la fraccin asociada con I = +ABC se denomina fraccin principal. Ambas
Pgina 59 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
fracciones pertenecen a la misma familia; en otras palabras, estas dos fracciones forman
el diseo 23 completo.
5.3 Resolucin del diseo
l diseo anterior 23-1 se conoce como diseo de resolucin III. En tal diseo los
alias de los efectos principales son interacciones de dos factores. Un diseo es
resolucin R si ningn efecto de p factores es alias de otro efecto que tenga
2III
1. Diseo con resolucin III: stos son diseos en los que ningn efecto principal es
alias de otro, pero si lo son de las interacciones de dos factores; a su vez, estas
ltimas son alias entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.
2. Diseo con resolucin IV: En estos diseo ningn efecto principal es alias de otro
efecto principal, o bien, de alguna interaccin de dos factores. Las interacciones de
dos factores son alias entre s. Un diseo 24-1 con I = ABCD es de resolucin IV (
4 1
2IV ).
3. Diseos resolucin V: Estos son diseos en los que ningn efecto principal o
interaccin de dos factores es alias de ningn efecto principal o interacciones entre
5 1
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 61 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Tipo de material
1
3
3
130
74
150
159
138
168
15
155
180
188
126
110
160
Temperatura F
70
34
40
80
75
126
122
106
115
174
120
150
139
20
82
25
58
96
82
125
70
58
70
45
104
60
Pgina 62 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Este diseo es un ejemplo especfico del caso general de un diseo con dos factores
(bifactorial). Para pasar al caso general, sea Yijk la respuesta observada cuando el factor
A se encuentra en el i-simo nivel (i -1, 2,..., n). En general, los datos observados se vern
como en la tabla 2. El orden en el cual se toman las abn observaciones es aleatorio, de
modo que ste es un diseo completamente aleatorizado.
i 1,2,..., a
Yijk i j ij i jk j 1,2,..., b
k 1,2,...,n
En donde es el efecto medio general, i es el efecto del i-simo nivel del factor rengln
A, j es el efecto del j-simo nivel del factor columna B, ()ij es el efecto de la interaccin
entre i y j, ijk es el componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como desviaciones de la
media general, por lo tanto.
ia1 i 0; bj1j 0
ia1 ij 0
Pgina 63 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
En un diseo factorial de dos factores, tanto los factores (o tratamientos) de rengln como
de columna tienen la misma importancia, especficamente el inters consiste en probar
hiptesis acerca de la igualdad de los efectos de tratamiento de rengln, es decir:
Ho : 1 2 ...a 0
H1 : al menos una i 0
2 ...b 0
H1 : al menos una j 0
Tambin es interesante determinar s los tratamientos de rengln y columna
interaccionan. En otras palabras, resulta conveniente probar:
Ho : ()i 0 para toda i, j
H1 : al menos una ()i 0
ea Yi..; el total de las observaciones bajo el i-simo nivel del factor A; Y.j. El total
de las observaciones bajo el j-simo nivel del factor B, Yij. El total de las
observaciones de la ij-sima celda, e Y... el total general de todas las
observaciones. Se definen Yi..; Y.j. y Yij. y Y... como los promedios de rengln, columna,
celda y general, respectivamente, matemticamente:
Pgina 64 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
b n
Yi.. Yijk
j1k 1
Yi..
a n
Y.j. Yijk
i1k 1
Y.j.
Yij.
Yijk
k 1
Yij.
Yi..
bn
Y.j.
; j 1,2,...,b
an
Y...
n
a b n
Y... Yijk
i1j1k 1
; i 1,2,..., a
i 1,2,..., a
j 1,2,...,b
Y...
Y...
abn
i1
2
n
b Yijk Y...
k 1
j1
2
a b n
Yijk Y...
i1j1 k 1
2
2
2
a
b
a b
bn Yi.. Y... an Y.j. Y... n Yi j. Yi .. Y.j. Y...
i1
j1
i1j1
2
a b n
Yijk - Yi j.
i1j1 k 1
Dado que los seis productos cruzados del segundo miembro de la ecuacin anterior son
iguales a cero. Se observa que la suma total de cuadrados se ha descompuesto en una
suma de cuadrados debida a los renglones o al factor A (SS A) en una suma de
cuadrados debida a las "columnas" o al factor B (SSB), en una suma de cuadrados debida
a la interaccin entre A y B (SSAB), y en una suma de cuadrados debida al error (SS E):
Pgina 65 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
SST
Grados de libertad
a-1
b-1
(a-1)(b-1)
ab(n-1)
abn-1
Esta descomposicin del total de abn -1 grados de libertad para las sumas de cuadrados
se puede justificar como sigue: Los efectos principales de A y B tienen a y b niveles,
respectivamente, por lo tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interaccin simplemente corresponden a los grados de
libertad de cada celda (los cuales son iguales a ab -1) menos los grados de libertad de los
dos efectos principales A y B en otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de
cada una de las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo tanto,
hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los trminos del miembro derecho de
la ecuacin anterior es igual al total de los grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad produce una media de
cuadrados.
Por lo tanto, para probar el significado de ambos efectos principales, as como de su
interaccin, simplemente deben dividirse las medias de cuadrados correspondientes entre
Pgina 66 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
la media de cuadrados del error. Valores grandes de estas razones implican que los datos
no concuerdan con las hiptesis nulas.
Si se considera que el modelo estadstico es adecuado y que los trminos del error ijk
son independientes con distribuciones normales con variancia constante 2, entonces las
razones de las medias de cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribucin
F con a -1, b- 1 y (a -1)(b -1) grados de libertad en el numerador, respectivamente, y ab(n
-1) grados de libertad en el denominador. Las regiones crticas corresponden al extremo
superior de la distribucin F. Usualmente la prueba se presenta en una tabla de anlisis
de variancia como la que aparece en la tabla 2.
Fuente de
Variacin
Tratamientos A
SS
SSA
G.L.
a-1
MS
MSA
SSA
Fo
MSA
MSE
a 1
Tratamientos B
Interaccin
SSB
SSAB
b-1
(a - 1)(b - 1)
MSB
MSB
SSB
MSE
b 1
MSAB
MSAB
SSAB
MSE
(a 1)(b 1)
Error
SSE
ab(n-1)
MSB
SSE
ab(n 1)
Total
SST
abn - 1
Pgina 67 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
2
a b n
Y ...
2
SST Y ijk
i1j1k 1
abn
2
2
a Y i.. Y ...
SSA
i1 bn
abn
2
2
b Y .j. Y ...
SSB
j1 an
abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la suma de cuadrados
entre los totales de las ab celdas, conocida como la suma de cuadrados debido a los
"subtotales":
2
2
a b Y ij. Y ...
SSsubtotales
i1j1 n
abn
Esta suma de cuadrados contiene a la SSA y SSB. Por lo tanto, la segunda etapa consiste
en calcular SSAB mediante:
SSE
o bien :
SSE
SST SSSubtotales
Pgina 68 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Ti
Temperatura (F)
po
de
15
70
125
Yi.
at.
1
1 1
3 4
3 5
4 0
0 5
539 4
7 1
134.758
0
4 8
7
5
2 7
2
2
9
0 0
8 5
2 8
2
3
0
99
8
0
2
1 1
1 1
5 8
3 2
0 8
6 2
1 1
623
1 1
5 2
0 1
9 6
6 5
1 1
1 1
3 1
7 2
8 0
4 0
1 1
576
1 1
6 6
5 3
8 0
0 9
Y.j 1738
1291
2 7
4
7
9
5 0
5 4
8 5
1
9
8
13
00
9 1
5
8
3
6 0
4
8 6
2 0
770
.=
3
4
2
15
01
Y..
.=
37
99
Pgina 69 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
2
a b n 2
Y ...
SST Y i jk
i1j1 k 1
abn
130
2
2
2
2 3799
155 74 ... 60
77,646.97
36
2
2
a Y i.. Y ...
SSmaterial
i1 bn
abn
2
2
2
2
998 1300 1501
3799
10,683.72
(3)(4)
36
2
2
b Y .j. Y ...
SStemperat ura
j1 an
abn
2
2
2
2
1738 1291 770
3799
39,118.72
(3)(49
36
2
2
a b Y ij. Y ...
SSinteraccion
i1j1 n
abn
2
2
2
2
539 229 ... 342
3799
10,683.72
4
36
39,118.72 9,613.78
Pgina 70 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 71 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Fuente de variacin
Tipo de material
Temperatura
Interaccin
Error
Total
SS
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97
G.L.
2
2
4
27
35
MS
5,341.86
19,558.36
2,403.44
675.21
Fo
7.91
28.97
3.56
175
150
125
Yij. 100
Material tipo 3
75
Material tipo 1
Material tipo 2
50
25
15
70
Tempera tura
125
El hecho de que las rectas no sean paralelas indica una interaccin significativa. En
general, a menor temperatura mayor duracin, independientemente del tipo de material.
Pgina 72 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 73 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
7.1 Introduccin
La parte fundamental de la metodologa ideada por el matemtico japons G. Taguchi es
la optimizacin de productos y procesos, a fin de asegurar productos robustos, de alta
calidad y bajo costo.
La metodologa Taguchi consta de tres etapas:
Pgina 74 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
La (b)C
Donde:
a = Representa el nmero de pruebas o condiciones experimentales que se tomarn.
Esto es el nmero de renglones o lneas en el arreglo.
b = Representa los diferentes niveles a los que se tomar cada factor.
c = Es el nmero de efectos independientes que se pueden analizar, esto es el nmero
de columnas.
No. (a)
1
2
3
4
1 , 2
A
1
1
2
2
=
F A C T O R E S (c)
B
C
1
1
2
2
1
1
2
1
Resultado
Y1
Y2
Y3
Y4
Un
arreglo ortogonal es una tabla de nmeros. Como ejemplo de un arreglo ortogonal
tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo mostrado como ejemplo,
se le llama un arreglo L4, por tener cuatro renglones.
Pgina 75 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
En general, para un arreglo a dos niveles, el nmero de columnas (efectos o factores) que
se pueden analizar, es igual al nmero de renglones menos 1.
Taguchi ha desarrollado una serie de arreglos para experimentos con factores a dos
niveles, los ms utilizados y difundidos segn el nmero de factores a analizar son:
No.
de
factores
a Arreglo
analizar
Entre 1 y 3
Entre 4 y 7
Entre 8 y 11
Entre 12 y 15
Entre 16 y 31
Entre 32 y 63
utilizar
L4
L8
L12
L16
L32
L64
4
8
12
16
32
64
L8
Exp. No.
1
2
3
4
5
6
7
8
Col.
Col.
Col.
Col.
Col.
Col.
Col.
1
1
1
1
2
2
2
2
1
1
2
2
1
1
2
2
1
1
2
2
2
2
1
1
1
2
1
2
1
2
1
2
1
2
1
2
2
1
2
1
1
2
2
1
1
2
2
1
1
2
2
1
2
1
1
2
Matriz
tabla
de
interaccione
s
Columna
s
1
2
3
4
1
(1)
2
3
(2)
3
2
1
(3)
4
5
6
7
(4)
5
4
7
6
1
6
7
4
5
2
Pgina 76 de 95
7
6
5
4
3
ESTADSTICA APLICA
MACETAS HERNNDEZ
5
6
7
(5)
1
(1)
1
3
2
6
(7)
5
1
.7
6
2
(a)
(b)
Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el caso de menor es
mejor son:
7.3 Caso menor es mejor
1. Seleccionar una caracterstica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados combinarlos en dos o
tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los factores de control al
arreglo interno y los factores de ruido al arreglo externo.
5. Realizar los experimentos.
6. Realizar anlisis estadstico con base en S/N para identificar los niveles de los factores de
control ptimos Algunas veces ayuda realizar un estudio de la interaccin entre factores
de control y de ruido.
7. Realizar anlisis estadstico con base en las medias para identificar los niveles de los
factores de control ptimos que ajustan a la respuesta promedio en el nivel deseado. Si
Pgina 77 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
hay conflicto entre los niveles de los factores para maximizar la relacin S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relacin S/N.
8. Predecir el desempeo de salida ptimo con base en una combinacin ptima de niveles
de factores de control y realiza un experimento confirmatorio.
Ejemplo: Disminucin de la contaminacin
Optimizacin de un mtodo de purificacin para drenajes contaminados con metales.
Las aguas residuales que contienen iones metlicos es muy riesgoso por su toxicidad y
no biodegradable. Se propone utilizar xidos de hierro hidratados con un pH adecuado
para remover los metales dainos. La caracterstica de salida es la concentracin
remanente de metales en mg/L, con una respuesta menor es mejor.
Factores de control
Nivel 1
Contaminacin de FeII 2
Temperatura C
25
Tiempo de aejamiento
Nivel 2
7
50
Nivel 3
15
75
C
D
h
pH
2
10
3
12
1
8
Pgina 78 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Factores de ruido
Conc. De KMnO4
Nivel 1
0.00375
Nivel 2
0.0375
Nivel 3
0.075
Se asume que no hay interacciones por lo que se puede utilizar un arreglo L9, realizando
los experimentos se obtienen los datos siguientes con dos rplicas en cada nivel del factor
de ruido:
L9
Col.
1
Exp A
Col.
Col Col.
2
B
.3
C
4
D
N1
N1
N2
N2
N3
N3
No.
1
1
2
3
4
5
6
2
3
1
2
3
2
3
2
3
1
2
3
3
1
2
2.24
1.75
5.32
0.37
7.2
39.1
0.59
5.07
0.65
0.32
0.49
27.0
5.29
1.05
0.4
0.34
0.48
46.5
1.75
0.41
1.07
0.68
0.44
25.7
4
0.38
0.51
4.31
0.8
138.0
7
0.48
0.36
0.65
0.88
165.6
55.20
1.52
1.39
1.11
1.72
-39.36
-7.05
-7.05
-5.19
-9.54
7
0.57
5
1.26
4
0.61
22.7
7
0.7
36.3
8
0.91
1
1.42
120.3
73.70
0.91
-39.34
0.28
3.88
15.4
7.85
25.5
4
35.2
3
48.6
92.8
47.32
-36.20
67.56
72.73
44.19
-33.79
7
8
9
1
1
2
2
2
3
3
3
1
2
3
3
1
2
2
3
1
1 n 2
yi
n i1
S / N 10 log
A1 = Y1 + Y2 + Y3
Pgina 79 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9
Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ... versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D
Coef
Constant -19.6915
A1
1.8735
Pgina 80 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
A2
1.6687
B1
4.9386
B2
2.0970
C1
-18.6078
C2
4.3499
D1
-7.8678
D2
4.3221
S=*
56.52
10.32%
74.91%
12.28%
Residual Error 0
Total
56.52 28.261 * *
2.49%
8 2276.21
Coef
Constant 25.2281
A1
-5.8598
A2
0.2819
B1
-6.1548
B2
-8.3748
C1
33.5124
C2
-9.6215
D1
8.4707
D2
0.1513
Pgina 81 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
S=*
2 196.59 196.59
Residual Error 0
Total
98.30 * *
8 6951.62
Delta
Rank
Pgina 82 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
-10
Mean of SN ratios
-20
-30
-40
1
2
C
2
D
-10
-20
-30
-40
60
45
Mean of Means
30
15
0
1
2
C
2
D
60
45
30
15
0
Mean
5.70044 -10.5261
Factor levels for predictions
A B C D
Pgina 83 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
1 1 3 2
Pgina 84 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o
respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.
*
**
*
*
*
*
*
*
b1
* *
*
*
b0
Correlacin positiva
Correlacin negativa
X
Sin
correlacin
Pgina 85 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
El trmino de error es la diferencia entre los valores reales observados Yi y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Pgina 86 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
*
X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresin
poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad)
Pgina 87 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Y
Yest = 4.4 + 1.08
X
Yi =
23
Desviacin no
*
explicada
Error = (Yi - Yest)
= 1.32
Variacin
total
(Yimedia)=5.1
Desviacin
explicada
(Yest-Ymedia) =
3.81
Ymedia =17.87
X = 16
Y Tiempo
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
(Xi-X)*(Yi-Y)
119.076672
1.099872
7.499472
10.502272
0.963072
51.612672
91.433472
121.260672
-3.558928
(Xi-X)^2
38.9376
0.0576
7.6176
3.0976
0.0576
17.9776
38.9376
38.9376
0.5776
Pgina 88 de 95
(Yi-Y)^2
364.1533
21.0021
7.3832
35.6075
16.1026
148.1771
214.7045
377.6337
21.9286
Yest
10.9199
28.3362
37.0443
34.1416
28.3362
16.7253
10.9199
10.9199
31.2389
Error
0.9408
15.1022
28.0292
0.7369
10.9969
0.0181
11.9721
1.7422
47.4563
ESTADSTICA APLICA
MACETAS HERNNDEZ
8
4
11
12
2
4
4
20
1
10
15
15
16
17
6
5
206
27.50
17.08
37.00
41.95
11.66
21.65
17.89
69.00
10.30
34.93
46.59
44.88
54.12
56.63
22.13
21.15
725.82
0.367872
50.679872
21.989472
48.568672
108.406272
31.303072
47.245472
470.014272
135.625472
10.379072
118.686672
107.127072
194.676672
241.751472
15.462272
25.540272
2,027.7132
Sxy
0.0576
2.3495
28.3362 0.6991
17.9776 142.8694 16.7253 0.1258
7.6176
63.4763
37.0443 0.0020
14.1376 166.8541 39.9470 4.0121
38.9376 301.8142 10.9199 0.5477
17.9776
54.5057
16.7253 24.2523
17.9776 124.1620 16.7253 1.3564
138.2976 1,597.3771 63.1686 34.0052
52.4176 350.9178
8.0172
5.2111
3.0976
34.7770
34.1416 0.6216
45.6976 308.2553 48.6551 4.2646
45.6976 251.1337 48.6551 14.2512
60.2176 629.3676 51.5578 6.5649
76.7376 761.6054 54.4605 4.7068
5.0176
47.6486
22.5307 0.1606
10.4976
62.1385
19.6280 2.3164
698.5600
6,105.9447
220.0926
Sxx
Syy = SST
SSE
X
promedio
Y Promedio
Sxy
Sxx
Syy
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera y = a
+ bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx
= 698.56
Syy
= 6105.94
b1 1
b0 0
( Xi X )(Yi Y ) S
S
( Xi X )
XY
1 X i
n
XX
Y X
= 2.902704421
= 5.114515575
ESTADSTICA APLICA
MACETAS HERNNDEZ
SST (Yi Y ) 2
6,105.9447
220.0926
r2 1
SST
SST
SST = 0.9639
r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r
es un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente),
y r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica
para afirmar que el tiempo de atencin esta relacionado con el nmero de servicios
atendidos.
8.3 Uso de Excel
1. En el men Herramientas seleccione la opcin Anlisis de datos. Datos de
ejemplo 6.
2. Seleccione la opcin Regresin.
Pgina 90 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
Resumen
Estadsticas de la regresin
Coeficiente de
0.9818117
correlacin mltiple
78
Coeficiente de
0.9639543
determinacin R^2
68
0.9623871
R^2 ajustado
67
3.0934196
Error tpico
Observaciones
27
25
Promedio
ANLISIS DE VARIANZA
Suma de
de
Valor
Grados de Cuadrado
libertad
cuadrado
crtico de
s
s
F
F
5885.8520 5885.8520 615.08008 4.24118E-
Regresin
Residuos
23
48
6105.9447
Total
24
04
Coeficient
69
69
220.09263 9.5692449
Error
98
18
92
Estadstic
Probabilid
Inferior
es
tpico
ot
ad
95%
5.1145155 1.1458041 4.4636910 0.0001772 2.7442391
Intercepcin
XServicios
75
27
04
15
61
2.9027044 0.1170407 24.800808 4.24118E- 2.6605872
21
19
Pgina 91 de 95
25
18
49
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 92 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
70
60
S
R-Sq
R-Sq(adj)
Y Tiempo
50
3.09342
96.4%
96.2%
40
30
20
10
0
0
10
X Servicios
15
20
DF
SS
MS
23 220.09
Total
24 6105.94
9.57
Pgina 93 de 95
ESTADSTICA APLICA
MACETAS HERNNDEZ
8.5 Ejercicios:
1. La energa consumida en un proceso depende del ajuste de mquinas, realizar una
regresin cuadrtica con los datos siguientes y responder las preguntas.
Cons_energ
Ajuste
Mq.
X
11.15
15.7
18.9
19.4
21.4
21.7
25.3
26.4
26.7
29.1
Y
21.6
4
1.8
1
1
0.8
3.8
7.4
4.3
36.2
ESTADSTICA APLICA
MACETAS HERNNDEZ
Pgina 95 de 95