You are on page 1of 119

DISEO DE EXPERIMENTOS. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Introduccin.(2 hrs). Diseo completamente al azar. (6) Diseo en bloques completos al azar.

(4) Diseo en cuadro latino.(4) Arreglo de tratamientos en dos factores.(10) Arreglos de tratamientos multifactorial.(4) Arreglos factoriales dos a la k.(6) Confusin en los arreglos factoriales dos a la k.(6) Bloques incompletos.(4) Factoriales fraccionados.(4) Arreglos Ortogonales de Taguchi.(6) Metodologa de superficie de respuesta.(8).

INTRODUCCION 1. 2. 3. 4. 5. 6. Relacin entre investigacin y estadstica. Objetivo general de la experimentacin. Objetivo de un diseo experimental. Ingredientes de un diseo experimental. Variables y sus relaciones en un diseo experimental. Modelos estadsticos para establecer las relaciones entre variables en un diseo experimental. Relacin entre investigacin y estadstica: La investigacin es una actividad inherente a todo ser humano. En mayor o menor grado desde pequeos se nota la inquietud por investigar ciertos aspectos de inters. Por ejemplo, una de las formas de aprendizaje ms rudimentarias es la prueba y error, en donde la prueba realmente consiste en un experimento para investigar un cierto resultado. Las herramientas de investigacin en algunos casos se van

mejorando e incrementando, en otros no evolucionan y permanecen con las mismas tcnicas rudimentarias de investigacin. A nivel de actividad profesional, en todos los campos, debe ser una actividad de primordial importancia. Por ejemplo, para los mdicos, cada paciente es un sujeto de investigacin, cuyo objetivo es llegar a resolver un problema. Por otro lado, a nivel del campo de la medicina se lleva a cabo una labor muy intensa de investigacin para el desarrollo de nuevos frmacos, nuevas tcnicas quirrgicas, nuevos equipos en el diagnostico y tratamiento de enfermedades, etc. El desarrollo en todos los campos de actividad profesional se atribuyen en gran medida a la aplicacin de los resultados obtenidos a travs de la investigacin. La gran mayora de las investigaciones se llevan a cabo a travs de la aplicacin del mtodo cientfico que incluye los siguientes pasos: 1. 2. 3. 4. 5. 6. Establecer el problema. Formular la hiptesis. Disear el experimento o muestreo. Tomar las observaciones. Interpretar los datos. Concluir.

Este proceso lleva implcitos algunos pasos que son de naturaleza estadstica. Empezando por la formulacin de la hiptesis, punto de primordial importancia para el desarrollo de la investigacin. Una hiptesis estadstica debe incluir el juego de hiptesis que incluye: La hiptesis nula (Ho). La hiptesis alternativa (Ha). La hiptesis alternativa es la correspondiente a la hiptesis de trabajo del investigador, aplicada a una variable de inters, y por ello es la que direcciona el proceso de investigacin en lo referente a las evidencias que el investigador debe colectar y mostrar debidamente procesadas para apoyar su hiptesis.

La hiptesis alternativa es un enunciado en forma de una desigualdad que indica el conjunto de valores que el parmetro, correspondiente a la variable de inters, debe tomar para ser consistente con la hiptesis de trabajo. 1. En base a la desigualdad, las hiptesis alternativas se clasifican como: Ensayos bilaterales o de dos colas, cuando el signo de la desigualdad es diferente de () lo cual implica que la hiptesis alternativa va a ser apoyada en cualquiera de los dos extremos de los valores del parmetro. Este tipo de alternativa se establece siempre que no se tiene una clara idea de la direccin de cambio en el valor del parmetro. 2. Ensayos unilaterales o de una cola, que corresponden a una hiptesis de trabajo unidireccional, de tal manera que pueden ser de cola izquierda (<) o de cola derecha (>). La hiptesis de cola izquierda implica que el extremo izquierdo de los valores del parmetro apoyan a la hiptesis de trabajo; esto es, entre mas pequeo el valor del parmetro mas consistentes son los resultados con la hiptesis de trabajo. De manera equivalente, en un ensayo de cola derecha, implicara que entre mas alto el valor del parmetro mas se favorece a la hiptesis de trabajo. Hay que hacer notar que la hiptesis alternativa siempre es establecida como una desigualdad, en la que como tal, nunca debe aparecer el signo de la igualdad, y debe ser establecida en trminos de la hiptesis de trabajo. La hiptesis nula es lo contrario a la hiptesis alternativa, por lo que siempre incluye el signo de la igualdad. De esta manera corresponde a la negacin de lo que el investigador desea probar en su investigacin, por lo que esta se considera como verdadera, hasta que se muestran suficientes evidencias que apoyan a la hiptesis de trabajo. La hiptesis nula es una hiptesis de consecuencias estadsticas definidas, es decir, es posible llegar a determinar que se espera del valor del parmetro si la hiptesis nula es verdadera. El mecanismo de una prueba de hiptesis puede ser descrito como una comparacin entre las evidencias colectadas y lo que se

espera bajo la hiptesis nula. Este mecanismo siempre conduce a una toma de decisin basada en probabilidades de riesgos de equivocarse. Para establecer los diferentes escenarios a que puede conducir una toma de decisin considere el siguiente cuadro, en donde las entradas son el estado de naturaleza, es decir lo que realmente es en relacin a la hiptesis nula, y por otro lado, la toma de decisin a que conduce la evidencia colectada: DECISION Rechazar Ho No Rechazar Ho. Ho Verdadera Error tipo I Confiabilidad Ho Falsa=Ha Verdadera Poder de la prueba Error tipo II

Las posibles decisiones a que puede conducir el mecanismo de una prueba de hiptesis son: 1. Rechazar Ho, cuando se tienen suficientes evidencias que apoyan a la hiptesis alternativa. Este tipo de decisin se considera el mas fuerte, ya que lleva a la implcito el hecho de que el investigador ha logrado confirmar su sospecha original mediante su trabajo de investigacin. El error tipo I esta relacionado con esta decisin al definirlo como: Rechazar Ho cuando Ho es verdadera. A la probabilidad de este error se le denota por la letra (alfa) y para propsitos de toma de decisin, el alfa de la prueba se establece a niveles muy bajos, tales como 0.10, 0.05 o 0.01. A este nivel de error tipo I fijado en la prueba se le llama nivel de significancia de la prueba. 2. No Rechazar Ho, cuando el investigador no ha logrado reunir los suficientes elementos que confirmen su hiptesis de trabajo. Es una decisin en la que la sospecha queda como tal, y si es razonable, queda abierta la posibilidad de seguirla investigando, con tcnicas mejoradas o de manera mas minuciosa que lleve a la coleccin de evidencias requeridas. El error tipo II esta relacionado con esta decisin al definirlo como: No Rechazar Ho cuando Ho es falsa. La probabilidad asociada a este error se le denota por (beta).

El mecanismo para llevar a cabo una prueba de hiptesis consiste de los siguientes pasos: 1. 2. 3. 4. 5. 6. 7. Establecer el juego de hiptesis. Establecer la estadstica de prueba. Determinar la distribucin de la estadstica de prueba bajo la hiptesis nula. Determinar el nivel de significancia y zona de rechazo. Calculo de la estadstica de prueba en base a la evidencia colectada. Toma de decisinConclusin-

Disear el experimento o muestreo: En estadstica se tienen dos metodologas para la coleccin de evidencias para probar una hiptesis, que son: 1. 2. Diseo experimental. Diseo de muestreo.

La coleccin de datos bajo un diseo experimental implica un proceso de control por parte del investigador con la finalidad de asociar datos a condiciones experimentales. El objetivo es determinar la relacin causa efecto. La coleccin de datos por muestreo es un examen de un sistema en operacin en el que el investigador no tiene oportunidad de asignar diferentes condiciones a los objetos de estudio. El objetivo bsico es la caracterizacin del sistema en base a las variables evaluadas. Entonces, el diseo experimental es una herramienta de metodologa estadstica para colectar los datos bajo condiciones controladas y a la vez construir, en base a la metodologa de coleccin, los modelos necesarios para analizar e interpretar los resultados. La interpretacin de resultados se lleva a cabo una vez que los datos colectados son procesados y sometidos al mecanismo de una prueba de hiptesis. La interpretacin comprende bsicamente la toma

de decisin y la conclusin, incluidas en el mecanismo de la prueba de hiptesis. De esta manera, en gran medida, el mtodo cientfico esta apoyado fuertemente por la metodologa estadstica, desde el planteamiento de las hiptesis, coleccin de los datos, procesamiento, interpretacin y conclusin. Objetivo general de la experimentacin: En trminos muy sencillos un experimento es una prueba o ensayo que conduce a un resultado cuantificable. En trminos prcticos es una manipulacin deliberada de un proceso con el propsito de medir el impacto del cambio en una o mas variables de entrada sobre una o mas variables de salida. Formalmente, el experimento es definido como una operacin llevada a cabo bajo condiciones controladas para descubrir un efecto desconocido, probar una hiptesis o ilustrar una ley conocida. En general, los experimentos son llevados a cabo para explorar, estimar o confirmar. Objetivo de un diseo experimental: El diseo de experimentos o diseo estadstico de experimentos es una disciplina basada en principios estadsticos, y construida a travs de aos de experiencia en la ciencia y la ingeniera. Implica el proceso de diseo y planeacion del experimento, de tal forma que datos apropiados puedan ser colectados y posteriormente ser analizados por mtodos estadsticos para llegar a conclusiones validas y objetivas. Los principales beneficios de la experimentacin diseada es que la informacin critica es obtenida mas rpido, econmica y confiable de lo que seria si se aplicara un enfoque no planeado. El DOE o SDE permite al investigador entender un proceso y determinar como las variables de entrada (factores) afectan a las variables de salida

(respuesta). Es un enfoque sistemtico para la optimizacin de procesos. En general el DOE puede ser usado para: 1. 2. 3. 4. 5. 6. 7. Estudiar el efecto de varios factores sobre el comportamiento del producto o proceso. Entender la relacin entre las variables de entrada y las variables de salida. Identificar las condiciones optimas de un proceso que maximizan o minimizan la respuesta. Reducir la variabilidad en las caractersticas de un producto. Mejorar la confiabilidad del producto. Reducir costos de manufactura. Acortar el tiempo de desarrollo de productos o procesos.

Variables y sus relaciones en un diseo experimental: En todo experimento debemos definir la unidad experimental, como el material mnimo requerido para aplicar los tratamientos (las causas) y evaluar las respuestas (los efectos). Tambin debemos definir los tratamientos como cada una de las diferentes condiciones experimentales que van a ser evaluadas en el experimento. Las variables en un diseo experimental se clasifican fundamentalmente en dos grandes grupos de acuerdo su rol en la unidad experimental: 1. 2. Variables de entrada. Variables de salida.

Las variables de entrada son todas aquellas variables a las que esta expuesta la unidad experimental. Comprende los siguientes grupos de variables: 1. 2. 3. 4. 5. Factores experimentales. Factores de bloqueo. Factores de ruido. Variables deliberadamente controladas. Variables no controladas.

Factores experimentales:

Los factores experimentales son aquellas variables del proceso que deliberadamente son manipuladas en un experimento para investigar su impacto sobre las variables de respuesta. Cada uno de los valores de estas variables incluidos en un experimento se denomina los niveles del factor. Si el experimento incluye solo un factor (experimento unifactorial), entonces cada uno de los niveles se constituye en un tratamiento. Si el experimento incluye varios factores (experimento multifactorial), entonces la combinacin de los niveles de todos y cada uno de los factores incluidos ser lo que se constituya como un tratamiento. Los factores experimentales se clasifican de acuerdo a varios criterios: De acuerdo a la naturaleza de los niveles los factores se clasifican en: 1. 2. Cualitativos o categricos. Cuantitativos o continuos.

Los cualitativos o categricos son aquellos factores donde la escala de los niveles es puramente nominal. Para este tipo de factores el inters se centra en la comparacin de los promedios, para seleccionar el mas adecuado. Al graficar estos promedios no existe un orden nico de los niveles y por lo tanto nunca deben usarse lneas continuas o de puntos en su representacin, siendo lo mas conveniente una grafica de barras. Los factores cuantitativos son aquellos cuyos niveles se expresan en una escala numrica, siendo el principal objetivo del anlisis el describir un modelo de respuesta de acuerdo a los niveles de este factor. Su representacin grafica mas adecuada es a travs de puntos o lneas. De acuerdo a la forma de seleccin de los niveles del factor, se clasifican como: 1. 2. Factores fijos. Factores aleatorios.

Los factores fijos son aquellos en los que la seleccin de los niveles esta basada en el inters del investigador, quien decide cuales son los que deben incluirse en el experimento. Para este tipo de factores las conclusiones estn restringidas al rango de niveles seleccionados, para factores continuos, o estrictamente para los niveles seleccionados en caso de los factores cualitativos.

Los factores aleatorios son aquellos en donde los niveles del factor se seleccionan de una poblacin de niveles de una manera aleatoria. Para este tipo de factores el inters esta centrado en investigar la variabilidad que genera el cambio en los niveles de este factor. Para los experimentos multifactoriales, los factores se clasifican de acuerdo a la relacin que guardan los niveles de los factores en: 1. Factores cruzados, en los que los niveles de dos factores son independientes, es decir, los niveles de un factor se pueden combinar sin ninguna restriccin con los niveles del segundo factor, generando as una estructura factorial de tratamientos. 2. Factores anidados, en los que los niveles de un factor de jerarqua inferior depende de los niveles de un factor de jerarqua superior, generando as una estructura jerrquica. Factores de bloqueo: Cuando fuentes de variacin extraas e indeseables pueden ser identificadas, podemos disear el experimento de tal forma que eliminemos su influencia. La idea es arreglar las unidades experimentales en grupos o bloques de unidades uniformes en los valores de la variable de bloqueo, asignando luego, al azar, los tratamientos dentro de cada bloque. La variabilidad entre bloques es considerada en el anlisis, lo que conduce a una mejora en la precisin del experimento. Cuatro criterios son frecuentemente usados para bloquear unidades experimentales: Proximidad de unidades experimentales; caractersticas fsicas de las unidades experimentales que tengan un impacto fuerte en las variables de respuesta; tiempo; administracin de tareas en el experimento. Factores de Ruido: Son las variables que solo pueden controlarse durante la fase experimental, ya que resulta difcil o costoso tratar de controlarlas durante la etapa de produccin normal. Variables deliberadamente controladas: Conjunto de variables en un experimento que se caracterizan por tomar un valor constante durante la etapa experimental, debido al control que ejerce el investigador sobre estas.

Variables no controladas: Conjunto muy grande de variables que se les permite variar sin control durante un experimento. Algunas pueden ser monitoreadas y llegar a convertirse en covariables. Otras puede ser que no sean medibles o accidentalmente ignoradas y este grupo es el que origina el error experimental. En cualquier caso, el impacto que tienen sobre las variables de respuesta debe ser mnimo. Si sucede que una variable de este grupo cambia a la par con los niveles de un factor experimental, esto ocasiona una confusin, ya que el anlisis no puede separar el efecto en el cambio simultaneo de ambas variables. Si el investigador no esta consciente de este cambio simultaneo de variables, entonces la variable no controlada va a enmascarar el efecto del factor experimental. Las covariables deben reunir dos caractersticas: Guardar una relacin lineal con las variables de respuesta y que no deben ser impactadas por los tratamientos. Estas variables, que pueden ser del ambiente fsico o de las mismas unidades experimentales, son analizadas conjuntamente con la respuesta para mejorar la precisin del experimento. Las variables de salida es el conjunto de variables que se van a evaluar en la unidad experimental, una vez que el tratamiento haya impactado, para determinar los efectos de tratamiento. Las respuestas se seleccionan en base a dos criterios: Las respuestas que son sensibles a los factores experimentales que se estn investigando y las respuestas que son de importancia econmica. Componentes de un diseo experimental: Dos caractersticas de todo diseo experimental son: 1. 2. Repeticin. Aleatorizacion.

La repeticin se refiere a que cada condicin experimental debe ser aplicada de manera independiente, al menos a dos unidades experimentales. A travs de las repeticiones en un tratamiento se evala la consistencia del tratamiento en lo que se refiere a su efecto. Si los resultados en una variable de inters son muy similares entre si, entonces el efecto del tratamiento es muy consistente. Una medida de esta consistencia es el grado de dispersin que

tienen las repeticiones de un tratamiento con respecto a su media de tratamiento, medida de variabilidad dentro de tratamiento que es conocida como el error experimental. Adems, el nmero de repeticiones repercute en la estimacin de la varianza de la media de tratamiento. La aleatorizacin se refiere al proceso de asignacin de tratamientos a las unidades experimentales. El objetivo de este mecanismo de asignacin es distribuir en forma aleatoria las diferencias entre unidades experimentales, de tal manera que ninguno de los tratamientos se favorezca o se perjudique con alguna asignacin tendenciosa generada a base del juicio del investigador. A travs de un diseo experimental se pretende entonces probar una hiptesis acerca del efecto de los tratamientos bajo condiciones controladas. Para tal fin todo diseo experimental consta de dos componentes: 1. Arreglo geomtrico de las unidades experimentales. Este componente se enfoca a mejorar la precisin de las estimaciones reduciendo variabilidad de unidades experimentales dentro de tratamientos. El mecanismo para definir arreglos geomtricos es el manejo de las variables de bloqueo y el sistema de aleatorizacion. Los principales arreglos geomtricos son: El diseo completamente al azar, el diseo en bloques al azar y el diseo en cuadro latino. 2. Arreglo de tratamientos. Este componente se enfoca a generar la estructura de los tratamientos adecuada a la hiptesis que se desea probar. Las estructuras bsicas son: Estructuras unifactoriales y estructuras multifactoriales. En las multifactoriales podemos distinguir las estructuras factoriales, estructuras jerrquicas y en parcelas divididas. Modelos para establecer las relaciones entre variables en un diseo experimental: En diseo de experimentos todo el anlisis de resultados se lleva a cabo mediante el ajuste de modelos. Estos modelos, en general se establecen como: RESPUESTA = INDEPENDIENTES + ERROR En Las variables independientes deben distinguirse aquellas que son fijas de las que son aleatorias. Las fijas se agrupan dentro de la parte sistemtica del modelo y las aleatorias en lo que se considera la parte aleatoria del modelo,

dentro de la cual se puede ubicar el error, por lo que la estructura del modelo quedara como: RESPUESTA = SISTEMTICA + ALEATORIA En la parte sistemtica se incluira entonces los factores experimentales y los factores de bloqueo, en tanto que en la parte aleatoria se incluiran los efectos aleatorios y el error experimental. EL DISEO COMPLETAMENTE AL AZAR Es el arreglo geomtrico ms simple, en el que se supone que tanto las unidades experimentales como el ambiente fsico en el que se lleva a cabo el experimento son totalmente homogneos, uniformes, sin cambio, lo cual representara un ambiente controlado y un material experimental estable. Bajo estas condiciones ideales solo quedara por definir los factores experimentales y sus niveles para determinar los tratamientos o condiciones experimentales que van a ser investigadas. Por esta razn, el nico efecto incluido en el modelo bajo este diseo, es precisamente el efecto de los tratamientos, que sera la nica fuente de variacin identificable en este experimento. Como puede ser sospechado, difcilmente se van a cubrir los requisitos para poder aplicar este diseo, por lo que en la prctica solo se recomienda para condiciones muy controladas, como es el caso de experimentos de laboratorio. Aleatorizacion: Ya que las unidades experimentales y las condiciones fsicas en las que se va a llevar a cabo el experimento son muy homogneas, entonces el mecanismo de asignacin de tratamientos a las unidades experimentales es completamente al azar, lo cual se puede lograr mediante la aplicacin de cualquier mtodo de sorteo aleatorio. Puede ser mediante el uso de nmeros aleatorios, mediante seleccin aleatoria de nmeros asociados a unidades experimentales y aplicacin secuencial de tratamientos. Si en realidad las unidades experimentales son muy homogneas, entonces cualquier nmero de subgrupos generados al azar van a ser tambin muy similares, lo cual asegura una comparacin muy justa de los tratamientos. Este diseo, es una generalizacin, para comparar ms de dos tratamientos, de la

comparacin de dos medias mediante la prueba de t para muestras independientes. Datos en el diseo completamente al azar: Los datos en un diseo completamente al azar solo tienen un criterio de clasificacin, correspondiente a los tratamientos. Para identificar a cada una de las observaciones, se requieren entonces de dos subndices ligados a la letra que representa la variable de respuesta; de acuerdo al modelo estadstico Yij = + i + ij El subndice i esta asociado al tratamiento y el subndice j esta asociada a la repeticin dentro de cada tratamiento. Yij corresponde al valor de la variable de respuesta en la repeticin j del tratamiento i. es la media general del experimento. i es el efecto del tratamiento i. ij es el error experimental en la repeticin j del tratamiento i. i=1,2,,t; j=1,2,,r Lo cual indica que en el experimento hay t tratamientos, y en cada tratamiento r es el numero de repeticiones, cuando el numero de repeticiones es el mismo en cada tratamiento; entonces el experimento esta balanceado. Cuando el numero de repeticiones varia de tratamiento a tratamiento, el diseo experimental ser desbalanceado y el subndice j llegara a un numero diferente para cada tratamiento, lo cual puede ser indicado con j=1,2,,r i . Hiptesis que se desea probar: La hiptesis que se desea probar es la referente al efecto de los tratamientos. La hiptesis estadstica es: Ho: Todos los efectos de tratamientos son iguales a cero. Ho: 1=2==t=0 Ha: Al menos uno de los efectos de tratamiento es diferente de cero. Para expresarla en trminos de los parmetros del modelo tendra que ser una hiptesis mltiple, que por el momento no es de inters llegar a detallar. Lo importante en este punto es recordar que la hiptesis nula es de consecuencias estadsticas definidas. En este caso la consecuencia de la hiptesis nula, es que el modelo estadstico se reduce a:

Yij = + ij Al que se le llama el modelo reducido. Para probar esta hiptesis el razonamiento que se sigue es evaluar la magnitud de los errores en ambos modelos y determinar que tanto impacto tienen los efectos de tratamiento. Si la reduccin en los errores es importante, entonces el efecto de los tratamientos se declara significativo. Por el contrario, si la magnitud de los errores prcticamente es la misma en ambos modelos, esto significa que los efectos de tratamiento no contribuyen a explicar la respuesta, y por lo tanto son declarados no significativos. Anlisis de los datos: El anlisis de los datos de un diseo experimental siempre se lleva a cabo mediante la tcnica del anlisis de varianza. Para aplicar esta tcnica se requiere del ajuste de los dos modelos al mismo conjunto de observaciones, el completo y el reducido bajo la hiptesis nula, para despus comparar la magnitud de los errores obtenida en ambos modelos. El ajuste de un modelo consiste en estimar sus parmetros, es decir todos aquellos componentes del modelo que no incluyan la secuencia completa de subndices usada en la variable de respuesta. En otras palabras, el nico componente que no se estima en el ajuste del modelo es el que corresponde al error experimental. En el ajuste del modelo se deben tener en cuenta las siguientes caractersticas tanto del conjunto de observaciones como del modelo que se desea ajustar: 1. Numero total de observaciones: Corresponde al numero total de valores en el diseo experimental. Vamos a denotar este numero con la letra n. 2. Numero de parmetros independientes en el modelo que se ajusta: Parmetros independientes son aquellos que no estn sujetos a las restricciones impuestas por la definicin de los parmetros. Por ejemplo el modelo reducido solo tiene un parmetro, que es independiente; en el modelo completo del diseo completamente al azar se impone la restriccin de i=1i = 0, por lo que el numero de parmetros independientes seria t-1. A estos faltara sumar el parmetro , por lo que entonces serian t parmetros independientes.

3.

Grados de libertad para el modelo ajustado: Se refiere al numero de componentes independientes en el conjunto de datos despus de haber ajustado un modelo. Los grados de libertad se van reduciendo a medida que se introducen mas componentes en un modelo. Estos grados de libertad son los que permiten estimar la varianza del error, por lo que se recomienda en general que no deben ser inferiores de 10 a 12 en el modelo completo. Se estiman como:

G.L. = n parmetros independientes en el modelo. Para el modelo completo de un diseo completamente al azar se tiene: G.L. = n t Para el modelo reducido se tienen: G.L.= n 1 Al revisar la estructura del modelo reducido y el modelo completo se puede deducir que los resultados de las diferencias entre el modelo reducido menos el modelo completo se pueden atribuir al termino que corresponde al efecto de los tratamientos. Entonces: G.L.Trat = t 1 Estos grados de libertad son de particular importancia, ya que indican el numero de parmetros independientes en un modelo ajustado al conjunto de datos, tomando como variables independientes los tratamientos. Si el factor es cuantitativo, entonces los grados de libertad indican el grado mximo de polinomio en el modelo de regresin; si se trata de un factor cualitativo, entonces los grados de libertad en los tratamientos indica el numero mximo de comparaciones independientes entre los niveles del factor. Con esta informacin podemos empezar a generar la tabla de anlisis de varianza, que resume el ajuste de modelos y sus comparaciones. Para el diseo completamente al azar, las fuentes de variacin bsicas que se incluyen son: Tratamientos Error Total.

El total corresponde al ajuste del modelo reducido. De esta manera cuando requiramos los grados de libertad del total, sern los grados de libertad al ajustar el modelo reducido, esto es n-1. El error corresponde al ajuste del modelo completo. Cuando hablemos de los grados de libertado en un diseo completamente al zar, entonces se calcularan como n t. Hasta aqu el anlisis de varianza solo requiere de la informacin de cuantas observaciones comprende el conjunto de datos y cuantos tratamientos van a ser incluidos. Para el resto del anlisis se requiere ya del procesamiento de los datos y ajuste de los modelos. Ajuste de modelos por mnimos cuadrados ordinarios: Los modelos de anova se ajustan por mnimos cuadrados ordinarios, llamados as porque el ajuste se lleva a cabo bajo las suposiciones convencionales de anlisis, esto es, suponiendo normalidad, independencia y homogeneidad de varianzas en el componente de error. Una supocisin adicional es la aditividad de los componentes del modelo. Los pasos para llevar a cabo el ajuste son los siguientes: 1. Definir el modelo que se va a ajustar. 2. Definir las restricciones que se imponen en los parmetros del modelo. 3. Obtener la expresin para el error experimental despejando este termino del modelo que se vaya a ajustar. 4. Obtener la expresin para la suma de cuadrados de los errores. 5. Derivar la expresin de la suma de cuadrados de los errores con respecto a cada uno de los parmetros del modelo. 6. Igualar a cero las derivadas, para generar las ecuaciones normales de mnimos cuadrados. 7. De las ecuaciones normales de mnimos cuadrados se despejan los estimadores de los parmetros. Vamos a considerar el modelo reducido del diseo completamente al azar para ejemplificar los pasos del ajuste de un modelo: 1. Modelo que se va a ajustar: Yij = + ij

2. 3. 4. 5. 6. 7.

Restricciones en los parmetros: No hay restricciones. Error experimental: ij = Yij - S.C.E. = ijij2 = ij(Yij )2 Derivada de la S.C.E. con respecto al parmetro : 2 ij(Yij )(-1). Ecuacin normal de mnimos cuadrados: -2 ij(Yij ) = 0 Estimador del parmetro: Media general de las observaciones.

Este proceso de estimacin es para obtener las expresiones algebraicas de los estimadores de mnimos cuadrados ordinarios y solo es necesario desarrollarlo cuando estas se desconozcan, ya que si se tienen a la mano, pues solo restara aplicarlas al conjunto particular de observaciones. Por otro lado si se tiene un paquete estadstico disponible, lo nico que hara falta es cargar adecuadamente los datos y darle correctamente las instrucciones para que genere los estimadores y todo el anlisis completo. Por estas razones vamos a enfocar la atencin al manejo del paquete para captura y anlisis de resultados mas que a la teora para generar estimaciones. Sumas de cuadrados en la tabla de anlisis de varianza: Una vez que los estimadores de los parmetros del modelo han sido obtenidos, pueden obtenerse los valores ajustados para cada una de las observaciones, a los que se les denominan los valores predichos. Por diferencia de los observados menos los predichos se obtienen los residuales o errores estimados para cada una de las observaciones. Al elevar al cuadrado cada uno de los residuales se obtienen solo cantidades positivas, que al sumarlas generan las sumas de cuadrados de los errores para el modelo ajustado. En cuanto a las sumas de cuadrados de los errores de un modelo ajustado se deben hacer las siguientes observaciones: a). Mientras mas reducido sea el modelo ajustado, esto es, mientras menor sea el numero de parmetros que contiene, la suma de cuadrados de los errores tendera a ser mayor. b). Cada suma de cuadrados de los errores tiene asociados un cierto numero de grados de libertad, que como ya se discuti, se calculan por la diferencia del numero de observaciones menos el numero de parmetros independientes que se van a estimar

c).

La suma de cuadrados de los errores refleja, en general, que tan

separados estn los valores observados de los valores ajustados por el modelo. d). Al comparar las sumas de cuadrados de los errores de un modelo reducido contra un modelo completo, la diferencia puede ser atribuida a los componentes que aparecen en el modelo completo pero que no aparecen en el modelo reducido. As entonces en el diseo completamente al azar, la diferencia entre el modelo reducido Yij= + ij y el modelo completo Yij=+i + ij se puede atribuir al efecto de los tratamientos, y esta suma de cuadrados tiene asociados t-1 grados de libertad. Hasta aqu podemos construir la tabla de anlisis de varianza para un diseo completamente al azar, con las siguientes columnas: Fuente de variacin Tratamientos Error Total Grados de libertad t-1 n-t n-1 Suma de cuadrados Diferencia. S.C.E. modelo completo S.C.E. modelo reducido

Estadstica de prueba en el anlisis de varianza: A partir de estas columnas en el anlisis de varianza, que fueron generadas en base a la informacin colectada de los datos y del ajuste de los modelos, se calcula otra columna encabezada por el titulo de cuadrados medios, que contiene el estimador de varianza para cada fuente de variacin. Como cualquier varianza, estas cantidades se calculan como el cociente de la suma de cuadrados entre sus grados de libertad. Finalmente, la estadstica de prueba que se utiliza en el anlisis de varianza es una F, el cociente de dos varianzas, a partir de la cual se va a poder tomar una decisin acerca de la hiptesis planteada en trminos de los efectos de tratamientos. La F calculada es el cociente del cuadrado medio de tratamientos entre el cuadrado medio del error. En los paquetes estadsticos una columna adicional es agregada a la tabla de anlisis de varianza para mostrar el valor de probabilidad, es decir, la probabilidad de obtener un valor de F mayor o igual a la F calculada. Con este nico valor es posible llegar a una decisin acerca de la hiptesis, al

compararlo con el nivel de significancia de la prueba. Las decisiones basadas en este criterio son: Rechazar Ho si el valor de probabilidad es menor o igual al nivel de significancia de la prueba. No rechazar Ho si el valor de probabilidad es mayor que el nivel de significancia de la prueba. Ejemplo numrico 1: Observaciones de la produccin de una reaccin qumica tomada a diferentes temperaturas fue registrada como sigue:
150 150 150 200 200 200 250 250 250 300 300 300 77.4 76.7 78.2 84.1 84.5 83.7 88.9 89.2 89.7 94.8 94.7 95.9

La primer columna representa los niveles de temperatura que se incluyeron en el experimento y la segunda columna los valores correspondientes a la produccin de la reaccin qumica. Como puede ser observado, se realizaron tres repeticiones por cada uno de los cuatro niveles de temperatura. Para empezar un anlisis exploratorio del comportamiento de los datos, siempre es recomendable graficar las observaciones contra los niveles del factor bajo estudio. En este caso la grafica resulta ser

100

95 90 Serie1 85 80

75 100

150

200

250

300

350

Dos patrones son los que deben ser observados en una grafica exploratoria: 1. La tendencia o patrn general de las observaciones. Debe ser identificado el comportamiento de los datos de acuerdo a los niveles del factor bajo estudio. Aqu observamos que a medida que aumenta la temperatura la produccin de la reaccin tambin aumenta de manera muy consistente, esto es, que se tiene un comportamiento lineal de la produccin con respecto a los niveles de temperatura. 2. Observaciones que se salen del patrn general de tendencia: En estas graficas exploratorias tambin pueden ser identificadas aquellas observaciones que no siguen el patrn de comportamiento. Estas observaciones deben ser cuidadosamente tratadas y checadas, pues en la gran mayora de las ocasiones son resultado de un error, ya sea en el experimento, a la hora de registrar, o inclusive capturar la informacin. En este ejemplo, como puede ser observado en la grafica, todas las observaciones siguen el mismo comportamiento de tendencia lineal. El anlisis de los datos consiste de los siguientes puntos, que corresponden a los de una prueba de hiptesis:

1. Establecer las hiptesis: Ho: Todos los efectos de tratamiento son iguales a cero. Ha: al menos uno de los efectos de tratamiento es diferente de cero. 2. Llevar a cabo la tabla de anlisis de varianza.
Anlisis de varianza de un factor ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 510.456667 3 Dentro de los grupos 2.66 8 Total 513.116667 11

Promedio de los Probabilida Valor crtico cuadrados F d para F 170.152222 511.736007 1.7736E-09 4.06618056 0.3325

3. Cantidades bsicas del anova: 3.1 3.2 3.3 Coeficiente de determinacin R-cuadrado: Desviacin estndar del error: Probabilidad de un valor mayor de F:

El coeficiente de determinacin R-cuadrado es el porcentaje de variacin explicado por el efecto de los tratamientos. Se calcula como una regla de tres directa, en la que la suma de cuadrados del total es al 100 % como la suma de cuadrados de tratamientos es al coeficiente de determinacin. Para nuestro ejemplo: 513.116667 510.456667 R-Cuadrado = 510.456667100 513.116667 Lo que significa que el 99.48 % de la variacin en el conjunto de observaciones esta siendo explicado por la variacin en la temperatura y solo el 0.52 % se debe a los factores de error. La varianza del error lo constituye el cuadrado medio del error y la desviacin del error se calcula como la raz cuadrada de la varianza, siendo en este caso S = 0.5679 La probabilidad mayor de un valor de F es lo que se denomina el valor de P o nivel de significancia observado, valor que nos permite tomar una decisin sobre la hiptesis acerca del efecto de los tratamientos. En este caso el valor es 100% Coeficiente de determinacin = 99.4816

P = 1.7736E-09 Aun cuando parece mayor que uno, el componente E-09 indica que hay ocho cero antes de la parte entera, lo que representa un valor muy inferior al 0.05 que consideramos como nivel de significancia de la prueba, por lo cual la hiptesis nula es rechazada, y por lo tanto se concluye que los tratamientos si tienen un efecto significativo sobre la respuesta. Ya que se trata de un factor cuantitativo, la mejor manera de investigar el efecto de los tratamientos es a travs de una regresin polinomial, checando hasta que nivel de tendencia llega a ser significativa. Ejemplo numrico 2: Los datos siguientes se refieren a las perdidas de peso de ciertas piezas mecnicas (en miligramos) debidas a la friccin cuando tres diferentes lubricantes se utilizaron en condiciones controladas. El lubricante C es el que se ha estado usando en el proceso, y ahora se desea evaluar dos nuevas posibilidades, el lubricante A y el lubricante B.
Lubricante A A A A A A A A B B B B B B B B C C C C C C C C Desgaste 12.2 11.8 13.1 11 3.9 4.1 10.3 8.4 10.9 5.7 13.5 9.4 11.4 15.7 10.8 14 12.7 19.9 13.6 11.7 18.3 14.3 22.8 20.4

Anlisis exploratorio:

Mediante una grafica de barras con su error estndar, podemos determinar el comportamiento de desgaste y la variabilidad en el conjunto de observaciones.

Promedios de desgaste
20 18 16 14 12 10 8 6 4 2 0 A B Tipo de lubricante C

Como puede observarse en la grafica, los patrones de dispersin dentro de cada lubricante son muy parecidos (por la similitud en las barras de error estndar). Puede observarse tambin que el lubricante de mayor valor en la respuesta es el C, seguido en orden decreciente por el lubricante B y el de mas baja respuesta en promedio el lubricante A. Planteamiento de la hiptesis: Ho: Las medias de desgaste por friccin bajo los tres lubricantes empleados son iguales. Ha: Al menos una media de desgaste asociada a un lubricante es diferente. Modelo estadstico para este conjunto de datos: Bajo la Ha el modelo es el correspondiente a un diseo completamente al azar: Yij = + i + ij Yij corresponde al valor del desgaste en la repeticin j del tratamiento i. es la media general del desgaste. i es el efecto del lubricante i. ij es el error experimental en la repeticin j del lubricante i. i=1,2,3 j=1,2,,8

Desgaste (mgs)

Anlisis de varianza para probar la hiptesis:


ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 230.585833 2 Dentro de los grupos 276.80375 21 Total 507.389583 23 Promedio de los Probabilida Valor crtico cuadrados F d para F 115.292917 8.74681521 0.00172472 3.46680011 13.181131

R-Cuadrado = 0.4544 Lo que significa que los lubricantes explican el 45 % de la variacin en el conjunto de datos. El 55 % se debe a factares no considerados en la investigacin. Desviacin estndar = 3.6306 que es el promedio del error en nuestro conjunto de datos bajo el modelo completo. Error estndar del la media = 1.2836 Lo que viene a confirmar el patrn de similitud en la variacin de desgaste dentro de cada lubricante, al obtener un error estndar muy similar a partir del anlisis de varianza, con los ya obtenidos para cada lubricante por separado. Valor de P = 0.0017 Que por ser menor al nivel de significancia de la prueba (0.05) se toma la decisin de rechazar Ho y concluir que las medias de desgaste en los tres lubricantes no son iguales. Esto implica que el lubricante entonces si tiene un impacto en el nivel de desgaste, por lo cual debemos investigar el patrn de variacin entre lubricantes y poder llegar a tomar una decisin acerca de cual lubricante es el mas conveniente para conservar las piezas de la maquinaria. MTODOS PARA IDENTIFICAR PATRONES DE VARIACIN POR TRATAMIENTOS El mtodo para factores cuantitativos es la regresin y para factores cualitativos es la comparacin de medias. Ambos procedimientos se pueden llevar a cabo por sus mtodos muy particulares o bien, bajo condiciones muy especificas, ambos se pueden llevar a cabo por medio de los contrastes ortogonales. Vamos a revisar primero los mtodos especficos para cada tipo de factor y posteriormente se discutir el enfoque general de contrastes ortogonales.

REGRESIN: La regresin es una metodologa de anlisis estadstico muy general, que aplica cuando se quiere investigar la relacin que guardan una variable dependiente con una o mas variables independientes. La regresin es muy extensa, y aqu solo nos limitaremos, en este punto, a la regresin lineal de tipo polinomial en una variable independiente. Los modelos de regresin polinomial se caracterizan por la potencia en la variable independiente. Como se muestra en la siguiente tabla los modelos de mas importancia son: Grado Lineal Cuadrtico Modelo Yij=o + 1Xij + ij Yij = o + 1 Xij + 2 X2ij + ij Descripcin Lnea Parbola

La estructura general del modelo polinomial consiste en que la variable de respuesta se describe a travs de un intercepto (o) valor en la variable de respuesta cuando la variable independiente es igual a cero y una serie de trminos aditivos que consisten en el producto de la pendiente (i) multiplicada por la variable independiente elevada a la potencia i. La pendiente o tasa de cambio es el cambio en la variable de respuesta por unidad de cambio en la variable independiente. De esta manera, estos polinomios pueden ser generalizados a cualquier grado. Es conveniente, aclarar desde aqu, que el ajuste de estos modelos va a estar limitado por el nmero de niveles en la variable independiente en el conjunto de datos. El gado de polinomio mximo va a estar dado por el numero de grados de libertad en los tratamientos, que corresponde exactamente a los parmetros, quitando el intercepto, que se incluyen en el modelo- As un modelo lineal puede ajustarse a un conjunto de datos con dos niveles en la variable independiente, un cuadrtico requiere mnimo tres niveles en la variable independiente para poder ser ajustado, etc. Esto implica, que un modelo mas all de ese grado no podr ser ajustado, con lo que no es posible llegar a determinar si en realidad dicho modelo ajusta bien al conjunto de datos. Por esta razn se recomienda que cuando sospechemos de un modelo polinomial de grado p, el numero de niveles en la variable independiente sea al menos p+2, para que de esta manera tengamos

posibilidad de llevar a cabo un prueba de falta de ajuste. Esta prueba consiste en comparar que tan bien se ajusta el modelo propuesto contra un modelo de grado ms alto. Cada grado que aumenta la ecuacin polinomial de regresin, se le asocia un grado de libertad, de los correspondientes a los tratamientos. De esta manera, los grados de libertad que quedan despus de ajustar una ecuacin polinomial de un cierto grado, se asocian a lo que se conoce como falta de ajuste, con la que se prueba si alguna de las tendencias incluidas en esta podra llegar a ser significativa, con lo cual se anulara el modelo propuesto. Esta es la forma de checar si el modelo requiere de mas parmetros de los que se estn considerando. Ejemplo numrico 3. Continuando con el ejemplo numrico 1, podemos investigar el efecto de los tratamientos al ajustar una regresin lineal al conjunto de datos:
Coeficiente Error Estadstico Probabilida Inferior Superior s Estandar t d 95% 95% 60.2633333 0.74439685 80.9559223 2.0211E-15 58.6047138 61.9219529 0.11653333 0.00321082 36.2940036 5.9937E-12 0.10937919 0.12368748

Intercepto Temperatur

En este ajuste podemos observar que ambos parmetros son estadsticamente diferentes de cero, ya que al probar: Ho: 1 = 0 vs. Ha 1 0 P = 5.99 E-12, que para todo propsito practico es igual a cero, y por lo tanto se rechaza Ho, y se concluye que la pendiente es diferente de cero. Su valor estimado es de 0.1165 con un error estndar de 0.0032, lo que indica que la produccin aumenta 0.1165 unidades por cada grado de incremento en la temperatura. Por cada 100 grados de aumento, la produccin aumenta 11.65 unidades. Con este valor ya tenemos evaluado el cambio que sufre la variable dependiente por un cambio en la independiente. Ya no es necesario establecer comparaciones de medias para saber si son estadsticamente diferentes, pues esto de antemano y se sabe. Ho: 0 = 0 vs. Ha 0 0 P = 2.02 E-15, que tambin es menor del nivel de significancia de la prueba, y por lo tanto se rechaza Ho, concluyendo que el intercepto es diferente de cero, con un valor estimado de 60.26 con un error estndar de 0.74444, lo que debera interpretarse como el valor de la produccin cuando la temperatura fuera igual a cero. Aprovechando el ejemplo,

debemos comentar que esta interpretacin seria correcta siempre y cuando la tendencia en la produccin se mantuviera constante como la que se encontr de 150 a 350 grados, lo cual es poco creble, y en todo caso, no se tiene la evidencia suficiente de que as sea. Entonces, queda en entredicho la interpretacin que se pueda dar a este valor. Al aplicar la formula encontrada de la ecuacin de regresin dada por Produccin = 60.26 + 0.1165*Temperatura Se determinan los valores esperados bajo el modelo de regresin ajustado, y al graficarlos sobrepuestos contra la temperatura, resulta la curva ajustada.

100 95 Produccion 90 85 80 75 100

Curva ajustada

Observados Esperados

150

200

250

300

350

Temperatura

Junto con la ecuacin de regresin ajustada, los paquetes tambin proporcionan el anlisis de varianza de la regresin, como a continuacin se muestra
ANLISIS DE VARIANZA Grados de libertad Regresin 1 Residuos 10 Total 11 Suma de cuadrados 509.250667 3.866 513.116667 Promedio de los cuadrados F 509.250667 1317.2547 0.3866 Valor crtico de F 5.9937E-12

Si se observa el valor de P coincide con el que ya se haba calculado para el parmetro de la pendiente, debido a que la hiptesis que se prueba con este abalisis de varianza es exactamente la misma, acerca de la pendiente. Entonces lo importante de este anlisis de varianza es conectarlo con el

anlisis de varianza para probar el efecto de los tratamientos. Para tal fin debemos considerar los siguientes clculos: G.L.Trat G.L.Reg.Lin = 3 1 = 2 que representan los grados de libertad asociados a la tendencia cuadrtica y cbica que pueden ser ajustados a este conjunto de datos por haber 4 niveles en la variable independiente. S.C.Trat S.C.Reg.Lin = 510.4566 509.2507 = 1.2059 que corresponde a la suma de cuadrados debida a la tendencia cuadrtica mas la suma de cuadrados debida a la tendencia cbica. Esta suma de cuadrados con los dos grados de libertad asociados, se le conoce como falta de ajuste. Esta informacin puede ser anexada en una tabla de anova con separacion de tendencias por efecto de los tratamientos.
ANLISIS DE VARIANZA Origen de las Suma de Grados de variaciones cuadrados libertad Entre grupos 510.456667 3 Separacion Tendencia Lineal 509.2507 1 Falta de Ajuste 1.2059 2 Dentro de los grupos Total 2.66 513.116667 8 11 Promedio de los cuadrados 170.152222 Probabilida Valor crtico d para F 1.7736E-09 4.06618056 0.000000 0.224166 5.3176 4.4589

F 511.736007

509.2507 1531.581053 0.6029 1.813230 0.3325

Con la prueba acerca de la falta de ajuste se concluye que el modelo ajustado a los datos no requiere de mas parmetros. Por lo que finalmente se puede sugerir el modelo lineal encontrado es el que mejor ajusta a este conjunto de observaciones. Prueba de separacin de medias: Es un mtodo que se aplica despus de que el anlisis de varianza detecta diferencias entre tratamientos, con la finalidad de llegar a determinar, especficamente, cuales son las medias de tratamientos que son diferentes, hasta llegar a formar grupos de tratamientos con medias iguales. Se han propuesto una variedad de pruebas con este fin, algunas mas sensibles, otras mas estrictas, generando conclusiones diferentes y que en algunas ocasiones no se pueden explicar de manera sencilla, mucho menos interpretar.

En este punto vamos a considerar solo uno de los mtodos, que es el de uso mas frecuente en la literatura cientfica, conocido como la prueba honesta de Tukey. Este procedimiento fue diseado para experimentos balanceados, donde cada tratamiento tiene un numero de repeticiones igual a r. El procedimiento para aplicar la prueba de Tukey consiste de los siguientes pasos: 1. Calcular el error estndar de las medias. Recordar que se calcula como la raz cuadrada del cociente del cuadrado medio del error entre el numero de repeticiones. Por ser balanceado el experimento, este error estndar es el mismo para todas las medias de los tratamientos. 2. Obtener el valor critico del rango estudentizado de acuerdo al nivel de significancia (), numero de tratamientos (t) y grados de libertad en el error (), representado por q(, t, ). Este valor es obtenido de la tabla de rangos estudentizados que se localiza en los apndices de la mayora de los libros de diseo de experimentos. 3. 4. 5. Obtener el valor HSD (diferencia significativa honesta) como el producto del error estndar por el rango estdentizado. Calcular la diferencia entre todas las posibles parejas de medias de tratamientos. Declarar diferencia significativa entre las medias de los tratamientos cuando el valor absoluto de la diferencia sea estrictamente mayor que el valor del HSD. De otro modo, las medias de los tratamientos se declaran estadsticamente iguales. Para facilitar el calculo e interpretacin de las comparaciones, las medias se ordenan de menor a mayor; se arma una tabla de doble entrada donde el criterio de clasificacin tanto por hileras como por columnas van a ser las medias ordenadas de los tratamientos. En cada cuadro de la tabla se calcula la diferencia entre la media de hilera y la de columna, y se establece la decisin. Finalmente se hacen los grupos de medias iguales y sus interconexiones, a travs de superndices alfabticos o lneas verticales uniendo las medias de los tratamientos que corresponden a cada grupo. Cuando el experimento esta desbalanceado, entonces se
calcula

la media

armnica del nmero de repeticiones por tratamiento y esta se usa para

calcular el error estndar de las medias de los tratamientos. La media armnica del numero de repeticiones se calcula por rh = t/i(1/ri) Ejemplo numrico 4. Llevar a cabo el procedimiento de la prueba honesta de Tukey en los datos del ejemplo numerico2, referente a las marcas de lubricantes. A continuacin se muestra una tabla con la media y varianza de cada uno de los tratamientos.
Grupos A B C Cuenta 8 8 8 Suma 74.8 91.4 133.7 Promedio Varianza 9.35 12.8542857 11.425 9.53642857 16.7125 17.1526786

Llevando a cabo el procedimiento de la prueba honesta de Tukey, encontramos: 1. Error estndar de las medias de tratamiento = 1.2836 2. Rango estudentizado = q(.05,3,21) = 3.58 3. HSD(.05,3) = 4.5953 4. Parejas de medias: A=74.8 B=91.4 C=133-7 A=74.8 A-A=0 B-A=16.6 * C-A=58.9 * B=91.4 B-B=0 C-B=42.3 * C=133.7 C-C=0 Conclusin: Estadsticamente las tres medias son diferentes entre si, por lo que la seleccin optima del lubricante esta basada en aquella que genera el menor desgaste de piezas de la maquinaria; de esta manera se seleccionara el lubricante A. Contrastes ortogonales: Un contraste en estadstica es una combinacin lineal de las medias de los tratamientos definida por la suma de productos de las medias de tratamiento por un coeficiente. Estos coeficientes deben cumplir con la caracterstica de que su suma es igual a cero, de tal manera que para algunas medias sus coeficientes asociados son positivos y para otras son negativos. Las reglas de asignacin de los coeficientes va a depender de la tendencia que se desee encontrar o de la comparacin de medias que se

desee hacer. Cada contraste tendr asociado un grado de libertad, debido a que la comparacin que se lleva a cabo es entre dos grupos de tratamientos, lo que llevan el signo positivo contra los que llevan el signo negativo. De esta manera el numero de posibles contrastes ortogonales en un conjunto de datos corresponde exactamente a los grados de libertad para los tratamientos. Dos contrastes sern ortogonales si la suma de los productos de sus correspondientes coeficientes es igual a cero. Esto implica que la covarianza entre los dos contrastes es igual a cero, y por lo tanto los contrastes van a ser independientes. En este sentido la ortogonalidad implica independencia. Si todos los contrastes formulados son ortogonales entre si, entonces esto llevara a que la suma de cuadrados acumulada en todos los contrastes ortogonales corresponda exactamente a la suma de cuadrados de los tratamientos. La suma de cuadrados asociada a un contraste se calcula por el cuadrado de la combinacin lineal de las medias multiplicada por el numero de repeticiones y dividida por la suma de los cuadrados de los coeficientes de la combinacin lineal. Esta suma de cuadraos siempre lleva asociada un solo grado de libertad. Si se aplican contrastes no ortogonales, entonces existir covarianza entre ellos y esto implica que la informacin contenida en ellos esta relacionada en un cierto grado, con lo cual se considera que la informacin contenida en los datos esta siendo sobreutilizada. Esto se va a reflejar en el hecho de que el acumulado de la suma de cuadrados de los contrastes no ortogonales no cerrara a la suma de cuadrados de los tratamientos. Contrastes ortogonales para el calculo de tendencias: Los contrastes ortogonales pueden ser usados para estimar las sumas de cuadrados asociadas a los diferentes componentes de un modelo polinomial, siempre y cuando los datos experimentales tengan las siguientes dos caractersticas: 1. Experimento balanceado, lo que es un requisito general para aplicar contrastes. 2. Los niveles del factor deben estar igualmente espaciados Si alguna de estas caractersticas no se da en el conjunto de datos, se recomienda aplicar la tcnica de la regresin para llevar a cabo la

separacin de la suma de cuadrados de tratamientos en las diferentes tendencias. La siguiente tabla muestra los coeficientes de las combinaciones lineales para cada una de las diferentes tendencias que se pueden ajustar a un conjunto de datos de acuerdo al nmero de niveles del factor. Los coeficientes estn en orden creciente del factor.
Numero Trats 2 3 4 Primer Nivel -1 -1 1 -3 1 -1 -2 2 -1 1 Segndo Nivel 1 0 -2 -1 -1 3 -1 -1 2 -4 Tercer Nivel 1 1 1 -1 -3 0 -2 0 6 Cuarto Nivel

Tendencia Lineal Lineal Cuadrtica Lineal Cuadrtica Cbica Lineal Cuadrtica Cbica Cuarto

Quinto Nivel

3 1 1 1 -1 -2 -4

2 2 1 1

Ejemplo numrico 5. Aplicar contrastes ortogonales al ejemplo numrico 1. Vamos a llevar a cabo los clculos en Excel y mostrarlos en la siguiente tabla. Como puede ser observado los niveles se acomodan en orden creciente y as tambin las medias por nivel. De la tabla de coeficientes se seleccionan los correspondientes a 4 tratamientos.
Nivel medias Lineal Cuadrtica Cbica Contr Lin Contr Cuadr Contr Cubico 150 77.4333333 -3 1 -1 -232.3 77.4333333 77.4333333 200 250 300 84.1 89.2666667 95.1333333 -1 1 3 -1 -1 1 3 -3 1 -84.1 89.2666667 285.4 58.2666667 -84.1 89.2666667 95.1333333 -0.8 252.3 -267.8 95.1333333 2.2

En la tabla estn contenidos los clculos del coeficiente por la media y en la ultima columna su correspondiente suma. A partir de estos clculos podemos determinar la suma de cuadrados correspondientes a cada uno de los contrastes: Para la tendencia lineal: S.C.Tend. Lineal = 3*(58.2666667) 2/20 = 509.250667 Para la tendencia cuadrtica: S.C.Tend Cuadr = 3*(-0.8) 2/4 = 0.48

Para la tendencia Cbica: S.C.Tend Cubica = 3*(2.2) 2/20 = 0.726 Como puede ser comprobado, las sumas de cuadros para la tendencia lineal coincide con la suma de cuadrados de la regresin lineal, y el acumulado de la suma de cuadrados de la regresin cuadrtica y cbica coincide con la suma de cuadrados de la falta de ajuste. Se pudiera hacer el cuestionamiento acerca de la importancia de tener diferentes mtodos para realizar un mismo calculo. Aparte de la simplicidad de los contrastes, otra gran ventaja es que puede ser utilizado para analizar los arreglos factoriales de tratamientos que se vern posteriormente. Mediante la tcnica de contrastes ortogonales van a poder ser separadas las sumas de cuadrados en componentes con un solo grado de libertad, sin importar la naturaleza de los factores que se estn investigando. Contrastes ortogonales para comparacin de medias: Para factores

cualitativos, la aplicacin de los contrastes ortogonales es mas especifica para cada problema. Se requiere de un conocimiento mas o menos profundo de lo que son los tratamientos para poderlos agrupar. La idea de los contrastes para factores cualitativos es ir formando dos grupos de comparacin, cada uno de los cuales va estar formado por uno o ms tratamientos con alguna caracterstica comn. Cada uno de los grupos se irn separando en otros dos grupos de comparacin, en base a otra caracterstica de los tratamientos, y este proceso continuara hasta que al final los contrastes comparen un tratamiento contra otro. Ejemplo de aplicacin conceptual 1: Suponga que se esta llevando a cabo una investigacin para seleccionar un ingrediente proteico en la elaboracin de un alimento para mascotas. Se prueban tres fuentes de protena: Carne de res, carne de cerdo y soya. Lleve a cabo la comparacin de los tratamientos por contrastes ortogonales: Los contrastes ortogonales que pueden planearse para estas tres fuentes son: 1. 2. Protena de origen animal (cerdo y res) contra protena de origen vegetal (soya). Protena de origen animal (res) contra protena de origen animal (cerdo).

Ejemplo de aplicacin conceptual 2: Supngase que se esta llevando a cabo una investigacin en la que se desea evaluar diferentes fuentes de carnes no convencionales en la elaboracin de un producto carnico de bajo costo. El producto tradicional se elabora con carne de cerdo, y se desea investigar fuentes no convencionales que incluyen: Caballo, burro, gallina y pavo. Planear las comparaciones demedias por contrastes ortogonales. Los contrastes ortogonales que pueden planearse para estos tratamientos son: 1. 2. 3. 4. Testigo (cerdo) contra el promedio de los tratamientos (caballo, burro, gallina y pavo). Carnes de mamferos (caballo y burro) contra carnes de aves (gallina y pavo). Caballo contra burro. Gallina contra pavo.

Una vez que los contrastes ortogonales han sido planeados, debemos checar el requisito de que el experimento este balanceado, y si es as debemos obtener los coeficientes para cada uno de los contrastes. La mecnica para el calculo de los coeficientes es la siguiente: 1. Los coeficientes de un grupo llevaran signo positivo y los del grupo contrastante llevaran signo negativo. Esta es una seleccin completamente arbitraria. 2. El valor del coeficiente de un grupo ser igual al numero de tratamientos que tiene el grupo contrastante. Ejemplo numrico 6. Analice el ejemplo numrico 2 usando contrastes ortogonales. El ejemplo de los lubricantes y desgaste de las piezas consiste de tres tratamientos, cada uno con 8 repeticiones. El A y B son lubricantes nuevos y disponibles que se pueden usar en el proceso, y el lubricante C que es el que convencionalmente se utiliza en el proceso. Entonces podemos generar los siguientes contrastes con sus coeficientes y clculos requeridos para determinar las pruebas de significancia:
Lubricante Media C vs (A B) A vs. B C vs (A B) A 9.35 1 1 9.35 B 11.425 1 -1 11.425 C 16.7125 Suma -2 -12.65 0 -2.075 -33.425

A vs. B

9.35

-11.425

A partir de las cantidades en la tabla podemos calcular las sumas de cuadrados correspondientes a cada contraste: Contraste convencional vs. Nuevas alternativas: S.C. = 8*(-12.65)2/6 = 213.3633 Contraste alternativa A vs. Alternativa B: S.C. = 8*(-2.075)2/2 = 17.2225 Estas sumas de cuadrados pueden ser agregadas a la tabla de anlisis de varianza para completar las pruebas de significancia:
ANLISIS DE VARIANZA Origen de las variaciones Entre grupos C vs. A B A vs. B Dentro de los grupos Total Suma de cuadrados 230.585833 213.363333 17.222500 276.80375 507.389583 Grados de libertad 2 1 1 21 23 Promedio de los cuadrados F 115.292917 8.74681521 213.363333 16.1872773 17.222500 1.3066026 13.181131

El valor de P para el contraste C vs. A B resulto en 0.00061447 que es menor del 0.05, por lo que se concluye que este contraste es significativo, es decir, existe diferencia entre el lubricante convencional y las nuevas alternativas. El valor de P para el contraste C vs. A B resulto en 0.26587522 que es mayor del 0.05, por lo que se concluye que este contraste no es significativo, es decir, no existe diferencia entre el lubricante las nuevas alternativas. Para la seleccin del aceite entre las nuevas alternativas, se requiere de un criterio adicional, pues en cuanto a la variable medida, el desgaste de las piezas, no existe una diferencia. El criterio adicional puede ser el econmico, ecolgico, o algn otro en el que uno de ellos tuviera ventaja. DISEO EN BLOQUES COMPLETOS AL AZAR Cuando las unidades experimentales no son homogneas en alguna de las variables identificadas como de impacto importante sobre la respuesta, o bien, las condiciones fsicas en que se lleva a cabo el experimento no son totalmente

uniformes, entonces se puede emplear un diseo en bloques para asegurar comparaciones mas justas entre los tratamientos. La idea de un bloque en diseo de experimentos se refiere a un conjunto de unidades experimentales que tienen valores muy similares en cuanto a la variable de bloqueo, o bien que estn bajo condiciones experimentales muy similares. Una variable de bloqueo es una caracterstica de las unidades experimentales o del ambiente fsico donde se lleva a cabo el experimento, que se ha identificado como de impacto importante en la variable de respuesta. Esto es, valores diferentes en la variable de bloqueo, tienen efecto sobre la variable de respuesta. Por esto, si no se controlan a travs del diseo de experimentos, puede enmascarar el efecto de los tratamientos. Una variable de bloqueo debe ser seleccionada de acuerdo al tipo de experimento que se este llevando a cabo y a las variables de respuesta que se estn evaluando. A menudo las unidades de equipo de prueba o maquinas son diferentes en sus caractersticas de operacin y constituyen un factor tpico que es necesario controlar. Lotes de materia prima, personas o tiempo son posibles fuentes de variacin que pueden ser controladas mediante un arreglo geomtrico en bloques al azar. Por ejemplo, si se desea evaluar las caractersticas organolpticas en pasta de manzana para pasteles, elaborados con diferentes edulcorantes; se debe considerar como variables importantes que las impactan, a la variedad de la manzana, el nivel de madurez del fruto, o inclusive la regin de donde se cosecho. Todas estas variables pudieran ser controladas como variables de bloqueo, para obtener una estimacin ms pura del efecto de los tratamientos. Una condicin que debe conservarse para que este diseo sea valido, es que no debe haber un efecto cruzado entre las variables de bloqueo y las variables de respuesta. Esto implica que el efecto de un tratamiento se modifica por los bloques de manera proporcional en todos los tratamientos. Esto permite identificar diferencias de tratamientos, independientemente del bloque. En un diseo en bloques completos al azar cada bloque generado debe contener un numero de unidades experimentales igual al numero de tratamientos, ya que cada bloque debe contener a todos los tratamientos. Los bloques en este diseo constituyen las repeticiones del experimento.

Para poder llevar a cabo el arreglo geomtrico en bloques al azar, es necesario conocer el valor de la variable de bloqueo en cada una de las unidades experimentales, para poder agruparlas en base a esta informacin y construir los bloques, que deben quedar con valores muy similares en la variable(s) de bloqueo. Es necesario tambin saber que la variable de bloqueo no tiene un efecto cruzado con la variable de respuesta que se esta evaluando, esto es, el valor de la variable de bloque no modifica el efecto de los tratamientos. Ventajas del diseo en bloques con respecto al diseo completamente al azar: 1. Con un agrupamiento efectivo, el diseo en bloques puede generar resultados sustancialmente mas precisos de los que arrojara un diseo completamente al azar de tamao comparable. En otras palabras, el error experimental se puede controlar a niveles mas bajos con el diseo en bloques. 2. La variabilidad de las unidades experimentales, o de las condiciones fsicas donde se lleva a cabo el experimento, puede ser deliberadamente introducida para ampliar el rango de validez de los resultados experimentales sin sacrificar precisin. Desventajas del diseo en bloques comparado con el diseo completamente al azar: 1. Los grados de libertad para el error experimental no son tan grandes como en un diseo completamente al azar. Un grado de libertad es perdido para cada bloque despus del primero. 2. Mas suposiciones son requeridas para el modelo (varianza constante de bloque a bloque y no efecto cruzado de bloque y tratamiento) que para un diseo completamente al azar. Aleatorizacion: Una vez que los bloques han sido formados, con unidades experimentales lo mas parecido posible en cuanto a la variable de bloqueo, cada bloque se considera como un grupo muy homogneo de unidades experimentales, pero con un alto grado de variacin entre bloques. La forma de asignar tratamientos a las unidades experimentales es al azar e independientemente dentro de cada bloque.

Modelo estadstico: El modelo completo de un diseo en bloques al azar contiene los efectos de tratamiento (como en el completamente al azar) y el de los bloques, dado por Yij = + i + j + ij I=1,2,,t; j=1,2,,b Yij Es la variable de repuesta en el bloque j y el tratamiento i. Es la media general del experimento. i Es el efecto del tratamiento i. j Es el efecto del bloque j. ij es el error experimental en el bloque j y el tratamiento i. Hiptesis del investigador: La hiptesis que se desea probar bajo este arreglo experimental es: Ho: No hay efecto de tratamientos (i = 0 para toda i). Ha: al menos un efecto de tratamiento es diferente de cero. En relacin al efecto de los bloques, debemos ser claros de que no se deseaba investigar su efecto, solo se empleo como una forma de controlar la variabilidad en las unidades experimentales, con la finalidad de hacer mas sensible el experimento, es decir, poder detectar efecto de tratamientos cuando verdaderamente existan. De esta manera, no se plantea una hiptesis asociada el efecto de los bloques. Tampoco es posible probarla, ya que prcticamente no se tienen repeticiones de bloques. Cabe hacer mencin que si se tuvieran repeticiones de bloques, entonces el experimento dejara de ser bloques para convertirse en un arreglo de tratamientos factorial, y en este caso la variable de bloqueo ya pasara a ser un factor. ANOVA en el diseo en bloques al azar: El anlisis de varianza en un diseo en bloques al azar debe incluir las fuentes de variacin de tratamientos y la fuente de variacin de bloques, adems del error y total. Debe considerarse las restricciones en los parmetros, dadas por: 1. 2. Para los efectos de tratamientos: i = 0 Para los efectos de los bloques: j = 0

El arreglo en un diseo en bloques completos al azar y que no tenga datos perdidos, siempre tendr un numero de observaciones igual al producto del

numero de bloques por el numero de tratamientos (n = t b). Entonces el anova se construye como Fuente de variacin Bloques Tratamientos Error Total Grados de libertad b-1 t-1 (t-1)(b-1) n-1 Suma de cuadrados Diferencia (1) Diferencia (2). S.C.E. modelo completo S.C.E. modelo reducido

Los paquetes estadsticos en general reportan dos tipos de sumas de cuadrados en un anova, denominadas las secuenciales y las ajustadas. Estos nombres hacen referencia a la forma en que cada una es calculada. En el caso de las secuenciales, son calculadas mediante la diferencia en sumas de cuadrados de los errores de modelos conteniendo trminos adicionales, empezando con el modelo reducido y hasta llegar al modelo completo. As para un diseo en bloques al azar la secuencia de modelos serian: 1. 2. 3. Yij = + ij Yij = + j + ij Yij = + i + j + ij

La suma de cuadrados secuencial para bloques seria la suma de cuadrados del error en el modelo (1) menos la suma de cuadrados del error en el modelo (2). La suma de cuadrados secuencial para tratamientos seria la suma de cuadrados del error en el modelo (2) menos la suma de cuadrados del error en el modelo (3). En estas sumas de cuadrados, la de tratamientos seria ajustada por la presencia de los bloques, ya que se calculo como la diferencia con respecto a un modelo conteniendo el efecto de los bloques. Los modelos requeridos para el calculo de las sumas de cuadrados ajustadas serian: 1. 2. 3. 4. Yij = + ij Yij = + j + ij Yij = + i + ij Yij = + i + j + ij

La suma de cuadrados ajustada por efecto de los tratamientos se calcula por la diferencia en la suma de cuadrados de los errores del modelo 3 menos la suma

de cuadrados del error del modelo 4. La suma de cuadrados ajustada para los efectos de tratamiento se calculara por la diferencia en las sumas de cuadrados de los errores del modelo (2) menos la del modelo (4). Cuando el diseo esta balanceado estas sumas de cuadrados coinciden. Las diferencias se presentan cuando el diseo esta desbalanceado, y en este caso se deben considerar para la prueba de hiptesis las sumas de cuadrados ajustadas. Ejemplos Numricos. 1. Una compaa constructora desea probar la eficiencia de 3 tipos de aislantes diferentes. Ya que el rea sobre la que la compaa construye se caracteriza por diferencias importantes en el clima, la compaa ha dividido, en base a esta caracterstica, el rea en 4 regiones geogrficas. Dentro de cada regin geogrfica usa aleatoriamente cada uno de los tres aislantes y registra la perdida de energa como un ndice. Valores mas pequeos del ndice corresponden a perdidas mas bajas de energa.
Aislante 1 2 3 R.G. 1 19.2 11.7 6.7 R.G. 2 12.8 6.4 2.9 R.G. 3 16.3 7.3 4.1 R.G. 4 12.5 6.2 2.8

La hiptesis que se desea probar es: Ho: No hay diferencias en el valor promedio del ndice de perdida de energa en los tres aislantes. ( Ho: i = 0 para toda i). Ha: Al menos el promedio del ndice de perdida de energa para uno de los aislantes es diferente (Ha: al menos una i 0). Una grafica para explorara las caractersticas de los datos es muy recomendable. En este caso conviene graficar las observaciones de los tres aislantes para cada regin por separado, para determinar si el efecto de los tratamientos es proporcional en todos los bloques.

Valores de perdida de energia


25

20

Perdida de energia

15 Aislante 1 Aislante 2 Aislante 3 10

0 R.G. 1 R.G. 2 Region Geografica R.G. 3 R.G. 4

Podemos observar el comportamiento muy homogneo de los aislantes en cada una de las regiones geogrficas, lo cual implica que no existe un efecto cruzado de regin con aislante, con lo que se cumple uno de los requisitos fundamentales para aplicar el diseo en bloques. Se puede observar que el aislante 1 es el de mayores perdidas de energa, seguido del aislante 2 y el de menor perdidas de energa es el aislante 3. El siguiente paso es llevar a cabo el anlisis de varianza para probar la hiptesis acerca del efecto de los tratamientos.
Origen de Promedio las Suma de Grados de de los Probabilida variaciones cuadrados libertad cuadrados F d Aislantes 253.595 2 126.7975 170.898914 5.1342E-06 Regiones 55.6358333 3 18.5452778 24.9955073 0.00086444 Error 4.45166667 6 0.74194444 Total 313.6825 11

El nivel de significancia para el efecto de los aislantes es 5.13E-6, que es un valor menor de 0.05 (P<.05) lo que conduce al rechazo de la hiptesis nula, por lo que se concluye que los tipos de aislantes tienen un impacto importante en la media de perdidas de energa.

El siguiente paso es detectar cuales son las diferencias entre los aislantes. Ya que nada es especificado acerca de la naturaleza de los aislantes, lo nico que procede es una comparacin de todas contra todas las medias, usando la prueba honesta de Tukey. Construimos primero las medias de la variable perdida de energa por aislante:
RESUMEN Aislante 1 Aislante 2 Aislante 3 Repeticione s 4 4 4 Suma 60.8 31.6 16.5 Promedio Varianza 15.2 10.0866667 7.9 6.64666667 4.125 3.29583333

Calculamos el error estndar de las medias: 0.4307 Valor de la tabla de rangos estudentizados, con 3 medias, 6 grados de libertad para el error y un nivel de significancia de 0.05: 4.34 Calculamos el valor de HSD: 1.8692 Enseguida, se construye la tabla de diferencias de medias: 4.125 (3) 7.9 (2) 7.9 (2) (2)-(3) = 3.775 * * Diferencia significativa (P<.05) De estos resultados se concluye que las 3 medias son estadsticamente diferentes, y por lo tanto, podemos hacer una seleccin del mejor aislante desde el punto de vista de la variable de inters, perdida de energa. Ya que el aislante tiene por objetivo la conservacin de la energa, el mejor es aquel en el que las perdidas son mnimas, por lo que tomamos la decisin de que el mejor aislante es el tipo 3. 2. En una industria yesera se desea mejorar la resistencia del yeso a las quebraduras. Para tal efecto se prueban dos aditivos orgnicos, uno denominado n y otro denominado p, cada uno a dos niveles, y adems un tratamiento testigo, que consiste en el uso de un producto convencional. La variable de inters es la resistencia a las quebraduras, que se mide a travs de la fuerza que debe aplicarse para quebrar el yeso ya instalado. El experimento es llevado a cabo en 5 diferentes zonas, caracterizadas por diferencias importantes en 15.2 (1) (1)-(3) = 11.075 * (1)-(2) = 7.3 *

temperatura y clima. Los datos colectados se muestran en la siguiente tabla:


Zona 1 Producto convencional 50n 100n 50n+75p 100n+75p 7.6 7.3 6.9 10.8 9.6 Zona 2 8.1 7.7 6 11.2 9.3 Zona 3 7.3 7.7 5.6 12 9 Zona 4 7.9 7.7 7.4 12.9 10.6 Zona 5 9.4 8.2 7 11.6 10.4

Como una etapa de exploracin de las caractersticas de los datos, conviene revisar una grafica que muestre como se comportaron las observaciones de acuerdo al bloque y tratamiento.
Resistencia por bloque y tratamiento
14

12

10

Resistencia

Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5

0 0 50n 100n Tratamientos 50n+75p 100n+75p

El patrn general de los bloques se mantiene en los diferentes tratamientos, tendiendo a sobresalir el bloque 4, seguido muy de cerca del bloque 5. En general los bloques 1,2 y 3 tienden a una menor respuesta. Se observa entonces muy poca posibilidad de un efecto cruzado entre bloque y tratamiento. Se procede como siguiente punto a probar la hiptesis nula de no efecto de los tratamientos, contra la alternativa de que al menos una media de los tratamientos es diferente. Para tal fin se muestra el anlisis de varianza-

Origen de Promedio las Suma de Grados de de los Probabilida variaciones cuadrados libertad cuadrados F d Tratamientos 80.0384 4 20.0096 66.1255783 9.5744E-10 Bloques 4.9544 4 1.2386 4.09319233 0.01796691 Error 4.8416 16 0.3026 Total 89.8344 24

Con un nivel de significancia de 9.57E-10 se rechaza la hiptesis nula y se concluye que si existe diferencia en la resistencia promedio por efecto de los tratamientos. Como siguiente punto es de importancia llegar a determinar cuales son las diferencias que pueden ser detectadas entre los tratamientos. Ya que se conoce la naturaleza de los tratamientos, pueden llevarse a cabo los contrastes ortogonales para separar las medias. Los cuatro contrastes que se recomiendan son: 1. 2. 3. 4. Testigo contra tratados. 50 de n contra 100 de n. 0 de p contra 75 de p. Efecto cruzado de n y p.

A continuacin se muestran las medias de los tratamientos y sus correspondientes coeficientes para cada uno de los contrastes:
Testigo vs 50n vs. Tratamiento Repeticiones Media tratados 100n 0 5 8.06 4 50n 5 7.72 -1 100n 5 6.58 -1 50n+75p 5 11.7 -1 100n+75p 5 9.78 -1 efecto 0 p vs. 75 p cruzado 0 0 -1 1 -1 -1 1 -1 1 1

0 -1 1 -1 1

El anlisis de varianza aumentado con los contrastes se muestra a continuacin:


Origen de Promedio las Suma de Grados de de los Probabilida variaciones cuadrados libertad cuadrados F d Tratamientos 80.0384 4 20.0096 66.1255783 9.5744E-10

Testigo vs. tratados 50 n vs. 100 n 0 p vs 75 p Efecto cruzado Bloques Error Total

3.1329 11.7045 64.4405 0.7605 4.9544 4.8416 89.8344

(1) (1) (1) (1) 4 16 24

3.1329 11.7045 64.4405

10.3532 38.6797 212.9560

0.00431 4.4895E-06 3.9922E-12

0.7605 2.5132 0.12858022 1.2386 4.09319233 0.01796691 0.3026

Interpretacin de los contrastes ortogonales: 1. Al no ser significativo el efecto cruzado de los aditivos n y p, podemos concluir que sus efectos son independientes, es decir, no hay interferencia de los aditivos en su modo de accin. 2. Hay diferencia significativa de 50 n vs. 100 n, por lo que podemos seleccionar el nivel que mas convenga de acuerdo a la variable de respuesta. Ya que el objetivo era mejorar la resistencia a las quebraduras del yeso, entonces, la variable de respuesta es del tipo mientras mas grande mejor, por lo que, revisando la medias marginal para cada uno de los niveles del aditivo n, podremos hacer la seleccin: En Cuanto a las medias marginales por n se obtiene 9.71 para el nivel 50 contra 8.18 para el nivel 100, por lo que para mejorar resistencia se selecciona el nivel 50 n. 3. Hay diferencia significativa de 0 p contra 75 p. De manea equivalente al procedimiento anterior, revisando las medias marginales podemos hacer la seleccin del nivel. Para el nivel 0 p la media marginal es 7.15 y para el nivel 75 p la media es 10.74, por lo que el nivel mas recomendable para mejorar resistencia es 75 p. 4. Por lo tanto la mejor combinacin de niveles de aditivos es 50 n y 75 p, cuya combinacin arroja una media de 11.7, que es precisamente la media mas alta de los tratamientos. 5. En este anlisis podemos hacer la separacin de la contribucin de cada uno de los aditivos, a la mejora de la resistencia. Para este fin vamos a simplificar los valores de los niveles en cada uno de los aditivos de la siguiente manera: (-1) ser el valor asociado al nivel bajo y (+1) ser el valor asociado al nivel alto. Estos valores son

seleccionados para simplificar clculos e interpretacin de los valores obtenidos. El cambio en promedios de la resistencia al cambiar del nivel bajo al nivel alto, esta dado por la diferencia en el promedio al nivel alto menos el promedio al nivel bajo. Para el aditivo n la diferencia as definida es -1.53, de tal manera, que el cambio por unidad convencional (al pasar de -1 a +1, 2 unidades de diferencia) es -0.765. Por eso al seleccionar el nivel (-1) el incremento en la respuesta promedio seria estimado en 0.765. De manera equivalente, para el aditivo p, la diferencia en los promedios de los niveles esta dada por 3.59 y el cambio por unidad de incremento en el aditivo p en unidades convencionales es de 1.795. Por eso, al seleccionar el nivel (+1) del aditivo p, el cambio en la respuesta promedio es de 1.795. Con este sencillo anlisis podemos evaluar el impacto independiente que tienen cada uno de los aditivos para mejorar la resistencia. Podemos concluir que el aditivo p es de mayor impacto en la mejora de la resistencia, para los niveles investigados. 6. El contraste del testigo contra el promedio de los tratados resulto ser significativo, con lo cual concluimos que el promedio de los tratados (8.945) es significativamente diferente del promedio del testigo (8.06). La diferencia 0.939 es la ganancia promedio por aplicacin de tratamientos. 3. El propsito de un experimento fue mejorar el valor nutricional de la paja de trigo como alimento para ovejas. Los tratamientos de la paja fueron: paja picada, paja molida, paja tratada con amonio y paja tratada con urea. Un grupo de 24 ovejas fue usado en el experimento. Se considero el peso inicial como variable de bloqueo para llevar a cabo una separacin en subgrupos de 4 animales mas homogneos. En cada uno de los 6 gripos se probaron las 4 dietasen orden aleatorio. Para cada una de las 24 ovejas fue medido el porcentaje de materia seca digerido. Los datos se muestran en la siguiente tabla:

paja picada paja molida tratada amonio tratada urea

bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 32.68 36.22 36.36 40.95 34.99 33.89 35.9 38.73 37.55 34.64 37.36 34.35 49.43 46.58 53.5 42.82 52.86 45.41 45 45.08 47.2 43.81 49.76 47.4

Una presentacin grafica de los datos por tratamiento y bloque es mostrada en la siguiente figura.
MATERIA SECA DIGERIDA
60

50

40 PORCENTAJE

30

paja picada paja molida tratada amonio tratada urea

20

10

0 bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6

Observe que la tendencia de los tratamientos se mantiene en todos los bloques, a excepcin del bloque 4, donde la materia seca digerida fue mayor en la paja picada con respecto a la paja molida y el amonio iguala a la urea. En este caso una prueba de aditividad en el modelo se hace necesaria para determinar si el modelo del diseo en bloques completos al azar es adecuado. 4. Se llevo a cabo un experimento bajo un diseo en bloques completos al azar para evaluar el efecto de diferentes espaciamientos de surcos (en pulgadas) en la siembra de frjol, sobre la produccin de paja (bushels por acre). Los resultados fueron los siguientes.
Bloque 1 Bloque 2 Bloque 3 Bloque 4 Espac 18 33.6 37.1 34.1 34.6 Espac 24 31.1 34.5 30.5 32.7 Espac 30 33 29.5 29.2 30.7 Espac 36 28.4 29.9 31.6 32.3 Espac 42 31.4 28.3 28.9 28.6

Bloque 5 Bloque 6

35.4 36.1

30.7 27.9

30.7 27.9

28.1 26.9

29.6 33.4

Una grafica exploratoria de los datos revelara el comportamiento de los tratamientos en cada uno de los bloques, como se muestra a continuacin:

Produccion por bloque


40

Bushels por acre

35

Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5

30

Bloque 6

25 15 20 25 30 Espaciamiento 35 40 45

Como puede ser observado, el comportamiento general en los bloques es a disminuir la produccin a medida que aumenta el espaciamiento. En los espaciamientos 30 y 42 sin embargo, en los bloques 1, 5 y 6 esta tendencia no se mantiene. En el espaciamiento 36 tampoco la tendencia general es observada en los bloques 2, 3 y 4. Por lo tanto, estos datos requieren tambin de la prueba de aditividad de Tukey antes de que puedan ser interpretados adecuadamente.

Prueba de aditividad de Tukey:

Idealmente, los bloques representan influencias que uno esperara que solo incrementaran o disminuyeran el nivel general de respuesta, es decir, constituiran un efecto puramente aditivo. Si los efectos de bloques y tratamientos no fueran aditivos, un efecto cruzado entre bloques y tratamientos ocurrira, lo cual es reflejado por un efecto diferencial de tratamiento por bloque. Esto significa, que para algunos tratamientos un bloque favoreciera la respuesta de inters, mientras que para otros bloques la respuesta seria favorecida para otros tratamientos. Estos efectos cruzados pueden ser clasificados como transformables y no transformables. Los transformables son aquellos que pueden ser eliminados mediante el anlisis, usando alguna transformacin de la variable de respuesta, por ejemplo, el logaritmo, raz cuadrada o reciproco de los datos originales. La segunda categora, los efectos cruzados no transformables, son aquellos que no pueden ser eliminados por el anlisis. Un grado de libertad para la no aditividad transformable: Una prueba formal para la no aditividad transformable basada en la deteccin de una relacin curvilnea entre los residuales despus de ajustar el modelo del diseo en bloques al azar y sus valores estimados, es debida a J- W. Tukey. El procedimiento consiste en: 1. Analizar la variable original yij bajo el modelo del diseo en bloques al azar. 2. Evaluar los valores estimados de la variable original bajo el modelo en bloques al azar. 3. Evaluar los residuales en la variable original del modelo que corresponde al diseo en bloques al azar: 4. Definir la variable qij como el cuadrado del valor estimado por el modelo del diseo en bloques al azar. 5. Analizar la variable qij bajo el modelo de diseo en bloques al azar. 6. Obtener los valores estimados y los residuales de la variable qij. 7. Defina P como la suma de los productos cruzados de los residuales. 8. Defina Q como la suma de los cuadrados de los residuales de la variable qij.

9. Un grado de libertad asociado al error en el anlisis de varianza de la variable (y) es sustrado para la prueba de aditividad, y su suma de cuadrados (suma de cuadrados de la regresin) asociada va a estar dada por el producto del cuadrado de (P) por (Q), que debe ser restada de la suma de cuadrados del error. 10. La hiptesis que se plantea es en trminos del coeficiente de regresin que cuantifica la relacin de la variable original con el cuadrado de los estimados bajo el modelo del diseo en bloques completos al azar, Ho: =0 contra la Ha: 0. La hiptesis se prueba con la estadstica F definida por el cociente del cuadrado medio de la regresin entre el cuadrado medio del residual. 11. Una decisin de no rechazar Ho conlleva a que el modelo del diseo en bloques al azar cumple con la suposicin de aditividad. Por otro lado el rechazo de Ho puede indicar la necesidad de transformar los datos para lograr que el modelo aditivo sea adecuado en los datos transformados. 5. Aplicacin de la prueba de aditividad al ejemplo 3 de tratamientos de paja. a). Ajuste del modelo del diseo en bloques al azar a la variable original, digestibilidad de materia seca.
Media de bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 trat 32.68 36.22 36.36 40.95 34.99 33.89 35.8483333 35.9 38.73 37.55 34.64 37.36 34.35 36.4216667 49.43 46.58 41.1475 53.5 42.82 42.8175 52.86 45.41 43.045 45 45.08 41.4175 47.2 43.81 40.84 49.76 49.625 47.4 45.1833333 41.35 41.7695833

paja picada paja molida tratada amonio tratada urea Media de blo

A partir de estas medias por bloque, por tratamiento y la media general podemos calcular los estimadores de los efectos de tratamiento: Efectos de tratamiento:
Media de trat 35.8483333 36.4216667 49.625 45.1833333 41.7695833 Media general Efecto de tratamiento 41.7695833 -5.92125 41.7695833 -5.34791667 41.7695833 7.85541667 41.7695833 3.41375 41.7695833 0

Efectos de bloque:

Media de blo 41.1475 42.8175 43.045 41.4175 40.84 41.35

Media general Efecto de bloque 41.7695833 -0.62208333 41.7695833 1.04791667 41.7695833 1.27541667 41.7695833 -0.35208333 41.7695833 -0.92958333 41.7695833 -0.41958333

Tabla de valores observados, estimados por el modelo y residuales.


Tratamiento bloque Paja Picada Paja Picada Paja Picada Paja Picada Paja Picada Paja Picada Paja Molida Paja Molida Paja Molida Paja Molida Paja Molida Paja Molida Paja con A Paja con A Paja con A Paja con A Paja con A Paja con A Paja con U Paja con U Paja con U Paja con U Paja con U Paja con U 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 observados Estimados Residuales 32.68 35.2262501 -2.54625007 36.22 36.8962501 -0.67625007 36.36 37.1237501 -0.76375007 40.95 35.4962501 5.45374993 34.99 34.9187501 0.07124993 33.89 35.4287501 -1.53875007 35.9 35.7995834 0.1004166 38.73 37.4695834 1.2604166 37.55 37.6970834 -0.1470834 34.64 36.0695834 -1.4295834 37.36 35.4920834 1.8679166 34.35 36.0020834 -1.6520834 49.43 49.0029167 0.42708327 53.5 50.6729167 2.82708327 52.86 50.9004167 1.95958327 45 49.2729167 -4.27291673 47.2 48.6954167 -1.49541673 49.76 49.2054167 0.55458327 46.58 44.5612501 2.01874993 42.82 46.2312501 -3.41125007 45.41 46.4587501 -1.04875007 45.08 44.8312501 0.24874993 43.81 44.2537501 -0.44375007 47.4 44.7637501 2.63624993

Tabla de anlisis de varianza para la variable (y):


Fuente de Variacion Tratamientos Bloques Error Total Suma de Grados de cuadrados libertad 822.136046 3 17.1037708 5 106.359679 15 945.599496 23 Valor Cuadrados Probabilida crtico para Medios F d F 274.045349 38.6488589 2.6922E-07 3.28738211 3.42075417 0.482432 0.7840427 2.90129454 7.09064528

b). Tabla de valores de la variable (q) y sus promedios:

paja picada paja molida tratada amonio tratada urea Media de blo

Media de bloque 1 bloque 2 bloque 3 bloque 4 bloque 5 bloque 6 trat 1240.88869 1361.33327 1378.17282 1259.98377 1219.31911 1255.19633 1285.81566 1281.61017 1403.96968 1421.0701 1301.01485 1259.68798 1296.15001 1327.25046 2401.28585 2567.74449 2590.85242 2427.82032 2371.24361 2421.17304 2463.35329 1985.70501 2137.32848 2158.41546 2009.84098 1958.39439 2003.79332 2042.24627 1727.37243 1867.59398 1887.1277 1749.66498 1702.16127 1744.07817 1779.66642

Estimacin de los efectos de tratamiento:


Tratamiento paja picada paja molida tratada amonio tratada urea Media de tra Media gral Efecto de tra 1285.81566 1779.66642 -493.850758 1327.25046 1779.66642 -452.415958 2463.35329 1779.66642 2042.24627 1779.66642 683.686866 262.579851

Estimacin de los efectos de bloque:


Bloque 1 2 3 4 5 6 Media de blo 1727.37243 1867.59398 1887.1277 1749.66498 1702.16127 1744.07817 Media gral Efecto de blo 1779.66642 -52.2939928 1779.66642 87.9275574 1779.66642 107.461276 1779.66642 -30.0014428 1779.66642 -77.5051491 1779.66642 -35.588249

Tabla de observados, estimados y residuales de la variable (q):

Tratamiento bloque Paja Picada Paja Picada Paja Picada Paja Picada Paja Picada Paja Picada Paja Molida Paja Molida Paja Molida Paja Molida Paja Molida Paja Molida Paja con A Paja con A Paja con A Paja con A Paja con A Paja con A Paja con U Paja con U Paja con U Paja con U Paja con U Paja con U

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

Observados 1240.88869 1361.33327 1378.17282 1259.98377 1219.31911 1255.19633 1281.61017 1403.96968 1421.0701 1301.01485 1259.68798 1296.15001 2401.28585 2567.74449 2590.85242 2427.82032 2371.24361 2421.17304 1985.70501 2137.32848 2158.41546 2009.84098 1958.39439 2003.79332

Estimados Residuales 1233.52167 7.36702187 1373.74322 -12.4099531 1393.27694 -15.1041219 1255.81422 4.16954687 1208.31052 11.0085906 1250.22742 4.96891563 1274.95647 6.65369965 1415.17802 -11.208342 1434.71174 -13.6416441 1297.24902 3.76582465 1249.74532 9.9426684 1291.66222 4.4877934 2411.0593 -9.77344757 2551.28085 16.4636441 2570.81456 20.0378587 2433.35185 -5.53152257 2385.84814 -14.6045288 2427.76504 -6.59200382 1989.95228 -4.24727396 2130.17383 7.15465104 2149.70755 8.70790729 2012.24483 -2.40384896 1964.74113 -6.34673021 2006.65803 -2.86470521

La suma de productos cruzados de los residuales esta dada por P = 87.3786269 Y la suma de cuadrados de los residuales en la variable (q) esta dada por Q = 2343.60442 El estimador del efecto curvilneo puede ahora ser calculado por = 0.03728 y su suma de cuadrados asociada con un grado de libertad es: S.C.R. = 3.2574 La suma de cuadrados del error con 14 grados de libertad en la variable (y) es 106.359679-3.2574 = 103.102279 Y su correspondiente cuadrado medio 7.3644 Por esto la prueba de F para aditividad esta dada por F = 0.4423

Que se distribuye como una F con 1 y 14 grados de libertad. Por lo tanto, con este valor de la F no se rechaza Ho y se concluye que no existe suficiente evidencia acerca de un efecto cruzado entre bloques y tratamientos. As, podemos tomar la decisin de que el modelo del diseo en bloques al azar es adecuado para la variable (y) digestibilidad de materia seca. Siguiendo con el anlisis de la variable (y), al detectar un efecto significativo de tratamientos y conocer la naturaleza de los tratamientos, podemos identificar las comparaciones de inters y llevarlas a cabo por el mtodo de contrastes ortogonales. Los contrastes de inters son: Tratamientos fsicos contra tratamientos qumicos. Paja picada contra paja molida. Paja tratada con urea contra paja tratada con amonio. La tabla siguiente muestra los coeficientes de los contrastes:
Tratamiento paja picada paja molida tratada amonio tratada urea picada vs amonio vs Repeticiones Media fis vs quim molida urea 6 35.8483333 -1 -1 0 6 36.4216667 -1 1 0 6 49.625 6 45.1833333 1 1 0 0 -1 1

La tabla de anova con los contrastes integrados es mostrada a continuacin:


Fuente de Variacion Tratamientos Fis vs quim Picada vs molida Urea vs amonio Bloques Error Total Valor Suma de Grados de Cuadrados Probabilida crtico para cuadrados libertad Medios F d F 822.136046 3 274.045349 38.6488589 2.6922E-07 3.28738211 761.964704 (1) 761.964704 111.6922 2.4027E-08 4.54307712 0.98613333 59.1852083 17.1037708 106.359679 945.599496 (1) 0.98613333 (1) 59.1852083 5 3.42075417 15 7.09064528 23 0.139076 0.71441849 4.54307712 0.0112399 8.347 5 4.54307712 0.482432 0.7840427 2.90129454

La diferencia detectada como significativa corresponde al contraste urea contra amonio, lo cual significa que existe diferencia estadstica entre el promedio de digestibilidad de la paja tratada con urea (45.1833333) y la paja tratada con

amonio (49.625), por lo que si la digestibilidad se desea que se incremente, entonces debe proporcionarse a las ovejas la paja tratada con amonio. 6. Aplicacin de la prueba de aditividad al ejemplo 4. a). Ajuste del modelo del diseo en bloques al azar a la variable original:
Medias de 42 bloques 31.4 31.5 28.3 31.86 28.9 30.86 28.6 31.78 29.6 30.9 33.4 30.44

1 2 3 4 5 6 Medias de tratamiento Efs. De trat

18 33.6 37.1 34.1 34.6 35.4 36.1

24 31.1 34.5 30.5 32.7 30.7 27.9

30 33 29.5 29.2 30.7 30.7 27.9

36 28.4 29.9 31.6 32.3 28.1 26.9

Efs. De bloq 0.27666667 0.63666667 -0.36333333 0.55666667 -0.32333333 -0.78333333

35.15 31.2333333 30.1666667 29.5333333 30.0333333 31.2233333 3.92666667 0.01 1.05666667 -1.69 -1.19

Valores estimados, predichos y residuales en la variable y:


bloque Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 trat obs media gral efe trat efe bloque estimado residual 18 33.6 31.22333333 3.92666667 0.27666667 35.4266667 -1.82666667 18 37.1 31.22333333 3.92666667 0.63666667 35.7866667 1.31333333 18 34.1 31.22333333 3.92666667 -0.36333333 34.7866667 -0.68666667 18 34.6 31.22333333 3.92666667 0.55666667 35.7066667 -1.10666667 18 35.4 31.22333333 3.92666667 -0.32333333 34.8266667 0.57333333 18 36.1 31.22333333 3.92666667 -0.78333333 34.3666667 1.73333333 24 31.1 31.22333333 0.01000000 0.27666667 31.51 -0.41000001 24 34.5 31.22333333 0.01000000 0.63666667 31.87 2.62999999 24 30.5 31.22333333 0.01000000 -0.36333333 30.87 -0.37000001 24 32.7 31.22333333 0.01000000 0.55666667 31.79 0.90999999 24 30.7 31.22333333 0.01000000 -0.32333333 30.91 -0.21000001 24 27.9 31.22333333 0.01000000 -0.78333333 30.45 -2.55000001 30 33 31.22333333 -1.05666666 0.27666667 30.4433333 2.55666666 30 29.5 31.22333333 -1.05666666 0.63666667 30.8033333 -1.30333334 30 29.2 31.22333333 -1.05666666 -0.36333333 29.8033333 -0.60333334 30 30.7 31.22333333 -1.05666666 0.55666667 30.7233333 -0.02333334 30 30.7 31.22333333 -1.05666666 -0.32333333 29.8433333 0.85666666 30 27.9 31.22333333 -1.05666666 -0.78333333 29.3833333 -1.48333334 36 28.4 31.22333333 -1.69000000 0.27666667 29.81 -1.41000001 36 29.9 31.22333333 -1.69000000 0.63666667 30.17 -0.27000001 36 31.6 31.22333333 -1.69000000 -0.36333333 29.17 2.42999999 36 32.3 31.22333333 -1.69000000 0.55666667 30.09 2.20999999 36 28.1 31.22333333 -1.69000000 -0.32333333 29.21 -1.11000001 36 26.9 31.22333333 -1.69000000 -0.78333333 28.75 -1.85000001 42 31.4 31.22333333 -1.19000000 0.27666667 30.31 1.08999999 42 28.3 31.22333333 -1.19000000 0.63666667 30.67 -2.37000001 42 28.9 31.22333333 -1.19000000 -0.36333333 29.67 -0.77000001 42 28.6 31.22333333 -1.19000000 0.55666667 30.59 -1.99000001 42 29.6 31.22333333 -1.19000000 -0.32333333 29.71 -0.11000001

Bloque 6

42

33.4

31.22333333

-1.19000000

-0.78333333

29.25

4.14999999

b). Ajuste del modelo del diseo en bloques al azar en la variable q:


bloque Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 18 1255.04871 1280.68551 1210.11218 1274.96604 1212.89671 24 30 992.8801 926.796545 1015.6969 948.845345 952.9569 888.238678 1010.6041 943.923212 955.4281 890.624545 36 888.6361 910.2289 850.8889 905.4081 853.2241 ef de 42 medias blo bloque 918.6961 996.411512 17.0797995 940.6489 1019.22111 39.8893995 880.3089 956.501112 22.8306005 935.7481 1014.12991 34.7981995 882.6841 958.971512 20.3602005 855.5625 930.755112 48.5766005 902.274767 979.331712 77.0569449

1181.06778 927.2025 863.380278 826.5625 1235.79616 975.794767 910.301434 872.491434 256.464444 3.53694492 69.0302783 106.840278

Valores observados, estimados y residuales en la variable q:


bloque Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6 trat q observada media gral ef de bloue ef de trat estim de q residual 18 1255.04871 979.331712 17.0797995 256.464444 1252.87596 2.1727565 18 1280.68551 979.331712 39.8893995 256.464444 1275.68556 4.9999565 18 1210.11218 979.331712 -22.8306005 256.464444 1212.96556 2.85337683 18 1274.96604 979.331712 34.7981995 256.464444 1270.59436 4.37168983 18 1212.89671 979.331712 -20.3602005 256.464444 1215.43596 -2.5392435 18 1181.06778 979.331712 -48.5766005 256.464444 1187.21956 6.15177683 24 992.8801 979.331712 17.0797995 -3.53694492 992.874566 0.00553428 24 1015.6969 979.331712 39.8893995 -3.53694492 1015.68417 0.01273428 24 952.9569 979.331712 -22.8306005 -3.53694492 952.964166 0.00726572 24 1010.6041 979.331712 34.7981995 -3.53694492 1010.59297 0.01113428 24 955.4281 979.331712 -20.3602005 -3.53694492 955.434566 0.00646572 24 927.2025 979.331712 -48.5766005 -3.53694492 927.218166 0.01566572 30 926.796545 979.331712 17.0797995 -69.0302783 927.381233 0.58468794 30 948.845345 979.331712 39.8893995 -69.0302783 950.190833 1.34548794 30 888.238678 979.331712 -22.8306005 -69.0302783 887.470833 0.76784539 30 943.923212 979.331712 34.7981995 -69.0302783 945.099633 1.17642128 30 890.624545 979.331712 -20.3602005 -69.0302783 889.941233 0.68331206 30 863.380278 979.331712 -48.5766005 -69.0302783 861.724833 1.65544539 36 888.6361 979.331712 17.0797995 -106.840278 889.571233 0.93513239 36 910.2289 979.331712 39.8893995 -106.840278 912.380833 2.15193239 36 850.8889 979.331712 -22.8306005 -106.840278 849.660833 1.22806761 36 905.4081 979.331712 34.7981995 -106.840278 907.289633 1.88153239 36 853.2241 979.331712 -20.3602005 -106.840278 852.131233 1.09286761 36 826.5625 979.331712 -48.5766005 -106.840278 823.914833 2.64766761

Bloque 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6

42 42 42 42 42 42

918.6961 979.331712 940.6489 979.331712 880.3089 979.331712 935.7481 979.331712 882.6841 979.331712 855.5625 979.331712

17.0797995 39.8893995 -22.8306005 34.7981995 -20.3602005 -48.5766005

-77.0569449 919.354566 0.65846572 -77.0569449 942.164166 1.51526572 -77.0569449 879.444166 0.86473428 -77.0569449 937.072966 1.32486572 -77.0569449 881.914566 0.76953428 -77.0569449 853.698166 1.86433428

c). Obtener los valores P y Q a partir de los residuales encontrados: P = -7.25106222 Q = 136.658476 d). Obtener el estimador del efecto curvilneo y su suma de cuadrados asociada: Beta = -0.053059 S.C.R. = 0.38474 e). Prueba de aditividad de Tukey: F = 0.38474/81.933927 =0.0047 con 1 grado de libertad en el numerador y 19 grados de libertad en el denominador, por lo que se toma la decisin de no rechazar la hiptesis nula, concluyndose entonces que el modelo de bloques al azar es apropiados a este conjunto de observaciones. Continuando entonces con el anlisis, establecemos las tendencias lineal y cuadrtica en el anova de la variable original:
Fuente variacion Bloques Tratamiento s T. Lineal T.Cuadratica T. Cbica T. Cuarto Error Total Valor Probabilida crtico para C.M. F d F 5 1.64193333 0.39892127 0.84373767 2.71088984 4 31.2113333 85.4426667 36.8019048 1.76816667 0.83259524 20 4.11593333 29 7.58305123 20.7590016 8.94132674 0.4295907 0.20228589 0.00068956 0.00019193 0.00723358 0.51965862 0.65771869 2.8660814 4.3512435 4.3512435 4.3512435 4.3512435

S.C. 8.20966667 124.845333 85.4426667 36.8019048 1.76816667 0.83259524 82.3186667 215.373667 1 1 1 1

G.L.

Las tendencias que resultan ser significativas son la lineal y la cuadrtica, por lo que se puede concluir que un modelo polinomial de segundo orden se ajusta adecuadamente a este conjunto de observaciones.

Variable X Curva de regresin ajustada


38 36 34 32 30 Y 28 26 24 22 20 15 25 Variable X 35 45 Y Pronstico para Y

Los coeficientes de la ecuacin ajustada son:


Intercepcin Variable X Variable X^2 Coeficientes 52.4138 -1.30206 0.01838 Error tpico 4.82431978 0.34008611 0.00562884

Bajo este modelo estimado podemos determinar el nivel exacto de espaciamiento en el cual se logra una produccin mnima de paja, con el siguiente procedimiento: 1. 2. 3. 1. 2. 3. Derivar la variable y ajustada con respecto a la variable x: Igualar a cero la derivada. Despejar la variable x. dy/dx = -1.30206 +2*(0.01838)x -1.30206 + 0.03676x =0 x = 35.42 pulgadas de espaciamiento.

Aplicando el procedimiento, se obtiene:

Con una produccin mnima estimada en 29.354.

DISEO EN CUADRO LATINO El diseo en cuadro latino es una generalizacin del diseo en bloques al azar, consistente en que las variables de bloqueo usadas en el diseo son dos, llamadas genricamente la variable de hileras y la variable de columnas. El nombre de este arreglo geomtrico es debido a que el numero de niveles en las variable de hileras es igual al numero de niveles en la variable de columnas y es igual al numero de tratamientos, estos ultimos son denotados por letras latinas dentro de las celdas del cuadrado que forman las hileras y las columnas. Una restriccin en la aleatorizacion de este arreglo geomtrico es que cada letra correspondiente a uno de los tratamientos solo debe aparecer una vez en cada hilera y en cada columna. El procedimiento de aleatorizacion en este arreglo geomtrico consiste de los siguientes pasos: 1. Empezar con la construccin de un cuadro latino estndar. la primera hilera y primera columna. 2. 3. Aleatorizar las hileras para generar un segundo cuadro. Aleatorizar las columnas del segundo cuadro para definir el cuadro que va ser utilizado en el experimento. Apliquemos el procedimiento de aleatorizacion a un cuadro latino de dimension 44: 1. Cuadro latino estndar: Hilera 1 Hilera 2 Hilera 3 Hilera 4 Columna 1 A B C D Columna 2 B C D A Columna 3 C D A B Columna 4 D A B C Este cuadro se caracteriza por el orden alfabtico de las letras a partir de

2. Aleatorizar hileras: Para este fin se pueden obtener cuatro nmeros aleatorios que se asignan en secuencia de generacion a las hileras ordenadas en el cuadro latino estndar. En seguida los nmeros aleatorios se ordenan en magnitud, indicando as el orden aleatorio en que deben estar las hileras. Usando el generador de nmeros aleatorios disponible en Excel, los nmeros aleatorios generados son:

Numero Aleatorio 0.08060046 0.09297599 0.61098286 0.47095288

Orden Actual de Hileras 1 2 3 4

Orden Aleatorio de Hileras 1 2 4 3

As el nuevo cuadro, con hileras aleatorizadas debe ser Hilera 1 Hilera 2 Hilera 3 Hilera 4 Columna 1 A B D C Columna 2 B C A D Columna 3 C D B A Columna 4 D A C B

3. Aleatorizar columnas: Este paso se lleva a cabo de manera equivalente a las hileras, solo que en este caso aplicado a columnas:
Numero Aleatorio 0.4209566 0.41984865 0.90356138 0.88228072 Orden Actual de columna 1 2 3 4 Orden aleatorio de Columna 2 1 4 3

Por lo que el nuevo cuadro ser: Hilera 1 Hilera 2 Hilera 3 Hilera 4 Columna 1 B C A D Columna 2 A B D C Columna 3 D A C B Columna 4 C D B A

Este seria el cuadro latino que debe usarse como arreglo geomtrico del diseo experimental. Las letras pueden tambin ser asignadas al azar a los tratamientos.

MODELO ESTADSTICO DEL DISEO EN CUADRTO LATINO: Aparte de los tratamientos, este arreglo geomtrico debe incorporar en el modelo las dos fuentes de bloqueo, las hileras y columnas. Para construir el modelo debemos considerar 3 subindices (i, j, k) que correspondan a cada una de las fuentes de variacin, pero el subndice de tratamiento queda

definido por los subndices de hilera y columna, lo que es generado por el hecho de que tratamiento este anidado a hilera y columna. Esta situacin es representada en el modelo como: Yijk = + k(ij) + i + j + ijk i = 1,2,,t ; j = 1,2,,t; k = 1,2,t t = numero de tratamientos. n = t2 , numero total de observaciones en el arreglo. Donde Es la media general de la poblacin. k(ij) Es el efecto del tratamiento k en la hilera i y columna j. i Es el efecto de la hilera i. j Es el efecto de la columna j. ijk Es el error experimental en la hilera i, columna j y tratamiento k. La hiptesis que se desea probar es solo acerca del efecto de los tratamientos, es decir: Ho: Todos los efectos de tratamiento son iguales a cero. Contra la Ha: al menos uno de los efectos de tratamiento es diferente de cero. Las variables de bloqueo incluidas en este arreglo son estrictamente, como en el arreglo en bloques, para el control de la variacin en las unidades experimentales o de las condiciones en que se lleva a cabo el experimento, pero no son de inters como factores de investigacin. El objetivo entonces de las variables de bloqueo sigue siendo eliminar posibles fuentes de variacin en el experimento que pudieran impactar sobre la variable de respuesta y enmascarar el efecto de los tratamientos. ANLISIS DE VARIANZA EN EL DISEO EN CUADRO LATINO: Como Lo establece el modelo del diseo en cuadro latino, se supone que los efectos son aditivos e independientes, por lo que para el anlisis establecemos las siguientes restricciones acerca de los parmetros del modelo: k(ij) = 0 i = 0

j= 0 Ya que el numero de niveles en cada fuente de variacin es t, entonces el numero de parmetros independientes que deben ser estimados por cada fuente de variacin es (t - 1), y as los grados de libertad son: Para el modelo reducido: t2 1 = (t + 1)(t - 1) Para el modelo completo: t2 1 - 3(t - 1)= t2 - 3(t )+2 = (t 1) (t 2) La estimacin de los parmetros del modelo es la que se ha venido identificando en los otros dos arreglos geomtricos: k(ij) = Media del tratamiento k Media General i = Media de la hilera i Media General. j = Media de la columna j Media General. La suma de cuadrados asociada al efecto de los tratamientos esta dada por: S.C.(tratamientos) = t 2k(ij) con ( t 1 ) grados de libertad. S.C. (hileras) = t 2i con ( t 1 ) grados de libertad. S.C. (columnas) = t 2j con ( t 1 )grados de libertad. La suma de cuadrados del total y sus grados de libertad asociados se obtienen del ajuste del modelo reducido, en tanto que la suma de cuadrados del residual y sus grados de libertad se obtienen del ajuste del modelo completo. El resto de la tabla de anlisis de varianza reobtiene de la manera convencional.
F.V. Modelo Hileras Columnas Tratamientos Error Total G.L. 3( t - 1 ) t-1 t-1 t-1 (t-1)(t-2) t^2 - 1 S.C. S.C.To - S.C.E t (S.C.(ef. Hilera)) t (S.C.(ef. Columna)) t (S.C. (ef. Tratamiento) S.C.E. Mod. Completo S.C.E. Mod. Reducido C.M. Fc Ft Pr > Fc

Ejemplo numrico 1. Se llevo a cabo un experimento en un diseo en cuadro latino en el que se deseaba comparar el efecto de 5 fuentes de fertilizacin nitrogenada y un testigo sobre la produccin de azucar de remolacha. Las fuentes a comparar fueron: A: Sulfato de amonio. B: Nitrato de amonio. C: Urea

D: Nitrato de calcio. E: Nitrato de sodio. F: Control, sin nitrogeno. Los resultados del experimento fueron:
H1 H2 H3 H4 H5 H6 c1 F=28.2 E=31.0 D=30.6 C=33.1 B=29.9 A=30.8 c2 D=29.1 B=29.5 E=28.8 A=30.4 F=25.8 C=29.7 c3 A=32.1 C=29.4 F=21.7 B=28.8 E=30.3 D=27.4 c4 B=33.1 F=24.8 C=30.8 D=31.4 A=30.3 E=29.1 c5 E=31.1 D=33.0 A=31.9 F=26.7 C=33.5 B=30.7 c6 C=32.4 A=30.6 B=30.1 E=31.9 D=32.3 F=21.4

Para llevar a cabo el anlisis de este conjunto de datos se aplica primeramente el anlisis de varianza y se anexa el siguiente conjunto de contrastes ortogonales: 1. Testigo vs. Tratados. 2. Organico vs. Inorganicos. 3. Sales de amonio vs. Sales de no amonio. 4. Sulfato de amonio vs. Nitrato de amonio. 5. Nitrato de calcio vs. Nitrato de sodio. Los resultados se muestran en la siguiente tabla:
F.V. Hileras Columnas Tratamientos Testigo vs. Tratados Organico Vs. Inorg Amoniac Vs. No Amoniac Sulfato vs. Nitrato (amoniac) Ca vs. Na (Nitratos) Error Total G.L. S.C. C.M. Fc 5 32.1880555 6.43761111 4.25549027 5 33.6680556 6.73361111 4.45115681 5 185.764722 37.1529444 24.5594198 Ft P>Fc 2.71088984 0.00848296 2.71088984 0.00689471 2.71088984 6.718E-08

1 1 1 1 1

180.200056 180.200056 119.118656 4.35124348 7.1267E-10 3.81633333 3.81633333 2.52273228 4.35124348 0.12790015 0.20166667 0.20166667 0.13330885 4.35124348 0.71885832 1.33333333 1.33333333 0.88138083 4.35124348 0.35902438 0.21333333 0.21333333 0.14102093 4.35124348 0.71122148 20 30.2555556 1.51277778 35 281.876389

El efecto de tratamientos detectado por el anlisis de varianza en la prueba de tratamientos con los 5 grados de libertad, es debida solamente a la diferencia que existe entre los tratamientos con nitrgeno y el testigo, pues la significancia de los contrastes ortogonales solo resulto menor de .05 para

este contraste, no detectndose ningn otro contraste como significativo, lo que indica que en cuanto a la variable de respuesta evaluada, todos los fertilizantes tienen el mismo efecto. CUADROS LATINOS AUMENTADOS: Una desventaja de este arreglo geomtrico es que cuando el numero de tratamientos es pequeo, esto trae como consecuencia un escaso numero de grados de libertad para el error. Por ello se recomienda, fundamentalmente en estos casos, aumentar el diseo en cuadro latino a travs de repeticiones completas de los cuadros, que puede estar asociada a algn otro factor de bloqueo, diferente al empleado para definir las hileras y columnas, por ejemplo, aos en que se lleva a cabo el experimento, sitios en que se lleva a cabo el experimento, etc. Debemos distinguir fundamentalmente tres tipos de cuadros latinos repetidos: 1. Con hileras y columnas comunes en cada repeticin del cuadro. Sucede con hileras y columnas lo mismo que con los tratamientos, son los mismos niveles en cada repeticin, por lo que las repeticiones se asocian mas comnmente a tiempo. El modelo para este arreglo es el del cuadro latino convencional con el efecto aditivo de repeticiones. Yijkl = + i + l(ijk) + j + k + ijkl En este caso, entonces, solo se agrega la fuente de variacin de repeticin en el anova con (r-1) grados de libertad, siendo r el numero de repeticiones de cuadros latinos completos. Cada una de las fuentes de variacin en el modelo (hileras, columnas y tratamientos) contribuyen con (t-1) grados de libertad. El numero total de observaciones es ahora rt , por lo que los grados de libertad para el total son (rt-1) quedando para el error la diferencia definida por (t-1)[r(t+1)-3]. Con tres repeticiones en un cuadro latino con tres tratamientos, los grados de libertad en el error aumenta 9 veces en comparacin con una sola repeticin. Ejemplo numrico 2. Considere la situacin experimental en una industria en la que se estn probando tres tipos de soldadura (tratamientos) y se controlan como variables de bloqueo el fundente (columnas) y el operador que lleva a cabo el proceso (hileras), en dos

maquinas soldadoras diferentes (repeticiones). La variable de respuesta es la resistencia de las piezas soldadas a la separacin de piezas. Los resultados se muestran en la siguiente tabla.
R1 Fund 1 A = 14.0 C = 9.5 B = 11.0 R1 Fund 2 B = 16.5 A = 17.0 C = 12.0 R1 Fund 3 C = 11.0 B = 15.0 A = 13.5 R2 Fund 1 C = 10 A = 12.0 B = 13.5 R2 Fund 2 B = 16.5 C = 12.0 A = 18.0 R2 Fund 3 A = 13.0 B = 14.0 C = 11.5

Op 1 Op 2 Op 3

El resultado del anlisis de varianza es mostrado:


F.V. Modelo Repeticion Fundentes Operadores Tratamientos Error Total G.L. 1 2 2 2 S.C. 7 90.7222222 0.05555556 41.3333333 0.25 49.0833333 10 13.7777778 17 104.5 C.M. Fc Ft Pr>Fc 0.844876514 0.000976563 0.914011146 0.000505808

0.05555556 0.04032258 4.9646027 20.6666667 15 4.10282102 0.125 0.09072581 4.10282102 24.5416667 17.8125 4.10282102 1.37777778

La interpretacin de resultados es que los tratamientos tienen un efecto significativo. Las medias de los tratamientos son:
Media de Tratamiento Totales Observaciones Trat A 87.5 6 14.5833333 B 86.5 6 14.4166667 C 66 6 11

Donde se observa que el tratamiento C es el de menor respuesta, en tanto que el A y B son de valores muy similares y mas altos que el del tratamiento C. Lleve a cabo la prueba de separacin de medias de Tukey para reportar las diferencias y llevar a cabo la toma de decisin y recomendacin de la soldadura. 2. Con una variable de bloqueo con diferentes niveles en las repeticiones y la otra variable de bloqueo con niveles comunes en las diferentes repeticiones. Supngase ahora que se desean probar los mismos 3 tipos de soldadura, pero el experimento se desea de resultados lo mas rpido posible, por lo que un numero de operadores diferentes van a ser empleados en cada repeticin, usando los mismos fundentes para todas las repeticiones. En este caso los operadores van a estar asociados a cada repeticin, por lo que este factor se cataloga como anidado dentro de repeticin. Conviene entonces en este apartado revisar el anlisis de los factores jerrquicos. En este ejemplo articular, el factor de jerarqua

superior es la repeticin y el de jerarqua inferior son los operadores. La estimacin de los efectos del factor de jerarqua superior se llevan a cabo de la manera acostumbrada, pero los efectos del factor de jerarqua inferior se llevan a cabo dentro de cada nivel del factor de jerarqua superior. En este ejemplo tenemos que llevar a cabo la estimacin de cada operador dentro de cada repeticin del cuadro latino, ya que en cada uno los operadores sern diferentes (media de operador menos la media de repeticin). Esto implica que en cada repeticin se debern estimar (t-1) parmetros independientes, por lo que los grados de libertad para esta fuente de variacin sern r(t-1). El modelo estadstico es similar al del cuadro latino con repeticiones con factores de bloqueo comunes, con la nica diferencia de que ahora debe ser especificado el anidamiento de una de las fuentes de bloqueo. Yijkl = + i + l(ijk) + j(i) + k + ijkl Los grados de libertad en el error para este modelo van a estar definidos por (t-1)(rt 2). El incremento en los grados de libertad en el error es menor bajo este arreglo, por la mayor cantidad de parmetros independientes que deben ser estimados. Ejemplo numrico 3. A continuacin se muestran los datos del segundo experimento en la industria referente a la soldadura con diferentes operadores en cada repeticin. Una tabla de anlisis de varianza es mostrada enseguida de los datos. En dicha tabla se observa una significancia para todos los efectos. Las medias de los tipos de soldadura son requeridos para seleccionar el mejor nivel. Los valores resultaron ser: Media A = 296 , Media B = 253.3, Media C = 210.6 Por lo que la mejor soldadura es la del tipo A.

Rep 1

Rep 2

Rep 3

Operador 1 Operador 2 Operador 3 Operador 4 Operador 5 Operador 6 Operador 7 Operador 8

Fundente 1 B = 265 A =350 C = 258 B = 220 A = 319 C = 175 B = 159 A = 262

Fundente 2 A = 311 C = 284 B = 305 A = 276 C = 232 B = 254 A = 205 C = 168

Fundente 3 C = 249 B = 330 A = 351 C = 189 B = 264 A = 307 C = 142 B = 246

Operador 9 C = 198 F.V. Modelo Repeticion Oper(Rep Fund Tratamiento Error Total 2 6 2 2 G.L. S-C. 12 84904.2222 36140.5185 14565.7778 1344.51852 32853.4074

B = 237 C.M.

A = 283 Fc Ft P > Fc

18070.2593 134.60819 3.73889183 7.2122E-10 2427.62963 18.0837932 2.847726 7.4259E-06 672.259259 5.00776446 3.73889183 0.02287974 16426.7037 122.365087 3.73889183 1.3582E-09

14 1879.40741 134.243386 26 86783.6296

Conviene llevar a cabo la prueba de separacin de medias de Tukey para mostrar las diferencias significativas entre los tratamientos y poder establecer la recomendacin. 3. Con hileras y columnas con diferentes niveles en cada repeticin del cuadro. Considere ahora la situacin en que lo nico que es comn en las repeticiones del cuadro latino son los tratamientos, usando diferentes niveles del factor hilera y del factor columna en cada una de las repeticiones. Esto implica que tanto hileras como columnas estn anidadas dentro de cada repeticin. geomtrico es Yijkl = + i + l(ijk) + j(i) + k(i) + ijkl En base a este modelo los grados de libertada para el error experimental quedan definidos por la expresin (t-1)(rt-r-1) . Como puede sospecharse, por el numero de parmetros a estimar, este es el cuadro latino repetido que tiene un menor incremento en los grados de libertad en el error, ya que la estimacin de efectos de hilera y columna se llevan a cabo dentro de cada repeticin. Ejemplo numrico 4. Como un ejemplo considere la situacin en la que se estn probando cuatro diferentes tratamientos (A, B, C, D) para mejorar el valor nutricional de subproductos agrcolas para la alimentacin del ganado. Se dispone de dos zonas climticas, cada una de las cuales produce cuatro diferentes tipos de subproductos agrcolas que se pueden someter a los El modelo estadstico para este arreglo

mismos tratamientos, y en cada zona climtica son usados 4 diferentes animales en los que se prueba el subproducto tratado. La variable a medir es el porcentaje de disgestibilidad. Los resultados se muestran a continuacin: S U B P R O D U C T O S ANIMAL
1 2 3 4 5 6 7 8 1 C = 0.2 B = 0.28 D = 0.34 A = 0.32 5 B = 0.29 D = 0.28 C = 0.28 A = 0.3 2 A = 0.24 C = 0.19 B = 0.23 D = 0.22 6 A = 0.25 B = 0.18 D = 0.23 C = 0.19 3 D = 0.2 A = 0.22 C = 0.21 B = 0.16 7 C = 0.18 A = 0.21 B = 0.2 D = 0.24 4 B = 0.27 D = 0.28 A = 0.28 C = 0.27 8 D = 0.28 C = 0.25 A = 0.28 B = 0.25

Se requiere en primer lugar la estimacin de los efectos de acuerdo al modelo establecido: Media general: 0.24375 Efecto de la repeticin: Media de repeticin Media general. Efecto de la repeticin 1 = 0.000625 Efecto de la repeticin 2 = - 0.000625 Efectos de hilera en la repeticin 1: Media de la hilera Media Repeticin 1 Efecto de la hilera 1 (Repeticin 1) = 0.016875 Efecto de la hilera 2 (Repeticin 1) = -0.001875 Efecto de la hilera 3 (Repeticin 1) = 0.020625 Efecto de la hilera 4 (Repeticin 1) = -0.001875 Efectos de hilera en la repeticin 2: Media de la hilera Media Repeticin 2 Efecto de la hilera 5 (Repeticin 2) = 0.006875 Efecto de la hilera 6 (Repeticin 2) = -0.013125 Efecto de la hilera 7 (Repeticin 2) = 0.004375 Efecto de la hilera 8 (Repeticin 2) = 0.001875 Recalcamos que una estimacin de efectos anidados consiste en la estimacin separada de los efectos en cada nivel del factor de jerarqua superior. Efectos de columna en repeticin 1: Media de la columna Media repeticin 1 Efecto de la Columna 1 (Repeticin 1) = 0.040625

Efecto de la Columna 2 (Repeticin 1) = -0.024375 Efecto de la Columna 3 (Repeticin 1) = -0.046875 Efecto de la Columna 4 (Repeticin 1) = 0.030625 Efectos de columna en repeticin 2: Media de la columna Media repeticin 2 Efecto de la Columna 5 (Repeticin 2) = 0.044375 Efecto de la Columna 6 (Repeticin 2) = -0.030625 Efecto de la Columna 7 (Repeticin 2) = -0.035625 Efecto de la Columna 8 (Repeticin 2) = 0.021875 Efecto de los Tratamientos: Media de tratamiento Media general. Efecto del tratamiento 1 = 0.01875 Efecto del tratamiento 2 = -0.01125 Efecto del tratamiento 3 = -0.0225 Efecto del tratamiento 4 = 0.015 En base a estos efectos estimados se pueden deducir los grados del libertad, las sumas de cuadrados de los efectos, el modelo completo y el modelo reducido, es decir, se puede derivar todo el anlisis de varianza. Vamos a repasar primero los grados de libertad asociados a los efectos incluidos en el modelo. Como regla general, los grados de libertad del efecto corresponde al numero de parmetros independientes estimados para dicho efecto. Entonces: Para repeticiones es un grado de libertad, ya que se estimaron dos efectos de repeticin, pero su suma es igual a cero, de tal forma que independientes solo se estima uno. Para hileras anidadas en repeticiones, se tienen 4 estimaciones en la repeticin uno y otras 4 en la repeticin dos, pero, en cada caso su suma es cero, por lo que solo quedan 3 estimaciones independientes en cada repeticin, y as, los grados de libertad para hileras en repeticin son 6. Para columnas anidadas en repeticin, se tiene una situacin equivalente a la de hileras, 4 estimadores de columnas en cada repeticin, pero solo tres independientes en cada caso, por lo que los grados de libertad de columnas anidadas en repeticin son tambin 6. Para tratamientos es una situacin diferente, ya que los tratamientos son comunes en ambas repeticiones, para calcular los estimadores de los efectos se juntan ambas repeticiones y se obtienen solo 4 estimadores, de los cuales,

por ser su suma igual a cero, se consideran 3 independientes, que son los grados de libertad de los tratamientos. Los grados de libertad para el total siempre se calculan como el numero total de observaciones menos una, por lo que en este caso, cada repeticin del cuadro latino incluye 44=16 observaciones en cada repeticin, y por ser dos repeticiones, entonces el numero total de observaciones son 32. Los grados de libertad del total son entonces 31. Aplicando la expresin derivada para grados de libertad especifica para este tipo de cuadro latino aumentado (hileras y columnas diferentes en cada repeticin) se obtienen 15 grados de libertad. Las sumas de cuadrados asociadas a cada uno de los efectos se obtiene mediante los efectos estimados, elevados al cuadrado y sumados sobre todas las observaciones. La tabla de anlisis de varianza para estos datos es mostrada:
F.V Modelo Repeticion Hileras(rep) Colum(rep) tratamientos Error Total 1 6 6 3 15 31 G.L. 16 S.C. 0.0536625 0.0000125 0.0000125 0.02377179 4.54307712 0.87952229 0.0038375 0.00063958 1.2163233 2.790465 0.35123807 0.0401375 0.00668958 12.72187 2.790465 3.8579E-05 0.009675 0.003225 6.13312203 3.28738211 0.00621636 0.0078875 0.00052583 0.06155 C.M. Fc Ft Pr > Fc

Los valores de significancia indican una diferencia estadstica entre tratamientos, por lo que es necesario aplicar la prueba de Tukey a las medias de los tratamientos para determinar cuales medias son diferentes. Las medias de los tratamientos son: A = 0.2625 B = 0.2325 C = 0.22125 D = 0.25875 Prueba de separacin de medias de Tukey: Ordenar las medias de mayor a menor: A = 0.2625 D = 0.25875

B = 0.2325 C = 0.22125 Construir una tabla de diferencia de medias: A A D B C D A-D=0.00375 B A-B=0.03000 D-B=0.02625 C A-C=0.04125 D-C=.0375 B-C=0.01125

Valor HSD: Diferncia honesta significativa de Tukey: Error estndar de la media = 0.008107 Valor critico de la tabla de Tukey = 4.08 HSD = 0.0081074.08 = 0.033 Declaracion de diferencias significativas: A-D < HSD , No significativa A-B < HSD , No significativa A-C > HSD , Significativa D-B < HSD , No significativa. D-C > HSD , Significativa. B-C < HSD , No significativa. Separacin de medias: A = 0.2625a D = 0.25875a B = 0.2325ac C = 0.22125c Los tratamientos A y D estadsticamente iguales son los que incrementaron mas la respuesta. El tratamiento C es el de mas baja respuesta y estadsticamente es igual al tratamiento B, que por estar en valor intermedio, tambin es estadsticamente igual an los tratamientos A y D. ARREGLOS DE TRATAMIENTOS: Los arreglos de tratamientos se refieren al conjunto de tratamientos que deben ser incluidos en un experimento para poder llevar a cabo las hiptesis que se plantean en la investigacin. De esta manera, si la hiptesis establece solo los efectos de tratamientos referentes a un solo factor, entonces el arreglo de tratamientos requerido es un arreglo unifactorial.

Por otro lado, si las hiptesis que se desean probar se refieren a dos o mas factores, entonces el arreglo a seleccionar es un arreglo multifactorial, que puede ser un arreglo factorial o un arreglo en parcelas divididas. El arreglo factorial es seleccionado cuando el tamao de la unidad experimental es el mismo para cualquiera de los factores que se desean probar. Bajo este arreglo se aleatorizan independientemente los niveles de cada uno de los factores a las unidades experimentales. De manera equivalente, se pueden formular todas las posibles combinaciones de los niveles de los factores y considerarlas como tratamientos, llevando a cabo una aleatorizacion experimentales. El arreglo de parcelas divididas es seleccionado cuando el tamao de la unidad experimental requerido para probar los niveles de un factor es mas grande (factor de parcela principal) comparado con el tamao de la unidad experimental para probar otro factor (factor de subparcela). En estos arreglos de tratamientos las unidades experimentales para probar el factor de parcela principal son aleatorizados de acuerdo a algn arreglo geomtrico seleccionado. Posteriormente la parcela principal ya tratada con el nivel del factor de parcela principal es dividida (de ah su nombre) en un numero de subunidades igual al numero de niveles del factor de subparcela, el cual es asignado de manera aleatoria. Ejemplo tpico de un arreglo factorial: Se desea investigar el efecto de la fuente de protena y la cantidad de protena en la dieta para mascotas de tipo roedor, sobre sus ganancias de peso, con la finalidad de minimizar crecimiento. Las fuentes de protena investigadas son de tres tipos: Res, soya y puerco. Un factor fijo, cualitativo y con tres niveles. Los niveles del factor cantidad de protena en la dieta son dos, denominados el nivel alto y el nivel bajo. Es un factor fijo, cuantitativo con dos niveles. La denominacin de los niveles de este factor (alto y bajo) no le quita la naturaleza cuantitativa al factor. El arreglo factorial requerido para probar estos factores es caracterizado como un 32, o sea, los tres niveles del factor tipo de protena y dos niveles del factor cantidad de protena en la dieta, dando un arreglo con 6 combinaciones , cada una de las cuales constituye un tratamiento. Ya que se de acuerdo al arreglo geomtrico de las unidades

cuenta con un grupo homogneo de 60 animales de este tipo, se separan en 6 grupos de 10 animales cada uno, en forma completamente aleatoria, asignando a cada grupo un tratamiento. Este es un caso tpico en que ambos factores requieren del mismo tamao de unidad experimental (el animal) para probar ambos factores. Los datos obtenidos de las ganancias de peso para cada animal se muestran en la siguiente tabla:
ALTA PROTENA Soya Puerco Res 98 94 74 79 56 96 111 98 95 102 88 102 82 108 77 91 86 120 92 105 BAJA PROTENA Soya Puerco 107 49 95 82 97 73 80 86 98 81 74 97 74 106 67 70 89 61 58 82

Res 73 102 118 104 81 107 100 87 117 111

90 76 90 64 86 51 72 90 95 78

Las hiptesis que se desean probar son: 1. 2. 3. Ho: No hay efecto de la cantidad de protena. Ho: No hay efecto de la fuente de protena. Ho: No hay efecto de interaccin de cantidad por tipo de protena.

Efecto de interaccin: Siempre que se lleva a cabo un experimento multifactorial el objetivo fundamental es investigar el efecto conjunto de los factores. Esto implica investigar como los niveles de un factor pueden modificar el efecto de otro factor sobre una respuesta. En nuestro ejemplo de las mascotas esto llevara a determinar como el efecto de la cantidad de protena se ve modificado al cambiar las fuentes de protena. En otras palabras, indagar si el efecto de la cantidad de protena es el mismo para cada una de las fuentes investigadas. Si el efecto de la cantidad de protena resulta ser el mismo para cada fuente, es decir, el cambio en respuesta promedio por efecto de la cantidad

de protena para cada fuente resulta muy homogneo, esto refleja que la fuente de protena no modifica el efecto de la cantidad, por lo tanto, bajo esta situacin se considera que el efecto de los factores sobre la variable de respuesta son independientes, esto es, cada uno de los factores tiene su efecto sobre la respuesta indistintamente del nivel en el que se encuentra el otro factor. Sobre otro punto de vista, si el efecto de la cantidad de protena se modifica para cada una de las fuentes, entonces existe una dependencia entre los dos factores. La magnitud de cambio en la variable de respuesta debido a la cantidad de protena va a depender de la fuente de protena que se este considerando, situacin que caracteriza un efecto de interaccin de cantidad por fuente. Esto equivale a observar diferentes pendientes o tasas de cambio de un factor para diferentes niveles de un segundo factor. El efecto de un factor bajo una situacin de interaccin se potencializa o inhibe de acuerdo al nivel del segundo factor. Los efectos de los factores no son independientes, sino todo lo contrario, existe un efecto cruzado de los factores. Bajo una situacin de interaccin de factores no tiene sentido entonces concluir acerca de cada uno de los factores por separado, por la dependencia que existe del efecto de un factor y los niveles de un segundo factor.

En los estudios multifactoriales vamos a distinguir dos tipos de efectos: 1. Los efectos principales, que evalan el cambio en respuesta por los niveles de un factor, ignorando los niveles del resto de los factores. 2. Los efectos de interaccin, que evalan el cambio en el efecto de un factor a diferentes niveles de un segundo factor. Las interacciones se clasifican de acuerdo al numero de factores que se consideran en la interaccin como: a), Interacciones de primer orden, cuando solo se consideran dos factores en la interaccin. Por ejemplo, la interaccin cantidad de protena por fuente de protena es una interaccin de primer orden y es

la nica que puede ser investigada , ya que solo se incluyen en el experimento estos dos factores. b). Interacciones de segundo orden o de tres factores, que estudia el efecto conjunto de tres factores, es decir, como se modifica el efecto de un factor al variar los niveles de un segundo y un tercer factor en el experimento. Sucesivamente se pueden definir, de manera equivalente las interacciones de mas alto orden. Al llevar a cabo el anlisis de los datos de un estudio multifactorial con repeticiones en cada combinacin de niveles de los factores, deben ser incluidas todas las posibles interacciones, para poder determinar cuales son significativas. EJEMPLO TPICO DE UN ARREGLO EN PARCELAS DIVIDIDAS: Se realiza un experimento para determinar la dispersin del pigmento en la pintura. Se estudian 4 mezclas de un pigmento particular. El procedimiento consiste en preparar una mezcla y aplicarla sobre una tabla mediante tres mtodos de aplicacin (con brocha, por aspersin y con rodillo). La respuesta se mide mediante el porcentaje de reflexion del pigmento. Se requieren de tres dias para llevar a cabo el experimento. Los datos obtenidos se muestran a continuacin:
Dia Mtodo de Aplicacin 1 1 2 3 2 1 2 3 3 1 2 3 1 64.5 68.3 70.3 65.2 69.2 71.2 66.2 69 70.8 2 66.3 69.5 73.1 65 70.3 72.8 66.5 69 74.2 MEZCLA 3 74.1 73.8 78 73.8 74.5 79.1 72.3 75.4 80.1 4 66.5 70 72.3 64.8 68.3 71.5 67.7 68.6 72.4

De acuerdo a la descripcin del experimento, se preparo cada una de las mezclas (factor de parcela principal) y la mezcla es aplicada por tres mtodos (factor de subparcela). En cada da (bloque) se preparan y aplican las cuatro mezclas. La parcela principal esta formada por la

mezcla y da y como un ejemplo se tienen los datos de la siguiente parcela principal:


Dia 1 Mtodo de Aplicacin 1 2 3 MEZCLA 1 64.5 68.3 70.3

Y la subparcela seria mtodo de aplicacin, mezcla y da, cada una de las piezas de informacin.
Dia 1 Mtodo de Aplicacin 1 MEZCLA 1 64.5

Las hiptesis que se desean probar son: 1. 2. 3. Ho: No hay efecto de mezcla. Ho: No hay efecto de mtodo de aplicacin. Ho: No hay efecto de interaccin de mezcla por mtodo de aplicacin. Como puede ser visualizado a partir de estos ejemplos tipicos de cada arreglo de tratamientos, la seleccin esta basada en un criterio netamente practicote llevar a cabo la aplicacin de los niveles de los factores a las unidades experimentales; cada una de las diferentes situaciones debe reflejarse en el modelo estadstico y consecuentemente en el anlisis de resultados.

ARREGLO FACTORIAL DE TRATAMIENTOS: El tema de arreglos factoriales de tratamiento debe ser revisado bajo la siguiente secuencia de subtemas: 1. 2. 3. 4. 5. Arreglos factoriales en general. Series 2 a la k. Series 3 a la k. Fracciones de las series 2 a la k aplicando la tcnica de la confusin. Bloqueo en las series 2 a la k.

Estos arreglos constituyen la base fundamental de los arreglos empleados en las metodologas de optimizacin, tales como la metodologa de Taguchi y la metodologa de superficie de respuesta. ARREGLOS FACTORIALES EN GENERAL: En este subtema vamos a considerar los arreglos factoriales en los que cada factor tiene su numero muy particular de niveles. Suponga que se tienen 3 factores, que convencionalmente los denotamos con letras maysculas, digamos el factor A, el factor B y el factor C. sea a el numero de niveles en el factor A, b el numero de niveles en el factor B y c el numero de niveles en el factor C. Cada uno de los niveles de los factores se pueden representar con la letra minscula del factor seguido de un subndice que corre desde cero hasta el numero de niveles en el factor menos uno. As por ejemplo, el factor A con a niveles, pueden ser representados por a0,a1,aa-1 esta notacin para niveles puede ser usada tambin para el resto de los factores. Entonces tenemos un arreglo factorial denotado por abc Esta notacin convencional para caracterizar los arreglos factoriales nos informa directamente el numero de factores que se estn investigando en el experimento y el numero de niveles en cada uno de los factores. Adicionalmente, el resultado de la multiplicacin corresponde al numero de tratamientos que se generan en este arreglo. Cada tratamiento es una condicin experimental diferente que se caracteriza por un nivel particular en cada uno de los factores. As cada tratamiento debe corresponder a una de las combinaciones de los niveles de los factores. Para generar una estructura factorial se pueden emplear varios mtodos, por ejemplo el mtodo tabular, el mtodo de diagrama de arbol o el mtodo computacional. El mtodo tabular trabaja de manera adecuada cuando son pocos los factores que se van a considerar, a lo mas cuatro. Se construye una tabla de doble entrada, con hileras correspondiendo a las combinaciones de dos factores (o los niveles de un factor) y las columnas correspondiendo a las combinaciones

de otros dos factores (o niveles de otro factor). Las celdas generadas en esta tabla constituyen cada una de las combinaciones de tratamiento que deben ser incluidas en el arreglo factorial. Construya un arreglo factorial 324 en forma tabular: Es un arreglo factorial con tres factores, A,B y C, en el que el factor A tiene tres niveles (a0,a1,a2) , el factor B tiene dos niveles (b 0,b1) y el factor C tiene 4 niveles (c0,c1,c2,c3). Cada nivel de un factor debe combinarse con todos los niveles de los otros factores. En este ejemplo generamos las combinaciones de los primeros dos factores (AB) a las que colocamos como encabezados de columna de la tabla, en tanto que los niveles del factor C los colocamos como encabezados de hilera, formano as la siguiente estructura: a0 b1 a 0 b 1 c0 a 0 b 1 c1 a 0 b 1 c2 a 0 b 1 c3 a1 b1 a 1 b 1 c0 a 1 b 1 c1 a 1 b 1 c2 a 1 b 1 c3 a2 b1 a 2 b 1 c0 a 2 b 1 c1 a 2 b 1 c2 a 2 b 1 c3

c0 c1 c2 c3

b0 a 0 b 0 c0 a 0 b 0 c1 a 0 b 0 c2 a 0 b 0 c3

b0 a 1 b 0 c0 a 1 b 0 c1 a 1 b 0 c2 a 1 b 0 c3

b0 a 2 b 0 c0 a 2 b 0 c1 a 2 b 0 c2 a 2 b 0 c3

Si esta tabla la desdoblamos para que nos quede en forma vertical, solo debemos considerar los siguientes valores: 1. 2. 3. 4. a0 a0 a0 a0 a0 a0 a0 a0 a1 a1 a1 a1 El numero total de combinaciones: 24 Numero de veces que se va a repetir cada nivel del factor A: 24/3=8 Numero de veces que se va a repetir cada nivel del factor B en cada nivel del factor A: 8/2 = 4 Numero de veces que se va a repetir cada nivel del factor C en cada nivel del factor B: 4/4=1. b0 b0 b0 b0 b1 b1 b1 b1 b0 b0 b0 b0 c0 c1 c2 c3 c0 c1 c2 c3 c0 c1 c2 c3

a1 a1 a1 a1 a2 a2 a2 a2 a2 a2 a2 a2

b1 b1 b1 b1 b0 b0 b0 b0 b1 b1 b1 b1

c0 c1 c2 c3 c0 c1 c2 c3 c0 c1 c2 c3

Modelo estadstico para una estructura factorial: Para generar el modelo estadstico de una estructura factorial debemos considerar en primer lugar, el modelo estadstico bsico que incluira el arreglo geomtrico que se utilizo para acomodar los tratamientos a las unidades experimentales y el efecto de los tratamientos, como si estos constituyeran una estructura unifactorial. Enseguida, vamos a desdoblar los efectos de tratamientos en los efectos principales y efectos de interaccin. Para ello debemos disponer de un subndice, adicional a los del arreglo geomtrico, por cada factor incluido en el arreglo factorial. Se deben considerar en el modelo estadstico todos los efectos principales y todos los posibles efectos de interaccin entre los factores. Ejemplo: Genere el modelo estadstico para el ejemplo de las mascotas. 1. Modelo estadstico Bsico: Ya que se trata de un arreglo geomtrico completamente al azar con 6 tratamientos y 10 repeticiones por tratamiento, el modelo estadstico bsico es:

Yij = + i + ij
por 87.86666667.

; i=1,2,..,6 ; j=1,2,,10

El estimador de la media general es la media de todas las observaciones, dada Los efectos de tratamiento vienen dados por: 12.13333333 -1.966666667 11.63333333 -8.666666667 -3.966666667 -9.166666667

El anova bajo este modelo esta dado por Fuente de variacin Tratamientos Error Total

G.L. 5 54 59

S.C. 4612.9333 11586.0000 16198.9333

C.M 922.5866 214.5555

Fc 4.2999

Ft 2.3860

Pr > Fc 0.0023

La conclusin a partir de este anlisis es que si existe una diferencia significativa de los tratamientos; sin embargo, no sabemos si esta diferencia se puede atribuir a efectos principales o a un efecto de interaccin entre los dos factores, por lo que se hace necesario separar la fuente de variacin de los tratamientos bajo un modelo que incluya los efectos principales y efecto de interaccin.

2.

Desdoblamiento del efecto de tratamientos en efectos principales y efectos de interaccin: Los factores incluidos en el arreglo factorial de tratamientos fueron la fuente de protena, con tres niveles y la cantidad de protena con dos niveles, por lo que requerimos de 2 subindices, uno para cada factor, mas el subndice para repeticiones. Nuestro modelo incluyendo la estructura factorial queda como:

Yijk = + i + j + ()ij + ijk


i=1,2,3; j=1,2; k=1,2, ,10 Donde

Yijk = = i j

Variable de respuesta en la repeticin k del nivel i de la fuente de

protena y el nivel j de la cantidad de protena. Media general del experimento.

= Efecto del nivel i del factor fuente de protena. = Efecto del nivel j del factor cantidad de protena. = Efecto de la interaccin del nivel i de la fuente de protena y el nivel j

()ij

de la cantidad de protena.

ijk

= Error experimental en la repeticin k en el nivel i de la fuente de

protena y el nivel j de la cantidad de protena. Para propsitos de estimacin de los efectos las restricciones que deben imponerse son: Restriccin para la estimacin de los efectos del factor fuente de protena.

i i = 0
Restriccin para la estimacin de los efectos del factor cantidad de protena

j j

= 0

Restricciones para la estimacin de los efectos de interaccin entre los factores cantidad y fuente de protenas.

i ()ij = 0 j ()jj

= 0

ij ()jj

= 0

Bajo este conjunto de restricciones las estimaciones de los efectos son: Media general del experimento es la que corresponde a la media de todas las observaciones. Para este conjunto de observaciones corresponde a la media de las 60 observaciones que es igual a 87.86666667 y constituye el primer estimador independiente del modelo. Efecto del nivel i de la fuente de protena es igual a la media del nivel i de la fuente de protena menos la media general. Ya que los niveles del factor fuente de protena son res, cereal y puerco, entonces son tres estimadores los que vamos a calcular, pero por la restriccin impuesta su suma debe ser igual a cero y por ello solo dos sern independientes Fuente Res Soya Puerco Promedio Efecto 89.6 1.733333333 84.9 -2.966666667 89.1 1.233333333 Suma de estimadores 1.42109E-14

Efecto del nivel j de la cantidad de protena es la media del nivel j de la cantidad de protena menos la media general. Para este factor solo se tienen dos niveles, la cantidad alta y la cantidad baja de protena, por lo que calculamos dos estimadores, pero solo uno ser independiente, ya que la suma de ambos ser cero: Cantidad Alta Baja Media Efecto 95.133333 3 7.266666667 80.6 -7.266666667 Suma de efectos 1.42109E-14

Efecto de interaccin del nivel i de la fuente con el nivel j de la cantidad es igual a la media de las observaciones en el nivel i de la fuente y el nivel j de la cantidad menos la media del nivel i de la fuente menos la media del nivel j de la cantidad mas la media general. Para determinar el numero de estimadores independientes de los efectos de interaccin considere que en cada columna la suma de los estimadores sobre las hileras debe ser cero y tambin la suma de los estimadores sobre columnas en cada hilera debe ser cero, de tal manera que los estimadores independientes en general van a ser: ab a b + 1=a(b - 1) (b - 1) = (a - 1)( b - 1) donde a es el numero de niveles del factor A y b es el numero de niveles del factor b. Como regla general entonces, el numero de efectos independientes que se estiman en una interaccin es igual al producto del numero de efectos independientes que se estiman en cada uno de los factores en la interaccin. Para nuestro ejemplo construimos la tabla de las medias de fuente de protena por cantidad de protena:
Alto Bajo Res 100 79.2 Soya 85.9 83.9 Puerco 99.5 78.7

Con estos promedios y los calculados anteriormente para cada nivel en cada uno de los factores y la media general podemos estimar los efectos de interaccin:
Alto Bajo Res 3.13333333 -3.13333333 Soya -6.26666667 6.26666667 Puerco 3.13333333 -3.13333333

Como puede ser fcilmente verificado la suma de los estimadores de los efectos de interaccin suman cero por hileras y columnas. Con los efectos estimados podemos construir la tabla de anlisis de varianza que corresponde a este modelo.
F.V. Tratamientos Fuente Cantidad Cantidad*fuente Error Total G.L. 2 1 2 S.C. 4612.93333 266.533333 3168.26667 1178.13333 54 11586.00000 59 16198.9333 5 C.M. 922.586667 133.266667 3168.26667 589.066667 214.555556 F.C. 4.29998964 0.62112895 14.7666494 2.74552046 F.TABLAS 2.38606985 3.16824597 4.01954091 3.16824597 Pr > F.C. 0.00229944 0.54113191 0.00032236 0.07318788

La primera observacin es que tenemos fuentes de variacin que aun pueden seguir siendo desdobladas en grados de libertad individuales por medio de contrastes. La tabla indica un posible efecto de interaccin entre cantidad y fuente, por lo que una conclusin final solo puede darse hasta que se haya realizado la separacin de este efecto en grados de libertad individuales. Los coeficientes de los contrastes para una interaccin se calculan multiplicando los coeficientes de los contrastes que corresponden a los efectos principales incluidos en la interaccin, al establecerlos para todas las combinaciones de la estructura factorial. Los contrastes para efectos principales se definieron de la manera ya establecida. As para cantidad de protena tenemos solo dos niveles, cada uno con tres tratamientos, por lo que al simplificarse se puede asignar un mas uno al nivel de cantidad alto y un menos uno al nivel de cantidad bajo. Para fuente de protena se tienen dos grados de libertad, de tal manera que podemos definir dos contrastes: El primero separa las fuentes por su origen, en protenas de origen animal (2, res y cerdo) contra la de origen vegetal ( la soya). Tenemos cuatro combinaciones de tratamientos con protenas de origen animal y dos combinaciones con origen vegetal, de tal manera que los coeficientes serian: Un uno positivo para las protenas de origen animal y un menos 2 para las de origen vegetal. El segundo de los contrastes compara las protenas de origen animal, res contra cerdo. Ya que la de origen vegetal no se incluye en este contraste, los coeficientes para este nivel de fuente sern ceros. Por otro lado se tienen dos

combinaciones con res y dos combinaciones con cerdo, por lo que los coeficientes para estos niveles sern: Un mas uno para el nivel res y un menos uno para el nivel cerdo. Para los contrastes de interaccin, cada contraste de un factor se multiplica por cada uno de los contrastes del segundo factor, especificando en cada uno cuales son los contrastes que se estn considerando en la interaccin. La tabla completa de coeficientes para todos los contrastes ortogonales es mostrada.
CANTIDAD FUENTE Res Medias Alta vs. Baja OV vs. OA Res vs.Puerco Cantidad(OV vs OA) Cantidad(Res vs Puerco) ALTA PROTENA Soya Puerco Res 85.9 99.5 1 1 -2 1 0 -1 -2 1 0 -1 BAJA PROTENA Soya Puerco 83.9 78.7 -1 -1 -2 1 0 -1 2 -1 0 1

100 1 1 1 1 1

79.2 -1 1 1 -1 -1

Al aplicar estos contrastes podemos construir la siguiente tabla de anlisis de varianza, que incorpora todas las previas y los contrastes que se han definido:
F.V. Tratamientos Fuente Veg. Vs. Animal Res vs. Cerdo Cantidad Cantidad*fuente Cantidad*(Veg vs. Anim) Cantidad*(Res vs. Cerdo) Error Total G.L. 2 1 1 1 2 1 1 S.C. 4612.93333 266.5333333 264.0333333 2.5 3168.266667 1178.133333 1178.133333 0 54 11586.00000 59 16198.93333 5 C.M. 922.586667 133.266667 264.033333 2.5 3168.26667 589.066667 1178.13333 0 214.555556 F.C. 4.29998964 0.62112895 1.2306059 0.01165199 14.7666494 2.74552046 5.49104091 0 F.TABLAS 2.38606985 3.16824597 4.01954091 4.01954091 4.01954091 3.16824597 4.01954091 4.01954091 Pr > F.C. 0.00229944 0.54113191 0.2722052 0.91443988 0.00032236 0.07318788 0.02282668 1

El contraste de interaccin (Res Vs. Cerdo)*Cantidad tiene una suma de cuadrados que es igual a cero, lo que indica que res y cerdo tienen ganacias paralelas con respecto a las cantidades de protena, concluyndose que el efecto de estas fuentes es independiente de la cantidad. De esta manera podemos hacer inferencias acerca del contraste res vs. cerdo. El contraste Res vs. Cerdo no es significativo, lo que indica que para estos dos niveles del factor fuente no hay diferencia significativa (89.6 para Res vs. 89.1 para cerdo). Para el contraste cantidad de protena en la dieta no podemos separarlo de la fuente vegetal, ya que su calculo esta basado en las tres fuentes; sin embargo ya que no existe diferencia entre las fuentes de protena animal, su promedio es un

estimador adecuado del comportamiento de la protena de origen animal. La discusin del factor cantidad de protena en las fuentes de origen animal se discutir mas adelante. La siguiente figura muestra grficamente el comportamiento de las ganancias promedio de peso de acuerdo a la cantidad de protena para cada una de las fuentes de origen animal.

100 95 90 85 80 75 70 baja alta RES PUERCO

El contraste de interaccin (origen animal vs origen vegetal)*cantidad resulto ser significativo, por lo que se concluye que la cantidad de protena tiene un efecto diferente para la fuente vegetal y el promedio de la fuente de origen animal. La significancia de este contraste obliga a evaluar el efecto de la cantidad de protena separadamente para cada fuente. Para la fuente de origen vegetal el promedio de la cantidad alta de protena es 85.9 en tanto que para la cantidad baja de protena es 83.9, siendo entonces el efecto de 2 unidades. Para la fuente de origen animal, el promedio de la cantidad alta de protena es 99.75 en tanto que para la cantidad baja de protena es de 78.95, por lo que el efecto es de 20.8 unidades. La siguiente figura nos muestra el efecto de interaccin entre fuente y cantidad de protena, para el contraste (origen vegetal vs origen animal)*cantidad:

105 100 95 90 85 80 75 70 baja alta PROMEDIO O. ANIMAL SOYA

ARREGLOS FACTORIALES 2K Estos arreglos se caracterizan por tener incluidos K factores cada uno en dos niveles. Estos arreglos son de gran inters en los diversos campos de la ciencia y la ingeniera, donde la experimentacin es la principal herramienta de investigacin. Esto se debe a que constituye una gran diversidad de arreglos de tratamientos que permiten investigar una gran cantidad de factores con pocas corridas experimentales, principalmente en la fase de exploracin de impactos de las diferentes variables independientes sobre las variables de respuesta. Tambin son de inters porque constituyen la base para construir diseos experimentales en la fase de optimizacin de procesos, como son los diseos de metodologa de superficie de respuesta y los arreglos ortogonales de Taguchi. Nomenclatura: La nomenclatura particular para estos arreglos permite el manejo mas eficiente de las combinaciones de tratamiento. Con la nomenclatura simplificada tambin se logra un procedimiento para construir estos arreglos.

A cada uno de los factores se les asocia una letra mayscula latina, empezando con la letra A y continuando as hasta los K factores que se incluyen en el arreglo. Entonces tenemos los factores A, B, C,,K. Cada uno de los factores solo tiene dos niveles, a los que se les denomina el nivel bajo y el nivel alto. Esta nomenclatura es arbitraria para factores cualitativos no ordinales, pero para factores cuantitativos o cualitativos ordinales estos se asocian de acuerdo a la magnitud del nivel en el factor. Los niveles se representan con la letra minscula correspondiente al factor, denotando el nivel bajo con un subndice cero y el nivel alto con un subndice uno. De esta manera los nieles del factor A son a 0 y a1, a los cuales genricamente se les denomina el nivel bajo del factor A y el nivel alto del factor A. De manera equivalente se sigue esta notacin para los niveles de los K factores.

Construccin de los arreglos factoriales 2K: Los principios de construccin que se han revisado para los arreglos factoriales en general se aplican tambin para estos arreglos. Lo especial en el proceso va ser el orden estndar en que se acomodan las combinaciones de tratamiento. Este orden estndar consiste en que los niveles de los factores se colocan en columnas, empezando por el factor A, y as sucesivamente hasta el factor K. Los niveles del primer factor irn variando de 2 0 = 1 en 1, es decir los niveles del factor A van alternndose de uno en uno, empezando con el nivel bajo seguido del nivel alto, y as sucesivamente hasta el numero de combinaciones de tratamiento. En la segunda columna los niveles del factor irn variando de 21= 2 en 2, igualmente empezando con el nivel bajo y seguido por el nivel alto. Este proceso continuara hasta llegar al factor K., donde las primeras 2 K-1 combinaciones de tratamiento llevaran el nivel bajo del factor K y la mitad restante el nivel alto del factor K.. Como un ejemplo considere primero la construccin del arreglo 2 2 , con los factores A y B.. En este arreglo factorial tenemos 4 combinaciones de tratamiento (22 ) . Por esta razn empezamos con la primer columna hasta

completar cuatro combinaciones, alternando el nivel bajo y el nivel alto del factor A: a0 a1 a0 a1 En la segunda columna del arreglo factorial, los niveles del factor B van ir variando de 2 en 2, de tal forma que se generan las 4 combinaciones, como se muestra a continuacin: a0 b0 a1 b0 a0 b1 a1 b1 Si deseamos la construccin de una serie 2 el procedimiento es el mismo, pero debemos completar hasta 8 combinaciones bajo el mismo proceso, y al final agregar los niveles del factor C, que van a variar de 4 en 4, como a continuacin se muestra. a 0 b 0 c0 a1 b0 c0 a0 b1 c0 a1 b1c0 a 0 b 0 c1 a1 b0 c1 a0 b1 c1 a1 b1c1 Este proceso se seguira para cualquier valor de K. Sin embargo, a medida que K aumenta, mas tardada es la descripcin de las combinaciones. Para una mayor simplificacin, los subndices de las combinaciones se prefiri pasarlo como exponente, que al aplicarlo tiene simplemente el efecto de desaparecer la letra de la combinacin cuando el nivel es bajo y de dejarla cuando el nivel es alto. En la primera combinacin todas las letras desapareceran, quedando solamente un 1, que para distinguirlo como combinacin este se coloca entre parntesis. Bajo estas reglas se tiene: Arreglo 22 :

(1) a b ab Con esta notacin es mas directa la generacin de la siguiente serie, pues solo se duplica y a cada combinacin duplicada se multiplica por el nuevo factor. As para un 23 se tiene: (1) a b ab (1)*c = c a*c = ac b*c = bc ab*c = abc Ejemplo: Genere una serie 25: (1) a b ab c ac bc abc d ad bd abd cd acd bcd abcd e ae be abe ce ace bce abce de ade bde abde cde acde bcde abcde

Para la interpretacin de estas combinaciones solo debemos recordar que de los factores que entran en el factorial, las letras que aparecen en la combinacin son los que corresponden a un nivel alto del factor, mientras que las que no aparecen, corresponden a los factores que se encuentran a un nivel bajo. Debemos tener presente siempre que la combinacin (1) es aquella en la que todos los factores se encuentran a un nivel bajo. Contrastes en las series 2K : Los contrastes, aparte de que son la herramienta para el anlisis de los datos, van a constituir un elemento crucial en las tcnicas de factoriales fraccionados y bloques incompletos en estos arreglos. Lo primero que debemos puntualizar es que los contrastes deben estar asociados a la estimacin de efectos. En un arreglo 2 K podemos estimar los efectos principales de cada uno de los factores y en adicin todas las posibles interacciones de 2, 3, ., K factores.

Los efectos principales van a ser K. Las interacciones de 2 factores van a ser KC2 . Las interacciones de 3 factores van a ser KC3 . Y as sucesivamente hasta llegar a una sola interaccin de los K factores. As por ejemplo en la serie 25 los efectos que se van a poder estimar son: 5 efectos principales. 10 interacciones de 2 factores. 10 interacciones de 3 factores. 5 interacciones de 4 factores. 1 interaccin de 5 factores. Como podemos ver en este ejemplo, los efectos que podemos estimar, en numero corresponden a los grados de libertad de los tratamientos. Lo importante en estos arreglos es poder construir la tabla de contrastes, que por el lado de las hileras va llevar como encabezado a los tratamientos y por el lado de las columnas va a llevar los efectos que se van a estimar. El numero de columnas va ser igual al numero de hileras menos una. Los coeficientes que se van a emplear para construir los contrastes son siempre el -1 para el nivel bajo del factor y el +1 para el nivel alto del factor. Ejemplo: Construya la tabla de contrastes para la serie 2 3 : (1) a b ab c ac bc abc A -1 +1 -1 +1 -1 +1 -1 +1 B -1 -1 +1 +1 -1 -1 +1 +1 AB +1 -1 -1 +1 +1 -1 -1 +1 C -1 -1 -1 -1 +1 +1 +1 +1 AC +1 -1 +1 -1 -1 +1 -1 +1 BC +1 +1 -1 -1 -1 -1 +1 +1 ABC -1 +1 -1 +1 +1 -1 -1 +1

Para cualquier serie 2K

su tabla de contrastes tiene una propiedad muy

interesante que se deriva de sus coeficientes: Al elevar al cuadrado o cualquier potencia par, cualquier columna genera un elemento neutro, es decir una columna de puros unos. Esto implica que si multiplicamos las columnas correspondientes a los estimadores del factor A y la correspondiente a la interaccin AB, entonces obtenemos A 2B = B, ya que la potencia par a la que

esta elevada la columna A la transforma a un elemento neutro, que multiplicado por la columna B, genera el mismo resultado. Ejemplos numricos de arreglos factoriales 2 K: 1. Un ingeniero esta interesado en el efecto que tienen la rapidez de corte (A), la configuracin (B) y el ngulo de corte (C) sobre la duracion de una herramienta. Se eligen dos niveles de cada factor y se realiza un arreglo factorial 23 con 3 replicas. Los resultados se muestran a continuacin. Analice los resultados de este experimento y seleccione la combinacin para mejorar la durabilidad de la herramienta.

Combinacion (1) a b ab c ac bc abc

1 22 32 35 55 44 40 60 39

2 31 43 34 47 45 37 50 41

3 25 29 50 46 38 36 54 47

2. En la industria mueblera la calidad de acabado de las piezas diseadas es una caracterstica importante. Tres factores van a ser probados , cada uno en dos niveles, para evaluar su impacto en el acabado. El factor A es el tipo de madera (a0 = roble, a1 = pino) ; el factor B es la tasa de alimentacin (b0 = 2 m/min, b1 = 4 m/min); el factor C es la profundidad de corte (c 0 = 1 mm , c1 = 3 mm). Para cada combinacin de tratamiento tres repeticiones fueron llevadas a cabo usando un diseo completamente aleatorizado. La siguiente tabla muestra el acabado para los 8 tratamientod- Entre mas grande el valor mas aspero es el acabado. Combinacion (1) a 1 6 10 2 8 16 3 9 15

b ab c ac bc abc

18 12 20 34 36 25

12 9 26 28 44 22

15 10 29 32 46 24

Analice los datos y seleccione la mejor combinacin para mejorar el acabado. Estimacin de los efectos: Mediante la informacin que se obtiene en el anlisis por contrastes ortogonales en estos arreglos factoriales, podemos calcular una ecuacin de regresin lineal mltiple en los diferentes efectos principales e interacciones en unidades estandarizadas, es decir, considerando que los niveles de los factores son menos uno y mas uno. El cambio promedio en respuesta entre el nivel alto y el nivel bajo de un factor es la diferencia en los promedios del nivel alto menos el del nivel bajo. Este cambio promedio puede obtenerse a partir de la estimacin del contraste (suma de los productos de los coeficientes del contraste por sus correspondientes medias) al considerar que cada nivel del factor tiene la mitad de las medias incluidas en cada uno de los niveles. Entonces el cambio promedio en respuesta entre los niveles de un factor se calcula como el cociente del contraste entre la mitad del numero de combinaciones en el arreglo factorial (2k-1). El coeficiente de regresin se calcula como la pendiente de una recta, es decir el cambio en la variable dependiente dividido por el cambio en la variable independiente. El cambio en la variable dependiente el es cambio promedio en la respuesta entre los dos niveles y el cambio en la independiente es del valor -1 al valor +1, es decir dos unidades de cambio. De esta manera el coeficiente de regresin se estima dividiendo el cambio promedio en la respuesta entre dos. Debemos puntualizar dos situaciones: 1. Estos clculos son igualmente validos para los efectos de interaccin.

2.

Estos clculos pueden tambin ser llevados a cabo para factores cualitativos, pero carecen completamente de sentido al interpretarlos en unidades originales.

CONFUSIN EN LOS ARREGLOS FACTORIALES 2K La confusin es una consecuencia que se presenta en la estimacin de efectos factoriales al no llevar a cabo la totalidad de las combinaciones en un arreglo factorial y consiste en que un contraste estima la combinacin de dos o mas efectos factoriales. Las combinaciones de tratamiento se dividen con dos objetivos bsicos: 1. 2. Generar bloques incompletos. Generar factoriales fraccionados.

Los bloques incompletos se aplican cuando se tienen muchos factores que se van a investigar y consecuentemente las combinaciones que se deben probar son muchas y si las unidades experimentales no son homogneas, entonces probablemente no se puedan lograr bloques suficientemente grandes para generar un diseo en bloques completos al azar, y de ah que surja la necesidad de los bloques incompletos. En este caso se pretende confundir el efecto de bloques con un efecto que no sea de inters en el anlisis de los datos de un arreglo factorial, como pueden ser las interacciones de mas alto orden. Los factoriales fraccionados se procuran cuando no se tienen suficientes recursos para llevar a cabo todas las combinaciones de un arreglo factorial completo, o bien cuando los efectos que se desean estimar son aquellos de mas bajo orden (efectos principales e interacciones de dos factores). Al suponer que los efectos de mas alto orden no son de importancia en la variable de respuesta, estos se pueden confundir con los de mas bajo orden, y sin alterar demasiado la calidad de las estimaciones, estas se pueden hacer con un numero menor de combinaciones de las que incluye el arreglo factorial completo. Bloques incompletos:

El numero de bloques para llevar a cabo una replica del arreglo factorial 2K debe ser una potencia de 2, llmele P, donde P<K.. Entonces P puede tomar los valores 1,2,..,K-1. Sin embargo, los valores mas bajos de P son los que mas frecuentemente se emplean en la experimentacin. Cuando P=1 implica que solo se requieren dos bloques, de tal manera que se tiene asociado un solo grado de libertad para bloques, y as un solo efecto es el que debe confundirse con bloques. En este caso no cabe duda de que el efecto que se selecciona para ser confundido con bloques es el de mas alto orden de interaccin, pues este es el de menor importancia en general. Entonces la totalidad de las combinaciones del arreglo factorial completo se dividen de acuerdo a los signos del contraste de la interaccin de mas alto orden. Entonces una mitad de las combinaciones se asigna a uno de los bloques y la otra mitad al segundo bloque. De esta manera el contraste que estima la interaccin de mas alto orden estar estimando adicionalmente el efecto de los bloques. Ejemplo: Considere que se desea llevar a cabo un arreglo factorial 2 4 en dos bloques. Se desea confundir la interaccin de los 4 factores con el efecto de los bloques. Cual es la distribucin de las combinaciones del arreglo factorial a los bloques. La siguiente tabla hace la distribucin de los tratamientos en los dos bloques: Combn. (1) a b ab c ac bc abc d ad bd abd cd acd bcd abcd A -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 -1 +1 B -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 C -1 -1 -1 -1 +1 +1 +1 +1 -1 -1 -1 -1 +1 +1 +1 +1 D -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1 +1 +1 +1 +1 ABCD +1 -1 -1 +1 -1 +1 +1 -1 -1 +1 +1 -1 +1 -1 -1 +1 Bloque 1 2 2 1 2 1 1 2 2 1 1 2 1 2 2 1

El siguiente caso es cunado P=2, es decir cuando se tienen 2 2 bloques, lo que representa cuatro bloques, teniendo as tres grados de libertad para bloques y en cada bloque debe ir una cuarta parte del numero total de combinaciones en el arreglo factorial. Los efectos que deben ser confundidos sern dos de ellos independientes y el tercero lo constituir la interaccin de los dos independientes. El objetivo en la seleccin de los independientes sern dos: Primero que sean de alto orden y segundo, que la interaccin de los dos tambin sea de alto orden. Para obtener la interaccin de dos efectos recuerde que todas las letras de ambos efectos deben ser multiplicadas y aquellas que queden con una potencia par se neutralizan y por lo tanto se anulan, quedando solo aquellas con potencia impar. Ejemplo: Considere que se desea correr un arreglo factorial 2 5 en 4 bloques. Ya que son 4 bloques se deben confundir 3 efectos, dos de los cuales deben ser independientes y el tercero resultara de la interaccin de ambos. El efecto de mas alto orden es la interaccin de los 5 factores, es decir ABCDE. Si seleccionamos una interaccin de 4 factores, entonces la interaccin va a resultar en un efecto principal, lo que es totalmente reprobable. Debemos entonces pensar en una interaccin de tres factores, pero la interaccin con la de 5 va a resultar en una interaccin de 2 factores, lo cual tambin, en la mayora de las ocasiones es reprobable. Esto nos lleva entonces a la conclusin de que no es buena seleccin la interaccin de 5 factores. La siguiente opcin es seleccionar la interaccin de 4 factores, de tal forma que uno de los 5 factores no esta incluido. Si combinamos dicho factor con dos de los incluidos en la de cuatro factores, originara una interaccin de 3 factores. Esto es, suponiendo se selecciona la de 4 factores ABCD, el E no esta incluido. El factor E lo combinamos con AB y resulta en ABE. La interaccin de ambas selecciones resulta en una interaccin de tres factores. En las interacciones seleccionadas, resultara en CDE. Este es el orden mas alto de efectos que pueden ser considerados para lograr separar las combinaciones del arreglo 2 5 en 4 bloques de 8 combinaciones cada uno. La separacin esta basada ahora en los signos de dos de las tres interacciones confundidas. A continuacin se muestra el arreglo factorial ordenado por bloques de acuerdo a las interacciones previamente seleccionadas.

Combinacion A B C D E ABE CDE Bloque 1 -1 -1 -1 -1 -1 -1 -1 1 ab 1 1 -1 -1 -1 -1 -1 1 cd -1 -1 1 1 -1 -1 -1 1 abcd 1 1 1 1 -1 -1 -1 1 ace 1 -1 1 -1 1 -1 -1 1 bce -1 1 1 -1 1 -1 -1 1 ade 1 -1 -1 1 1 -1 -1 1 bde -1 1 -1 1 1 -1 -1 1 a 1 -1 -1 -1 -1 1 -1 2 b -1 1 -1 -1 -1 1 -1 2 acd 1 -1 1 1 -1 1 -1 2 bcd -1 1 1 1 -1 1 -1 2 ce -1 -1 1 -1 1 1 -1 2 abce 1 1 1 -1 1 1 -1 2 de -1 -1 -1 1 1 1 -1 2 abde 1 1 -1 1 1 1 -1 2 c -1 -1 1 -1 -1 -1 1 3 abc 1 1 1 -1 -1 -1 1 3 d -1 -1 -1 1 -1 -1 1 3 abd 1 1 -1 1 -1 -1 1 3 ae 1 -1 -1 -1 1 -1 1 3 be -1 1 -1 -1 1 -1 1 3 acde 1 -1 1 1 1 -1 1 3 bcde -1 1 1 1 1 -1 1 3 ac 1 -1 1 -1 -1 1 1 4 bc -1 1 1 -1 -1 1 1 4 ad 1 -1 -1 1 -1 1 1 4 bd -1 1 -1 1 -1 1 1 4 e -1 -1 -1 -1 1 1 1 4 abe 1 1 -1 -1 1 1 1 4 cde -1 -1 1 1 1 1 1 4 abcde 1 1 1 1 1 1 1 4

Esta misma tcnica se seguira para un factorial con un mayor numero de factores o con mas bloques incompletos. Antes de finalizar esta seccin solo resta recalcar que la confusin para bloques incompletos se emplea para confundir algunos efectos con el efecto de los bloques, pero el arreglo factorial se correra de manera completa. Factoriales fraccionados:

La confusin tambin se emplea cuando se desea seleccionar una parte del arreglo factorial 2K completo, debido a que puede ser excesivo los recursos requeridos en esto comparado con los efectos que se desean estimar. En trminos generales, los efectos que se desean estimar corresponden a los efectos principales y las interacciones de dos factores, en tanto que el resto de los efectos resultan de escasa o nula importancia. Bajo estas circunstancias se prefiere seleccionar solo una fraccin del arreglo factorial tal que permita la estimacin de estos efectos y un esquema de confusin de estos efectos (estructura de alias) razonable tal que las estimaciones sean confiables. Partimos, como en bloques incompletos, de un efecto que permite fraccionar en dos mitades el arreglo factorial completo. A tal efecto le denominamos el generador de la fraccin y se denota con la letra I. Como en el bloqueo, cuando se trata de una fraccin mitad, el generador debe ser la interaccin de mas alto orden. Entonces en base a esta interaccin las combinaciones de tratamiento quedan divididas en dos mitades, una con el signo positivo en la interaccin y la otra con el signo negativo. Es realmente indistinto cual se seleccione, reflejndose esto en el signo del generador. Ejemplo: Suponga que se desea llevar a cabo una fraccin mitad de un arreglo factorial 25, seleccionando como el generador la interaccin de mas alto orden. Defina para tal mitad la estructura de alias. En este arreglo factorial se consideran 5 factores, que denominaremos A, B, C, D y E. El arreglo factorial completo incluye 32 combinaciones de tratamiento, por lo que una mitad deber contener 16 combinaciones. La interaccin de mas alto orden que se va a seleccionar como el generador es ABCDE=I. Para construir la fraccin mitad existen 3 mtodos: 1. El arreglo factorial completo es generado, y para cada combinacin se obtienen los signos de la interaccin mas alta. Se selecciona como la fraccin mitad aquellas combinaciones que tengan el signo positivo. 2. Generar el arreglo con un factor menos que el deseado, con lo cual se tiene la fraccin mitad, agregando los niveles del ultimo factor como la interaccin de los que ya estn definidos.

3.

Mediante la operacin modulo 2 de la expresin definida por

L = X 1a 1 + X 2a 2 + X 3a 3 + X 4a 4 + X 5a 5 Donde las Xi toman el valor cero o uno dependiendo si el factor se encuentra en el generador y ai toma el valor cero o uno dependiendo si el factor se encuentra en la combinacin de tratamiento. La estructura de alias se define al multiplicar el generador en ambos lados de la igualdad por el por el efecto cuyos alias se desean conocer. Resolucin del diseo: Es el numero de factores en la interaccin de mas bajo orden que forma parte del generador.

ARREGLO EN PARCELAS DIVIDIDAS: Es un arreglo multifactorial en el que cada uno de los factores a investigar requieren de diferente tamao de unidad experimental para ser aplicado. As entonces, en un proyecto de investigacin podemos reconocer, desde el momento de la planeacion el factor que debe aplicarse a parcela grande y cual debe aplicarse a parcela pequea. Esta decisin implica un aspecto netamente practico. Por ejemplo, suponga que se desean probar en un experimento agrcola diferentes camas de siembra y diferentes niveles de fertilizacin. Si la aplicacin del factor cama de siembra requiere de maquinaria, entonces, este factor requerira de una unidad experimental de mayor tamao que aquella para aplicar los diferentes niveles de fertilizacin. Entonces el experimento debe ser planeado como un arreglo en parcelas divididas, con el factor de parcela grande la cama de siembra y como factor de parcela pequea la fertilizacin. El experimento incluira la aplicacin de un nivel de cama de siembra en una parcela grande, la cual seria dividida para la aplicacin de los diferentes niveles del factor fertilizacin. En este arreglo debe tambin definirse en la planeacion del experimento cual seria el arreglo geomtrico de las parcelas grandes, ya que puede ser completamente al azar, en bloques al azar (el mas comn) o en cuadro latino. Se supone que la parcela grande es homognea, y por lo tanto los niveles del

factor de parcela pequea se pueden distribuir completamente al azar dentro de cada parcela grande. Debemos entonces reconocer el arreglo geomtrico de las repeticiones de parcelas grandes, las mismas parcelas grandes y las subparcelas dentro de cada parcela grande. El modelo entonces debe incorporar el arreglo geomtrico de las repeticiones de parcela grande con su correspondiente error aleatorio, con el cual se probara el efecto del factor de parcela grande; debe incorporar tambin el diseo completamente al azar del as subparcelas, en el que se incluira el factor de subparcela, la interaccin del factor de parcela grande son subparcela y el error experimental con el que se probaran estos dos ltimos efectos.

PARCELAS DIVIDIDAS EN UN DISEO COMPLETAMENTE AL AZAR: Si las parcelas grandes son muy similares, entonces un arreglo geomtrico completamente al azar puede ser utilizado, por lo que el modelo quedara definido como:

Yijk = +i+j(i)+k+()ik+ijk
El subndice i esta asociado a los niveles del factor de parcela grande, por lo que i=1,2,,a, El subndice j esta asociado a las repeticiones de parcela grande, por lo que j=1,2,,r. El subndice k esta asociado a los niveles del factor de subparcela, por lo que k=1,2,,b. El modelo indica entonces que se tienen a niveles del factor de parcela principal con r repeticiones en cada nivel. El error de parcela grande esta representado por el componente

j(i) el

efecto de la repeticin anidada en el

nivel i del factor de parcela principal. Los grados de libertad para este modelo quedan distribuidos de la siguiente manera:
Fuente de variacin Parcelas Grandes G.L. ar 1

Factor A Error (a) Subparcelas: Factor B Interaccin A*B Error (b) Total

a1 a*(r - 1) ar*( b - 1 ) b1 ( a - 1 ) *( b - 1 ) a*( b - 1)*( r - 1 ) (abr) - 1

Este modelo de parcelas divididas es muy frecuentemente empleado para analizar datos que provienen de experimentos con mediciones repetidas al considerar el factor tiempo como el factor de subparcela. En algunas situaciones se sugiere emplear este arreglo experimental cuando la precisin con que se desean llevar a cabo la comparacin de las medias no es la misma para amos factores; se seleccionara como factor de subparcela aquel en el que se quieren comparaciones mas precisas. PARCELAS DIVIDIDAS EN UN DISEO EN BLOQUES COMPLETOS AL AZAR: Al aplicar este arreglo suponemos que las repeticiones e parcela principal tienen un gradiente de variacin que se desea controlar como variable de bloqueo. Entonces si el factor de parcela principal tiene a niveles, cada bloque debe contener a unidades experimentales, donde se distribuyen al azar los niveles del factor de parcela principal. Supngase que se tienen r bloques, quedando el modelo descrito por

Yijk = +i+j+ ()jj+k+()ik+ijk


Donde ahora

constituye el efecto de los bloques y su interaccin con el

factor A de parcela grande constituye el error de parcela grande. El desdoblamiento de los grados de libertad se presenta en la siguiente tabla:
Fuente de variacin Parcelas Grandes Factor A Factor de bloqueo Error (a) G.L. ar - 1 a-1 r-1 ( a - 1 )*( r - 1 )

Subparcelas: Factor B Interaccin B*bloqueo Interaccin A*B Error (b) Total

ar*( b - 1 ) b-1 ( r - 1 )*( b - 1 ) ( a - 1 ) *( b - 1 ) ( a - 1 )*( b - 1 )*( r - 1 ) (abr) - 1

PARCELAS DIVIDIDAS EN UN DISEO EN CUADRO LATINO: Si las parcelas principales muestran variacin en dos gradientes de bloqueo, por hileras y columnas, entonces debe adoptarse un arreglo geomtrico de las parcelas principales en cuadro latino. Este arreglo debe ser representado en el modelo como:

Yijk = +i+j+k+ ()jjk+l+()il+ijkl


El subndice j esta asociado al efecto de las hileras y el subndice k al efecto de las columnas. La interaccin de hileras columnas y tratamientos de parcela principal es el componente de error para parcela grande. El desdoblamiento de los grados de libertad queda como:
Fuente de variacin Parcelas Grandes Factor A Factor de hileras Factor de columnas Error (a) Subparcelas: Factor B Interaccin A*B Error (b) Total G.L. a^2 - 1 a-1 a-1 a-1 ( a - 1 )*( a - 2 ) a^2*( b - 1 ) b-1 ( a - 1 ) *( b - 1 ) a * ( a - 1 )*( b - 1 ) (a^2)*b - 1

De las principales desventajas que se tienen con el arreglo en parcelas divididas es la estimacin del error estndar de las diferencias de las medias, para poder hacer las comparaciones de medias, que son diferentes para cada factor y su interaccin. Se recomienda que en caso de ser necesarias las comparaciones estas se hagan en algn paquete que las arroje como parte de

la salida del anlisis (como por ejemplo el SAS) o en su defecto, consultar los errores estndar de las diferencias en una referencia de diseos experimentales para poder aplicarlas manualmente. Desde luego este anlisis es mas complicado cuando la interaccin resulta ser significativa. Ejemplos:

2. Se llevo a cabo un experimento bajo un arreglo en parcelas divididas para probar el efecto de 3 hibridos (utilizado como factor de parcela principal) acomodados en un diseo en bloques completos al azar. Dentro de cada parcela grande se acomodaron bajo un diseo completamente al azar las 4 densidades (10,15,20 y 25 plantas por hilera). Los datos se muestran a continuacin:
BLOQUE 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 HIBRIDO 1 1 1 1 2 2 2 2 3 3 3 3 1 1 1 1 2 2 2 2 3 3 3 3 1 1 1 1 2 DENSIDAD RESPUESTA 10 40.7 15 24.2 20 16.1 25 11.2 10 39.4 15 31.3 20 17.9 25 14.8 10 68.7 15 26.2 20 20.5 25 18.9 10 37.8 15 44.4 20 17.6 25 12.7 10 47.8 15 34.5 20 30.5 25 17.3 10 56.2 15 48.1 20 28.2 25 26.2 10 32.9 15 27.8 20 19.9 25 14.5 10 44.4

3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4

2 2 2 3 3 3 3 1 1 1 1 2 2 2 2 3 3 3 3

15 20 25 10 15 20 25 10 15 20 25 10 15 20 25 10 15 20 25

25.6 22.5 17.7 44.8 41.1 30 19.2 43.1 34.1 20.1 15.4 49 50.4 25.2 18.7 59.3 46 24.7 22

El anlisis de varianza de este experimento se muestra en la siguiente tabla:


F.V. Parcela Grande Bloques Hibridos Hibridos*Bloques Subparcela Densidad Debsidad*Hibrido Error (b) Total G.L. 11 3 2 6 36 S.C. C.M. 1335.6 121.418182 408.985 136.328333 881.40875 440.704375 58.4924927 5.14325285 0.000116117 45.20625 7.534375 7653.93 212.609167 Fc Ft (.05) P-Valor

3 6429.38833 2143.12944 56.8953538 2.96035132 8.46431E-12 6 207.507917 34.5846528 0.91814615 2.45910844 0.497266439 27 1017.03375 37.6679167 47 8989.53

De donde se puede concluir que los efectos de hibrido y densidad son independientes, por lo que cada uno de ellos puede ser analizado independientemente. Por un lado, las medias de los hibridos estn dadas por
Media Hibidos 1 25.78125 Hibrido 2 30.4375 Hibrido 3 36.25625

Y el error estndar de la diferencia de las medias esta dado por: 0.666

Por lo que a un nivel de confianza del 95 % las tres medias resultan estadsticamente diferentes, siendo entonces el mejor hibrido el numero 3. Por otro lado el efecto de la densidad puede ser evaluado mediante una regresin: Respuesta = 66.61 2.045*Densidad Con un coeficiente de determinacin de 0.835 y un error estndar de 7.68. De estos resultados se desprende entonces que el mejor hibrido es el 3 que debe cultivarse bajo la densidad mas baja evaluada.

METODOLOGIA DE TAGUCHI: La metodologa de Taguchi es sinonimo de ingeniera de calidad y tiene por objetivo disear calidad en todo producto y su correspondiente proceso. Taguchi introduce una filosofa en la que la calidad es medida por la desviacin del valor de una caracterstica con respecto a su valor ptimo. Factores no controlables (ruido) ocasionan tales desviaciones. La eliminacin de los factores de ruido es impractico y muy a menudo imposible, de aqu que el mtodo de Taguchi procura minimizar los efectos de ruido. A travs de esta metodologa se determina el nivel ptimo de los factores controlables importantes basados en el concepto de robustez. El objetivo es crear un diseo de producto / proceso que sea lo menos sensible posible a las fluctuaciones de los factores de ruido (robusto) al establecer los factores controlables de impacto en los niveles ptimos. El diseo de parmetros usa la idea fundamental del procedimiento en dos pasos para lograr la calidad: 1. Los niveles de los parmetros que minimizan la variabilidad de la caracterstica de calidad son seleccionados. En esta etapa se genera un diseo que es robusto con respecto a las fuentes incontrolables de variacin. 2. Los parmetros que tienen un efecto en el valor promedio de la caracterstica de calidad, pero ningn impacto en la variabilidad, son identificados. Estos parmetros conocidos como factores de ajuste,

son usados para mover la caracterstica de calidad al valor otimo sin incrementar varianza. FUNCIN DE PERDIDA: Para evaluar la calidad en trminos monetarios, Taguchi crea la funcin de perdida, la cual estima el costo que la sociedad tiene que pagar por una desviacin de la caracterstica de calidad en un producto con respecto a su valor blanco. En esta funcin se supone que la perdida es proporcional al cuadrado de la desviacin de la caracterstica de calidad con respecto a su valor blanco. Esta funcin se define de acuerdo al tipo de caracterstica de calidad: Caractersticas de calidad del tipo Nominal es mejor: L(y) = K ( y m )2 L(y) es la funcin de perdida evaluada en el valor y de la caracterstica de calidad. K es una constante de proporcionalidad. m es el valor optimo de la caracterstica de calidad. El valor esperado de la funcin de perdida para este tipo de caractersticas de calidad esta dado por: K*(Varianza(y) + (media(y)-m) 2) Caractersticas de calidad del tipo mas pequeas es mejor: L(y) = K ( y 0)2 L(y) = K ( y )2 El valor esperado de la funcin de perdida es K*(Media( y2)) Caractersticas de calidad del tipo mayor es mejor: L(y) = K ( 1/y 0)2 L(y) = K (1/ y )2 El valor esperado de la funcin de perdida es K*(Media( 1/y)2)

Ejemplo numrico: Un producto tiene la especificacin 1.5 0.02 en una caracterstica de calidad. Al exceder justo estos limites el costo es de 50. 10 productos son seleccionados y se les mide su valor en dicha caracterstica: 1.53 , 1.49, 1.50, 1.49 , 1.48 , 1.52 , 1.54 , 1.53, 1.51 , 1.52 Encuentre el promedio de perdida por unidad de producto. El procedimiento para encontrar el valor de la constante K es sustituir los datos conocidos en la funcin de perdida: L(1.52) = L(1.48) = 50 y-m = 0.02 50 = K*(.02) K = 50/0.0004 = 125000 La funcin de perdida promedio esta dada por E{L(y)} = 125000(0.000369 + 0.000121) = 61.25 Razn Seal a Ruido (RSR): Taguchi define esta variable para el anlisis de los datos obtenidos de sus arreglos ortogonales. Incluye, como su nombre lo indica la razn de dos componentes: El termino seal representa el componente deseable, que preferiblemente estar cercano al valor optimo de la caracterstica de calidad. El termino ruido representa el componente indeseable y es una medida de la variabilidad de la caracterstica de calidad, la cual preferiblemente debe estar cercana a cero. El valor optimo de la razn seal a ruido debe ser tan grande como sea posible, sin importar el tipo de caracterstica de calidad de que se trate. RSR para variables de calidad del tipo nominal es mejor: Para este tipo de caractersticas de calidad debemos distinguir dos casos: 1. Varianza no relacionada a la media: Bajo esta situacin el principal inters es reducir la varianza de la caracterstica de calidad. La RSR esta definida por Z = log(varianza). 2. Varianza relacionada a la media: RSR para variables de calidad del tipo mas pequea es mejor: Z = -10 log (Media(y)) Z = 10 log(media/desv.est)

RSR para variables de calidad del tipo mas grande es mejor: Z = -10 log (Media(1/y)) Ejemplos: 1. Una firma de ingeniera de construccin esta llevando a cabo estudios de la firmeza de tensin de varias formulaciones de concreto. Seis variables de inters han sido identificadas y los niveles a los que han sido probados son mostrados en la siguiente tabla: Variable Tamao de espcimen (A) Cantidad de Agua (B) Tiempo de curado (C) Tcnica de mezclado (D) Agregado (E) Concentracin de cemento (F) Nivel 1 2 Baja 24 Manual Fino Baja Nivel 2 4 Alta 48 Maquina Grueso Alta

Un arreglo ortogonal L8 fue usado para estudiar los efectos de los 6 factores sobre la firmeza. Los resultados del experimento son mostrados en la siguiente tabla: Num 1 2 3 4 5 6 7 8 C 1 1 1 1 2 2 2 2 B 1 1 2 2 1 1 2 2 A 1 2 1 2 1 2 1 2 D 2 1 1 2 2 1 1 2 E 2 1 2 1 1 2 1 2 e 2 2 1 1 1 1 2 2 F 1 2 2 1 2 1 1 2 R1 2.3 3.5 3-0 2.1 3.5 2.6 2.9 3.9 R2 2.2 3.3 2.9 1.9 3.6 2.7 2.8 4.1

Construya una tabla de anova para identificar las variables que tienen un efecto significativo sobre la media de la firmeza. 2. En una compaa de aviacin se desea determinar cual de los siguientes 4 factores tienen mas impacto sobre el grosor de la pintura. Adems se quisiera reducir la variabilidad en el grosor de la pintura alrededor del optimo de 0.5 mm de grosor. Los factores y los niveles son:

Variable Cantidad de tiner (A) Presion de fluido (B) Temperatura (C) Marca de la pintura (D)

Nivel 1 10 15 68 X

Nivel 2 20 30 78 Y

Fue decidido conducir u arreglo ortogonal L8 con 4 replicas para cada corrida experimental. La matriz de diseo no codificada y los resultados son mostrados: Ens 1 2 3 4 5 6 7 8 A 10 10 10 10 20 20 20 20 B 15 15 30 30 15 15 30 30 C 68 78 68 78 68 78 68 78 D X Y Y X Y X X Y R1 0.638 0.496 0.562 0.564 0.659 0.549 0.842 0.910 R2 0.489 0.509 0.493 0.632 0.623 0.457 0.910 0.898 R3 0.541 0.513 0.529 0.507 0.636 0.604 0.657 0.913 R4 0.477 0.495 0.531 0.757 0.584 0.386 0.953 0.878

3. Un ingeniero de proceso trata de mejorar la vida de una cierta herramienta de corte. El ha corrido un experimento bajo un arreglo ortogonal L8 usando tres factores: Velocidad de corte (A), dureza del metal (B) y ngulo de corte (C). Los resultados obtenidos a partir del experimento son mostrados: Ensayo 1 2 3 4 5 6 7 8 R1 221 325 354 552 440 406 605 392 R2 311 435 348 472 453 377 500 419

Lleve a cabo el anova para la RSR y obtenga la combinacin de los niveles de los factores que producen la mas larga vida de la herramienta. 3. En un componente de un motor automotriz se desea maximizar la fuerza de empuje de una vlvula. Los investigadores identificaron 4

factores controlables y 3 de ruido que probablemente afecten la fuerza de empuje. La siguiente tabla muestra los factores y sus niveles. Factores Controlables: A. B. C. D. E. F. G Interferencia: Grosor de la pared Porciento de Adhesivo Tiempo Condicionamiento Humedad relativa Condicionan Baja Delgada Bajo Media Media Media Medio 24 hrs. 25 Alta Gruesa Profunda Alto 120 hrs. 150 F 75 %

Profundidad de Insercin Superficial

Factores no controlables: Temperatura Condicionamiento 72

Los factores de ruido son incontrolables durante la operacin normal del proceso, pero fueron controlados para los propsitos de la prueba. Un arreglo L9 es apropiado para el arreglo interno, mientras que un arreglo L8 es apropiado para el arreglo externo. Los arreglos externo e interno son combinados para formar el diseo de parmetros completo: A 1 1 1 2 2 2 3 3 3 B 1 2 3 1 2 3 1 2 3 C 1 2 3 2 3 1 3 1 2 D 1 2 3 3 1 2 2 3 1 1 15.6 15.0 16.3 18.3 19.7 16.2 16.4 14.2 16.1 2 9.5 16.2 16.7 17.4 18.6 16.3 19.1 15.6 19.9 3 16.9 19.4 19.1 18.9 19.4 20.0 18.4 15.1 19.3 4 19.9 19.2 15.6 18.6 25.1 19.8 23.6 16.8 17.3 5 19.6 19.7 22.6 21.0 25.6 14.7 16.8 17.8 23.1 6 19.6 19.8 18.2 18.9 21.4 19.6 18.6 19.6 22.7 7 20.0 24.2 23.3 23.2 27.5 22.5 24.3 23.2 22.6 8 19.1 21.9 20.4 24.7 25.3 24.7 21.6 24.2 28.6

Encontrar la combinacin optima de los factores que maximizan la fuerza de empuje con la mnima variacin por efecto de los factores de ruido. 4. En una planta procesadora de alimentos 4 parmetros (A,B,C,D) cada uno en 3 niveles han sido identificados como factores de posibles impactos en el contenido de humedad en carne empaquetada. 3 factores de ruido (E,F,G) cada uno en dos niveles van a ser tambin investigados en el experimento. En el arreglo

interno un L9 es usado con los factores A, B, C y D asignados a las columnas 1, 2, 3 y 4. Arreglo Ortogonal L9: Ensayo 1 2 3 4 5 6 7 8 9 A (A) 0 0 0 1 1 1 2 2 2 B (B) 0 1 2 0 1 2 0 1 2 AB (AB) 0 1 2 1 2 0 2 0 1 AB (AB) 0 1 2 2 0 1 1 2 0

Para el arreglo externo un arreglo ortogonal L4 es usado con los factores E,F y G asignados a las columnas 1, 2 y 3 respectivamente. Arreglo Ortogonal L4: Ensayo 1 2 3 4 E 0 0 1 1 F 0 1 0 1 G 0 1 1 0

Se desea que el contenido de humedad este alrededor de un valor codificado de 20. Calcular la respuesta media y la razn seal a ruido. Graficar los promedios de las medias de respuesta y de las razones seal a ruido y seleccionar los niveles de los factores. Como se pueden identificar grficamente las interacciones BE y CF. Los contenidos de humedad registrados en la carne empaquetada fueron registrados: Ensayo AO E Ensayo AO I 1 2 3 4 5 6 7 1 18.5 16.8 21.1 20.2 16.2 18.3 20.6 2 21.2 17.3 21.8 17.7 21.5 18.5 21.4 3 20.5 20.9 20.8 19.8 21.2 17.8 16.9 4 19.3 18.5 19.4 20.8 21.4 17.2 19.5

8 9

17.5 20.4

20.0 18.8

21.0 19.6

20.4 18.3

Suponga que se decide extender el arreglo externo a un L8 con las asignaciones como sigue: Efecto E F EF G EG experimental. Mostrar el diseo de parmetros completo. Calcular las respuestas promedio y la razn seal a ruido apropiada. Graficar los promedios de las razones seal a ruido y las respuestas promedio y discutir como van a ser seleccionados los niveles ptimos de los factores. Use las graficas de respuestas promedio para determinar la existencia de los efectos de interaccin AE, BF, EF y EG. Columna 1 2 3 4 5

Las otras dos columnas del arreglo L8 pueden ser asignadas al error

La siguiente tabla muestra los contenidos de humedad registrados. 1 19.3 20.6 18.3 20.8 18.7 21.1 17.5 20.4 18.0 2 20.2 18.5 20.7 21.2 19.8 20.2 18.3 21.2 20.2 3 19.1 20.2 19.4 20.2 19.4 22.4 20.0 22.4 17.6 4 18.4 19.4 17.6 19.9 17.2 20.5 18.8 21.9 22.4 5 21.1 20.1 20.4 21.7 18.5 18.7 20.2 21.5 17.2 6 20.6 16.3 17.3 22.2 19.7 21.4 17.7 20.8 21.6 7 19.5 17.2 18.2 20.4 18.8 21.8 17.9 22.5 18.5 8 18.7 19.4 19.2 20.6 18.4 20.6 18.2 21.7 19.2

1 2 3 4 5 6 7 8 9

Metodologa de superficie de respuesta: La metodologa de superficie de respuesta incluye una serie de herramientas de optimizacin, que tienen por objetivo llegar a determinar bajo que condiciones de las variables independientes investigadas se llega a maximizar o minimizar la respuesta o variable dependiente de inters. Para lograr este objetivo se emplea el ajuste de dos modelos de regresin: En una primera etapa exploratoria se investiga secuencialmente una regin de las variables independientes mediante el ajuste de modelos de primer orden, en donde se supone que los resultados del ajuste del modelo van indicando la direccin en que deben moverse las variables independientes. Para este fin se utilizan los diseos de primer orden, que consisten de dos porciones: Una porcin factorial, que puede ser una factorial completo dos a la K o una fraccin del factorial, en caso de ser muchos los factores que se estn investigando. Una porcin central, que consiste en un punto en el que todos los factores se prueban en el punto medio de los niveles empleados en el factorial, lo que correspondera al cero en unidades codificadas. Este es el nico punto es el que lleva repeticiones y cuya finalidad es: Primero evaluar el error puro y en segundo lugar probar curvatura en alguna de las variables cuyo efecto se esta investigando. Esta serie de diseos se van aplicando hasta que el anlisis de datos detecta una curvatura. En esta regin se disea un experimento para ajustar un modelo de segundo orden, que permita ajustar un modelo de segundo orden con la finalidad de identificar el punto optimo. Los diseos de segundo orden, aparte de la porcion factorial y la porcion central, llevan adicionalmente la porcion axial o porcion estrella, que son los valores extremos en cada una de las variables independientes que se prueban en el cero codificado del resto de las variables independientes. El valor codificado de esta porcion en cada una de las variables independientes se denomina alfa ( ) y es igual a la raz cuarta del numero de puntos en la porcion factorial, valor que le da la caracterstica de rotabilidad al diseo, es

decir, la precisin de la estimacin es la misma en cualquier punto de la regin investigada. Por eso, estos diseos se conocen como diseo central compuesto rotable. La finalidad de esta porcion es aumentar el numero de niveles en cada una de las variables independientes para poder ajustar el modelo de segundo orden. Bajo este modelo, si no existe falta de ajuste, entonces puede ser usado para encontrar el optimo en la variable de respuesta. Ejemplo 1: Los siguientes datos fueron recopilados por un ingeniero qumico. La respuesta Y corresponde al tiempo de filtracin, X1 es la temperatura y X2 es la presin. Ajuste un modelo de segundo orden y analice la superficie ajustada.
X1 -1 -1 1 1 -1.414 1.414 0 0 0 0 0 0 0 X2 1 -1 1 -1 0 0 -1.414 1.414 0 0 0 0 0 Y 54 45 32 47 50 53 47 51 41 39 44 42 40

Ejemplo 2: Los datos que se presentan en la siguiente tabla fueron recopilados en un experimento para optimizar el crecimiento de cristales en funcin de tres variables. Se desean valores altos de Y (rendimiento en gramos). Ajuste un modelo de segundo orden. Determine bajo que condiciones de las variables se logra un crecimiento optimo.
Codif X1 -1 -1 -1 -1 1 1 1 1 -1.682 Codif X2 -1 -1 1 1 -1 -1 1 1 0 Codif X3 -1 1 -1 1 -1 1 -1 1 0 Resp Y 66 70 78 60 80 70 100 75 100

1.682 0 0 0 0 0 0 0 0 0 0

0 -1.682 1.682 0 0 0 0 0 0 0 0

0 0 0 -1.682 1.682 0 0 0 0 0 0

80 68 63 65 82 113 100 118 88 100 85

El anlisis de los datos se lleva a cabo por medio de regresin del ajuste del modelo de segundo orden. El anova del modelo completo es mostrado en la siguiente tabla:
ANLISIS DE VARIANZA Grados de libertad Regresin 9 Residuos 10 Total 19

Suma de cuadrados 3661.97123 1860.97877 5522.95

Promedio de los Valor crtico cuadrados F de F 406.885692 2.18640695 0.11943925 186.097877

Lo que indica que el modelo no es significativo. Investigamos entonces los trminos incluidos en el modelo completo y vemos que solo los trminos cuadraticos en la variable codificada x2 y x3 son significativos, por lo que se procede a ajustar un modelo reducido, cuyo anlisis de varianza se muestra en la siguiente tabla:
ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Falta de ajuste Error puro Total 2 17 12 5 19 Suma de cuadrados 3087.06694 2435.88306 1576.55497 859.33333 5522.95 Promedio de los Valor crtico cuadrados F de F 1543.53347 10.7723024 0.00095088 143.287239 131.37914 0.76442482 171.86666 0.67603346

Lo que indica que el modelo es significativo y no existe una evidencia de la falta de ajuste, por lo que se concluye que es el modelo que mejor explica este conjunto de observaciones. Los estimadores de los parmetros del modelo se muestran a continuacin:
Coeficiente s Estadstico t Probabilida d

Error tpico

Intercepcin codif x2^2 codif x3^2

97.58157 4.1440598 23.5473372 2.0442E-14 -12.05327 3.13701026 -3.8422819 0.00130536 -9.225547 3.13701026 -2.9408725 0.00913491

Siendo ambos coeficientes negativos, se concluye que al separarse los niveles del valor cero en las variables independientes de impacto la respuesta va a tender a disminuir. Una grafica de los valores observados y los esperados por el modelo ajustado nos da una vision de la aproximacin del modelo.
esperados 100 95 90 85 80 esperados 75 70 65 60 55 50 50 60 70 80 90 Observados 100 110 120 130

El valor que genera la maxima respuesta es quel en el que las variables independientes de impacto estn en el valor cero. Ejemplo 3.Un ingeniero qumico esta interesado en determinar las condiciones de operacin que maximizan el rendimiento de una reaccin. Dos variables controlables Dos variables controlables influyen en este rendimiento: El tiempo y la temperatura de reaccin. Los datos obtenidos de un experimento se analizan para ajustar un modelo de segundo orden y obtener las condiciones en las cuales se optimiza la reaccin:
Variable Nat 1 80 80 90 Variable Nat. 2 170 180 170

Var. Codif x1 -1 -1 1

Var Codif x2 -1 1 -1

Resp Y 76.5 77 78

90 85 85 85 85 85 92.07 77.93 85 85

180 175 175 175 175 175 175 175 182.07 167.93

1 0 0 0 0 0 1.414 -1.414 0 0

1 0 0 0 0 0 0 0 1.414 -1.414

79.5 79.9 80.3 80 79.7 79.8 78.4 75.6 78.5 77

En primer lugar se muestra la tabla de anlisis de varianza donde se observa que el modelo es significativo.

ANLISIS DE VARIANZA Grados de libertad Regresin 5 Residuos 7 Total 12

Suma de cuadrados 28.2467034 0.49637349 28.7430769

Promedio de los cuadrados 5.64934069 0.0709105

F 79.668607

Valor crtico de F 5.147E-06

De aqu se procede a revisar los estimadores de los parmetros para investigar si todos tienen significancia.
Coeficientes 79.9399546 0.99505025 0.5152028 -1.37644928 -1.001336 0.25 Error tpico 0.11908862 0.09415493 0.09415493 0.10098417 0.10098417 0.13314513 Probabilida Estadstico t d 671.264433 4.3003E-18 10.5682224 1.4845E-05 5.47186207 0.00093401 -13.6303472 2.693E-06 -9.91577205 2.262E-05 1.8776504 0.10251919

Intercepcin x1 x2 x1^2 x2^2 x1*x2

Solo el termino de efecto cruzado de las dos variables se detecta como no significativo, por lo que se procede a ajustar un modelo reducido, eliminando dicho termino. Ejemplo 4: Un ingeniero esta interesado en determinar las condiciones optimas requeridas para una nueva sierra. Un diseo central compuesto fue usado en un experimento para evaluar la vida de la sierra bajo diferentes condiciones de operacin fijadas por la velocidad de corte y la profundidad del corte.
Velocidad Profundidad x1 600 0.1 600 0.05 x2 Vida Herr. 154 132

200 200 683 117 400 400 400 400 400 400 400 400

0.1 0.05 0.075 0.075 0.11 0.04 0.075 0.075 0.075 0.075 0.075 0.075

166 83 156 144 166 91 167 175 170 176 156 170

Ajustar un modelo de segundo orden y determinar las condiciones que optimizan la vida de la herramienta. Al llevar a cabo el ajuste del modelo de segundo orden se obtiene la siguiente tabla de anlisis de varianza:
ANLISIS DE VARIANZA Grados de libertad Regresin 5 Falta de ajuste 3 Error puro 5 Residuos 8 Total 13 Suma de cuadrados 10955.1767 102.251895 260 362.251895 11317.4286 Promedio de los Valor crtico cuadrados F de F 2191.03534 48.3870007 9.1102E-06 34.083965 0.65546086 0.61339158 52 45.2814869

De donde podemos concluir que el modelo es significativo. Al considerar la prueba de la falta de ajuste no es significativa, por lo que no es necesario introducir nuevos parmetros al modelo. Enseguida se muestra la tabla de coeficientes del modelo completo y sus pruebas de significancia para determinar aquellos que sobran en el modelo:
Probabilida Estadstico t d 61.5248242 5.4139E-12 2.83535076 0.02196856 11.0891016 3.9035E-06 -4.3492113 0.00244787 -8.74566247 2.2867E-05 -4.53251761 0.001918

Intercepcin x1 x2 x1^2 x2^2 x1*x2

Coeficientes 169.016235 6.74374879 26.5151515 -10.756724 -21.9855591 -15.25

Error tpico 2.7471226 2.3784531 2.39110005 2.47325855 2.5138815 3.36457601

Al revisar los valores de probabilidad, todos resultaron ser menores de 0.05, de donde concluimos que todos son importantes para explicar la respuesta. Una

grafica de observados contra esperados es mostrada para revisar el nivel de ajuste del modelo:
esperados 180 170 160 150 140 Esperados 130 120 110 100 90 80 60 80 100 120 Observados 140 160 180 200

You might also like