You are on page 1of 40

SEP

SEIT

DGIT

INSTITUTO TECNOLOGICO
DE CERRO AZUL
PRESENTAN
ALEJANDRA BAUTISTA NORBERTO A13500284
CAROLINA VARGAS PERDOMO A13500269
MARIA DEL ROSARIO MARTINEZ DE LA CRUZ A13500128
NORA HILDA HERNADEZ REYES A13500275
JULIO EDUARDO DURAN HERNANDEZ A12500354
REYNA REYES DE LA CRUZ A13500165
YESICA DE JESUS PETRONILO A13500232
VICTOR JAVIER SALVADOR DEL ANGEL A13500264

CATEDRATICO:
ING.JUAN PEDRO TORRES HERNANDEZ

MATERIA:
ESTADISTICA INFERENCIAL II
UNIDAD:
UNIDA 2.- DISEO DE EXPERIMENTOS DE UN FACTOR
ESPECIALIDAD:
ING. INDUSTRIAL S.A

CERRO AZUL, VER.; A 21 DE MARZO DEL 2015

INDICE

Introduccin
2.1 familia de diseos para comparar tratamientos
2.2 el modelo de efectos fijos
2.3 diseos completamente aleatorios y ANOVA
2.4 comparaciones o prueba de rangos mltiples
2.5 verificacin de los supuestos del modelo
2.6 uso de un software estadstico
Conclusin
Bibliografa

Introduccin
En esta unidad se presentan los diseos experimentales que se utilizan cuando el
objetivo es comparar ms de dos tratamientos.
Puede ser de inters comparar tres o ms mquinas, varios proveedores, cuatro
procesos, tres materiales ,etc..
El inters del experimentador est centrado en comparar los tratamientos en
cuanto a sus medias poblacionales, sin olvidar que tambin es importante
compararlos con respecto a sus varianzas. As, desde el punto de vista estadstico

2.1 Familia de diseos para comparar tratamientos


Los diseos experimentales ms utilizados para comparar tratamientos son:
1. Diseo completamente al azar (DCA)
2. Diseo en bloque completamente al azar (DBCA)
3. Diseo en cuadro latino (DCL)
4. Diseo en cuadro grecolatino (DCGL)
La diferencia fundamental entre estos diseos es el nmero de factores de bloque
que incorporan o controlan de forma explcita durante el experimento. La
comparacin de los tratamientos en cuanto a la respuesta media que logran, en
cualquiera de estos diseos, se hace mediante la hiptesis

que se prueba con la tcnica estadstica llamada Anlisis de Varianza (ANOVA)


con uno, dos, tres o cuatro criterios de clasificacin, dependiendo del nmero
de factores de bloques incorporados al diseo.

El modelo estadstico que describe el comportamiento de la variable observada


Y en cada diseo, incorpora un trmino adicional por cada factor de bloqueo

Controlado.
De acuerdo con los modelos dados en la tabla, para cada diseo comparativo se
tienen al menos dos fuentes de variabilidad: los tratamientos o niveles del factor
de inters y el error aleatorio. Se agrega una nueva fuente de variabilidad por cada
factor de bloque que se controla directamente. Se observa que los diseos
suponen que no hay efectos de interaccin entre los factores, lo cual sera lo
deseable que ocurra; de no ocurrir as, tal efecto se recarga al error y el problema
de comparacin no se resuelve con xito. Un efecto de interaccin entre dos
factores hace referencia a que el efecto de cada factor depende del nivel en que
se encuentra el otro.

2.2 El modelo de efectos fijos


El modelo de efectos fijos (es cuando se estudian todos los posibles tratamientos)
de anlisis de la varianza se aplica a situaciones en las que el experimentador ha
sometido al grupo o material analizado a varios factores, cada uno de los cuales le
afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin
normal.
Este modelo se supone cuando el investigador se interesa nicamente por los
niveles del factor presentes en el experimento, por lo que cualquier variacin
observada en las puntuaciones se deber al error experimental.

En la prctica puede suceder que los tratamientos que se desea comparar sean
demasiados como para experimentar con todos. Cuando esto sucede es
conveniente comparar slo una muestra de la poblacin de tratamientos, de modo
que pasa a ser una variable aleatoria con su propia varianza
que deber
estimarse a partir de los datos. En este captulo slo se presenta el caso en que
todos los tratamientos que se tienen se prueban, es decir, se supone una
poblacin pequea de tratamientos, lo cual hace posible compararlos a todos. En
este caso, el modelo dado por la ecuacin (2.2) se llama modelo de efectos fijos.

2.3. Diseo completamente al azar y ANOVA


Muchas comparaciones, como las antes mencionadas, se hacen con base en el
diseo completamente al azar (DCA), que es el ms simple de todos los diseos
que se utilizan para comparar dos o ms tratamientos, dado que slo consideran
dos fuentes de variabilidad: los tratamientos y el error aleatorio. En la siguiente
unidad veremos diseos que consideran la influencia de otras fuentes de
variabilidad (bloques).Este diseo se llama completamente al azar porque todas
las corridas experimentales se realizan en orden aleatorio completo. De esta
manera, si durante el estudio se hacen en total N pruebas, stas se corren al azar,
de manera que los posibles efectos ambientales y temporales se vayan
repartiendo equitativamente entre los tratamientos.

Ejemplo 1
Comparacin de cuatro mtodos de ensamble. Un equipo de mejora investiga
el efecto de cuatro mtodos de ensamble A, B, C y D, sobre el tiempo de
ensamble en minutos con un nivel de significancia de 0.05. En primera instancia,
la estrategia experimental es aplicar cuatro veces los cuatro mtodos de ensamble
en orden completamente aleatorio (las 16 pruebas en orden aleatorio). Los
tiempos de ensamble obtenidos se muestran en la tabla 2.1. Si se usa el diseo
completamente al azar (DCA), se supone que, adems del mtodo de ensamble,
no existe ningn otro factor que influya de manera significativa sobre la variable de
respuesta (tiempo de ensamble)

Ejemplo 2
Comparacin de cuatro tipos de cuero. Un fabricante de calzado desea mejorar
la calidad de las suelas, las cuales se pueden hacer con uno de los cuatro tipos de
cuero A,B, C y D disponibles en el mercado. Para ello, prueba los cueros con una
mquina que hace pasar los zapatos por una superficie abrasiva; la suela de stos
se desgasta al pasarla por dicha superficie. Como criterio de desgaste se usa la
prdida de peso despus de un nmero fijo de ciclos. Se prueban en orden
aleatorio 24 zapatos, seis de cada tipo de cuero. Al hacer las pruebas en orden
completamente al azar se evitan sesgos y las mediciones en un tipo de cuero
resultan independientes de las dems. Los datos (en miligramos) sobre el
desgaste de cada tipo de cuero se muestran en la tabla 2.2

El anlisis de la varianza de un criterio (ANOVA de un criterio) es una metodologa


para analizar la variacin entre muestras y la variacin al interior de las mismas
con varianzas, en lugar de rangos. Como tal, es un mtodo estadstico til para
comparar dos o ms medias poblacionales.
El objetivo del anlisis de varianza en el DCA es probar las hiptesis de igualdad
de los tratamientos con respecto a la media de la correspondiente variable de
respuesta:

Nota: Primeramente explicare el clculo manual tradicional para ANOVA,


posteriormente el simplificado y ms prctico, as como su solucin utilizando un
paquete computacional.
El mtodo de ANOVA con un criterio requiere del clculo de dos estimaciones
independientes para

la varianza poblacional comn. Estas dos estimaciones se

denotan por

Se denomina estimacin de la varianza entre muestras (Mtodo entre)


Se denomina estimacin de la varianza al interior de las muestras (Mtodo
dentro)

El estadstico entonces resulta


una distribucin F.

y tiene una distribucin muestral que sigue

Estadstico F para el ANOVA con un criterio

El cual se contrastara con el valor de F encontrado en tablas en relacin a los


grados de libertad del numerador entre grados de libertad del denominador y con
un (a) prefijado

Se deduce que si F0 es grande, se contradice la hiptesis de que no hay efectos


de tratamientos; en cambio, si F0 es pequeo se confirma la validez de H0
Mtodo dentro
El mtodo dentro de estimacin de la varianza produce una estimacin vlida sin
importar si la hiptesis nula de las medias poblacionales iguales es cierta. Esto se
debe a que la variabilidad de los valores de la muestra se determina comparando
cada elemento en los datos con la media muestral. Cada valor de la muestra
obtenido de la poblacin A se compara con la media muestral A; cada elemento
obtenido de la poblacin B se compara con la media muestral B, y as
sucesivamente. La ecuacin para calcular la estimacin de la varianza con el
mtodo dentro es:

donde:
= Estimacin de la varianza muestral con el mtodo entre.

= i-simo elemento de los datos de grupo j.


= media del grupo j
C = nmero de grupos

(2,4)

n = nmero de elementos de la muestra en cada grupo.


El nmero adecuado de grados de libertad para el mtodo dentro se calcula como
c(n-1) si el nmero de observaciones en cada grupo es igual. Como a cada
elemento del grupo se le resta la media de ese grupo, slo (n-1) elementos de
cada grupo pueden variar. Adems como se tienen c grupos, c se multiplica por (n1) para obtener los grados de libertad para el mtodo dentro.

Grados de libertad para


glw = C(n 1)
Mtodo entre
El segundo mtodo para estimar la varianza comn de la poblacin produce una
estimacin vlida slo si la hiptesis nula es cierta. Para entender el mtodo entre
recuerde el teorema del lmite central. Este importante teorema en estadstica
establece que la distribucin de las medias mustrales tiende a una distribucin
normal conforme crece el tamao de la muestra, con una media u y una
desviacin estndar

Si el error estndar de la media es

entonces la

varianza de la distribucin es igual al error estndar al cuadrado,

Esta varianza es una medida de las diferencias entre todas las medias mustrales
que puedan obtenerse de la distribucin y la media de la poblacin. La raz
cuadrada de esta varianza es el error estndar de la media, es decir, la diferencia
estndar entre una media muestral y la media poblacional. En ANOVA, para
estimar la varianza de la distribucin muestral de medias, se debe estimar primero
la media poblacional. La media de todos los valores muestrales proporciona esa
estimacin. Despus, se determina la diferencia entre la media de cada grupo y
esta media poblacional estimada, y estas diferencias se elevan al cuadrado y se
suman. Este valor, con frecuencia se llama la suma de cuadrados entre (SCb).
Esta suma se divide entonces entre el nmero adecuado de grados de libertad
para obtener la estimacin de la varianza de la distribucin muestral. La ecuacin
siguiente da el clculo de la estimacin de la varianza de la distribucin muestral
de las medias:

dnde:

(2,5)

Tabla ANOVA
Los resultados del anlisis de varianza se presentan en una tabla ANOVA que
resume los valores importantes de la prueba. Esta tabla tiene un formato estndar
que usan los libros y los problemas de computadora que ejecutan ANOVA. La
siguiente tabla muestra la forma general de la tabla ANOVA.
En dicha tabla se resumen los clculos necesarios para la prueba de igualdad de
las medias poblacionales usando anlisis de varianza. Primero se usa el mtodo
dentro para estimar s2. Cada valor de los datos se compara con su propia media,
y la suma de las |||diferencias al cuadrado se divide entre los grados de libertad
c(n-1).

donde:
j = Nmero de la columna
i = Nmero de la fila
c = Nmero de columnas (grupos)
n = Nmero de elementos en cada grupo (tamao de la muestra)

La tabla ANOVA contiene columnas con las fuentes de variacin, las sumas de
cuadrados, los grados de libertad, las estimaciones de la varianza y el valor F para
el procedimiento de anlisis de varianza.

Retomando el problema del efecto de cuatro mtodos de ensamble A, B, C y D,


sobre el tiempo de ensamble en minutos tenemos:

Completando la tabla ANOVA, quedando de la siguiente manera

Como la hiptesis a probar es


H0: u1 = u2 = u3 = u4
H1: No todas las poblaciones tienen la misma media
El valor de F calculado por tabla cuando tenemos un nivel de significancia de
0,05 y 3 grados de libertad en el numerador y 12 grados de libertad en el
denominador es F0,05 (3,12) = 3,49
Como nuestro estadstico de prueba F (9,42) excede el valor crtico tabulado
(3,49), rechazamos la hiptesis nula y aceptamos la alterna, concluyendo que s
hay diferencia o efecto de los mtodos de ensamble en cuanto a su tiempo
promedio.
Ahora veremos el procedimiento y notacin ms comnmente utilizado para la
solucin de ANOVA

ANOVA
Como ya lo mencionamos el objetivo del anlisis de varianza en el DCA es probar
la hiptesis de igualdad de los tratamientos con respecto a la media de
correspondiente variable de respuesta. Para probar la hiptesis dada por la
relacin:

Mediante la tcnica de ANOVA, lo primero es descomponer la variabilidad total de


los datos en sus dos componentes: la variabilidad debida a tratamientos y la que
corresponde al error aleatorio (equivalente al mtodo entre y mtodo dentro),
como se hace a continuacin.
Una medida de la variabilidad total presente en las observaciones de la tabla 2.3
es la suma total de cuadrados ( SCT) dada por:

donde la SCE mide la variacin dentro de tratamientos, ya que si hay mucha


variacin entre las observaciones de cada tratamiento entonces Yij-Y tender a ser
grande en valor absoluto. En forma abreviada, esta descomposicin de la suma
total de cuadrados se puede describir como:

La suma de cuadrados divididos entre sus respectivos grados de libertad se


llaman cuadrados medios. Los dos que ms interesan son el cuadrado medio de
tratamientos ( CMTRET) y el cuadrado medio del error ( CME), que se denotan por:

(2.13)
sigue una distribucin F con (K-1) grados de libertad en el numerador y (N-K )
grados de libertad en el denominador. De la ecuacin (2.13) se deduce que si F0
es grande, se contradice la hiptesis de que no hay efecto de tratamientos; en
cambio, si F0

Toda la informacin necesaria para calcular el estadstico F 0 hasta llegar al valor-p


se escribe en la llamada tabla de anlisis de varianza (ANOVA) que se muestra en
la tabla 2.4. En esta tabla, las abreviaturas significan lo siguiente: FV= fuente de
variabilidad (efecto), SC= suma de cuadrados, GL= grados de libertad, CM=
cuadrado medio, F0 estadstico de prueba, valor-p = significancia observada

Anlisis del ejemplo 1 (comparacin de cuatro tipos de mtodos de ensamble).


La interrogante que se plante en el problema de la comparacin entre los cuatro
tipos de mtodos de ensamble fue: existen diferencias entre el tiempo promedio
de los diferentes mtodos de ensamble? La respuesta a esta pregunta es el
resultado de contrastar las hiptesis:

Diagrama de cajas simultneos


Los diagramas de cajas es una herramienta para describir el comportamiento e
unos datos, y es de suma utilidad para comparar procesos, tratamientos y, en
general, para hacer anlisis por estratos (lotes, proveedores, turnos). En el
resultado arrojado por Minitab se observa en la figura (figura 2.1) que el mtodo C
parece diferente a los mtodos A y B en cuanto a sus medias; la media del mtodo
D tambin se ve diferente a la media del mtodo A. Por otra parte, se observa un
poco ms de variabilidad en el mtodo C que en todos los dems. Lo que sigue es
verificar que lo que se observa en el diagrama de cajas implica diferencias
significativas entre los distintos tratamientos; por lo tanto, es necesario hacer
pruebas estadsticas porque los datos que se analizan en los diagramas de cajas
son muestras.
En general, cuando los diagramas no se traslapan es probable que los
tratamientos correspondientes sean diferentes entre s, y la probabilidad es mayor
en la medida que los diagramas estn basados en ms datos. Cuando se
traslapan un poco puede ser que haya o no diferencias significativas, y en
cualquier caso es conveniente utilizar una prueba estadstica para determinar
cules diferencias son significativas. Estas pruebas se vern en la siguiente
seccin.

Anlisis del ejemplo 2 (comparacin de cuatro tipos de cuero). La interrogante


que se plante en el problema de la comparacin entre los cuatro tipos de cuero
fue: existen diferencias entre el desgaste promedio de los diferentes tipos de
cuero? La respuesta a esta pregunta es el resultado de contrastar las hiptesis:

En el resultado arrojado por Excel, se muestra el anlisis de varianza para este


ejemplo. Como el valor-p = 0,0000 es menor que la significancia prefijada a= 0,05 ,
se rechaza H0y se acepta que al menos un par de tipos de cuero tiene un
desgaste promedio diferente

ANOVA unidireccional: A; B; C; D Minitab

2.4 Comparaciones o pruebas de rangos mltiples


El anlisis de varianza es un procedimiento poderoso para probar la
homogeneidad de un conjunto de medias. Sin embargo, si rechazamos la
hiptesis nula ( ) y aceptamos la alterna (que no todas las medias son iguales) an
no sabemos cules de las medias poblacionales son iguales y cules son
diferentes.
Comparacin de parejas de medias de tratamientos.
Cuando no se rechaza la H0: 1 = 2 = 3, el objetivo del experimento est
cubierto y la conclusin es que los tratamientos no son diferentes. Si por el
contrario se rechaza H0, y por consiguiente se acepta la H1: No todas las
poblaciones tienen la misma media, es necesario investigar cules tratamientos
resultaron diferentes, o cules provocan la diferencia.
Estas interrogantes se responden probando la igualdad de todos los posibles
pares de medias, para lo cual se han propuesto varios mtodos, conocidos como
mtodos de comparaciones mltiples o pruebas de rango mltiple. La
diferencia primordial entre los mtodos radica en la potencia que tienen para
detectar las diferencias entre las medias. Se dice que
una prueba es ms potente si es capaz de detectar diferencias ms pequeas.

Hay varios mtodos estndar para realizar comparaciones pareadas que apoyen
la credibilidad de la tasa de error tipo I.
Mtodo de la diferencia mnima significativa de Fisher (mtodo LSD).
Una vez que se rechaz en el ANOVA, el problema es probar la igualdad de todos
los posibles pares de medias con la hiptesis:

En caso de rechazar H0 se acepta la hiptesis alternativa la cual nos dice que las
medias de los tratamientos i y j son diferentes. El mtodo LSD tiene una
potencia importante, por lo que en ocasiones declara significativas aun pequeas
diferencias.
Ilustremos esta prueba continuando con el ejemplo 1, en el cual, con el ANOVA
se rechaz la hiptesis nula y se acept que al menos un par de medias de
tratamientos (mtodos de ensamble) son diferentes entre s. Para investigar

cules pares de medias son estadsticamente diferentes se prueban los seis


posibles pares de hiptesis:

En el resultado de comparacin de parejas arrojado por minitab, por el mtodo


de LSD, observamos que este nos indica los intervalos de confianza para las

comparaciones de cada par de muestras, por lo que debemos tomar el punto


medio de cada comparacin (centro) y contrastarlo con el valor del estadstico t de
student obtenido en tablas (2,42) y tomar la decisin que corresponda

Mtodo de Tukey.
Es el mtodo ms conservador para comparar pares de medias de tratamientos, el
cual consiste en comparar las diferencias entre medias mustrales con el valor
crtico dado por:

Ejemplo. Al aplicar el mtodo de Tukey al ejemplo 1 de los mtodos de ensamble,


a partir de la tabla ANOVA correspondiente, se toma la informacin pertinente y de
las tablas del rango estudentizado (tabla 1) dada en el apndice.

En el resultado de comparacin de parejas arrojado por minitab, por el mtodo


de Tukey, observamos que este nos indica los intervalos de confianza para las
comparaciones de cada par de muestras, por lo que debemos tomar el punto
medio de cada comparacin (centro) y contrastarlo con el valor del estadstico de
rango estudentizado obtenido en tablas (4,20) y sustituyendo en la formula
obteniendo el valor de T 0,05 = 3,27, el cual se contrasta con la diferencia de
medias y se tomar la decisin que corresponda

Mtodo de Duncan.
En este mtodo para la comparacin de medias, si las muestras son de igual
tamao, los promedios se acomodan en orden ascendente y el error estndar de
los promedios se estima con

Este procedimiento de Duncan tambin se llama prueba de rango mltiple de


Duncan. Este procedimiento tambin se basa en la notacin general del rango
studentizado. El rango de cualquier subconjunto de medias muestrales debe
exceder cierto valor antes de que se encuentre que cualquiera de las p medias es

diferente. Este valor se llama rango de menor significancia para las medias y se
denota como

En las comparaciones donde la diferencia observada es mayor que el rango


respectivo, se concluye que esas medias son significativamente diferentes. Si dos
medias caen entre otras dos que no son muy diferentes, entonces esas dos
medias poblacionales tambin se consideran estadsticamente iguales.
Ejemplo. Supongamos que nos interesa probar las seis hiptesis para los cuatro
mtodos de ensamble del problema anterior.

de aqu se obtienen las diferencias en el orden dado por el mtodo de Duncan y


se van comparando con el rango correspondiente.
En la siguiente tabla se resumen los resultados

Mtodo de Dunnet (Comparacin de tratamientos con un control).


En muchos problemas cientficos y de ingeniera no interesa extraer inferencias
con respecto a todas las posibles comparaciones entre las medias de los
tratamientos. En su lugar, el experimento a menudo dicta la necesidad de
comparar de manera simultnea cada tratamiento con un control. Por ejemplo, al
comparar varios medicamentos para el resfriado es conveniente que uno de los
tratamientos sea que los pacientes no utilicen ningn medicamento, esto sirve
como referencia para decidir la posible utilidad de los medicamentos.
Un procedimiento de prueba desarrollado por C.W. Dunnett determina diferencias
significativas entre cada media del tratamiento y el control, en un solo nivel de
significancia.

. 2.5 Verificacin de los supuestos del modelo


La validez de los resultados obtenidos en cualquier anlisis de varianza queda
supeditada a que los supuestos del modelo se cumplan. Estos supuestos son:
A) Normalidad
B) Varianza constante (igual varianza de los tratamientos)
C) Independencia

Esto es, la respuesta (Y) se debe distribuir de manera normal, con la misma
varianza en cada tratamiento y las mediciones deben ser independientes. Estos
supuestos sobre Y se traducen en supuestos sobre el termino error (E ) en el
modelo

Es una prctica comn utilizar la muestra de residuos para comprobar los


supuestos del modelo, ya que si los supuestos se cumplen, los residuos o
residuales se pueden ver como una muestra aleatoria de una distribucin normal
con media cero y varianza constante.

Para comprobar cada supuesto existen pruebas analticas y grficas que veremos
a continuacin. Por sencillez, muchas veces se prefieren las pruebas grficas.
stas tienen el inconveniente de que no son exactas, pero aun as , en la mayora
de las situaciones prcticas proporcionan la evidencia suficiente en contra o a
favor de los supuestos.
Normalidad
Un procedimiento grfico para verificar el cumplimiento del supuesto de
normalidad de los residuos consiste en graficar los residuos en papel o en la
grfica de probabilidad normal que se incluye casi en todos los paquetes
estadsticos. Esta grfica del tipo X-Y tiene
las escalas de tal manera que si los residuos siguen una distribucin normal, al
graficarlos tienden a quedar alineados en una lnea recta; por lo tanto, si
claramente no se alinean se concluye que el supuesto de normalidad no es
correcto.
Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no tiene que
ser perfecto, dado que el anlisis de varianza resiste pequeas y moderadas
desviaciones al supuesto de normalidad.

Independencia
La suposicin de independencia en los residuos puede verificarse si se grafica el
orden en que se colect un dato contra el residuo correspondiente. De esta
manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje
vertical los residuos, se detecta una tendencia o patrn no aleatorio claramente
definido, esto es evidencia de que existe una correlacin entre los errores y, por lo
tanto, el supuesto de independencia no se cumple. Si el comportamiento de los
puntos es aleatorio dentro de una banda horizontal, el supuesto se est
cumpliendo.
La violacin de este supuesto generalmente indica deficiencias en la planeacin y
ejecucin del experimento; asimismo, puede ser un indicador de que no se aplico
en forma correcta el principio de aleatorizacin, o de que conforme se fueron
realizando las pruebas experimentales aparecieron factores que afectaron la
respuesta observada. Por ello, en caso de tener problemas con este supuesto, las
conclusiones que se obtienen del anlisis son endebles y por ello es mejor revisar
lo hecho y tratar de investigar por qu no se cumpli con ese supuesto de
independencia, a fin de reconsiderar la situacin.
En el ejemplo para comparar los cuatro tipos de cuero, las grficas resultantes

figuras 2.2 y 2.3. Se observa el cumplimiento de los supuestos de normalidad y


varianza constante, sin embargo, en las dos grficas es notorio un punto que se
aleja bastante del resto, el cual es un punto aberrante cuyo origen debe
investigarse
Eleccin del tamao de la muestra
Una decisin importante en cualquier diseo de experimentos es decidir el nmero
de rplicas que se har por cada tratamiento (tamao de muestra). Por lo general,
si se esperan diferencias pequeas entre tratamientos ser necesario un mayor
tamao de muestra.
Aunque existen varios mtodos para estimar el tamao muestral, muchas veces
tienen poca aplicabilidad porque requieren cierto conocimiento previo sobre la
varianza del error experimental.
Si recurrimos a la experiencia vemos que el nmero de rplicas en la mayora de
las situaciones experimentales en las que se involucra un factor vara entre cinco y
diez; incluso, en algn caso puede llegar hasta 30. La tendencia podra inclinarse
por un extremo de este rango e incluso salirse de ste, de acuerdo con las
siguientes consideraciones
A menor diferencia que se espera en los tratamientos, mayor ser la cantidad
de rplicas si se quieren detectar diferencias significativas, y viceversa, es decir, si
se esperan grandes diferencias quiz con pocas replicas sea suficiente
Si se espera mucha variacin dentro de cada tratamiento, debido a la variacin
de fuentes no controladas como mtodos de medicin, medio ambiente, materia
prima, etc., entonces se necesitarn ms rplicas
Si son varios tratamientos (cuatro o ms), entonces ste es un punto favorable
para reducir el nmero de rplicas.
Adems de lo anterior, es preciso considerar los costos y el tiempo global del
experimento. De aqu que si toman en cuenta las consideraciones antes
expuestas se podr establecer el tamao de muestra que permita responder en
una primera fase las preguntas ms importantes que se plantearon con el
experimento

2.6 Uso de un software estadstico

Excel
a) En una hoja de Excel capturar primeramente la tabla de datos
b) En la misma hoja de clculo seleccionar del cintillo superior Datos, luego
Anlisis de datos
c) Seleccionar anlisis de varianza de un factor en la ventana desplegada

d) En rango de entrada (en ventana de captura) seleccionar todos los grupos,


incluyendo su rtulo (sombrearlos con el mouse), automticamente se incluyen.
e) En el siguiente recuadro seleccionar si nuestros datos estn ordenados en filia
o columnas, adems indicar si tenemos rtulos en los encabezados, e indicar que
los resultados los arroje en una hoja nueva

Nota: Si no aparece Anlisis de datos en la parte superior derecha de la hoja de


clculo, se deber de activar de la siguiente manera:
En el smbolo del sistema en la parte superior izquierda de los encabezados
dar clic.
En la ventana desplegada seleccionar opciones de Excel en la parte inferior
dando un clic.
De la ventana desplegada sealar en el men del lado izquierdo
complementos
De la ventana desplegada en el lado derecho, sealar en la parte inferior de
la misma ir con un clic.
De la ventana desplegada palomear el recuadro de herramientas para
anlisis, y aceptar
Nota Como no est instalada esta herramienta el sistema nos preguntara si
queremos instalarla a lo que indicaremos que si, y la instalara en un par de
minutos.
Minitab
En la hoja de clculo que despliega Minitab capturar nuestra tabla de datos
indicando sus correspondientes rtulos en la primer fila que no est
numerada
En el cintillo superior indicar con el mouse Estadsticas
Del men desplegado seleccionar ANOVA, en el men desplegado
seleccionar Un solo factor (Desapilado) y dar clic con el mouse

En ventana de captura desplegada (Anlisis de varianza- Un solo factor),


en la parte izquierda aparecern automticamente los grupos de tabla de
datos
En el cuadro superior derecho (Respuestas (en columnas separadas))
indicar separando por un espacio (sin comas) los nombres de las columnas
que generalmente son letras, esto tambin se logra dando doble clic en
cada letra del cuadro de la izquierda, automticamente son capturadas
En nivel de confianza por default es 95%
Sealar Aceptar y nos arrojara el resultado ANOVA en la parte superior
de la hoja de calculo

Si queremos hacer comparaciones de rango mltiples, entonces


sealamos de la ventana anterior comparaciones dando un clic.
En la ventana desplegada sealaremos las comparaciones que
queramos, y en control nivel del grupo indicamos la A, y damos clic en
aceptar

Si queremos las grficas del supuesto del modelo entonces, damos clic a
grficas (antepenltima ventana) y sealamos tres en uno y damos clic en
aceptar

CONCLUSION

BIBLIOGRAFIA
Libro estadstica inferencial 2

You might also like