You are on page 1of 60

ANALISIS DE VARIANZA

DISEO DE
EXPERIMENTOS
MARISOL GORDILLO S.
Ph.D en Ingeniera

INTRODUCCION
INTRODUCCION AL
AL DISEO
DISEO Y
Y ANALISIS
ANALISIS DE
DE EXPERIMENTOS
EXPERIMENTOS

ESTUDIOS
Experiment
os

Observacin

Mtodos primarios de investigacin


cientfica
Slo un experimento controlado en el cual las
unidades experimentales son asignadas al azar a
las variables controladas es posible establecer su
efecto
Las variables no se controlan en un estudio

Diseo estadstico y el Anlisis de


experimentos

Ronald S. Fisher 1920 -1935


Estacin experimental de agricultura
Los diseos cuadrados latinos

Sir Ronald A. Fisher in


1924. (fuente: FisherBox, 1978, Plate 4).

El mtodos de anlisis (El anlisis de


varianza) y escribi el primer libro sobre el
tema (Fischer 1935).
Sir Frank Yates
(1940s)
diseo de bloques y experimento
factorial y sus mtodos de anlisis.

Sir George Box


1940s y 1950s

Industria Qumica (M.S.R)


Hay algunas diferencias cruciales entre la
experimentacin agrcola, y la industrial (Box et al 1953)

La informacin en la industria esta disponible a tiempos mas cortos.


ocurre en lnea. (experimentos
En la industria la experimentacin
secuenciales pequeos)
Agricultura compara variedades o fertilizantes / en los experimentos
industriales
el foco est sobre el proceso modelando, optimizacin, y
mejora de calidad.

Raj Chandra Bose et al .


1940s - 1950s

Teora matemtica de construccin de diseos experimentales


basados en anlisis combinatorio

Jack Kiefer

A. Bradford Hill
1950s

(1950s)

Asignaciones
aleatorizada
s

Teora de
diseos
ptimos

Psicologa, Educacin,
Mercadeo, y otras
disciplinas tambin
fueron testigo de
aplicaciones de
experimentos diseados

Donald Campbell y
Julian Stanley
Cuasi-experimentos
Nuevas
ideas

Ingeniero japons
Genichi Taguchi
Diseo robusto

GEOESTADISTICA

LOS CONCEPTOS Y TERMINOLOGA BSICA


DE EXPERIMENTACIN

Bases cientficas
Estadstica matemtica y las bases tcnicas

Ejemplo
Si suponemos que la cantidad de
hemicelulosa (hongos xilofagos) medida en
240 muestras de madera procedente de
tocones de Pinus silvestris es afectada por
la edad, orientacin, altura y profundidad

Planeacin incorrecta
Estrategia de factor por factor :

Es imposible saber si las variables interactan


entre si

Otro planteamiento:
Variar muchos factores a la
vez

En el diseo y anlisis de un experimento, es


necesario que quienes lo desarrollen :
Entiendan claramente el problema
objeto de estudio
Conocimiento del material experimental
a usar,
Posibilidades existentes para
coleccionar los datos
Generalmente
un grupo
de investigacin
Conocimiento
estadstico
necesario se
conforma por :
Expertos tema
Estadstico
Tukey afirma
Estadstico, es el experto que
piensa con el cerebro del otro

Los pasos que se siguen en la


experimentacin
mtodo experimental
El mtodo cientfico
formulan hiptesis
experimentacin

DEFINICIONES BASICAS
Cuantitativ
BLOQUE
os

Factor

Cualitativos

Cuantitativos:
edad-altura - profundidad
Cualitativo:
estaciones (inv-prim-verotoo)

Efectos fijos
Efectos
aleatorios
Efectos Mixtos

Niveles

Tratamien
tos

Unidad experimental (u.e)


(unidades muestrales )

tratamien
to testigo

Tratamientos no
son parte de la
No homognea estructura de la
u.e.
Homognea

Variable respuesta

Se
Se desea
desea investigar
investigar el
el efecto
efecto del
del pH
pH en
en el
el crecimiento
crecimiento de
de cierto
cierto
microorganismo
microorganismo en
en un
un medio
medio especifico
especifico .. Para
Para ello
ello se
se realiza
realiza un
un
experimento,
experimento, teniendo
teniendo como
como punto
punto de
de partida
partida la
la misma
misma cantidad
cantidad
de
de microorganismos
microorganismos ,, se
se realiz
realiz 4
4 repeticiones.
repeticiones. Existe
Existe suficiente
suficiente
evidencia
evidencia para
para firmar
firmar que
que los
los niveles
niveles de
de pH
pH utilizados
utilizados presenta
presenta
crecimiento
crecimiento distintos?
distintos?
Se
Se desea
desea investigar
investigar la
la influencia
influencia de
de la
la temperatura
temperatura y
y el
el tiempo
tiempo
sobre
sobre el
el rendimiento
rendimiento de
de un
un proceso
proceso qumico.
qumico.

En un estudio sobre viabilidad de Drosophila


melanogaster se tienen en cuenta el Genotipo (G) (se
estudian 3 genotipos distintos); Generacin (N) (el
experimento se repite durante 4 generaciones
sucesivas); Temperatura (T) (incubacin a 17 y 25
grados centgrados). El experimento se realizo
sembrando 100 huevos y anotando el numero de

EL DISEO DE
EXPERIMENTOS

Consiste en determinar cuantos


factores, niveles y tratamientos
se estudian y como se asignaran
los tratamientos a las unidades
experimentales.

Diseo de los tratamientos

Diseo de control del error

Diseo de observaciones Muestreo

OTRAS VARIABLES
Variable sustituta
Covariable
Material experimental
Variables Explicatorias
Observaciones para verificar la aplicacin
de los tratamiento
Observaciones para determinar las
condiciones externas del
experimentos
Error experimental

PRINCIPIOS DEL DISEO EXPERIMENTAL

PASOS NECESARIOS PARA PLANIFICAR, LLEVAR


A CABO Y ANALIZAR UN EXP. DISEADO

DISEO DEL EXPERIMENTO


1. Establecer los objetivos.
2. Seleccionar los factores, niveles y
tratamientos
3. Definir la unidad experimental y todas las
variables que deban medirse. (Prueba Piloto)
4. Determinar el nmero de replicas
5. Aleatorizar las pruebas
6. Realizar el experimento y tomar los datos
ANALISIS DEL EXPERIMENTO
7. Determinar como deben ser analizados los
resultados
8. Extraer conclusiones

Ejemplo 1:

Ensayo
El porcentajehongos
de humedad relativa (HR)

es determinante para el ataque de


hongos en semillas. Para evaluar la
susceptibilidad de las semillas de man
al ataque de un hongo se realiz un
ensayo en cmaras de cra con tres
porcentajes de HR: 70%, 80% y 90%.
Cinco observaciones fueron tomadas
para cada porcentaje de HR,
registrndose el nmero de semillas

Ejemplo 2

Se desea conocer el efecto de las cepas de inoculantes


sobre el contenido de nitrgeno de plantas de trbol
rojo. Para ello se dispone de 30 macetas de trbol rojo
en un invernadero. Se asignan al azar 5 macetas para
cada una de las cepas y se procede a inocularlas.
Los resultados son los siguientes (en mg. de nitrgeno):
Cep Cep Cep Cep Cep Cep
a I a II a III a IV a V a VI
19.4 17.7 09.1 18.6 11.6 16.9
27.0 24.3 11.9 18.8 11.8 17.3
32.1 24.8 15.8 20.5 14.2 19.1
32.6 25.2 17.0 20.7 14.3 19.4
33.0 27.9 19.4 21.0 14.4 20.8

EJERCICIO 3

Se desea estudiar el efecto de la carga animal sobre la


produccin de materia seca en una pastura implantada.
Para ello se divide un lote en 28 potreros y se asignan
aleatoriamente 7 potreros a cada una de las 4 cargas
animales en estudio (2 nov./ha., 4 nov./ha, 6 nov./ha. y 8
nov./ha.)
Los resultados fueron los siguientes expresados en
toneladas de materia seca por hectrea.
Carga 2

2.6

1.9

3.1

2.8

2.2

2.0

2.7

Carga 4

3.3

3.6

3.0

3.5

3.2

3.9

3.4

Carga 6

3.1

2.0

2.5

3.1

2.3

3.0

2.2

Carga 8

2.5

2.3

2.8

1.8

2.7

2.6

2.0

RESUMEN
En un estudio experimental el
investigador
Pasivamente observa variables de
pronostico potenciales y la variable de
respuesta.
Slo puede establecer la asociacin entre las
variables de pronostico y la variable de
respuesta.
Manipula variables de pronostico
potenciales para estudiar sus efectos sobre
la variable de respuesta.
Establecer la relacin efecto de causa.

Una meta bsica en cualquier experimento es


identificar los efectos de los factores
tratamiento sobre la variable de respuesta no
confundida con cualquier factor ruido.
El bloqueo se usa para evaluar la consistencia
de la efectividad de los tratamientos a travs
de unidades experimentales teniendo
caractersticas de amplio rango.
La aleatorizacin se usa para minimizar los
efectos tendenciosos de todos los otros factores
de ruido.
La variacin causada por los errores aleatorios
y de medida pueden ser minimizada a travs
de la repeticin.

PLANES DE EXPERIMENTACIN
MODELOS DE RANGO INCOMPLETO
DISEO COMPLETAMENTE
ALEATORIZADO (D.C.A)
UN SOLO FACTOR DE CLASIFICACION

D.C.A
caractersticas

u.e son homogneas

Asignacin de tratamientos a las


unidades experimentales

N - P

- k

azar
Numero
aleatorio
s

Condiciones ambientales
un solo factor con k
tratamientos
Varios factores

El numero de u.e. =
numero de tratamientos * numero de
repeticiones
Las ventajas de este tipo de diseo son :
Total flexibilidad en cuanto al nmero de
tratamientos y al nmero de unidades
experimentales .
Anlisis sencillos.
Ninguna dificultad por perdida de datos

EJEMPLO

En un experimento realizado para determinar si los


pesos (mg) de las hembras adultas de Drosophila
permisilis, criadas a 24C, resultan afectados por la
densidad a la que se cran las larvas, se pesaron 10
ejemplares adultos de cada medio.

Factor : DENSIDAD
LARVAL
Niveles : 3, 5,
: TRATAMIENTOS

u.e.
(larvas de
Drosophila
permisilis)

V.R.
PESOS
(mg)

u.e : homognea

Se realizaron 10
repeticiones
azar

Cuando los ni son iguales, se dice que el


diseo es BALANCEADO, y cuando los ni
son diferentes se dice que el diseo es
DESBALANCEADO.

MODELO DE ANLISIS DE VARIANZA


ASOCIADO AL D.C.A

El modelo podra ser expresado como


ij

ij

i = 1, 2, 3, . . . t j = 1,2, 3, . . r
Estimar la parmetro . t
y las hiptesis experimentales tales como:
Ho: = t

yij Z i ij
i 1,2,...

j 1,2,...

El modelo en forma matricial se escribe:

Y X
rango=2

6x3

parmetro
, y no
puede ser
estimada
por T
1
T

( X X ) X y
i no son nicos y por consiguiente no pueden ser estimados

Para remediar la falta de unicidad de los


parmetros en el modelo sobreparametrizados

Redefina el modelo usando un nmero ms


pequeo de parmetros nuevos que son
nicos.
Utilice combinaciones lineales de los
parmetros que son nicos y puede ser sin
ambigedades estimado.
REPARAMETRIZACION
DEL
MODELO
Reparametrizacin
del
modelo

ri Z i 0

S.E.N. : XTX=XTY
+

ri Z i 0

SOLUCION
parmetros

Los supuestos del modelo son:


Los errores se distribuyen normal con media 0 y varianza 2, ij
N(0, 2)
Los errores tienen varianza constante
Los errores son independientes, COV (ij, ij)=0 ii; jj

En caso de no cumplirse la normalidad de los


errores, usted puede utilizar la prueba no
parmetrica:
TEST DE LA MEDIANA
Las observaciones deben de estar medidas en
la escala ordinal.
Tambin es posible utilizar la prueba de

HIPOTESIS NULA DE INTERES EN EL MODELO


H0: 1 = 2 = 3 =... a = (La media de los
tratamientos son
iguales)
H1 : i i `
(por lo menos dos de las medias
son
diferentes)
Que en trminos del modelo es equivalente a probar:
H0: Z1 = Z2 =...= Zt= Z
H1 : Zi Zi

ANOVA

ANLISIS DE VARIANZA
PARA EL MODELO COMPLETAMENTE
El mtodo empleadoALEATORIO
para comparar las medias de los
tratamientos se denomina ANALISIS DE VARIANZA
(ANOVA), mediante el cual se prueban las hiptesis
planteadas.
Inferencia

En el caso del D.C.A, la particin es :


SCT = SCTrat + SCE
Suma de cuadrados del total es igual a Suma de
cuadrados de los tratamientos ms la suma de
cuadrados de los errores, la cual se conoce como
la ecuacin fundamental del anlisis de
varianza.

a . Anlisis de varianza . Modelo Completamente Alea

Donde: t: Nmero de tratamientos


r : Nmero de replicas por tratamiento
n: Total de muestras =rt
=Suma de cuadrados de los tratamientos

SCTrat

H0: Z1 = Z2 =...= Zt= Z

H1 : Zi al
Zi
Un p-valor es la probabilidad, calculada
asumir que
Ho es cierta, de que la estadstica de prueba tome valore tan
extremos o ms extremos que los calculados con la muestra
actual.

Ensayo de las densidades de


larvas D3
D5
D6
D10

TOTALES
MEDIA
DESVIACIO
N
CV

D20

1,27

1,30

1,25

0,99

0,64

1,32

1,29

1,25

0,99

0,66

1,25

1,26

1,24

0,96

0,64

1,30

1,29

1,26

0,99

0,67

1,24

1,27

1,24

1,02

0,67

1,29

1,27

1,25

1,01

0,67

1,28

1,31

1,25

1,00

0,67

1,25

1,25

1,22

1,00

0,68

1,29

1,30

1,24

0,97

0,64

0,99
9,92
0,99

0,62
6,57
0,66

1,26
12,76
1,28

1,32
1,26
12,87 12,46
1,29
1,25

0,027
2,1

0,021 0,011 0,018 0,019


1,7
0,9
1,8
2,9

Tabla Anlisis de varianza. Variable dependiente


Resultados Minitab

CASO DE UN DISEO DESBALANCEADO : (diferentes


tamaos de muestras)
Solo es necesario ajustar los clculos para:

SCTRAT:

i 1

SCTRAT:

si es balanceado.

y1.
y 2.
yt.
y..2
( r r ... r ) n
i 1
1
2
t

SCERROR :

SCERROR:

y 2 i. y..2

ri
n

2
Y
Y T Y i.
ri

si
balanceado.

2
2
2
y
y
y
Y T Y ( 1. 2. ... t . )
r2
rt
i 1 r1
t

si el diseo es
desbalanceado

es

si el diseo es
desbalanceado

DISEO DE EXPERIMENTOS
VALIDACION DE LOS SUPUESTOS DEL MODELO


ij

ij

Los errores se distribuyen normal con media 0 y varianza 2 :


ij N(0, 2)

Los errores tienen varianza constante

Los errores son independientes, COV (ij, ij) =0 ii; jj

ESTIMACIN DEL ERROR


DIFERENCIA ENTRE ERRORES () Y RESIDUALES (e)
Un residuo (eij), es un estimador del error experimental o aleatorio (i).
El error aleatorio esta dado por :

e y y
e y y
Ho: i ~ normal

Ha: i No ~ normal

Prueba de Shapiro Wilks (n< 30)


Kolmogorov Smirnov (n >30)
Anderson Darling (n>30)

SUPUESTO 2: LA VARIANZA DE LOS ERROR SON IGUALES


(HOMOGENEIDAD DE VARIANZAS)

Los efectos de la desigualdad de las varianzas son:


Estimadores insesgados y consistentes pero no de varianza mnima.
Problemas de variabilidad en las predicciones
El F-test ANOVA es slo ligeramente afectado por la desigualdad de la
varianza si el modelo contiene slo los factores fijos y tiene tamaos iguales
o casi iguales de muestras
DETECCIN
Pruebas formales
Ho: =...=
Comparaciones mltiples:
Prueba de Levene's: datos continuos, no
necesariamente con distribucin normal. Este
mtodo considera las distancias de las
observaciones de su mediana de la muestra en
lugar de su media de la muestra, hace que la
prueba sea ms robusto para muestras pequeas

Grficos de residuales con


bandas crecientes, decrecientes o
combinaciones de ambas.

SUPUESTO 3: LOS ERROR SON INDEPENDIENTES

Datos son tomados secuencia de tiempo: series de tiempo.


3

-1

-2

10

-1

e ij

-2

-3

-1

0
-1

eij

e ij

eij

M.M.C.O Se basa en que los errores son independientes uno del


otro.

-2

-2

-3

-3

-4
t

Durbin watson
El estadstico de Durbin -Watson est condicionado a la orden de las
observaciones (filas)
las observaciones estn en un orden significativo, como el tiempo.

CASO: DENSIDAD DE LAS LARVAS

TAMAO DE MUESTRA O NMERO DE


REPLICAS PARA CADA TRATAMIENTO
Este se realiza mediante un anlisis de sensibilidad, para lo
cual se debe tener :

1. La diferencia mnima del cuadrado entre la media


de los efectos de los i-tratamientos y la media
general.
La diferencia la podemos obtener de dos
maneras :
Especificada por el investigador
Prueba Piloto: Consiste en realizar el experimento
(mnimo 3 veces), con el fin de obtener la media y
a
la varianza,
con la media
se calcula
la diferencia
2
2
2
2
(

...

)
i :
mnima
1
2
a
i 1

2. Estimacin de la varianza : Se puede obtener


mediante :
Investigaciones similares .
Prueba pilote : De todas las varianzas de cada
tratamiento, debemos escoger la ms grande,
debido a que esta cubre las dems.
3. Hallar la potencia de la prueba (probabilidad de
rechazar acertadamente la hiptesis nula). Esta se
obtiene de la siguiente manera:
3.1 Se calcula el factor de no
centralidad (parmetro de
excentricidad) de la distribucin
de la variable:

3.2 Con el factor de no


centralidad, calculamos el
parmetro de no centralidad.

(i ) 2 ri
i 1

2 2

2K
t

3.3 Buscamos el valor en la tabla de la F-no


centrada. En est ubicamos :
Nivel de significancia deseado ( = 0.005, 0.025, 0.05, 0.10)
Los grados de libertad del numerados : (t-1)
Los grados de libertad del denominador : t (ri-1)
El valor

El valor obtenido, se le llama , que es la


probabilidad de cometer el error tipo II
(probabilidad de rechazar Ho, cuando Ho es
verdadera)
3.4 El poder de la prueba es (1-).

CASO : DENSIDAD
LARVAS

Diferencia mnima :

D3

D5

D6

D10

D20

1,27

1,30

1,25

0,99

0,64

1,32

1,29

1,25

0,99

0,66

1,25

1,26

1,24

0,96

0,64

1,30

1,29

1,26

0,99

0,67

1,24

1,27

1,24

1,02

0,67

1,29

1,27

1,25

1,01

0,67

1,28

1,31

1,25

1,00

0,67

1,25

1,25

1,22

1,00

0,68

1,29
1,30
1,24
0,97

1,26
1,32
1,26
0,99
MEDIA

1,09
GLOBAL

MEDIA
1,28
1,29
1,25
0,99
VARIANZA
0,00070
0,00046 0,00012 0,00033

2 = 0.0007 la mas grande de los


tratamientos
t = 5 tratamientos

0,64
0,62

0,66
0,00035

Poder de la prueba:
-Factor de no centralidad :

t
2
( i ) r
0.295
K i 1

* r 209.66 * r
2
2
*
0
.
0007
2

-Parmetro de no
centralidad.

2K
2K

t
5

Con estas ecuaciones construimos la


siguiente tabla:

V1=(t-1)
4
ri
8
V2=t(ri-1)
35
k
1677,3
25,9

0,01

0.99

4
10
45
2096,6
29,0
0.01
0.99

Ocho muestras en cada tratamiento


nos da un 99% de probabilidad de
detectar diferencias a un nivel de
significancia del 0.05.

V1=(t1)
4
4
ri
8
10
V2=t(ri
-1)
35
45
k
1677,3 2096,6

25,9
29,0

0,01
0.01
0.99
0.99

Tamao de la muestra en minitab

D.C.A - MINITAB

Comparacione
mltiples
residuales

storage

Comparaciones
mltiples

resultados

Validacin de supuestos
Normalidad

HOMOGENEIDAD

TALLER 1. PROXIMA

CLASE

Se supone que buena parte de las diferencias entre


las variedades A y B de una especie vegetal, se deben
no a causas genticas sino al efecto del medio
ambiente donde se
desarrollan. Para probar (parcialmente) esta hiptesis
se realiz un experimento en el cual 10 lotes de cada
variedad se hicieron crecer en un mismo ambiente. La
altura de planta fue la variable que se registr y los
datos son los siguientes:
VARIEDA
D
ALTURA

1 1 1 1 1 1 1 1 1 1 22 2 22 2 2 22 233 3 3 3 33 3
1 1 1 1 1 1 1 1 1 1
1 1
1 1 1
1
1 1 1 1
1
15 2 0 4 6 6 3 5 1 4 2 9 3 0 8 2 3 4 9 0 9 9 2 5 2 6 8 2

EXISTE DIFERENCIAS ENTRE LAS DOS VARIEDADES? USE


A=0.05

La estadstica, n
matemtica pue
mentir. Ellas s
estn all, para
usadas, para apo
en la bsqueda d
verdad.

You might also like