Professional Documents
Culture Documents
Modelo matemtico
Se dice que un factor B est anidado en otro factor A (o que sus niveles estn anidados en los de A) cuando cada nivel del factor B aparece asociado a un nico nivel del factor A. Se denota como B A. A1 . & B1 B2 B3 obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3 A2 . & B4 B5 B6 obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3 Aa . & Bm2 Bm1 Bm obs. 1 obs. 1 obs. 1 obs. 2 obs. 2 obs. 2 obs. 3 obs. 3 obs. 3
j(i) = 0 i = 0
a X i=1
Se observa que j(i) representa el efecto medio adicional del nivel j-simo anidado en el nivel i. Por otro lado, b es el nmero de niveles anidados en cada nivel i, de modo que el nmero total de niveles de B es a b y la suma de los efectos del factor B dentro de cada nivel de A es 0.
,i , j(i)
= y
yijk bn nbi = 0 = y
yijk n n (i y ) n j(i) = 0 = y y
j(i) = yij yi De este modo, yijk = y + (i y ) + (ij yi ) = yij y y El nmero total de observaciones es abn y el nmero total de parmetros a estimar es 1+(a1)+a(b1) = ab, luego el nmero de grados de libertad total es abnab = ab(n1). De este modo, la estima de la varianza es Pa Pb Pn =
2 i=1 j=1
(yijk y )2
(yijk y )
+ entonces
SCT = SCA + SCB(A) + SCE que puesto en trminos de totales queda A1 B1 B2 y111 y121 . . . . . . yij yi y11n y12n y11 y12 y1 A2 B3 B4 y211 y221 . . . . . . y21n y22n y21 y22 y2 A3 B5 B5 y311 y321 . . . . . . y31n y32n y31 y32 y3
a b n XXX
2 yijk
1 2 y abn
1 2 y abn
y como SCB(A) =
Pa
i=1
SCB(A)i , entonces
a b a
Los contrastes de hiptesis que se realizan son: H0 : 1 = = a = 0 (el factor A no inuye) H1 : algn i 6= 0 (el factor A inuye) en este caso F0 = de modo que se rechaza H0 a nivel si F0 > F(a1),ab(n1), La otra hiptesis que se contrasta es, i = 1, . . . , a H0 : 1(i) = = b(i) = 0 H1 : algn j(i) 6= 0 en este caso, F0 =
SCB(A) a(b1) SCE ab(n1) SCA a1 SCE ab(n1)
MCA MCE
MCB(A) MCE
de modo que se rechaza H0 a nivel si F0 > Fa(b1),ab(n1), En este caso, se contrasta la hiptesis de que todos los niveles del factor anidado B son iguales dentro del factor A donde estn anidados. Sin embargo, si se obtiene que son distintos a nivel global, es interesante contrastar, a continuacin, si los niveles del factor B anidado en A son iguales entre s, dentro de cada nivel i (de A) en el que estn anidados. As, para cada nivel jado de i, donde i = 1, . . . , a se contrasta si los niveles del factor anidado son iguales o no dentro de cada uno de los niveles del factor A en el que estn anidados de manera individual 5
de modo que se rechaza H0 a nivel si F0 > F(b1),ab(n1) , La tabla ANOVA es F. V. Factor A S. C. SCA G. L. a1 M. C. MCA = F FA =
Ejemplo. Un gelogo estudia el contenido en trazas radiactivas de cinco tipos diferentes de suelo. Para ello recoge cuatro muestras de contenido en sustancias radiactivas en cuatro localidades diferentes que estn situadas sobre cada tipo de suelo. Se obtienen los siguientes datos: A B 1 2 3 4 5 6 7 8 6 13 1 7 10 2 4 0 2 3 10 4 9 1 1 3 0 9 0 7 7 1 7 4 8 8 6 9 12 10 9 1 16 33 17 27 38 14 21 8 93 81 402 6 C 11 8 5 0 7 20 82
yij yi y
9 10 0 10 0 11 5 6 5 7 10 34
12 7 2 5 4 18
D 13 11 0 6 4 21 14 5 10 8 3 26 15 1 8 9 4 22 88 16 0 8 6 5 19 17 1 4 7 9 21 18 6 7 0 3 16
E 19 3 0 2 2 7 58 20 3 7 4 0 14
yij yi y
402
SCT =
2 yijk
SCE = SCT SCA SCB(A) = 642 La tabla ANOVA es F. V. Factor A terreno S. C. 45,75 G. L. a1=4 M. C. F 11,269 FA =
Factor B(A) localidad 282,875 a(b 1) = 15 18,858 Residual 642 ab(n 1) = 60 10,7 Total 969,95 abn 1 = 79 Se obtiene que F(a1),ab(n1), = F4,60,00 1 = 2,04 7
por lo cual se acepta H0 : 1 = = a = 0 As no existen diferencias signicativas entre los terrenos a nivel = 0,1. Por otro lado, Fa(b1),ab(n1), = F15,60,00 1 = 1,6 luego se rechaza i = 1, . . . , a la hiptesis H0 : 1(i) = = b(i) = 0 a nivel = 0,1. Estudiamos los contrastes individuales por nivel. Se calcula para cada i 1X 2 1 2 1X 2 1 2 yij yi = yij yi SCB(A)i = n j=1 bn 4 j=1 16
b 4
De este modo, i=1 i=2 i=3 i=4 i=5 SCB(A)1 SCB(A)2 SCB(A)3 SCB(A)4 SCB(A)5 = = = = =
1 (162 4 1 (382 4 1 (102 4 1 (212 4 1 (212 4 1 + 332 + 172 + 272 ) 16 932 = 50,18 1 + 142 + 212 + 82 ) 16 832 = 126,18 1 + 342 + 202 + 182 ) 16 822 = 74,75 1 2 2 2 + 26 + 22 + 19 ) 16 882 = 6,5 1 + 162 + 72 + 142 ) 16 582 = 25,25
La tabla ANOVA queda como F. V. Factor A terreno Factor B(A) localidad A(1) B(2) C(3) D(4) E(5) Residual Total Como F3,60,00 1 = 2,18 existen diferencias signicativas en los niveles B(2) y C(3), es decir, respecto a los terrenos de tipo B y C las localidades tienen distinto nivel de sustancia radiactiva. S. C. 45,75 282,875 50,18 126,18 74,75 6,5 25,25 642 969,95 G. L. M. C. 4 11,269 15 18,858 3 16,726 3 42,06 3 24,92 3 2,16 3 8,41 60 10,7 79 F FA = 1,053 FB(A) = 1,762 FB(A)1 = 1,56 FB(A)2 = 3,93 FB(A)1 = 2,33 FB(A)1 = 0,202 FB(A)1 = 0,786
para todo i,
Las estimas de los componentes de la varianza son: 2 = MCE 2 MCB(A) MCE = n 2 MCA MCB(A) = bn 9
Si FA =
MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 2 = 0 MCB(A) MCB(A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FB(A) =
i = 0
para todo i,
j(i) N 0, 2 donde todas las v.a. son independientes. As, yijk N + i , 2 + 2 ijk N 0, 2
Las esperanzas de los cuadrados medios son: Xa 2 bn i i=1 E(MCA) = 2 + n 2 + a1 E(MCB(A)) = 2 + n 2 E(MCE) = 2
Los contrastes de hiptesis son: Si FA = MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 i = 0, i MCB(A) MCB(A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FB(A) =
para todo i,
j(i) = 0
ijk N 0, 2
yijk N + j(i) , 2 + 2
Las esperanzas de los cuadrados medios son: 2 2 E(MCA) = + bn X X a b 2 n j(i) i=1 j=1 2 E(MCB(A)) = + a(b 1) E(MCE) = 2
11
Los contrastes de hiptesis son: MCA > Fa1,a(b1); se rechaza la hiptesis nula, H0 2 = 0 MCE MCB(A) > Fa(b1),ab(n1); se rechaza la hiptesis nula, H0 i(i) = 0, i MCE
Si FB(A) =
. T1 I1 I2
P1 T2 T3 I3 I5 I4 I6
& T4 I7 I8
Se observa que todos los niveles del factor posicin se cruzan con todos los niveles del factor tamao y que el factor individuo tiene niveles distintos para cada uno de los cruces, es decir, trabajan personas diferentes en cada caso. El esquema es P T y I (P T ).
Modelo matemtico. En el modelo se tienen que incluir: Los efectos principales de P y T. Las interacciones entre P y T. Los efectos de cada nivel k del factor I anidado en la combinacin de (i, j).
i =
b X j=1
(i, j) jo
k(ij) = 0
ya que el factor I tiene c niveles anidados en cada combinacin de los niveles de P y T. Se minimiza la suma de cuadrados de los errores para obtener los estimadores, derivan-
13
do con respecto a cada uno de los parmetros e igualando a 0. Se obtiene: = y i = yi y j = yj y c ()ij = yij yi yj + y
Las respectivas sumas de cuadrados y grados de libertad son: Sumas de Cuadrados b c n a XXXX SCT = (yijkl y )2 SCA = bcn
i=1 j=1 k=1 l=1 a X i=1 b X
SCB = acn
SCAB = cn
j=1 b a XX
SCC(AB) = n SCE =
(yijkl yijk )2
La tabla ANOVA es
14
G. L.
a1 b1 (a1)(b1) ab(c1) abc(n1) abcn1
SC
MCC(AB) MCE
As los contrastes que se establecen son: Si FA > Fa1,abc(n1), se rechaza H0 i = 0 a nivel . Si FB > Fb1,abc(n1), se rechaza H0 j = 0 a nivel . Si FAB > F(a1)(b1),abc(n1), se rechaza H0 ()ij = 0 a nivel . Si FC(AB) > Fab(c1),abc(n1), se rechaza H0 k(ij) = 0 a nivel . Modelo 2. En una serie de establecimientos de una cadena de tiendas de ropa se contabilizan las ventas realizadas de ropa de verano y de ropa de invierno. Se anotan, adems los empleados que realizan las ventas. Hay tres factores: A Tienda B Tipo de ropa C Empleado El esquema es el siguiente Tienda 1 . & V I E1 E2 E1 E2 Tienda 2 . & V I E 3 E4 E 3 E4
Se observa, aqu, que el factor C (empleado) no est anidado en el cruce de los factores A y B (AB) porque no est combinado con una nica combinacin (i, j), ya que se supone que estn los mismos empleados en verano e invierno. As, Empleados T iendas = C A Empleados Ropa = C B T iendas Ropa = A B 15
Modelo matemtico. yijkl = + i + j + ()ij + k(i) + ()k(i)j + ijkl donde i = 1, . . . , a j = 1, . . . , b k = 1, . . . , c l = 1, . . . , n sujeto a las restricciones
a X i=1
i =
b X j=1
y para cada i
c X k=1
k(i) = 0
Se minimiza la suma de cuadrados de los errores para obtener los estimadores, derivando con respecto a cada uno delo parmetros e igualando a 0. Se obtiene: = y i = yi y j = yj y c ()ij = yij yi yj + y k(i) = yik yi Del mismo modo, para i, j, k jados:
2 X c yijkl i j ()ij k(i) ()k(i)j = 0 = ()k(i)j i,j,k,l X 2 = 0 yijkl yij yik + yi ()k(i)j ()k(i)j i,j,k,l
l=1
16
Las respectivas sumas de cuadrados y grados de libertad son: Sumas de Cuadrados SCT =
n a b c XXXX i=1 j=1 k=1 l=1 a X i=1 b X
grados de libertad = = = = = = = abcn 1 a1 b1 ab a b + 1 = = (a 1)(b 1) ac a = a(c 1) abc ab ac + a = a(b 1)(c 1) abcn abc = = abc(n 1)
(yijkl y )2
SCA = bcn
SCB = acn
SCAB = cn
j=1 b a XX
SCC(A) = bn
i=1 j=1 a c XX
SCBC(A) = n SCE =
(yijkl yijk )2
i =
b X j=1
j =
(i, j) jo k(ij) N(0, 2 ) ijkl N(0, 2 ) independientes entre s. Las esperanzas de los cuadrados medios son: Xa 2 bcn i E[MCA] = 2 + n 2 + i=1 a1 Xb 2 acn j j=1 E[MCB] = 2 + n 2 + b1 X Xa b ()2 cn ij i=1 j=1 E[MCAB] = 2 + n 2 + (a 1)(b 1) E[MCC(AB)] = 2 + n 2 E[MCE] = 2
Las estimas de los componentes de la varianza son: 2 = MCE MCC(AB) MCE 2 = n MCA > Fa1,ab(c1); se rechaza la hiptesis nula, H0 i = 0, i MCC(AB) MCB > Fb1,ab(c1); se rechaza la hiptesis nula, H0 j = 0, j MCC(AB) MCAB > F(a1)(b1),ab(c1); se rechaza la hiptesis nula, H0 ()ij = 0, ij MCC(AB) MCC(AB) > Fab(c1),abc(n1); se rechaza la hiptesis nula, H0 2 = 0 MCE
Si FAB =
Si FC(AB) =
18
i j ()ij (ij)k
A b j b 1 1 1
A n k n n n 1
1. El trmino del error del modelo ij...m se representa como (ij...)m donde m es el ndice de las replicaciones, es decir, jados ij . . . se consideran m rplicas aleatorias. 2. Los subndices de cada trmino se subdividen en tres clases: activos: estn en el trmino y no se encuentran entre parntesis. pasivos: estn en el trmino pero se encuentran entre parntesis. ausentes: No estn en el trmino aunque pertenecen al modelo. 3. En cada la se escribe un 1 si uno de los subndices pasivos (tambin estn entre parntesis los correspondientes a los anidados) del componente de la la coincide con el subndice de la columna.
19
i j ()ij (ij)k
Pa
F A A a b n i j k
i=1 2 2 2
2 (a 1) i 1 1
4. Si algn subndice de la la coincide con el subndice de la columna, se escribe: Un 1 si es un factor aleatorio Un 0 si es un factor jo F A A a b n i j k Pa 2 i=1 i (a 1) 0 2 1 2 1 1 2 1 1 1
Tipo Factor Num. Niveles Subndices
i j ()ij (ij)k
En los huecos restantes, se escribe el nmero de niveles que tiene la columna correspondiente. Queda as la siguiente tabla: F a i Pa 2 (a 1) 0 i=1 i 2 a 2 1 2 1
Tipo Factor Num. Niveles Subndices
i j ()ij (ij)k
A b j b 1 1 1
A n k n n n 1
5. Para obtener el valor esperado de la media de cuadrados de cualquier componente del modelo, se hace: a) Se tapan todas las columnas encabezadas por los subndices activos de ese componente. b) Se multiplican los nmeros de las las que tienen al menos los mismos subndices que el componente, multiplicndolos a su vez por el factor jo (suma de cuadrados) o el factor aleatorio (varianza) obtenidos. 20
Por tanto, los contrastes de hiptesis son: FA = FB = MCA para H0 i = 0, i MCAB MCB para H0 2 = 0 MCAB MCAB para H0 2 = 0 MCE
FAB =
De todas formas, no siempre se pueden construir contrastes de hiptesis para cualquier modelo. Una posible solucin es suponer que algunas interacciones son nulas. Ejemplo. Supongamos un modelo bifactorial con efectos aleatorios:
Tipo Factor Num. Niveles Subndices
i j ()ij (ij)k
2 2 2 2
A a i 1 a 1 1
A b j b 1 1 1
A n k n n n 1
Las medias de cuadrados son: E[MCA] = bn 2 + n 2 + 2 E[MCB] = an 2 + n 2 + 2 E[MCAB] = n 2 + 2 E[MCE] = 2 Por tanto, los contrastes de hiptesis son:
21
FA = FB =
FAB =
Ejemplo. Supongamos un modelo bifactorial con efectos jos: F a i Pa 2 (a 1) 0 Pi=1 i2 b j (b 1) a Pj=1 Pb a 2 i=1 j=1 ()ij (a 1)(b 1) 0 2 1
Tipo Factor Num. Niveles Subndices
a 2 i=1 i + 2 a1 b 2 j=1 j + 2 b1 a b 2 i=1 j=1 ()ij (a1)(b1)
i j ()ij (ij)k
F b j b 0 0 1
A n k n n n 1
+ 2
Por tanto, los contrastes de hiptesis son: FA = FB = MCA para H0 i = 0, i MCE MCB para H0 j = 0, j MCE MCAB para H0 ()ij = 0, i, j MCE
FAB =
Ejemplo. Supongamos un modelo anidado con dos factores: B A donde B es aleatorio y A es jo: yijk = + i + j(i) + ijk siendo i = 1, . . . , a j = 1, . . . , b k = 1, . . . , n 22
donde
a X i=1
i = 0
para todo i,
ijk N 0, 2 A n k n n 1
i j(i) (ij)k
A b j b 1 1
Por tanto, los contrastes de hiptesis son: FA = MCA para H0 i = 0, i MCB(A) MCB(A) para H0 2 = 0 MCE
FB =
Ejemplo. Supongamos un modelo por bloques aleatorizados completos con un factor aleatorio y un bloque aleatorio: yij = + i + j + ij siendo i = 1, . . . , a j = 1, . . . , b
23
i j ij
2 2 2
A a i 1 a 1
A b j b 1 1
F* 1 k 1 1 1
(*) En este caso no hay rplicas aleatorias y hay un slo elemento jo (k = 1) . De este modo, k no es una rplica por lo que se pone ij . Las medias de cuadrados son: E[MCA] = b 2 + 2 E[MCB] = a 2 + 2 E[MCE] = 2 Por tanto, el contraste de hiptesis es: FA = MCA para H0 2 = 0 MCE
Ejemplo. Supongamos un modelo por bloques aleatorizados completos con un factor aleatorio y un bloque jo: yij = + i + j + ij siendo i = 1, . . . , a j = 1, . . . , b
24
donde i N(0, 2 ) j = 0 ij N 0, 2
b X j=1
i j ij
F b j b 0 1
F* 1 k 1 1 1
(*) En este caso no hay rplicas aleatorias y hay un slo elemento jo (k = 1) . De este modo, k no es una rplica por lo que se pone ij . Las medias de cuadrados son: E[MCA] = b 2 + 2 E[MCB] = a E[MCE] = 2
b j=1
2 j b1
+ 2
25
Aplicacin con R
# Diseo anidado datos <- read.table("datAnida.txt", header=T) attach(datos) terreno <- as.factor(terreno) locali <- as.factor(locali) # Dos formas de programarlo: modelo <- aov(silice ~ terreno + terreno/locali) # alternativamente: modelo <- aov(silice ~ terreno + locali%in%terreno) summary(modelo)
26
3 1 0 3 1 0 3 1 5 3 1 5 3 2 10 3 2 11 3 2 6 3 2 7 3 3 8 3 3 5 3 3 0 3 3 7 3 4 7 3 4 2 3 4 5 3 4 4 4 1 11 4 1 0 4 1 6 4 1 4 4 2 5 4 2 10 4 2 8 4 2 3 4 3 1 4 3 8 4 3 9 4 3 4 4 4 0 4 4 8 4 4 6 4 4 5 5 1 1 5 1 4 5 1 7 5 1 9 5 2 6 5 2 7 5 2 0 5 2 3 5 3 3 5 3 0 5 3 2 5 3 2 5 4 3 5 4 7 5 4 4 5 4 0 ; proc glm; class terreno locali; model silice=terreno locali(terreno); contrast 'locali(terreno_A)' locali(terreno) 1 -1 0 0 , locali(terreno) 1 0 -1 0 , locali(terreno) 1 0 0 -1 ; contrast 'locali(terreno_B)' locali(terreno) 0 0 0 0 1 -1 0 locali(terreno) 0 0 0 0 1 0 -1 locali(terreno) 0 0 0 0 1 0 0
0 , 0 , -1 ;
27
contrast 'locali(terreno_C)' locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 contrast 'locali(terreno_D)' locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 contrast 'locali(terreno_E)' locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 locali(terreno) 0 0 0 0 0 0 0 0 means locali(terreno); run;
1 -1 0 1 0 -1 1 0 0
0 , 0 , -1 ;
0 0 0 0 0 0 0 0 0 0 0 0
1 -1 0 1 0 -1 1 0 0
0 , 0 , -1 ;
0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0
1 -1 0 1 0 -1 1 0 0
0 , 0 , -1 ;
ANOVA ANIDADO The GLM Procedure Class Level Information Class terreno locali Levels 5 4 Values 1 2 3 4 5 1 2 3 4
Number of observations ANOVA ANIDADO The GLM Procedure Dependent Variable: silice Sum of Squares 327.9500000 642.0000000 969.9500000
80
DF 19 60 79
F Value 1.61
Pr > F 0.0823
R-Square 0.338110
DF 4 15
DF 4 15
28
DF 3 3 3 3 3
Level of locali 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Level of terreno 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5
N 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
------------silice----------Mean Std Dev 4.00000000 8.25000000 4.25000000 6.75000000 9.50000000 3.50000000 5.25000000 2.00000000 2.50000000 8.50000000 5.00000000 4.50000000 5.25000000 6.50000000 5.50000000 4.75000000 5.25000000 4.00000000 1.75000000 3.50000000 3.65148372 4.11298756 4.64578662 2.06155281 2.08166600 4.35889894 3.50000000 1.82574186 2.88675135 2.38047614 3.55902608 2.08166600 4.57347424 3.10912635 3.69684550 3.40342964 3.50000000 3.16227766 1.25830574 2.88675135
29