Professional Documents
Culture Documents
Partie 1
Mohammed El Haj Tirari
tirari@insea.ac.ma
INSEA
2013-2014
Introduction
Analyse de la Variance un facteur
Introduction
LAnalyse de la Variance (ANOVA) est une technique quon utilise
pour tudier leffet dune variable qualitative sur une variable
quantitative :
Variable dpendante : variable quantitative.
Variable indpendante : variable qualitative (avec plusieurs
catgories).
Par exemple : Impact du niveau dinstruction (variable qualitative
qualitative) sur le revenu (variable quantitative).
, On peut conclure quil existe une relation si les moyennes de
revenus des gens ne sont pas les mmes dans les diffrentes
catgories.
Chaque variable indpendante est appele un facteur et chaque
facteur peut avoir deux ou plusieurs niveaux ou traitements.
Mohammed El Haj Tiraritirari@insea.ac.ma
Introduction
Analyse de la Variance un facteur
Introduction
Lanalyse de variance peut tre vue comme une comparaison
multiple de moyennes. Dans tous les cas, la variable tudie est un
caractre quantitatif de type continu qui suit une loi normale.
, Une ANOVA teste si toutes les moyennes sont gales :
H0 : galit
contre
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Introduction
Analyse de la Variance un facteur
modalit 1
y11
..
.
...
...
..
.
Facteur A
modalit i
yi1
..
.
...
...
..
.
modalit p
yp1
..
.
y1j
..
.
...
..
.
yij
..
.
...
..
.
ypj
..
.
y1n1
y1
...
...
yini
yi
...
...
ypnp
yp
Introduction
Analyse de la Variance un facteur
Exemple de donnes
Introduction
Analyse de la Variance un facteur
Exemple de donnes
Dans cet exemple, lhypothse nulle revient considrer que toutes les
vaches produisent la mme quantit de lait journalire (au facteur
alatoire prs) quelle que soit la race. Lhypothse alternative revient
considrer quune des races produit significativement plus ou moins de
lait que les autres. Supposons que les productions sont :
La race des vaches
Race A Race B Race C
20,1
22,6
31,2
19,8
24,1
31,6
21,3
23,8
31,0
20,7
22,5
32,1
23,4
31,4
24,5
22,9
Introduction
Analyse de la Variance un facteur
Modle thorique
Introduction
Analyse de la Variance un facteur
Modle thorique
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Hypothse 1 : lIndpendance
Lindpendance entre les diffrentes valeurs de la variable mesure yij est
une condition essentielle la ralisation de lanalyse de variance.
, Les p chantillons compars sont indpendants.
, Lensemble des n individus est rparti au hasard entre les p
modalits du facteur contrl A et les ni individus correspondant
une modalit Ai recoivent le mme traitement i.
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Hypothse 3 : lHomoscdasticit
Les variances dans les p populations compares sont les mmes.
, Le facteur A agt seulement sur la moyenne de la variable Y et
ne change pas sa variance.
Plusieurs tests diffrents permettent de vrifier lgalit des
variances relatives aux p populations compares :
H0 : 1 = 2 = = i = = p =
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Hypothses
Normalit de Y
Homoscdasticit des
p distributions
Indpendance des
p distributions
Test
Test du 2
dajustement
Test de Levne
ou de Bartlett
Plan exprimental
Robustesse
Trs robuste si indpendance
et galit des variances
Trs robuste
lingalit des variances
Pas robuste
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
i
X
1 XX
yij avec n =
ni
b = y o y =
n i=1 j=1
i=1
Introduction
Analyse de la Variance un facteur
b+b
ai = y i o y i =
ni
1 X
yij
ni j=1
Ainsi,
b
ai = y i y
et
ebij = yij
bb
ai = yij y i
Introduction
Analyse de la Variance un facteur
p X
ni
X
(yij y) =
p
X
(yij y i ) +
i=1 j=1
i=1 j=1
{z
SCEtotale
ni (y i y)2
i=1
{z
SCEintra
{z
SCEinter
o
? SCEtotale : la somme des carts totaux ou la variation totale = ns2y
? SCEintra : la somme des carts rsiduelles ou la variation intra
(interne chaque modalit)
? SCEinter : la somme des carts lis aux effets du facteur A ou la
variation inter (entre modalits).
Mohammed El Haj Tiraritirari@insea.ac.ma
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
SCEinter
SCEtotale
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
yij N (i , 2 )
ni
2
1 X
yij N (i , )
ni
ni
j=1
i
1 XX
2
y=
yij N (, )
n
n
i=1 j=1
avec
n=
p
X
ni et =
i=1
Mohammed El Haj Tiraritirari@insea.ac.ma
1X
ni i
n
i=1
Introduction
Analyse de la Variance un facteur
y i N (,
yij
N (0, 1)
y
2
) = z i = ni i
N (0, 1)
ni
y N (,
y
2
) = z = n
N (0, 1)
n
Introduction
Analyse de la Variance un facteur
(yij y)2 =
ni (y i y)2 +
i=1
i=1 j=1
p
X
{z
SCEtotale
p X
ni
X
(yij y i )2
i=1 j=1
{z
SCEf acteur
{z
SCEresidu
SCEresidu =
p X
ni
X
i=1
p
ni
X
X
2
zij
z 2i 2 2np
(yij y i )2 = 2
i=1 j=1
i=1
j=1
Introduction
Analyse de la Variance un facteur
SCEtotale
n1
avec n =
p
X
ni
i=1
SCEf acteur
p1
SCEresidu
np
Introduction
Analyse de la Variance un facteur
F =
Sf2acteur
=
2
Sresidu
Sf2 acteur
2
Sresidu
SCEf acteur
p1
SCEresidu
np
2p1
F (p 1, n p)
2np
S2
Introduction
Analyse de la Variance un facteur
Table de lANOVA
Somme des
carrs des carts
SCEf acteur
SCEresidu
SCEtotal
Degr de
libert
DDLf
DDLr
DDLtotal
Variance
SCEf acteur
DDLf
SCEresidu
=
DDLr
2
Sf
=
2
Sr
F
F =
p-value
2
Sf
2
Sr
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Taille
4
7
5
25,1875
Moyenne
20,475
23,4
31,46
32,1
Variance
0,4425
0,5933
0,1780
20,8012
Somme des
carrs des carts
307,918
5,6
313,518
Degr de
libert
2
13
15
Variance
p-value
153,959
0,431
357,44
< 0, 001
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Hypothses : H0 :
contre
i = j
r
i 6= j
y i y j
1
1
n + nj
Sr2
6
H1 :
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
p
X
ci i
i=1
avec
p
X
ci = 0
i=1
Exemples : L = 1 3 , L = 1 + 2 3 4
? Deux contrastes sont orthogonaux si le produit de leur coefficients
de contraste est nul.
, On peut construire p 1 contrastes orthogonaux pour un
facteur q valeurs.
? Les contrastes sont des mthodes quon qualifie da priori car ils
sont guids par des hypothses que lon a formules pralablement
ltude elle-mme. On les dfinit donc sans avoir observ les
moyennes et sur base uniquement de ses hypothses thoriques.
Mohammed El Haj Tiraritirari@insea.ac.ma
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
L = c1 1 + c2 2 + + cp p .
Lhypothse nulle :
H0 : L = c1 1 + c2 2 + + cp p = 0
contre lhypothse alternative
H1 : L 6= 0
a2i
ni
tnp
|{z}
sous H0
Introduction
Analyse de la Variance un facteur
L = 1 + 2 3 4 = 0 contre H1 : L 6= 0
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Introduction
Analyse de la Variance un facteur
Modle thorique
Nous avons vu que dans le cas dune analyse de la variance un
facteur fixe, le modle linaire correspondant est donn par
yij = i + ij = + i + ij
o
yij est la valeur observe pour le sujet j du groupe i.
est la moyenne gnrale.
i est linfluence du traitement Ai sur le groupe i
(i = i ).
ij est lerreur ou les rsidus qui suit la loi N (0, 2 ).
Sous ce modle, nous avons
yij N (i , 2 )
Introduction
Analyse de la Variance un facteur
Modle thorique
Dans le cas dune analyse de la variance effet alatoire, les
modalits du facteur sont elles-mmes alatoires et le modle
linaire correspondant devient :
yij = + i + ij
avec
i N (0, 2 ) pour i = 1, . . . , p.
ij N (0, 2 ) pour i = 1, . . . , p et j = 1, . . . , ni .
i et ij sont indpendants pour i = 1, . . . , p et j = 1, . . . , ni .
Sous ce modle, nous avons
yij N (, 2 + 2 )
On dit alors que 2 et 2 sont les composantes de la variance. Une
partie de la variabilit de Y est explique par la variabilit entre les
traitements (2 ), lautre par la variabilit rsiduelle ( 2 ).
Mohammed El Haj Tiraritirari@insea.ac.ma
Introduction
Analyse de la Variance un facteur
Test dhypothses
Dans lANOVA un facteur fixe, on considre lhypothse
H0 : 1 = 2 = = p
Cette hypothse na plus de sens dans le contexte dune ANOVA
un facteur alatoire puisque les modalits sont elles-mmes
alatoires.
On veut tester si le facteur influence la variabilit de Y . Le test
dhypothses scrit donc
H0 : 2 = 0
contre
H1 : 2 > 0
Bien que les deux scnarios soient trs diffrents lun de lautre, on
utilise la mme rgle de dcision dans les deux cas, cest dire :
On rejette H0 si F =
2
Sinter
=
2
Sintra
SCEinter
p1
SCEintra
np
> Fp1,np,1
Introduction
Analyse de la Variance un facteur
i
1X
1 XX
y = +
i +
ij = y N
n i=1
n i=1 j=1
p
X
2
n2i
,
+ 2
n
n2
i=1
Introduction
Analyse de la Variance un facteur
ni
1 X
yij y i = ij
ij
ni j=1
avec
ij N 0, 2
et
ni
1 X
2
ij N 0,
ni j=1
ni
2
ni
X
1
2
ij
(yij y i ) =
ij
ni j=1
i=1 j=1
i=1 j=1
p X
ni
X
p X
ni
X
= 2 2np
Introduction
Analyse de la Variance un facteur
2 = 0
nous avons
yi N
2
,
ni
et
yN
2
,
n
p
X
ni (y i y) = 2 2p1
i=1
Par consquent,
F =
Sf2acteur
=
2
Sresidu
SCEinter
p1
SCEintra
np
2p1
Fp1,np
2np
Introduction
Analyse de la Variance un facteur
Remarques