Professional Documents
Culture Documents
Vincent DEBAT
UMR5202 Systématique et Evolution
Plate-forme Morphométrie
debat@mnhn.fr
ANOVA = ANalysis Of VAriance
Introduction
Exemples:
Exemples:
Deux raisons:
Exemple:
… et limite:
Exemples:
Exemples:
Population 1 Population 2 …
♂ ♀ ♂ ♀
Le facteur fixe est le sexe: les individus sont males ou femelles, pour toutes les
populations. Le facteur population est aleatoire : on ne peut pas predire ce qui
se passe dans d’autres populations.
Principe general – Cas du modele I (un effet fixe)
Population
Autrement dit, cela veut dire que les moyennes des groupes mélangés
(comparés) sont les mêmes.
H0: variance inter groupes = variance intra groupe => moyennes identiques
H1: variance inter groupes > variance intra groupe => moyennes différentes
Rappel: Variance
Trait mesuré Y
Echantillons (groupes)
Moyenne totale:
Echantillons k n
1
(groupes) Y=
N
∑∑
j= 1 i= 1
Yij
nj
1
Moyenne du jème groupe: Yj =
nj
∑
i= 1
Yij
Moyenne generale et variance totale (dispersion autour de la moyenne)
k nj
Y SCE total = ∑∑
j= 1 i= 1
(Yij − Y ) 2
Population
Individus
k nj
SCE total = ∑∑
j = 1 i= 1
(Yij − Y ) 2
k
1
SCE Inter =
N
∑j= 1
n j (Y j − Y ) 2
n
1 k j
SCE Intra = ∑j = 1 ∑i = 1 ij j
N moyennes
=variance des
(Y − Y ) 2
Echantillons
(groupes)
Individus k nj
SCE total = ∑∑
j= 1 i= 1
(Yij − Y ) 2
k
1
SCE Inter =
N
∑j= 1
n j (Y j − Y ) 2
k nj
1
SCE Intra =
N
∑∑
j= 1 i= 1
(Yij − Y j ) 2
Echantillons
(groupes)
● Calcul des sommes des carrés des écarts (SCE = SS (Sum of Squares))
SCE totaux = SCE inter groupes + SCE intra groupes (= residuels)
● Calcul des carrés moyens (CM = MS (Mean squares)) en divisant par les
degrés de liberté (ddl = df (degrees of freedom)
Sous H0, F suit une loi de Fisher à k-1 et n-k degrés de liberté
On compare Fobserve et F de la table statistique
Que conclure du test??
Si F est significatif:
Mais laquelle?
Quelles moyennes diffèrent??
M:B-F:B
F:O-F:B
M:O-F:B
F:O-M:B
M:O-M:B
M:O-F:O
-2 0 2 4 6
Normalité:
les echantillons doivent provenir d’une population distribuee normalement.
Plus precisement, ce sont les residus du modele utilise qui doivent suivre une
loi normale (pour que le rapport des variances suive une loi de fisher)
Homoscédasticité:
= Egalite des variances des differents echantillons.
Normalité :
Homoscédasticité:
ceci depend du plan d’echantillonage. Si l’on n’est pas sur, mieux vaut en
discuter avec le statisticien du labo!
TD: analyse du jeu de données crabs
meanT<-mean(crabs[, 6])
meanB<-mean(crabs[which(crabs$sp=="B"), 6])
meanO<-mean(crabs[which(crabs$sp=="O"), 6])
meanM<-mean(crabs[which(crabs$sex=="M"), 6])
meanF<-mean(crabs[which(crabs$sex=="F"), 6])
means<-c(meanT, meanB,meanO, meanM, meanF)
means
#representation graphique des deux effets sex et sp
Qu’en pensez vous? plot(crabs$CL~crabs$sp)
plot(crabs$CL~crabs$sex)
gp<-paste(crabs$sex, crabs$sp, sep="")
plot(crabs$CL~as.factor(gp))
g<-factor(gp, levels=c("MB", "FB", "MO", "FO"))
plot(crabs$CL~g)
#############ANOVA a la main: effet espece
###degrees of freedom
dfamong<-1
b<-length(crabs[which(crabs$sp=="B"), 6])-1
o<-length(crabs[which(crabs$sp=="O"), 6])-1
dfwithin<-b+o
MSamong<-SSamong/dfamong
MSwithin<-SSwithin/dfwithin
F<-MSamong/MSwithin
#significativité du F: pf(Fvalue, df1, df2,low=FALSE)
####Affichage global
MSamong
MSwithin
F
p
summary(aov(crabs$CL~crabs$sp))
anova(lm(crabs$CL~crabs$sp))
######### conditions d'application de l'anova: Analyse des residus #####
model<-(aov(crabs$CL~crabs$sp))
names(model)
qqnorm(model$res)
###tests:
shapiro.test(model$res)
ks.test(model$res, "pnorm")
Comme bcp de tests non par, on traite les rangs des donnees ordonnees et
plus les valeurs elles memes (perte de puissance)
En gros: on assigne a l’ensemble des valeurs un rang, et on somme les rangs
par groupe. La somme des rangs doit etre approximativement la meme si les
groupes sont semblables. L’alternative suggere que les groupes different.
kruskal.test(crabs$FL~crabs$sp)
################ ANOVA a deux effets fixes et interaction #########
aov(crabs$FL~crabs$sex*crabs$sp)
Interpreter
TukeyHSD(aov(crabs$FL~crabs$sex*crabs$sp))
plot(TukeyHSD(aov(crabs$FL~crabs$sex*crabs$sp)))
ANOVA a deux facteurs fixes: notion d’interaction
Analyse conjointe des effets espece et sexe sur FL (frontal lobe size)
On est ici dans le cas d’un modele a deux facteurs fixes = modele1
(model1 two-way ANOVA)
Exemple:
Y ij = µ + α i + ε ij
• Les algorithmes de µ =µ1 = µ2 = µ3
l’ANOVA suivent ce
modèle (par les
moindres carrés) afin Y µ
d’estimer les αi
• H0: tous les αi = 0 α1 = α2 = α3 = 0
Groupe 1
Groupe 2
Groupe 3
Groupe
µ2
Y µ
µ3
µ1