Professional Documents
Culture Documents
M4
Dans les paragraphes prcdents on a suppos que les hypothses dapplication de la rgression
taient vrifies ce qui permet de montrer les proprits remarquables (BLUE) des estimateurs, de
construire des tests des paramtres et du coefficient de dtermination et enfin dlaborer des
intervalles de confiance prvisionnels. Limportance de ces hypothses tant manifeste, il est
indispensable de les vrifier pour contrler la qualit statistique et donc oprationnelle du modle de
rgression.
Lhypothse dindpendance de la variable explicative est une hypothse ad hoc. Il en est de mme
dans ce cours de celle concernant le sens de causalit entre deux variables ainsi que labsence de
tendances communes pouvant conduire une spurious rgression (rgression factice, c'est--dire
une rgression qui semble de bonne qualit cause dune tendance semblable entre les deux
variables (r lev) mais qui dans la ralit nest quune covariation).
En dfinitive, ce sont les hypothses sur lala qui font lobjet de ce paragraphe. Rappelons que lala
est une succession temporelle (pour le modle choisi ici) de variables alatoires centres,
homoscdastiques, non autocorrles et obissant une loi normale. Cet ala est inconnu.
Lhypothse fondamentale sur laquelle repose le modle de rgression cest que le rsidu du modle
On sait que : e N m, e
e m
n N(0,1)
soit
n
e
e 0
e
1
e t pour vrifier cette hypothse.
n t
contre H1 : m 0
n < 1,96 (le quantile 95% de la loi normale centre rduite) alors lhypothse H0 est
vrifie.
Cette hypothse ne joue pas un rle important dans la rgression puisquon sait que e t = y t y t et
donc par construction e = 0 . Il sagit donc dune hypothse ad hoc et lutilit de ce test ne se justifie
que dans dautres applications (sries temporelles par exemple)
t, t' , t t'
1/12
M4
k N* rk [ 1,+1]
FAC
rk
+1
r3
r1
rk
k
K
-1
r2
K est le dcalage maximal pour lequel rk a un sens statistique (le nombre de points permettant le
calcul de rk ). En gnral
n
n
K
6
3
Si les rsidus sont une bonne reprsentation de lala, ils doivent vrifier lhypothse de non
autocorrlation ; cela signifie que toutes les autocorrlations successives doivent tre non
significativement diffrentes de 0.
y t = x t + t
Et supposons que :
2/12
M4
t = t 1 + t avec
E[ t ] = 0
Cov t t ' = 0
[ ]
On sait que :
xt yt
x 2t
= wtyt
avec w t =
xt
x 2t
= w t Yt Y = w t Yt Y w t
123
=0
Do
= w t ( + X t + t )
= w t + w t X t + w t t
123
1
424
3
=1
= + w tt
Do
[]
E = + w t E[ t ]
123
=0
t = t 1 + t scrit :
t = ( t 2 + t 1 ) + t
= 2 t 2 + t 1 + t
L etc L
t = t + t 1 + 2 t 2 + L
=
=0
E[ t ] =
[ t4
E1
3
]
42
=0
=0
La variance de scrit :
[]
V = 2 /
x 2t
[ ]]2
= E E
[ ]
2
Comme V [ t ] = E t E[ t ] = E t
{
=0
On a :
L3MS2_M5.doc
3/12
M4
t = t + t 1 + 2 t 2 + L
2t = 2 + 2 2 + L + 2 t t 1 + L
t 1
Do
[ ]
E 2t = E 2 + 2E 2 + L + 2E[ t t 1 ] + L
t
t 1
14243
=0
= 2 + 2 2 + K + 0
= 2 1 + 2 + L
Or : < 1 do :
[ ]
E 2t =
1
1
2 = 2
De ce fait :
[]
V =
1
2
x 2t
t
1 2
est grande et donc plus forte est la sous-estimation de la variance de .
La mthode des MCO nest donc pas, dans ce cas, la meilleure des mthodes pour estimer le
modle. Elle sous-estime les variances vraies dans le cas dune autocorrlation positive par exemple,
ce qui a pour consquence une surestimation de la prvision de lestimation. Dans le cas dune
prvision, on naura plus des valeurs de la variable endogne les meilleures possibles.
Lautocorrlation remet en cause lestimation du MLGS par les MCO ; on doit disposer de tests
permettant de la dtecter.
(e t + 1 e t )2
DW = t =1
e 2t
t =1
Pour n grand :
n1
n1
t =1
t =1
e 2t +1 e 2t
L3MS2_M5.doc
e 2t
t =1
4/12
avec
M4
t +1 t
t
n
e
t =1
2
t
avec < 1
d1
Autocorrlation
>0
d2
Doute
4 d2
indpendance
4 d1
Doute
Autocorrlation
<0
Ce test prsente linconvnient de ne pouvoir dceler que les autocorrlations dordre 1. On peut
remdier ce problme en utilisant les rsultats de la FAC (Fonction dautocorrlation). Chaque
autocorrlation peut tre teste par un test classique de signification de Student :
H0 : k = 0
tc =
rk
1 rk2
H1 : k 0
[ ]
[ ]
On va tester E 2t = 2
3.1 Dfinition
Lhomoscdasticit peut tre considre comme un cas particulier de la non autocorrlation
E[ t t ' ] = 0 ; lorsque t = t alors :
[ ]
5/12
M4
[ ]
[ ]
E 2t = aX t E 2t = a 2 X 2t
Principe du test :
On ordonne les observations des variables Yt et X t en fonction des valeurs croissantes de X t .
On nglige les observations centrales de lchantillon. On appelle m le nombre de ces observations
ngliges.
Comme m dpend de n, on prend pour n = 30, m = 8 et pour n = 60, m = 16, etc.
On obtient deux sous chantillons, lun correspond aux faibles valeurs de X t (premier chantillon),
lautre aux fortes valeurs ( deuxime chantillon). On applique les MCO sur les
faibles et sur les
nm
observations
2
nm
observations fortes. (Il faut que les deux chantillons soient suffisamment
2
importants).
On appelle SCR1 la somme des carrs des rsidus du premier chantillon, SCR2 la somme des carrs
des rsidus du second chantillon. On dmontre alors que :
SCR 2
nm 4 nm 4
F1 p
;
SCR1
2
2
si
si
SCR 2
< F1 H0 accepte au rique de 1re espce p hom oscdasticit
SCR1
SCR 2
F1 H0 rejete au rique de 1re espce p htroscdasticit
SCR1
Test de Glejser
Ce test propose de rgresser la valeur absolue des rsidus de la rgression avec la variable
explicative X t . On considre des fonctions simples du type, (selon lhypothse prcdente) :
6/12
e t = a0 +
a1
Xt
M4
+ t
H0 : a1 = 0 (hom oscdasticit )
H1 : a1 0 (htroscd asticit )
On applique alors la mthode des MCO aux diffrents modles proposs par Glejser :
tc =
a1
T(n 2)
a1
Test Arch - LM
Il sagit dun test de conception diffrente utilis principalement pour les sries temporelles. Les
modles AutoRgressifs Conditionnellement Htroscdastique (ARCH) ont t introduits par Engle
en 1982 pour modliser la volatilit des cours boursiers. Un reprsentant de ce modle est associ au
test du Multiplicateur de Lagrange (test du 2 ) pour vrifier lhypothse dhomoscdasticit du rsidu
e 2t = 0 + 1e 2t 1 + L + p e 2t p + t
- On estime le modle par la mthode des MCO (il sagit dun modle plusieurs variables qui sera
tudi ultrieurement).
e 2t = 0 + 1e 2t 1 + L + p e 2t p
- On calcule la statistique :
nR 2 avec
Do le test :
Test de White
L3MS2_M5.doc
7/12
M4
On effectue une rgression entre le carr du rsidu et une ou plusieurs variables explicatives en
niveau et au carr (ici, on considre une seule variable explicative puisque lon se place dans le cas
du modle linaire gnral simple 2 variables), cest--dire :
e 2t = a 0 + a1X1t + b1X12t + t
Si lun de ces coefficients de rgression ( a1 ou b1 ) est significativement diffrent de 0, on accepte
lhypothse dhtroscdasticit. Deux manires pour effectuer le test :
1) On effectue un test de Fisher : H0 : a1 = b1 = a 0 = 0
On construit le Fisher calcul suivant :
Fc =
R2
nk
o k reprsente le nombre total de paramtres estims (ici, k=3)
1 R k 1
2
Fc F(k 1, n k )
Rgle de dcision :
Si Fc < F1 p (k 1, n k ) alors Ho accepte au risque de 1
Si Fc F1 p (k 1, n k ) alors Ho rejete au risque de 1
re
re
espce p homoscdasticit
espce p htroscdasticit
Le coefficient du skewness : 1 2 =
Le coefficient du Kurtosis 2 =
4
4
3
3
On dmontre que :
L3MS2_M5.doc
8/12
M4
6
24
1 2 N 0,
et 2 N 3,
n
n
Remarque : il est donc possible de raliser un test de symtrie et daplatissement en utilisant les lois
normales centres rduites. :
1
1=
1 2 0
6
n
3
N(0,1)
N(0,1) et 2 = 2
24
n
si
1 2 0
6
n
< 1,96 (le quantile 95% de la loi normale centre rduite) alors H0 est accepte au
si
1 2 0
6
n
H0 : symtrie normale
Si
2 3
24
n
Si
2 3
24
n
Pour vrifier lhypothse de normalit, il faut la fois laplatissement normal et la symtrie normale.
JB =
n
n
1 +
( 2 3)2 Elle obt un 2 (2) (somme de deux lois normales au carr). Le test se
6
24
Hypothse : H0 : la distribution obit une loi normale H1 : la distribution nobit pas une
loi normale
Calcul de JB
Si JB < 2 (2) (gal 5,99 au seuil = 0,05 ) on est sous lhypothse H0 de normalit.
L3MS2_M5.doc
9/12
M4
5. La robustesse du modle
Un modle est dit robuste lorsquil est valide dans des circonstances diffrentes.
Exemple : lestimation de la fonction de consommation pendant la premire moiti du XX sicle estelle reste identique celle de la deuxime moiti ?
La relation prix rcolte de vin est-elle reste identique aprs lintroduction de la viticulture dans le
march commun en 1970 ?
Dans ces exemples, appels exemples de robustesses structurelles, ltude porte sur des poques de
temps conscutives, mais elle peut concerner des priodes qui se chevauchent. Cette robustesse
peut aussi tre lie des problmes dhomognit spatiale. La robustesse concerne aussi le sens de
la causalit de la relation conomique.
Dans ce cours, on dira quun modle est robuste, si quels que soient les sous-ensembles constitus
partir dobservations conscutives sur la priode [1,n], les estimateurs du mme modle sur chacun
de ces sous-ensembles sont :
-
stables : les paramtres estims ne sont pas significativement diffrents entre eux, et
et .
diffrents de
Cette dfinition amne sur le plan statistique comparer les estimations des paramtres entre eux et
les qualits de la rgression entre elles. Trois tests de stabilit sont prsents
z = Argth =
1
1+
Log
avec Argth : fonction Argument tangente hyperbolique et Log le logarithme
2
1
nprien :
1
2
V (z ) = s (z ) = n 3
E[r ] =
z1 = Argth 1
z 2 = Argth 2
Si on note alors :
1
1
+
n1 3 n 2 3
10/12
M4
'
1 + r1
1
z1 = Argth r1 = Log
2
1 r1
Avec
1 + r2
1
z 2 = Argth r2 = 2 Log 1 r
2
H1 : d 0
()
d
N(0,1) avec s d =
s d
()
1
1
+
n1 3 n 2 3
E[ 1 ] = E[ 2 ] = Do : E[ 1 ] E[ 2 ] = E[ 1 2 ] = 0
De plus comme 1 et 2 sont deux variables alatoires indpendantes on a :
s 2 [d] = s 2 [ 1 ] + s 2 [ 2 ] Do :
tc =
d
T1 (n1 + n 2 4 )
s d
[]
Do le test : H0 : d = 1 2 = 0
H1 : d 0
Et la rgle de dcision :
Si t c =
[ ] < T1 (n1 + n2 4) on est sous lhypothse H0 et donc les deux coefficients ne sont
s d
L3MS2_M5.doc
H1 : 1 2
11/12
Sous H0 : Fc =
1 p
SCR1 + SCR 2
M4
(2, n 4)
Rgle de dcision :
Si Fc F1 p (2, n 4 ) H0 rejete au risque de 1
re
espce p
re
Bibliographie :
ime
dition
ime
L3MS2_M5.doc
dition
12/12