Professional Documents
Culture Documents
Complments du cours
De
Mr Fouzi Mourji
Semestre 6
Anne Universitaire 2012/2013
Ensembles 1 et 2
1
AVERTISSEMENT
Dautres points sont traits dans le cours et ne sont pas abords dans
ce polycopi1. Il sagit notamment des rappels sur les indices, des
rappels de statistique descriptive et des mthodes de spcifications.
1
Des annexes compltent le cours et sont galement mis sur le site des de partage entre les tudiants des ensembles 1 et
2.
2
PLAN DU POLYCOPIE
Le cur du cours dintroduction aux mthodes conomtriques est constitu de deux chapitres :
le 1er porte sur le modle linaire de rgression simple et le 2nd sur la rgression multiple. Nous y
dveloppons les mthodes basiques destimation des paramtres dun modle et les proprits des
estimateurs et introduisons galement les techniques de validation des modles.
Mais pour bien comprendre lintrt de cet apprentissage, nous prsentons dans une annexe 1,
les concepts de modles et en particulier les modles de politique conomique. Nous montrons que les
modles que nous allons apprendre construire dans ce cours, constituent des outils daide la
dcision, que ce soit au niveau microconomique ou macroconomique.
Dans lannexe 2, nous effectuons des rappels statistiques indispensables, nous y expliquons
quavant tout travail de modlisation, il importe de procder des traitements pralables sur les sries
statistiques ; en loccurrence il importe de passer des sries en dirhams courants des sries en dirhams
constants.
Lannexe III comporte un certain nombre dexercices complmentaires. Il sagit dexemples
dapplication, pour bien comprendre les techniques exposes dans le cours.
Notez que les lments contenus dans ces trois annexes font partie intgrante du cours ; nous
y ferons rfrence explicitement et les dvelopperons en temps opportun au cours des diffrentes
sances.
INTRODUCTION :
Voir les sances de cours avec les dfinitions de base et la dmarche en conomtrie et
lannexe I qui traite de la typologie des modles.
3
CHAPITRE I. Le MODELE LINEAIRE DE REGRESSION
SIMPLE (MLRS) :
INTRODUCTION
Dfinition :
Du point de vue tymologique, le terme conomtrie , comporte la fois le terme conomie (en
tant que science) et le terme mesure. Elle applique les mthodes statistiques aux donnes empiriques
issues de lobservation de faits conomiques, pour expliquer et prvoir lvolution des variables.
En reprenant Malinvaud (1970) : lconomtrie utilise loutil mathmatique et linduction statistique,
pour vrifier des thories conomiques .
Lobjet de lconomtrie est donc de confronter une explication thorique un ensemble de donnes.
Ces donnes peuvent tre : i) temporelles), ii) en coupe transversale (donnes denqutes) ou iii) de
panel etc...). Voir les exemples dans le cours.
L'conomtrie vise quantifier les relations entre grandeurs conomiques dont la thorie ou lexprience
affirme l'existence. Elle permet de connatre le sens et lintensit des liens entre variables. ( Ex: voir le
cours)
Dans le cours, nous rpondons deux questions principales au niveau de chaque phase :
1- En quoi elle consiste ?
2- Comment y procder ?
On souligne que le sens des flches nest pas unique dans la mesure o le travail de lconomtrie est
un travail itratif.
Cf. lannexe I sur la typologie des modles
Soit Y i = aX i + b + U i
4
y i et x i .
Exemples : voir les dveloppements du cours
II. HYPOTHESES CLASSIQUES POUR LE MLRS :
2me tape : Meilleure prise en compte de lurbanisation : criture dun modle pour chaque type
dagglomration.
Y i 1 = a1 log X i 1 + b1 + U i 1 i=1....n 2
Y i 2 = a2 log X i 2 + b 2 + U i 2 i=1....n 2
Yi3 = a3 log X i 3 + b3 + U i 3 i=1....n 3
Remarque :
Gnralement, la rgression par le Logarithme prsente deux avantages. Elle permet de rendre linaire
une relation non linaire. Elle fait aussi apparatre les coefficients de la droite de rgression comme des
coefficients dlasticit.
5
La permanence structurelle doit tre prise en considration dans le temps et dans lespace.
E (Y i ) = a E (X i ) + b
Hypothse 3 : Lhomoscdasticit
V (U i ) = E (U i2 ) = u2 Quantit finie
Hypothse 3 reprend lhypothse 2 mais elle est plus forte . Si H3 nest pas ralise, on parle
dhtroscdasticit.
Cov (U i ,U j ) = 0 i j.
Plus tard, on utilisera le test de DURBIN & WASTON pour savoir sil faut ou non refuser lhypothse 4.
Ils peuvent prendre nimporte quelle valeur relle positive, ngative ou nulle.
Avant la clture de cette partie rserve aux hypothses classiques pour les M.R.S on met en exergue un
concepts important :
- la variabilit : On ntudie pas la variabilit dun phnomne qui ne prsente pas de variation .
Autrement dit, il importe que (Yi - Y) soit diffrent de zro. Pour des raisons identiques, il faut que
6
(X i X )2 soit diffrente de 0.
Exemples : 1) La quantit consomme de sel nest pas significativement diffrente dun mnage
lautre.
2) Linvestissement en priode t ( I t ) dune entreprise est fonction du taux dintrt ( i t ) du profit de la
priode t-1 ( t-1 ) et du taux de limpt sur la socit ( IS ) I t =f(i t , t-1 ,IS)
Le taux de lIS ne change pas significativement dune anne lautre.
n
Il sagit de dterminer et b qui minimisent lexpression (Y
i =1
i Y i ) 2
n
(Y i aX
Soit i b ) 2 lorsquon remplace Y par sa formule.
i
i =1
n
Cela revient minimiser la fonction F ( a, b )= (Y i aX i b )
2
i =1
2
(donc on minimise E = U i
)
F
= 0 (1)
a
F
= 0 (2)
b
= 0 2 X i (Y i a X i b ) = 0 (1)
a
= 0 2 (Y i a X i b ) = 0 (2)
b
Ces deux drives sont nulles en et b donc on aura :
Lquation ( 2) donne :
Y i a X i b = 0
En divisant le tout par n on aura :
Y i
a
X i b = 0
n n n
on aura donc
Y a X b = 0 b =Y a X
On remplace b par sa valeur dans lquation (1) et on obtient :
7
X i (Y i Y ) a X i (X i X ) = 0
Do a =
X (Y i i Y )
X i (X i X )
a=
X (Y i i Y ) X (Y i Y )
X (X i i X ) X (X i X )
a=
(X X )(Y Y )
i i
(X X ) i
2
Remarque : est une variable alatoire puisque fonction de Yi elle mme alatoire. Idem pour b .
Il faut ajouter les conditions de second ordre pour que F( a , b ) soit minimale en et b .
NB : cf. lannexe II sur les traitements pralables sur les sries statistiques
II- ETUDE DES PROPRIETES DE ET b :
1) Calcul de E () :
Y i Y = Y i - ( aX + b + U )
= ( aX i + b + U i ) - ( aX + b + U )
= a (X i X ) + (U i U )
a=
(X i X )[a (X i X ) + (U i U ) ]
do
(X i X ) 2
a (X i X )(X i X ) (X X )(U U )
a= + i i
(X i X ) 2
(X X ) i
2
a =a+
(X X )(U U ) i i
(X X ) i
2
a =a+
(X X )U U (Xi i i X )
(X X ) i
2
8
comme (X i X ) = 0 , on aura donc :
(X i X )U i
do E (a ) = E (a ) + E 2
(X i X )
1
E (a ) = E (a ) + E (X i X )E (U i )
i ( X X ) 2
E () = a
2) Calcul de E ( b ) :
On sait que b =Y a X
or Y = a X + b et Y = aX + b + U
donc b b = U X (a a )
soit b = b + U X (a a )
do E (b ) = E (b ) + E (U ) X E (a a )
E (b ) = b + E (U ) X E (a a )
or E (U ) = E (
U i
)=
E (U i )
=0
n n
E (a a ) = E (a ) E (a ) = a a = 0
Donc E (b ) = b .
3) Moment de 2me ordre de et b :
a- Variance de :
V (a ) = E ((a a ) 2 )
(X X ) i
2
(X X )U U (X X )
a =a+ (X
i i i
car et X ) =0
(X X ) 2 i
i
9
( (X i X )U i ) 2
donc V (a ) = E 2 2
( (X i X ) )
1
V (a ) = E ( (X i X )U i ) 2
( ( X i X ) )
2 2
Comme E ( (X i X )U i ) = (X i X ) U i + i j (X i X )(X j X )U iU j
2 2 2
1
2 2
V (a ) = ( X i X ) E (U i 2 ) + ( X i X )( X j X )E (U iU j )
( (X i X ) )
E (U i ) = 0
V (U i ) = E [ U i E (U i )] = E (U i 2 ) Quantit finie.
2
E (U iU j ) = Cov (U iU j ) = 0
Car cov(U i U j ) = E (U i E (U i )(U j E (U j ) avec E (U i ) = E (U j ) = 0
j2 ( X i X ) 2
V (a ) =
( ( X i X ) 2 ) 2
u2
et V (a ) =
( ( X i X ) 2
b) Variance de b :
2
V (b ) = E (b E (b ) ) 2 = E (b b )
Calculons ( b -b)
b = b + U X (a a )
2 2
V (b ) = E U 2X U (a a ) + X (a a ) 2
Donc
= E(U )-2X.E U( a -a) +X 2 .E( a -a) 2
2
On rappelle que E (a a ) 2 =V (a )
10
2 2
Donc V (b ) = X .V (a ) + E (U ) 2X .E (a a )U
2
Comme les quantits V() et E (U ) sont connues :
u 2
V (a ) =
(X i X )2
2
2 U + U 2 + ... + U n
E (U ) = E 1
n
E (U
2
2 i ) u2
E (U )= = 2
n2 n
Il reste dterminer E (a a )U pour connatre V (b ) .
On sait que :
a a =
(X i X )U i
(X i X ) 2
Donc :
(X i X )U i U
E (a a )U = E
(X i X )
2
(U U i )
E (U i U ) = E i
n
2 u2
V (b ) = X V . (a ) +
n
u2
2 u2
V (b ) = ( X +
((X i X )2 ) n
1 X
2
V (b ) = + (
2
n (X i X )
u 2
Remarques :
En vertu de lhypothse 6, X tend vers une valeur finie quand n tend vers linfini.
V (a ) X 2 tend vers 0 quand n tend vers linfini.
u2
Idem pour . Donc b est un estimateur convergent
n
Si lhypothse dindpendance des rsidus nest pas satisfaite (H 4 non satisfaite), la formule de V()
11
a
sous-estime celle-ci (donc surestime le T de Student pouvant nous amener conclure htivement que
a
la variable explicative Xi est satisfaisante).
Le lecteur constate quil est faux de dire, comme on le fait souvent, que lestimateur par les moindres
carres suppose une distribution normale des alas U i . En fait, la normalit des alas est ncessaire
seulement pour la justification de certains tests associs la mthode des moindres carrs et non pour
des formules des estimations.
V (U i ) = u2 est en gnral inconnue. Il est ncessaire de lestimer pour avoir les variances estimes de
et b .
Soit u i le rsidu de lestimation tel que :
u i = y i a x i b
= (a- a )x i +(b- b )+u i on montre que E( u i)=0
u i diffre de u i pour les termes (a a) x i et (b- b ) qui dpendent des rsidus de lestimation.
Comme a
prob
a (converge en probabilit vers a) et b
prob
b alors la distribution des u i
2
n : le nombre dobservation.
n-2 : le nombre de degr de libert.
2 : le nombre des paramtres ( a et b).
I Le COEFFICIENT DE DETERMINATION
Rappel :
12
Y i =Y i + u i
u i =0 Y = Y i i Y =Y
Y i Y i = Y i Y + u i
Revenons aux Y i observs :
2
(3) (Y i Y ) = (Y i Y ) + i + 2 (Y i Y ) i avec
2 2
(Y Y ) = 0 et i
=0
Divisons les 2 membres par n et rappelons que Y = Y
On remarque ainsi que variance empirique des Y i est gale la somme de la variance empirique des Y i
et de la variance empirique des u i .
La variance empirique de Y est souvent appele variance explique par la relation linaire. Celle des u i
est la variance rsiduelle.
Il semble alors naturel de mesurer la qualit de la liaison linaire par le rapport de la variance empirique
des Y i celle des Y i . Ce rapport sera not R 2 .
R 2
=
(Y i Y ) 2
=
variation explique
(Y i Y ) 2
variation totale
Exemple : si lon obtient R 2 =0.78 cela voudrait dire que le modle permet dexpliquer 78% de la
variabilit de Y.
R 2 est appel coefficient de dtermination (carr du coefficient de corrlation).
On souligne que la logique du carr du coefficient de corrlation ( r 2 ) tudi en statistique descriptive
nest pas la mme ici du fait quil y a lhypothse de causalit entre X et Y.
Ce sont les X qui ont des effets de causalit sur Y. On mesure donc la qualit de lapproximation par le
modle Y = ax + b, en valuant la proximit entre Y et Y
La logique du R 2 en conomtrie fait la diffrence entre la trajectoire de Y et celle de Y .
(Y
2
En divisant les termes de lgalit (3) par i Y ) :
2
1= R 2 +
u i
(Y i Y ) 2
2
R 2 = 1
u i
(Y i Y ) 2
13
II BREVE PRESENTATION DES TESTS DANS LE M.R.S. :
1) Enonc du problme :
Deux types de problme :
1er type : Y i = a log X i + b i=1...n
Remarques : On cherche toujours tester a = k et pas =k, cependant on utilise pour la commodit des
calculs du fait que a est inconnu.
LIntrt de tester a=0 est pour savoir la pertinence de la variable X et sa capacit expliquer Y.
Cependant, on peut tre amener tester a par rapport une quantit donne diffrente de zro.
Exemple : soit le modle suivant :
C r = a0 + a1D + a2 I r + a3IG + r
C r cours de laction dune entreprise. D : Dividende. I r : Linvestissement de cette entreprise.
IG : Lindice gnrale de la bourse.
Ici, on cherchera pas forcment tester a1 , a2 et a3 par rapport zro mais par rapport une autre
quantit donne.
2)Construction du test :
Donc si a = 0 , on aura :
u2
a N (0, )
(X i X ) 2
On ne peut pas construire lintervalle de confiance car u
2
est inconnue. On recourt une astuce
statistique. On cherche une variable alatoire T telle que :
* T soit fonction de
* T suit une loi de probabilit connue
14
On va retenir :
a 0
u i
T =
(X i X )2
u
( i2 )
u
n 2
Le numrateur est une variable normale centre et rduite. Le dnominateur est une variable de Khi-
Deux divise par son nombre de d.d.I (n-2). Test donc par dfinition une variable de STUDENT (n-2)
d.d.I.
Ds lors, lintervalle de confiance pour a scrit :
2 2
Sous H 0 P 0 t
u i
< a < 0 + t
u i = 0.95
2
(n 2) (X i X ) 2
(n 2) (X i X )
Soit : P [ t < T < +t ] = 0.95
Remarque et exemple :
Soit le modle Y = aX + b, expliquant la consommation Y, par le revenu X. On suppose quil a t
estim sur 26 ans.
Y t = 4X t + 6 a =4 et b =6
(0.6) (0.8) (..) carts-types estims des estimateurs
P { - t < 4/0,6 < t }= 0,95 (dans la table, pour n = 26, t 2,0 (voir p 26)
Donc P { - 2 x 0,6 < 4 < 2 x 0,6 }= 0,95 ou encore { - 1,2 < 4 <1,2 }= 0,95 sous H0
4 nappartient pas lintervalle, on rejette lhypothse H 0 qui accordait cet vnement, une trs
faible probabilit (0,05). Donc on rejette lhypothse de nullit de a.
On peut donc dire que le revenu X explique bien la consommation Y.
Souvent, on effectue une approximation : elle consiste rapporter lestimateur son cart-type estim.
Si ce rapport est suprieur 2, on rejette H 0 . Sil est infrieur 2, on ne rejette pas H 0 .
Sous H 0 T = / = 4 / 0,6 = 4,66 > 2
15
CHAPITRE II : MODELE LINEAIRE DE REGRESSION
MULTIPLE (M.R.M)
Section I- PRESENTATION
Les modles linaires sont fiables court et moyen terme car le domaine de variation des variables est
dans ce cas relativement restreint. La fiabilit de ces modles (modles linaires)
sera plus ou moins rduite dans le temps et ce en fonction de la rapidit avec laquelle les variables prises
en compte subissent des transformations.
Les M.R.M. sont du type :
(1) Y t = a1X 1t + a2 X 2t + ... + a p X pt + U t
Y t : Variable endogne, alatoire cause de lintroduction de U t .
X 1t ...X pt
Sont les observations chaque priode t des variables exognes X 1...X p .
a1X 1t + ... + ap X pt
Est la partie dterministe ou systmatique ou explicative du modle.
Ut est la partie alatoire du modle.
A partir des coefficients estims a1 ...a p et en utilisant les diffrents tests, on peut apprcier parmi les
variables du vecteur X celles qui sont les plus significatives.
Hypothse 2 : Les Y t et les X it sont des grandeurs numriques observes sans erreur.
E (U t ) = 0 quelque soient X it , et pour i=1,...,p .
Hypothse 5 : La loi de distribution de lala est une loi gaussienne de moyenne nulle et
lcart-type fini.
16
* *
Ici, on a une forte colinarit entre PIB et C dans la mesure o PIB=C+I+X-M .
On souligne limportance de la statistique descriptive o ltude de la covariance des variables deux
deux est un outil pertinent pour soulever ce problme.
X(n,p) est de rang p (avec n>p) cela veut dire que (X ' X ) 1 existe.
Avec n : ligne, p : colonne.
Cette hypothse est utile pour ltude des proprits de a .
Quand n tend vers linfini, (X ' X ) 1 reste non singulire.
Hypothse 7 : On nintroduit pas de restriction sur les estimateurs. Ils peuvent tre positifs, ngatifs ou
nuls.
RECAPITULONS :
*X pt = 1 pour tout t permet dintroduire une constante dans le M.R.M . Lexclusion dune constante
2
dans un MLRM donne souvent un R incorrect.
X ...X p 1
*Les p vecteurs 1 et E ne sont pas colinaires.
n
Ces vecteurs forment une varit linaire non dgnre p dimensions dans R quon appellera plan
de rgression.
La matrice X ( n , p ) = (X 1t , X 2t ,..., X p 1t , E ) pour t variant de 1 n est de rang p.
*Ecriture matricielle :
scrit pour chaque t et pour t = 1n
Y t = X .a + U t (2)
Enfin, on aura :
Y = X .a + U
Y = X a et U =Y- Y (3)
Do U =Y-X.a (4)
Avec Y = X a
La mthode consiste chercher les paramtres a i tels que :
n
(u
i =1
t ) 2 soit minimum.
Revenons (4), le vecteur U des carts est orthogonal au plan de rgression. Les quations normales
scrivent alors :
X 1' U = X 2' U = ... = X j' U = ... = X '
p 1 U = E 'U = 0
' ' ' '
Elles expriment lorthogonalit de et des p vecteurs lignes X 1 , X 2 ,..., X p 1 et E
17
Ces quations peuvent scrire :
X '.U = 0 le vecteur de la matrice X'.
X'= transpos de la matrice X.
En tenant compte de (4), on aura :
X '.(Y X a ) = 0
(X '.Y ) (X ' X . a ) = 0
X '.Y = X '.X a
(X ' X ) 1 X 'Y = (X ' X ) 1 ( X ' X ) a
a = ( X ' X ) 1.X 'Y
2) Proprits de :
Nous allons dmontrer que par les MCO, est lestimateur efficace dans lensemble des estimateurs
linaires et sans biais de a. sera dit BLUE (Best linear unbiased estimators)
Calcul de E (a ) :
a = ( X ' X ) 1 X 'Y
or Y = X a + U
Donc
a = ( X ' X ) 1 X '( X a + U )
a = ( X ' X ) 1 ( X ' X a + X 'U )
a = ( X ' X ) 1 ( X ' X ).a + ( X ' X ).X 'U
a = a + ( X ' X ) 1 X 'U
E (a ) = E a + (X ' X ) 1 X 'U
E (a ) = E (a ) + (X ' X ) 1 X ' E (U ) ; E(U) tant egal 0
E (a ) = a donc a est un estimateur sans biais de a.
*Calcul de V (a ) :
V (a ) = E (a a ) (a a )'
( p 1) (1 p )
Or (a a ) = (X ' X ) 1 X 'U o
(a a ) ' = U ' X (X ' X ) 1 , car X'X est symtrique
donc ( a -a)( a -a)'=(X'X) -1X'.UU'.X(X'X) -1
18
V( a )=E (X'X) -1.X'.UU'.X.(X'X)-1
Le seul terme alatoire dans lexpression de V (a ) est UU
donc : V (a ) = (X ' X )X .E (UU ').X (X ' X )
on rappelle H3 V (U t ) = u
2
Enfin V (a) = ( X ' X ) 1 X u2 I n X (X ' X ) 1
= u2 (X ' X ) 1 X '.I n X (X ' X ) 1
do V (a ) = u2 (X ' X ) 1 (6)
On montre quune condition ncessaire et suffisante pour que soit un estimateur convergent de a est
que les vecteurs variables exognes ne tendent pas tre colinaires quand n tend vers linfini.
Autrement dit H6 reste valable quand n tend vers linfini.
3) est BLUE
est efficace dans la classe des estimateurs de a sans biais et linaires en Y. Ce thorme de Gauss
Markov justifie lutilisation des M.C.O pour effectuer une estimation.
*
1- on va dfinir un estimateur linaire a sans biais de a et variance minimale
*
2- on va montrer que a est en fait quivalent .
Dmonstration
1- soit a*un estimateur de a linaire en Y
*
a =a + LY .
( p 1) (p 1) (n 1)
L(p,n) matrice quelconque
a* doit tre sans biais
*
E( a ) = E (a ) + L .E (Y )
= a+L.E(Xa+U)
= a+L.E(Xa)
L.X=0
a* ne sera sans biais que si L.X=0
*
*
V (a ) = E (a a )(a a ) '
*
a a = a + LY a
Or = a -a+L.(Xa+U)
= a -a+L.Xa+LU
or L.Xa=0
*
donc a -a= a -a+LU
19
Remplaons par sa valeur
a =a+(X'X)-1X'U
*
a -a=a+(X'X)-1X 'U + L .U
donc
= (X'X)-1X'U+LU
*
enfin V( a )= E(X'X)-1X'U+LU (X'X) -1X'U+LU '
On rappelle que E (UU ') = u
2
*
do V (a ) = u2 (X'X) -1X'+L X(X'X) -1 + L '
Comme L .X = 0 car a* est sans biais
Alors X ' L ' = 0 et
*
V (a ) = u2 (X ' X ) 1 + u2 L ' L
*
do V (a ) =V (a ) + u2 L ' L
et finalement,sauf si L = 0 , LL ' est une matrice semi-dfinie positive en dautres termes
*
V (a ) >V (a ) .
est un estimateur convergent.
Rappel :
Remarques : La taille de lchantillon nintervient pas dans le calcul de donc de E( a )=a n Lorsque
n tend vers linfini (1 condition)
Or V (a ) = u2 (X ' X ) 1
1
I
or n (X ' X ) 1 = X ' X
n
1
I -1 -1
n X ' X tend vers Q quand n tend vers linfini ( Q quantit finie)
Q-1
tend vers 0 quand n tend vers linfini
n
Donc V (a ) tend vers 0 quand n tend vers linfini
20
4) Dtermination de S2 estimateur de u
2
1-Expression de u :
On sait que Y=Xa+u et Y =X a
Y =Y + u ou u =Y Y (7)
dou u = Xa+U-X a
=U+Xa-X a+(X'X) -1X 'U
=U-X(X'X)-1X'U (8)
= I n -X(X'X)-1X ' .U
= M .U
-1
avec M=I n -X(X'X) X ' M est de format n.n
M=M' signifie que M est une matrice symtrique
On dit que A est idempotente si A 2 =A, A n =A n or M 2 =M de M est idempotente
2
2-Expression de u t
2
u t
= u 'u
daprs (8) u 'u =U'M'MU=U'MU
soit u ij llment de la matrice M situ lintersection de la ligne i et de la colonne j
2
u t =u ij Ui2 +2 i j u ijU iU j
et E (U t ) = trace M
2
2
car on a E u i = 0 quelque soit i et E(Ui U j )=E(Ui )E(U j )=0 avec i j
3-Trace de M :
donc trM=n-p
2
on avait E( u 'u ) = E ( u t ) = u (n p )
2
21
et E ( u t ) = t2trM = u2 (n p )
np
2
u t
enfin S = n p
2
I . LE COEFFICIENT DE DETERMINATION
1) Formulation :
(Y
t=1
t Y ) 2
22
2) Interprtation :
n
Au numrateur (Y
t=1
t Y ) 2 est limprcision de M1 (la variance totale)
n
(Yt=1
t X t a ) 2 la mesure de limprcision de M2 (variance rsiduelle). Plus cette dernire sera leve,
plus elle se rapproche de la variance totale, do linutilit dadopter M 2 plutt que M1 On remarque que
0<R<1.
Comme R < 1 alors si R2 est proche de 1, cela signifie que R est encore plus proche de 1.
Remarque :
R2 proche de 1 nest pas une preuve de causalit. De mme R 2 proche de 0 ne signifie pas absence de
lien entre la variable explique et les variables explicatives, mais peut tre la forme de liaison nest pas
adapte.
Bref, il faut tre prudent durant linterprtation de tout rsultat.
II- Tests dhypothses dans le M.R.M / valuation de la performances des variables exognes :
1) Test de lhypothse a = 0 :
a- Construction de test :
Dire que a = 0 , cest dire que toutes les variables retenues ne sont pas explicatives donc si H 0 est
vrifie cest--dire si a = 0 , on peut crire :
Y = P .Y et u = M .U
u 'u suit une loi khi-deux (n-p)
Si a = 0 Y ' Y suit la loi khi-deux p. Ces deux khi-deux sont indpendants en probabilit. Or, on sait que
le rapport de 2 khi-deux est un F de FISHER. Donc, pour tablir le test de a = 0 , on construit la variable
F qui suit une loi de Fisher.
Y 'Y
p Y ' Y n-p
F= = tend vers un Fp;n-p d.d.l
u 'u p u 'u
np
.
23
b- Solution du Test :
Remarque : Ce qui importe, cest de tester la porte explicative linfluence des vraies variables
exognes . Ce quil faut tester cest la nullit du vecteur form par les (p-1) premires composantes de
a. On a toujours :
' khi deux (n-p) d.d.I si les (p-1) premires sont nulles
Y' Y khi deux p-1 ddl
Exemple : Au Maroc les importations sont fonction de la consommation, de la FBCF et des exportations.
M = f (C , FBCF , X )
log M t = 0.469 log(C t ) + 0.034 log(FBCFt ) + 0.471log(X t ) 0.993
n=14 ; R 2 =0.82
Fc = 15.649
n p = 10 p-1=3 Ft =6.55
donc on rejette H 0 : les variables exognes peuvent tre considres comme explicatives dans
lensemble.
c- Gnralisation :
24
On pose n>q>p
Faut-il refuser H 0 qui considre M 2 comme meilleur ; cela veut dire : dans M1 les ( q-p ) variables ne
sont-elles pas en trop ?
Pour rpondre cette question, on dfinit un F qui suit une loi de probabilit donne ;
u =Y X a
* * *
u =Y X a
* *
u ' u u 'u * *
q-p u ' u u 'u n p
F= = * * .
* * q-p
u 'u u 'u
np
* *
u 'u u 'u np
F=
* * q-p
u 'u
Ce test permet en fait dapprcier la porte explicative de chaque variable exogne retenue.
Soit le modle : Y = X a + U
Supposons que lon sintresse un coefficient dtermin a k du modle. Nous avons dmontr que
E (a ) = a ou encore que E( a k )=a k ; nous avons montr que V( a )=u2 (X'X)-1 .
Soit Vk le Kime terme de la diagonale principale de (X'X)-1 , la variance dun coefficient quelconque
de rgression scrit
V( a k ) =u2 Vk et a k suit une loi normale de moyenne a k et dcart-type u2 Vk
a k -a k
La quantit P= N (0,1)
u Vk
S2 =
u t est un estimateur sans biais de la variance de u
np
25
a k -a k
u Vk a k -a k
T= = suit une loi de STUDENT (n-p) ddI
u 'u Vk .u 'u
np np
np
Lorsque on teste lhypothse a k =0 , cela revient :
partir du fait que a k N(a k , Vk )
poser a k =0 et dterminer une variable de STUDENT T (dans la formule ci-dessus cela revient
remplacer a k par 0).
Solution du test :
ak
ou encore P -t . ak < a k <+t . ak =0.95
2 cas possibles :
* a k appartient lintervalle -t . ak , +t . ak alors on ne refuse pas H0
* a k nappartient pas cet intervalle alors on refuse H0 .
Remarque :
Nous avons utilis le constat que la variable de Student T (n-p) ddI converge en loi vers une loi
normale centre rduite quand (n-p) augmente. On peut sans commettre derreur notable utiliser
lapproximation normale quand lchantillon est grand.
15 2.131
20 2.086
30 2.042
40 2.020
60 2.000
La table de la loi normale donne une valeur de 1.96 ; donc, en faisant une approximation, lhypothse de
26
nullit dun coefficient (ou son galit une quantit donne) sera rejete pour un T > 2 .
Exemple :
M t = e + aI t + bC t +U t
M t = 15.8 + 3.07I t + 1.92C t
pour n = 22, on a
(10.53) (0.81) (1.25)
comme n = 22, les T suivent une loi de Student 19 ddI (22 3),
lcriture
a
P -t < <+t =0.95 ; donne ici , P -t . ak < a k <+t . ak =0.95
k
ak
le t lu sur la table 95% est 2.093 et on remplace les carts types par leur valeur, il vient :
P( - 2,093x 0,81 < 3,07 < 2,093 x 0,81) = 0,95 ou P( - 1,695 < 3,07 < 1,695) = 0,95 , sous H0
Or la valeur = 3,07 nappartient pas lintervalle, donc rejet de H0 ; en dautres termes coefficient a2
est diffrent de 0 et linvestissement est une variable pertinente pour expliquer le niveau des
importations.
Il y a autocorrlation des rsidus quand le modle est mal spcifi. On peut prciser que le risque
dautocorrlation des rsidus augmente surtout dans les modles estims sur des sries chronologique.
Elle sera dailleurs dautant plus grande que la priodicit est courte.
Dans le cas de lomission dune variable significative, les rsidus ne sont plus distribus de faon
alatoire. Ils comportent leffet des variables omises. De manire gnrale, lautocorrlation des rsidus
provient dune mauvaise spcification (forme de liaison inapproprie, dfinition des variables...).
Lorsquon a autocorrlation des alas, on a tendance sous-estimer les cart-types des coefficients ; en
dautres termes on surestime le T de Student. Ds lors, on risque de conclure htivement la
pertinence dune variable propose et teste.
Les causes dun mauvais DW sont de deux types, conomique et statistique.
Pour sassurer du risque dautocorrlation des erreurs, on procde au test de Durbin & Watson.
A - Principe destimation :
Il existe plusieurs procdures destimation. On suppose par exemple que les rsidus U t sont corrls
selon un schma autorgressif de 1er ordre. Soit donc :
27
enfin U t = k t k
On dmontre que dans le cas dautocorrlation des erreurs, lestimateur est sans biais et il reste
convergent.
Mais, cela ne signifie pas quil a la variance minimum. La variance tant forte, lestimation peut
sloigner de son esprance mathmatique avec une forte probabilit.
Reprenons le modle initial :
Yt =a1X1t +a 2 X 2t +...+a p X pt +U t (1)
Soit a obtenu par les MCO et Y =X a
Pour une priode, u t =Y t Y t Ces rsidus dpendent aussi bien de la suite des erreurs u t mais
galement de la suite des X t .
Considrons la variable alatoire d dfinie comme suit :
d=
(u u t t 1 )2
(2)
2
u t
d est fonction de u t donc d = f (u t ) = f (Y t Y t ) . Or, u t N (0, u ) donc la limite en
2
probabilit de d varie entre 2 valeurs 0 et 4.
On dmontre que d 2(1 )
En effet, de la formule (2), on peut dduire :
d = 22
(u u t t 1 )
u t
2
Cette statistique de D.W est utilis pour donner la nature de la corrlation des rsidus.
* Quand il y a corrlation positive parfaite,
= 1 ; U t = U t 1 + t d = 0
* Quand = 1 d = 4 , il y a autocorrlation ngative parfaite.
* Il y a indpendance lorsque = 0 dans ce cas d = 2
Tableau de dcisions :
d =0 di d2 4-d 2 4-d i 4
----------------------------------------------------------------------------------------------------
! ! ! ! ! !
! AUTOCORR ! DOUTE ! INDEPENDACE ! DOUTE !AUTOCOR !
!ELATION ! ! ! !RELATION !
POSITIVE ! ! ! ! NGATIVE !
28
Les programmes de calcul donnent la valeur de d .
Remarques :
* La statistique de DW applique un modle contenant des variables endognes retardes est biaise
vers 2 ce qui laisserait supposer que les erreurs sont moins souvent corrles dans un processus
autorgressif que dans un processus ordinaire.
* Dans le cas dautocorrlation des alas, il y a lieu doprer sur le modle initial la transformation de
COCHRANE ORCUTT.
Exemple :
29
Bibliographie
Ouvrages de base pour complter le cours
Mthodes statistiques de lconomtrie Edmond MALINVAUD - Dunod / 1970
Introduction lconomtrie C. Labrousse Dunod / 1976
Mthodes conomtriques pour lanalyse conomique et laide la dcision
Kamal HADADJ Walada / 1994
Introduction lconomtrie Dormont B Montchrestien (1999)
Mtodes Economtriques , Tome 1 et 2, J.Johnston, Economica, 1985
Economtrie , Jean-Franois Brun, Jean Louis Combes et Claudio Araujo, Bral,
2004
The theory and practice of econometrics dition Wiley 1985
Exercices pdagogiques de statistiques et conomtrie Claude Mouchot, Economice
1979
Plus tard,
Limted dependent and qualitative varaibles in econometrics G.S.Madala ,
Cambrigde university Press, 1977.
A Guide to Econometrics Peter Kenned , Third Edition , 1992
Economtrie applique , sous la direction de Claude Montmarquette, Economica,
1997
Journaux
Il est conseill de lire
Le Monde ( du Mardi)
Le Figaro (pages saumon, conomiques)
Voir aussi les sites, comme celui du NBER (National Bureau of Economic Research) pour des travaux
de bons niveau (non encore publis), ainsi que dautres centres de recherche duniversits (working
papers / documents de travails)... ou encore le site de la Direction de la Statistique (HCP), pour laccs
des donnes ou des tudes /Maroc ce sont des exemples seulement.
30