You are on page 1of 27

Economtrie Le modle une variable

Economtrie
1 : Les moindres carrs ordinaires
Emmanuel Duguet
Universit Paris Est-Crteil
22 et 29 Sept. 2011
Economtrie Le modle une variable
Dnition
Prsentation
Quest-ce que lconomtrie?
fait rfrence une matire dont lobjectif est lapplication
dnition : ensemble des mthodes statistiques appliques
lconomie
A quoi lconomtrie sert-elle?
rpondre des questions concrtes
prvision, valuation, mieux comprendre lvolution des variables
conomiques
Le point de dpart : lestimation, on chire un modle conomique
Economtrie Le modle une variable
Dnition
Utilisations de lconomtrie
Macroconomie (macroconomtrie)
trouver les dterminants dune variable et chirer son impact :
quels-sont les dterminants du taux de croissance dun pays?
quells-sont les dterminants de limportance des ux commerciaux
entre deux pays?
prvision : valuer la valeur future dune variable conomique
aide prendre des dcisions dans lincertain
de manire cohrente
valuer une politique conomique
quel seraient les eets dune rduction de charges sur les bas salaires?
quel seraient les eets dun dcalage de lge de dpart la retraite?
valuer une politique conomique dj applique :
le seuil dapplication des rductions de charges (1,4 SMIC) est-il
optimal?
quel ge de dpart la retraite faudrait-il choisir?
dimension dominante :
le temps, car les donnes sont agrges
on travaille sur des sries temporelles : une valeur par date
Economtrie Le modle une variable
Dnition
Utilisations de lconomtrie
Microconomie (microconomtrie) :
trouver les dterminants dune variable et chirer son impact :
quel-est leet dun diplme sur le salaire toutes choses gales par
ailleurs? (cest--dire exprience identique, secteur dactivit
identique etc.)
quels-sont les dterminants individuels du chmage?
valuer une politique microconomique
les subventions la cration dentreprises sont-elles ecaces?
quel-est leet de la dure dindemnisation sur la dure du chmage?
exploiter les exprimentations :
peut-on amliorer la russite des tudiants en leur proposant des
emplois plus compatibles avec leur tudes (horaires, secteur
dactivit)?
certaines variables inuencent t-elles les rsultats dun testing?
marketing quantitatif :
valuer le risque de dfaut dun portefeuille dentreprises
valuer la probabilit de rponse positive une ore commerciale etc.
dimension dominante :
les individus
une seule date, o sur une seule priode
Economtrie Le modle une variable
Programme
Le cours de L3
Presque toute lconomie applique peut tre relie lconomtrie :
une exception : les monographies
car il faut relativement beaucoup dobservations
Objectifs de ce cours :
introduction lconomtrie
les cas les plus simple de cette matire
il sagit de la base de tous les cours dconomtrie qui suivront
Pr-requis :
algbre linaire, notamment le calcul matriciel
statistique : esprance, variance, limite en probabilit
culture conomique pour comprendre les exemples
Economtrie Le modle une variable
Programme
Programme
Nous tudierons "le modle linaire", mais attention :
ce terme ne signie pas que les modles estims sont linaires
mais quil peuvent tre rcrits sous cette forme aprs des
transformations qui peuvent tre complexes
ou en utilisant des thormes issus de la thorie conomique
ce modle permet dtudier des solutions explicites ainsi que leurs
proprits
les modles dit "non linaires" reposent exactement sur les mmes
concepts, de sorte quil faut commencer par tudier le modle linaire
Nous commencerons par tudier le modle une seule variable :
pour xer les notations
pour introduire les concepts de base
pour voir les mthodes de rsolution
pour faire des reprsentations graphiques
sa vocation est purement pdagogique
Economtrie Le modle une variable
Programme
Programme
Plan :
chapitre 1 : le modle une variable
prsentation, estimation et tests
chapitre 2 : le modle plusieurs variables
prsentation, estimation et tests
chapitre 3 : le modle non sphrique :
le modle htroscdastique
le modle autorgressif
Economtrie Le modle une variable
Cobb-Douglas
Le modle linaire
Pour commencer, on considre une relation entre deux grandeurs
conomiques :
y = f (x)
cette relation est souvent dduite de la thorie conomique. On la
met sous forme linaire en transformant les variables
y = a +b x
Exemple 1 : la fonction de production en logarithmes
Prenons une fonction de Cobb-Douglas rendements dchelle
constants :
Q = AC

L
1
,
Q
L
= A
_
C
L
_

en prenant le logarithme de chaque ct on obtient :


ln
Q
L
= ln A + ln
C
L
, y = a +b x
avec
y = ln
Q
L
, x = ln
C
L
, a = ln A, b =
Economtrie Le modle une variable
Taux de croissance
Les taux de croissance
Exemple 2 : la fonction de production en taux de croissance
Prenons une fonction de Cobb-Douglas rendements dchelle
constants, en logarithmes :
ln
Q
L
= ln A + ln
C
L
en prenant le logarithme de chaque ct on obtient :
ln q = ln A + ln c, avec q =
Q
L
et c =
C
L
en drivant les logarithmes par rapport au temps
d ln q
dt
=
d ln c
dt
,
1
q
dq
dt
=
1
c
dc
dt
,

q
q
=

c
c
,
on obtient un modle linaire avec :
y =

q
q
, x =

c
c
, a = 0, =
Economtrie Le modle une variable
Taux de croissance
Equation de salaire
Exemple 3 : Equation de Mincer ou equation de salaire
ln W = a
0
+ s + x
cette equation se drive dun modle dinvestissement dans
lducation ("capital humain")
W : salaire, s : dure des tudes, x : exprience professionnelle
la thorie nous indique que est le taux de rendement annuel des
tudes, que lon peut comparer avec le taux dintrt
100 donne leet dune anne dexprience professionnelle sur le
salaire, en pourcentages
la variable explique est prise en logarithmes et les autres variables
ne sont pas transformes
Economtrie Le modle une variable
Modle logistique
Le modle logistique
Exemple 4 : le modle logistique
Prenons une fonction logistique reliant une proportion une variable
explicative
diusion dun nouvel quipement (smartphone, etc.)
p = la proportion dutilisateurs, t = le temps
p =
exp (a +b t)
1 + exp (a +b t)
2 ]0, 1[
en prenant transformation suivante :
ln
p
1 p
= a +b t
on obtient un modle linaire avec :
y = ln
p
1 p
, x = t
Economtrie Le modle une variable
Nuage de points
Nuage de points
Log(W)
-4
-3
-2
-1
0
1
2
3
4
Education (s)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
On souhaite expliquer les ralisations dune base de donnes
pour quantier la relation entre entre une variable dit explique y et
une variable dite explicative x
Voici des donnes de salaris malaysiens, y = ln W et x = le niveau
dtudes
Economtrie Le modle une variable
Ajustement
Prvision et rsidu
Estimer un modle linaire revient, avec une variables explicative,
rechercher une droite passant travers un nuage de points
f (x) = a +b x
Ceci revient trouver des valeurs particulires de a et b qui
permettent dtre au plus prs des observations
On dispose de N ralisations de y : (y
1
, ..., y
N
) et de x : (x
1
, ..., x
N
)
Pour la i -ime observation, la vraie valeur de y est y
i
la valeur prvue de y
i
, note y
i
, par un modle avec des coecients
a et b, est gale y
i
(a, b) = f (x
i
) = a +b x
i
on ralise donc une erreur dnie par u
i
= y
i
y
i
. On appelle cette
erreur le rsidu.
on cherche rendre les erreurs les plus petites possibles
Economtrie Le modle une variable
Ajustement
Somme des carrs des rsidus
Comment mesurer globalement les erreurs que lon fait en
choisissant une valeur particulire de (a, b)?
il y a N valeurs : u = ( u
1
, ..., u
N
)
donc on prend la norme euclydienne comme mesure globale :
S = k uk
2
=
N

i =1
u
2
i
on remarque que k uk
2
= 0 , u
i
= 0 8i .
la quantit S est appele somme des carrs des rsidus
On recherche des valeurs particulires de a et b qui permettent
dtre au plus prs des observations
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
La mthode destimation la plus performante pour un modle
linaire simple est la mthode des moindres carrs ordinaires
On prend les valeurs de a et b qui rendent la somme des carrs des
rsidus la plus petite possible
_
a,

b
_
= arg min
(a,b)
N

i =1
u
2
i
= arg min
(a,b)
N

i =1
(y
i
y
i
(a, b))
2
= arg min
(a,b)
N

i =1
(y
i
a b x
i
)
2
a et

b sont appels estimateurs des moindres carrs ordinaires
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
Pour minimiser une fonction comme S, on doit avoir, en
_
a,

b
_
:
des drives premires nulles
une matrice des drives secondes dnie positives (valeurs propres
positives)
drives premires :
S
a
_
a,

b
_
= 0,
S
b
_
a,

b
_
= 0
on obtient un systme de 2 quations 2 inconnues, a et

b
les drives secondes permettent de xer des conditions dexistence
de lestimateur des moindres carrs ordinaires
On a :
S
a
_
a,

b
_
=
N

i =1
(2)
_
y
i
a

bx
i
_
= 0
S
b
_
a,

b
_
=
N

i =1
(2x
i
)
_
y
i
a

bx
i
_
= 0
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
Les drives secondes :
H =
_

2
S
a
2

2
S
ab

2
S
ba

2
S
b
2
_
= 2
_
N

N
i =1
x
i

N
i =1
x
i

N
i =1
x
2
i
_
Le dterminant de H est gal au produit de ses valeurs propres :
det H = 2N
2
_
1
N
N

i =1
x
2
i
x
2
_
= 2N
2
V
e
(x) > 0
donc les valeurs propres sont de mme signe
La trace de H est gale la somme de ses valeurs propres :
tr H = 2
_
N +
N

i =1
x
2
i
_
> 0,
donc les deux valeurs propres sont positives,
_
a,

b
_
correspond un
minimum global
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
De la premire drive, on dduit :
S
a
_
a,

b
_
= 0 ,
N

i =1
_
y
i
a

bx
i
_
= 0 , y = a +

b x
La droite des moindres carrs ordinaires passe par le point moyen du
nuage; on en dduit que a = y

b x
La seconde drive peut se rcrire
S
b
_
a,

b
_
= 0 ,

N
i =1
x
i
_
y
i
a

bx
i
_
= 0
,

N
i =1
x
i
y
i

_
y

b x
_

N
i =1
x
i

N
i =1
x
2
i
= 0
,

N
i =1
x
i
y
i
Nx y

b
_

N
i =1
x
2
i
Nx
2
_
= 0
,

b =
1/N

N
i =1
x
i
y
i
x y
1/N

N
i =1
x
2
i
x
2
=
Cov
e
(x, y)
V
e
(x)
Economtrie Le modle une variable
Les moindres carrs ordinaires
Corrlation linaire
Lestimateur des moindres carrs ordinaires est galement reli au
coecient de corrlation linaire entre y et x

b =
Cov
e
(x, y)
V
e
(x)
=
Cov
e
(x, y)
_
V
e
(x) V
e
(y)
_
V
e
(y)
V
e
(x)
=

y

x
avec :

y
=
_
V
e
(y) et
x
=
_
V
e
(x)
le terme en mesure la corrlation linaire entre les deux variables, il
dtermine le signe du coecient
le terme
y
/
x
permet de passer dun nombre sans dimension
(1 < < 1) un nombre

b qui tient compte des chelles de y et
de x
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
On peut rcrire lestimateur des MCO de deux autres manires.
Premire manire :

b =
Cov
e
(x, y)
V
e
(x)
=
1/N

N
i =1
(x
i
x) (y
i
y)
1/N

N
i =1
(x
i
x)
2
=

N
i =1
(x
i
x) (y
i
y)

N
i =1
(x
i
x)
2
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
Deuxime manire:

b =

N
i =1
x
i
(y
i
y)

N
i =1
x
i
(x
i
x)
Explication :
N

i =1
(x
i
x) (y
i
y) =
N

i =1
x
i
(y
i
y)
N

i =1
x (y
i
y)
et
N

i =1
x (y
i
y) = x
_
N

i =1
y
i
Ny
_
= 0
en posant y
i
= x
i
dans la relation prcdente, on trouve galement :
N

i =1
(x
i
x) (x
i
x)
. .
(x
i
x)
2
=
N

i =1
x
i
(x
i
x)
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
On peut galement raisonner directement sur un modle centr
Dnition : on remplace les variables du modle par leurs carts la
moyenne : y
i
est remplace par y
i
y, et x
i
par x
i
x
la fonction que lon cherche estimer se met sous la forme :
y
i
(a, b) = a +b x
i
la moyenne empirique de cette fonction est gale :
y (a, b) = a +b x
la fonction centre est donc gale :
y
i
(a, b) y (a, b) = b (x
i
x) ,
le terme constant est donc limin par centrage
lerreur de prvision sur la variable explicative centre est donc gale
:
u
i
= y
i
y
_
y
i
y
_
= y
i
y b (x
i
x)
on cherche maintenant minimiser S (b) = k uk
2
=

N
i =1
u
2
i
par
rapport b, car a nest plus dans le modle
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
Lestimateur des moindres carrs de b est obtenu de la manire
suivante :

b = arg min
b
N

i =1
(y
i
y b (x
i
x))
2
Il ny a plus quune drive :
S
b
_

b
_
=

N
i =1
(2) (x
i
x)
_
y
i
y

b (x
i
x)
_
= 0
La drive seconde est gale :

2
S
b
2
(b) = 2

N
i =1
(x
i
x)
2
= 2NV
e
(x) > 0,
on a donc un minimum global
Economtrie Le modle une variable
Les moindres carrs ordinaires
Les moindres carrs ordinaires
La condition du premier ordre se rcrit :

N
i =1
(x
i
x) (y
i
y)

N
i =1
(x
i
x)
2
= 0,
et on retrouve le mme estimateur que prcdemment
Il est donc quivalent :
destimer un modle avec terme constant
destimer un modle centr
Pour trouver a, on utilise simplement la relation :
a = y

b x = y
Cov
e
(x, y)
V
e
(x)
x.
Economtrie Le modle une variable
Interprtation des coecients
Interprtation
Lestimateur des MCO peut scrire (pour x
i
6= x) :

b =

N
i =1
(x
i
x) (y
i
y)

N
i =1
(x
i
x)
2
=

N
i =1
(x
i
x)
2
y
i
y
x
i
x

N
i =1
(x
i
x)
2
=
N

i =1
w
i

y
i
y
x
i
x
avec w
i
=
(x
i
x)
2

N
i =1
(x
i
x)
2
La pondration :
w
i
=
(x
i
x)
2

N
i =1
(x
i
x)
2
=
1/N (x
i
x)
2
1/N

N
i =1
(x
i
x)
2
,
reprsente le poids de la i-me observation dans la variance de x
i
.
Economtrie Le modle une variable
Interprtation des coecients
Pente de la droite des MCO
La quantit
y
i
y
x
i
x
est gale la pente de la droite passant par les points (x
i
, y
i
) et
(x, y)
Vrions-le :
une droite y = + x passe par les points (x
i
, y
i
) et (x, y) si elle
vrie :
y
i
= + x
i
y = + x
en faisant la dirence entre les deux quations, on obtient :
y
i
y = (x
i
x) , =
y
i
y
x
i
x
La pente de la droite des MCO est donc une moyenne pondre des
pentes de toutes les droites reliant les points au centre du nuage
Economtrie Le modle une variable
Interprtation des coecients
Pente de la droite des MCO
La pondration favorise les points les plus loigns de la moyenne de
la variable explicative
w
i
=
(x
i
x)
2

N
i =1
(x
i
x)
2
Il y a donc un risque que des points dits aberrants (loigns de la
droite de rgression) inuencent lestimation
Ce nest pas le cas des points situs sur la droite des MCO
Idalement, il faut toutefois justier llimination des points par des
arguments extrieurs au modle (mauvais enregistrement etc.)

You might also like