Professional Documents
Culture Documents
Wooldridge
Chapitre 3
Omitted Variable Bias: The Simple Case, 89-93 Omitted Variable Bias: More General Cases, 93-94 Variances in Misspecified Models, 99-101 General Omitted Variable Bias, 114-115
Chapitre 5
1. Introduction
Quelles sont les consquences de lomission dune variable importante sur lestimateur des MCO? Variable importante =
(i) a un effet partiel sur la variable dpendante dans la population (ii) est corrle avec une ou plusieurs variables explicatives dj incluses dans le modle
(cont.)
Tous les estimateurs des MCO seront en gnral biaiss et non convergents Pourquoi? Violation de lhypothse MLR.4 (et MLR.4) dans le modle qui omet une variable importante
Supposons que le vrai modle dans la population soit : y=0+1x1+2x2+u, sous MLR1-MLR.4 Exemple : log(wage)=0+1educ+2abil+u
(cont.)
(cont.)
Si 20 et Cov(x1,x2)0 Exemple : si abil a un effet partiel sur log(wage) et est corrle avec educ Alors, violation de MLR.4* : E(v| x1)=2E(x2|x1)0 x1 est endogne
(cont.)
Consquence : lestimateur des MCO de 1 dans le modle mal spcifi est biais et non-convergent asymptotiquement
~ =
1
n i= 1 n
( xi1 x1 ) yi ( xi1 x1 ) 2
i= 1
(cont.)
Comme chaque yi doit en ralit provenir de lestimation par MCO du vrai modle :
i= 1
n i= 1
( xi1 x1 )
+ 2
n i= 1
( xi1 x1 )xi 2
x
1
i= 1 n
xi1ui = 0 ui = 0
10
i= 1
(cont.)
~ + ~ 1 = 1 2 1 ~ o =
1 n i= 1 n
( xi1 x1 ) xi 2
~ 1 est l' estimateur des MCO de la pente du modle de rgression simple : xi 2 = 0 + 1xi1 + ei
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
i= 1
11
(cont.)
~ + ~ = * + ~ E 1 = E 1 2 1 1 2 1 ~ ~ ~ Biais 1 = E 1 - 1 = 2 1
* 1) Les esprances sont conditionn elles aux valeurs de x1 et x 2 ~ dans l' chantillon. Comme 1 n' est fonction que de x1 et x 2 , il est non - alatoire et sort donc de l' esprance 2) 1 et 2 sont des estimateurs non biaiss de 1 et
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
( )
( )
( )
12
Absence de biais
2 > 0 2 < 0
Biais positif Biais ngatif ou ou vers le haut vers le bas Biais ngatif ou Biais positif vers le bas ou vers le haut
Terminologie
Si 1 > 0 et
Biais > 0, on dit quon sur-estime, en moyenne, la valeur de 1 Biais < 0, on dit quon sous-estime, en ~ moyenne, la valeur de 1 (ou 1biais vers 0) Biais > 0, on dit quon sous-estime, en ~ moyenne, la valeur absolue de 1 (ou biais 1 vers 0) Biais < 0, on dit quon sur-estime, en moyenne, la valeur absolue de 1
15
Si 1 < 0 et
La prsence dun biais (positif par exemple) ne signifie pas que lestimateur des MCO obtenu en utilisant un chantillon particulier soit ncessairement plus grand (si biais positif) que le paramtre de la population (1)
16
(cont.)
Elle signifie plutt que, si on pouvait tirer indfiniment des chantillons alatoires (chacun de taille n) de la population, calculer chaque fois lestimateur des MCO, et prendre la moyenne de ces estimateurs travers tous les chantillons, on trouverait une valeur plus grande que le paramtre de la population, 1
17
( )
~ 1 Distribution de
~ 1
18
Le vrai modle dans la population : log(wage)=0+1educ+2abil+u Le modle (mal spcifi) estim par MCO :
en moyenne (sur plusieurs chantillons ~ alatoires de taille n), 1 trop grand (le rendement de lducation est sur-estim)
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
19
cont.
1 = 0.083
Si le nombre dannes dtudes augmente de 1 unit, le salaire augmente approximativement de 8,3% (variation exacte = 100.[exp(0,083)-1] = 8,6%)
20
Test de significativit globale: H0: 1==k=0 F=(R2/k) / ((1- R2)/(n-k-1)) ~ Fk,n-k-1 = F1,524 2 = t ~ car k=1 1
( ) cont.
~ 1 1.96 * ~
n
SSR ( n k 1)
SSR ( n k 1)
n-k-1
SSR
~ 1 ~ tn-k-1=524 P-valeur : proba dobserver |t.|=10.94 si t ~ = = 0.0827 1 ~ 0.0076 1 ~ N(0,1) H0 (1=0) vraie. <5%,<1% rejet H0
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
~ 0
~ 1
~
=
SSR ( n k 1)
(n
k 1)
21
( )
( xi1 x1 )
(cont.)
Dun ct, la variance de lestimateur de 1 est plus petite dans le modle mal spcifi Dun autre ct, lestimateur de 1 dans le modle mal spcifi est biais Mais si la taille de lchantillon augmente, la variance de chaque estimateur tend vers zro, ce qui nest pas le cas du biais ! 23
Exemple :
log(wage)=0+1educ+2exper+3abil+u
24
(cont.)
25
(cont.)
Si 30 et Cov(x1,x3)0 et/ou Cov(x2,x3)0 Exemple : si abil a un effet partiel sur log(wage) et est corrle avec educ et/ou exper Alors, violation de MLR.4 : E(v|x1,x2)=3E(x3|x1,x2)0 x1 et/ou x2 est endogne
26
(cont.)
Consquence : Si 30 et Cov(x1,x3)0, lestimateur des MCO de 1 ET de 2 du modle mal spcifi seront gnralement biaiss et non-convergents asymptotiquement, mme si Cov(x2,x3)=0 (mme si exper nest pas corrle avec abil)!
27
(cont.)
~ * Biais 2 = 0 ~ ~ Biais 1 = 3 1
( ) ( )
( )
Cov ( xi 2 , xi 3 ) ~ NB : 2 = Var ( xi 2 )
28
(cont.)
Le sens du biais pour le cas plus gnral (k>2) ne peut donc tre dtermin que si les x inclus dans le modle de rgression (mal spcifi) ne sont pas corrls entre eux En gnral, il est utile de rflchir au sens du biais dun estimateur induit par une variable omise en faisant cette hypothse, mme si elle nest pas vrifie
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
29
Le vrai modle dans la population : log(wage)=0+1educ+2exper+3abil+u Le modle (mal spcifi) estim par MCO :
Supposons Corr(educ,exper)=0
30
cont.
31
4. Non-convergence asymptotique
Si on omet une variable importante dans le modle de rgression, lestimateur des MCO est biais, cest--dire :
en moyenne (sur plusieurs chantillons de taille n), on va sur-(ou sous-)estimer la valeur du paramtre dans la population
quand n , la distribution de lestimateur se concentre sur une valeur plus grande ou plus petite que celle du paramtre dans la population
32
( )
( )
( )
33
(cont.)
Rflchir la non-convergence asymptotique de lestimateur des MCO = rflchir son biais (k=2 ou k>2) Diffrence principale :
Non-convergence : fait intervenir variance de x1 et covariance entre x1 et x2 dans la population Biais : fait intervenir leurs quivalents dans lchantillon
Non-convergence = problme de grand chantillon ne disparat pas avec plus de donnes ! 34 Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
35
un groupe exprimental qui reoit une anne dtudes supplmentaire un groupe tmoin qui ne reoit pas cette anne dtudes supplmentaire
36
(cont.)
o educ=1 si groupe exprimental =0 si groupe tmoin Lestimateur de 1 sera sans biais et convergent car E(u|educ)=0 ou Cov(u,educ)=0 [ayant t forms
alatoirement, les 2 groupes doivent avoir la mme composition] 37 Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
(cont.)
38
(cont.)
Il est toutefois recommand dajouter des variables de contrle dans le modle de rgression
Permettent de rduire la variance de lerreur, sans induire ici de problme de multicolinarit, et donc de diminuer lcart-type de lestimateur de 1 (cf. Partie 1, pp.44-45)
39
Solutions (cont.)
(3) Essayer de trouver une variable proxy pour la variable non observe (4) Avoir recours des donnes de panel et supposer que la variable non observe ne change pas travers le temps (5) Essayer de trouver une variable instrumentale pour la variable non observe
40
Questions 5.1 p.172; Info on GPA (Grade Point Average) http://www.back2college.com/gpa.htm Problmes (p.108) 3.7 3.8 3.9 Exercices STATA (pp.111-112) C3.1 C3.6 C3.7 (+ interprtation de lestimateur de 1)
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
41
Seul (ii) = omettre une variable importante (soit une variable qui a un effet partiel sur la variable dpendante) peut causer un biais dans les estimateurs des MCO, mais seulement au cas o cette variable est corrle avec une ou plusieurs des variables explicatives dj prsentes dans le modle (violation de MLR.4). Lhypothse dhomoscdasticit (MLR.5) ne joue aucun rle pour dmontrer labsence de biais des estimateurs MCO. Le degr de colinarit entre des variables explicatives de lchantillon, mme sil est lev, na aucun effet sur les hypothses de Gauss-Markov (MLR.1-2-3-4) ncessaires pour dmontrer labsence de biais des estimateurs MCO. Ce nest quen cas de relation linaire exacte entre deux ou plusieurs rgresseurs que lhypothse MLR.3 est viole.
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
42
Un autre Problme
(ex. obligatoire 2010)
Des chercheurs sintressent leffet davoir un 3e enfant sur loffre de travail des femmes de moins de 35 ans ayant au moins 2 enfants, partir dun chantillon alatoire tir dans cette population. Ils supposent que lquation expliquant loffre de travail des femmes de moins de 35 ans dans la population est:
o la variable hours est le nombre dheures de travail hebdomadaire dune femme, age est son ge, educ est son nombre dannes dtude et kids3 est gale 1 si la femme a 3 enfants (= 0 autrement)
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
43
(cont.)
Question: (i) Mentionnez une variable omise importante qui est, selon vous, susceptible dentraner une corrlation entre kids3 et le terme derreur u1, (ii) prcisez le sens du biais de lestimateur des MCO de 3 si on omet cette variable importante (en supposant une corrlation nulle entre kids3 et age, et kids3 et educ) et (iii) en moyenne, on va sur ou sous-estimer la valeur (absolue si 3<0) de 3? Justifiez bien votre rponse.
44
Exercice obligatoire n1
45
(cont.)
Question b. Ecrivez le modle de rgression reliant score girlsch et aux autres variables explicatives mentionnes dans la rponse a. Question c. Supposez que le degr de soutien scolaire des parents est une variable non mesurable comprise dans le terme derreur de la rponse b. Cette variable est susceptible dtre corrle avec girlsch. Expliquez pourquoi et prcisez le sens du biais de lestimateur MCO de leffet de girlsch sur score si on omet la variable qui mesure le degr de soutien scolaire des parents (en supposant que les variables explicatives incluses dans le modle de rgression ne sont pas corrles entre elles).
46
Annexe
47
Annexe 1
Biais de lestimateur des MCO de 1 et de 2
Le modle de rgression estim par MCO : ~ ~ ~ ~ = + x + x , o y
i 0 1 i1 2 i2
~ 1 =
~ 2
n i= 1 n
~ y ri1 i ~2 ri1
, o ~1 = xi1 - ~0 - ~2 xi 2 ri
Cf. Wooldridge2-8, p.58
i= 1 n i= 1 n
~ y ri 2 i ~2 ri 2
~ ~ , o ~2 = xi 2 - 0 - 1xi1 ri
48
i= 1
(cont.)
Comme chaque yi doit en ralit provenir de lestimation par MCO du vrai modle :
1
1
i= 1 n
~ + x + x + x + u = ri1 0 1 i1 2 i2 3 i 3 i ~ x + ri1 i1 3
i= 1 n i= 1
( ~i1 ) 2 r
+
3
n i= 1 n
~x = ri1 i3 ~x ri1 i3
~ x = 0 r ( x ~ ~ x
0
~ = 0 ri1
i1 i 2 2 i1 0
2 i 2 ui = 0
~ ~ xi1 = 0 + 2 xi 2 + ~1 ri
49
i= 1
(cont.)
~ + ~ o ~ = 1 = 1 3 1 1
~ 2 = 2
~ o ~ = +
3 2 2
50
(cont.)
~ + ~ = + ~ E 1 = E 1 3 1 1 3 1 ~ ~ ~ Biais 1 = E 1 - 1 = 3 1 ~ + ~ = + ~ E2 = E2 3 2 1 3 2 ~ ~ ~ Biais 2 = E 2 - 2 = 3 2
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
) ( ) ( ( ) ( )
) ( ) ( ( ) ( )
51
( )
n i= 1 n
( xi1 x1 ) xi3
i= 1
estimateur des MCO de la pente du modle de rgression simple : xi3 = 0 + 1xi1 + ei = biais dans le cas simple
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
52
(cont.)
Si Corr ( xi1,xi 2 ) = 0 ~ o 2 = ~ ~ Biais 2 = 3 2 , x2 ) xi3
( )
n i= 1 n
( xi 2
i= 1
estimateur MCO de la pente du modle de rgression simple : xi3 = 0 + 2 xi 2 + ei ~ 2 non biais ssi Corr ( xi 2 , xi3 ) = 0 ET Corr ( xi1, xi 2 ) = 0
Partie 2 - Biais de la variable omise Microconomtrie - LECON2033 - 2011
53
Fin de la Partie 2
54