You are on page 1of 11

Coupe instantane :

Analyse descriptive :
Variable

Obs

ly
lk
ll
lw
etrangere

3148
3148
3148
3142
3148

exportarice

Mean Std. Dev.


13.12879
12.71691
4.606148
12.64032
.5794155

Min

Max

1.22562 7.053586 17.53424


1.417872 5.09375 16.63109
.9445391
0 7.348588
1.129853 6.049734 15.76328
.4937313
0
1

3148 .9224905 .2674407

57% des entreprises ont une participation trangre en capital


92% sont des entreprises exportatrices
Pour voir si les populations sont homognes ou htrognes, on calcul le coefficient de
variation (pour les variables quantitatives seulement) : cart type/ moyenne
Si le cv30% population htrogne
Si le CV30% population homogne
Distribution des entreprises selon la participation trangre en capital
etrangere

Freq.

Percent

Cum.

0
1

1,324
1,824

42.06
57.94

42.06
100.00

Total

3,148

100.00

57% ont une participation trangre en capital


exportarice

Freq.

Percent

Cum.

0
1

244
2,904

7.75
92.25

7.75
100.00

Total

3,148

100.00

92% des entreprises sont exportatrices contre 7.75% locales

Test de corrlation :

ly
lk
ll
lw

ly

lk

ll

lw

1.0000
0.8056
0.8011
0.8758

1.0000
0.6951
0.7461

1.0000
0.8836

1.0000

Lk et ll sont fortement corrls.


Test dindpendance :
exportarice
0

etrangere

Total

237
176.0

1,087
14.8

1,324
190.7

7
127.7

1,817
10.7

1,824
138.5

Total

244
303.7

2,904
25.5

3,148
329.2

Pearson chi2(1) = 329.1981

Pr = 0.000

H0 : les 2 variables sont indpendantes


H1 : les 2 variables sont dpendantes
On remarque que (p/H0 vrais) : 0.000< 0.05
Donc jaccepte H1, il ya une relation entre lexportation et la participation trangre en
capital.
Estimation du model :
-

Sans salaire :
Source

SS

df

MS

Model
Residual

3668.34805
4 917.087012
1058.90067 3143 .336907626

Total

4727.24872 3147 1.50214449

ly

Coef.

lk
ll
etrangere
exportarice
_cons

.4288987
.5109178
.3621693
.1111097
5.008815

Avec salaire :

Std. Err.
.0101501
.0161984
.0228578
.0425313
.0979406

t
42.26
31.54
15.84
2.61
51.14

Number of obs
F( 4, 3143)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

3148
2722.07
0.0000
0.7760
0.7757
.58044

P>|t|

[95% Conf. Interval]

0.000
0.000
0.000
0.009
0.000

.4089972
.4791573
.3173515
.0277178
4.816781

.4488002
.5426782
.4069871
.1945015
5.200849

Source

SS

df

MS

Model
Residual

3886.2543
5 777.250859
811.271668 3136 .258696323

Total

4697.52596 3141 1.49555109

ly

Coef.

lw
lk
ll
etrangere
exportarice
_cons

.5533598
.3082683
.0870434
.20487
.1178926
1.586412

Std. Err.
.019334
.0098131
.0212929
.0207375
.0374216
.1456077

t
28.62
31.41
4.09
9.88
3.15
10.90

Number of obs
F( 5, 3136)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

3142
3004.49
0.0000
0.8273
0.8270
.50862

P>|t|

[95% Conf. Interval]

0.000
0.000
0.000
0.000
0.002
0.000

.5154512
.2890276
.045294
.1642095
.0445194
1.300916

.5912684
.327509
.1287927
.2455305
.1912659
1.871908

On remarque quil ya une baisse considrable de limpact du travail, qui a pass de 0.51% a
0.08% .cest du a la forte colinarit entre la variable travail et salaire.
Cest pour cela quon introduit leffet crois (la relation production-travail dpend telle de la
politique salariale de la firme ? si oui existe-t-il un effet seuil) :
Source

SS

df

MS

Model
Residual

3821.81139
5 764.362279
875.714569 3136 .279245717

Total

4697.52596 3141 1.49555109

ly

Coef.

cross
lk
ll
etrangere
exportarice
_cons

.0902181
.3302451
-.9178839
.2533361
.280988
7.414274

Std. Err.
.0039258
.0101465
.0649471
.0213086
.0394813
.1395809

t
22.98
32.55
-14.13
11.89
7.12
53.12

Number of obs
F( 5, 3136)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.000
0.000
0.000
0.000
0.000

=
=
=
=
=
=

3142
2737.24
0.0000
0.8136
0.8133
.52844

[95% Conf. Interval]


.0825207
.3103506
-1.045227
.2115558
.2035762
7.140595

.0979156
.3501396
-.7905409
.2951163
.3583998
7.687953

Cross : lw*ll.
dly/dll : -0.91+0.090 lw : donc il ya un effet seuil a partir duquel la politique salariale volue
ngativement par rapport la production.(il faut adopter une politique dincitation au
travail).
Lw= 0.918/0.090= seuil.
Rgression en srie temporelle :
Evolution du cour parpart au volume des transactions
Test de corrlation :

close volume
close 1.0000
volume -0.3106 1.0000
Il ya une corrlation ngative entre le volume des transactions et lindice boursier(-0.31)
Estimation avec MCO :
Y : volume des transactions
X : prix de fermeture de lindice boursier.

. regress ly lx
Source

SS

df

MS

Model
Residual

.891330398
10.2779572

1 .891330398
246 .041780314

Total

11.1692876

247 .045219788

ly

Coef.

lx
_cons

-.821677
15.21681

Std. Err.
.1778966
1.260031

t
-4.62
12.08

Number of obs
F( 1, 246)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.000

=
248
= 21.33
= 0.0000
= 0.0798
= 0.0761
= .2044

[95% Conf. Interval]


-1.172072
12.73498

-.4712822
17.69863

8.5

9.5

10

On remarque q un accroissement de 1% du prix du march admet une baisse de 0.82% du


volume des transactions. Ce model est globalement significatif car p : 0.000 < 5%

01jan2001

01apr2001

01jul2001
Date

01oct2001

01jan2002

On remarque daprs le graphe que la variance peut changer (ne reste pas constante) parce
que le graphe de vient de plus en plus large avec le temps.
Existence de risque dhtroscdasticit.
Donc on doit tester la prsence de leffet ARCH(1) :
ARCH(1) V(Et)=t= 0+ 1 Et-1
ARCH(2) t= 0+ 1 Et-1+ 2Et-2
Ho :t = (absence deffet ARCH )
H1 : t=f(Et-1,Et-2)
P< 5% prsence dun effet ARCH
P> 5% absence deffet ARCH
ARCH family regression
Sample: 02jan2001 - 31dec2001, but with gaps
Distribution: Gaussian
Log likelihood = 52.3131
OPG
Std. Err.

Number of obs
Wald chi2(1)
Prob > chi2

P>|z|

=
=
=

248
16.33
0.0001

ly

Coef.

[95% Conf. Interval]

lx
_cons

-.7310114
14.59474

.1808923
1.282692

-4.04
11.38

0.000
0.000

-1.085554
12.08071

-.376469
17.10877

arch
L1.

.6505589

.0987972

6.58

0.000

.4569199

.8441978

_cons

.0232886

.0024002

9.70

0.000

.0185844

.0279928

ly

ARCH

P : 0.0001 < 5% prsence deffet ARCH


t= 0.023+0.65 Et-1
La variance des rsidus augmente dans le temps.
Le test ARCH(2) :

Sample: 02jan2001 - 31dec2001, but with gaps


Distribution: Gaussian
Log likelihood = 55.16315

ly

OPG
Coef. Std. Err.

Number of obs =
Wald chi2(1) =
Prob > chi2
=

248
21.05
0.0000

P>|z|

[95% Conf. Interval]


-1.192845 -.4787229
12.81323
17.8698

ly
lx
_cons

-.8357839 .1821773
15.34152 1.289964

-4.59 0.000
11.89 0.000

arch
L1.
L2.

.4417277 .1169616
.2535689 .1128049

3.78 0.000
2.25 0.025

.2124871
.0324752

.6709683
.4746625

_cons

.0191279 .0032349

5.91 0.000

.0127877

.0254681

ARCH

On se rfre on maximum de vraisemblance pour choisir le bon model (log like lihood)

Module 2 : Rgression non linaire


Models logit et probit
Crdit scoring :
Dans les modles ou la variable dpendante prend les valeurs 0 ou 1, l'estimation linaire
n'est pas approprie car les valeurs prdites peuvent tre au dessous de 0 et au dessus de 1,
ou comprises entre les deux.
L'inadquation du modle linaire conduit a modlis, non pas la variable dpendante ellemme, mais la probabilit qu'elle prenne la valeur 1 ou 0.
Pour modliser cette probabilit, on suppose qu'il existe une variable latente y* , fonction
score, telle que:
y =1 si y* 0 et y = 0 si y* < 0
y=1 si le client a obtenue un crdit
y=0 si le client na pas obtenu un crdit
Lorsque la variable dpendante est binaire (0,1) on utilise :
un modle probit ou un modle logit, selon les hypothses sur les rsidus. Les deux
Mthodes destimation utilisent le maximum de vraisemblance.(valeurs estimes proches).
Probit : on suppose que les rsidus suivent une loi normale centre rduite.
O est la fonction de rpartition de la loi normale centre-rduite (0,1)

Logit : on suppose que les rsidus suivent une loi logistique.

Pr Yi 1 Xi xi

exp xi
1 exp xi

Description du model estimer :

Logistic regression

Number of obs
Wald chi2(4)
Prob > chi2
Pseudo R2

Log pseudolikelihood = -20.248446

yi

Coef.

revenu
nbenf
engagem
loyer
_cons

.0127125
-.8077323
-.012255
-.0148147
-3.306201

Robust
Std. Err.
.0031358
.3361836
.0049399
.0058727
1.214511

z
4.05
-2.40
-2.48
-2.52
-2.72

P>|z|
0.000
0.016
0.013
0.012
0.006

=
=
=
=

50
17.47
0.0016
0.3802

[95% Conf. Interval]


.0065665
-1.46664
-.0219369
-.0263251
-5.686598

.0188585
-.1488247
-.002573
-.0033044
-.9258036

Loption robuste corrige les carts types sans tenir compte de lhtroscdasticit car les
variables sont homognes.
Les coefficients sont tous significatifs car z > 2 et p< 5%.
H0 : B1=0
H1 : B2# 0 p< 0.05 alors on accpte H1
Logistic regression

Number of obs
Wald chi2(4)
Prob > chi2
Pseudo R2

Log pseudolikelihood = -20.248446

yi

Coef.

revenu
nbenf
engagem
loyer
_cons

.0127125
-.8077323
-.012255
-.0148147
-3.306201

Robust
Std. Err.
.0031358
.3361836
.0049399
.0058727
1.214511

z
4.05
-2.40
-2.48
-2.52
-2.72

P>|z|
0.000
0.016
0.013
0.012
0.006

=
=
=
=

50
17.47
0.0016
0.3802

[95% Conf. Interval]


.0065665
-1.46664
-.0219369
-.0263251
-5.686598

.0188585
-.1488247
-.002573
-.0033044
-.9258036

On remarque que je revenu prsente un effet positif sur la probabilit davoir un crdit.

Quel est le facteur qui a le plus deffet ?


La relation nest pas linaire donc on ne peut pas savoir quel est la variable qui a le plus
deffet ?
E( pi/xi) : Dlnpi/dlnxi : variation relative de la probabilit davoir un crdit/ variation relative
de revenu.

Cest la variable revenu qui a le plus deffet, si le revenu augmente de 1% la probabilit


davoir un crdit va augmenter de 1.66%.
Le model est-il bien spcifi :
Le test de significativit globale
H0 : B1=B2=B3=0
H1 : il existe au moins un Bi #0 p=0.001< 5% et pseudo R=0.38 donc proche de 0.4
Le model est globalement significatif et a une bonne qualit dajustement.le model est bien
spcifi.
Le tableau de prdiction :

Que ce soit aprs un modle Logit ou un modle Probit, on peut faire un tableau de
prdiction du modle pour valuer sa qualit a prdire les valeurs 0 et 1 de la variable
dpendante.
On fixe un seuil arbitraire de probabilit et on suppose que si la probabilit prdite est
suprieure a ce seuil alors la variable dpendante est gale 1 (vnement) et si la probabilit
prdite est infrieure a ce seuil, alors la variable dpendante est gale a 0 (non vnement).
On compare ensuite ces prdictions aux vraies valeurs prises par la variable dpendante.
Logistic model for yi
True
Classified

~D

Total

+
-

28
4

6
12

34
16

Total

32

18

50

Classified + if predicted Pr(D) >= .5


True D defined as yi != 0
Sensitivity
Specificity
Positive predictive value
Negative predictive value

Pr( +| D)
Pr( -|~D)
Pr( D| +)
Pr(~D| -)

87.50%
66.67%
82.35%
75.00%

False
False
False
False

Pr( +|~D)
Pr( -| D)
Pr(~D| +)
Pr( D| -)

33.33%
12.50%
17.65%
25.00%

+
+
-

rate
rate
rate
rate

for
for
for
for

true ~D
true D
classified +
classified -

Correctly classified

80.00%

4 et 6 sont les erreurs du model ou erreurs de prdiction.


6 : les clients qui nont pas obtenu de crdit et qui sont classs sans risque par le model
(erreur dinclusion)
4 : les clients qui ont obtenu un crdit et qui sont classs a risque selon le model(erreur
dexclusion).
26+28 : correctly spicify 80% (28+26/50=0.8)
Sensitivity : sur les 32 qui ont eu le crdit ,28 sont bien slass (28/32=87.5%)
Specificity : les clients qui nont pas eu le crdit et qui sont bien classs par le model
(6/18=66%)
Module 3 : donnes de panel
Coupe instantane : N entreprise sur une anne
Srie temporelles : 1 entreprise sur plusieurs annes
Panel, N entreprise sur t annes.

Avantage avec panel : augmentation du nombre dobservation TXN , le model va avoir des
rsultats pcb plus robuste car lestimation est plus prcise .
Techniques de panel : quand n> 30 et t < 15 ans , de la dcoule le problme
dhtrognit des individus
Htrognit observable : taille, genre .
Htrognit non observable : qualit du management,gout et performance
Quel model retenir :
Analyse descriptive :
Xit : facteurs variables dans le temps (inflation, dpenses publiques, ouverture
commerciale).
Zi : facteurs invariants dans le temps
Region : midle east =1 si le pays est au moyen orient
=0 sinn
Ressources naturelles : petrole= 1 si le pays est exportateur de petrole
= 0 sinn.
Le pays de rfrence est celui qui vaut 0 .
Yit= croissance du PIB /tte.

You might also like