Main
Main
Main
1 Introduction
1.1 Quest-ce quun panel . . . . . . . . . . .
1.2 Organisation des donnes de panel sous R
1.3 Mesure de la variabilit dans un panel . .
1.4 Des transformations utiles . . . . . . . . .
1.5 Les diffrentes formes dhtrognit . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
3
5
10
12
. . . .
effets
. . . .
. . . .
41
41
41
42
42
viii
. . . . . .
. . . . . .
. . . . . .
. . . . . .
variables
. . . . . .
. . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
45
48
49
53
53
53
54
55
57
61
61
61
62
63
65
67
70
73
6 Endogneite
75
6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.2 Estimation dune quation isole . . . . . . . . . . . . . . . . . . . 76
6.2.1 Les modles within et between . . . . . . . . . . . . . . . . 80
6.2.2 Estimateurs combinant les variations intra et inter-individuelles 83
6.3 Estimation dun systme dquation . . . . . . . . . . . . . . . . . 88
6.3.1 Lestimateur des triples moindres carrs ordinaires . . . . . 88
6.3.2 Lestimateur des triples moindres carrs ordinaires erreurs
composes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.4 Estimateur dHausman-Taylor . . . . . . . . . . . . . . . . . . . . . 92
7 Estimation dun modle dynamique
97
7.1 Modle dynamique et endognit . . . . . . . . . . . . . . . . . . 99
7.1.1 Le biais de lestimateur des mco . . . . . . . . . . . . . . . 99
7.1.2 Lestimateur within . . . . . . . . . . . . . . . . . . . . . . 101
7.1.3 Mthodes destimation convergentes pour les modles dynamiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.2 Estimateur des moments gnraliss du modle en diffrences . . . 105
7.2.1 Variables instrumentales et mthode des moments gnraliss 105
7.2.2 Estimateur en une tape . . . . . . . . . . . . . . . . . . . . 107
7.2.3 Estimateur en deux tapes . . . . . . . . . . . . . . . . . . 109
7.4
7.5
ix
110
113
113
114
116
118
118
121
122
124
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
127
127
127
129
131
132
132
133
134
135
135
137
138
139
139
140
142
143
143
144
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
147
147
151
152
153
153
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10 Panels spacials
155
Bibliographie
161
Chapitre 1
Introduction
mco = (Z > Z)1 Z > y = (Z > Z)1 Z > (Z + )
b = (Z > BZ)1 Z > By = (Z > BZ)1 Z > B(Z + )
w = (X > W X)1 X > W y = (X > W X)1 X > W (j + X + )
mco = (Z > Z)1 Z >
b = (Z > BZ)1 Z > B)
w = (X > W X)1 X > W
Mmco = I Z(Z > Z)1 Z >
Mb = I Z(Z > BZ)1 Z > B
X(X > W X)1 X > W )
Mw = (I J)(I
= 2 I + 2 U
qw
qb
=
=
e = M
e> W e = > M > W M = tr(M > W M > )
e> Be = > M > BM = tr(M > BM > )
E(
qw ) = tr(M > W M ) = 2 tr(M > W M ) + 2 tr(M > W M U )
E(
qb ) = tr(M > BM ) = 2 tr(M > BM ) + 2 tr(M > BM U )
1.1
2
2
=
E(
qw )
E(
qb )
On appelle panel une base de donnes dans laquelle deux dimensions sont prsentes :
une dimension individuelle (au sens large) : il peut sagir de personnes physiques,
de mnages, dentreprises, de pays, etc. On note ces individus n = 1 . . . N .
une dimension temporelle : il existe plusieurs observations au cours du temps de
ces individus. On note les priodes dobservations t = 1 . . . T .
Les panels sont donc une combinaison de srie temporelle et de coupe transversale ;
ils permettent de combler en partie les limites de ces deux types dchantillon :
le fait quil y ait deux dimensions dans ces donnes permet daugmenter le
nombre dobservations et la variabilit de lchantillon, ce qui permet dobtenir
des estimations plus prcises,
lhtrognit individuelle peut tre prise en compte de manire beaucoup plus
satisfaisante dans le cadre de donnes de panel car on dispose de plusieurs observations des mmes individus.
Un panel est caractris par ses deux dimensions, transversale (N ) et temporelle
(T ). En fonction de ces dimensions, on peut distinguer grossirement deux types
de panel :
les panels micros N >> T : le nombre dindividus observs est trs important (typiquement plusieurs milliers) et le nombre dobservations temporelles
est faible (4-5 par exemple). Pour ce type de panel, il nest pas possible de
raliser des estimations pour chaque individu et laccent est mis sur des problmatiques de micro-conomtrie : htrognit individuelle, corrlation entre
lerreur et les variables explicatives,
les panels macros : le nombre dindividus est faible et le nombre de sries temporelles est lev, typiquement N et T sont du mme ordre de grandeur, la
ou quelques dizaines. il sagit par exemple de donnes de lOCDE, deurostat
ou dautres organismes internationaux concernant des groupes de pays ou de
rgions. Dans ce cas, lestimation sur donnes de panel est une alternative
une estimation sur une srie chronologique pour un seul individu. On retrouve
dans ce cas les proccupations prsentes dans lanalyse contemporaine des sries
temporelles, en particulier la dtection de racines unitaires et de relations de
cointgration.
Un panel est dit cylindr lorsque chaque individu est observ pour le mme ensemble de priodes. Dans ce cas, la taille totale de lchantillon est simplement
N T , alors que, P
dans le cas gnral, en notant Tn le nombre dobservations pour
N
lindividu n, on a n=1 Tn . Trs souvent, les modles dconomtrie de panel sont
prsents dans le cas ou le panel est cylindr et il est indiqu que lextension au
cas des panels non cylindrs est vidente. Ce point de vue nous semble abusif,
Chapitre 1. Introduction
lestimation sur des donnes cylindres tant trs souvent beaucoup plus simple
que sur des donnes non cylindres.
La littrature thorique et empirique concernant lconomtrie des donnes de
panel est trs abondante. Tous les manuels dconomtrie consacrent au moins un
chapitre ce sujet, dautres y sont spcifiquement consacrs, en particulier Baltagi
(2001), Sevestre (2002), Pirotte (2011) et Hsiao (2003)
R ne permet pas danalyser simplement les donnes de panel. La librairie plm
(Croissant & Millo, 2008) fournit un ensemble de fonctions qui permettent de
grer correctement les donnes de panel et qui proposent les principales mthodes
destimation et de test.
1.2
Avec R, il est dusage de stocker les donnes dans un data.frame , qui est une
liste contenant un ensemble de vecteurs qui peuvent tre de modes diffrents, mais
qui sont de mme longueur, ce qui permet une reprsentation tabulaire. Cette
structure est adapte aux coupes transversales mais elle est insuffisante car elle est
incapable de rendre compte de la double dimension (individuelle et temporelle) des
donnes de panel. A cet effet, plm fournit une fonction appele pdata.frame qui
prend pour argument principal un data.frame et qui renvoie un objet de classe
pdata.frame . Il sagit dun tableau de donnes auquel est ajout une information
sur les deux dimensions du panel. Les deux arguments obligatoires de cette fonction
sont data (un tableau de donnes) et index . Ce dernier renseigne la structure des
donnes. Il peut sagir :
dune chane de caractre : dans ce cas, il sagit du nom de la variable qui contient
lindex individuel,
dun vecteur de deux chanes de caractres, les deux variables qui contiennent
les index individuels et temporels,
dun entier, le nombre dindividus ; le panel doit dans ce cas tre cylindr et les
observations classes dabord par individu.
drop.index est un dernier argument optionnel logique ; sil est gal TRUE, les
index sont retirs du tableau de donnes.
A titre dexemple, nous allons analyser les donnes Grunfeld qui figurent dans la
librairie AER. Ces donnes indiquent linvestissement (invest), la valeur (value)
et le stock de capital (capital) de 10 entreprises amricaines pour 20 ans (de 1935
1954). Nous en prendrons pour linstant un petit sous-ensemble, constitu de
deux firmes pour trois ans.
>
>
>
>
1
2
3
4
21
22
23
24
invest
317.6
391.8
410.6
257.7
209.9
355.3
469.9
262.3
value capital
firm year
3078.5
2.8 General Motors 1935
4661.7
52.6 General Motors 1936
5387.1
156.9 General Motors 1937
2792.2
209.2 General Motors 1938
1362.4
53.8
US Steel 1935
1807.1
50.5
US Steel 1936
2676.3
118.1
US Steel 1937
1801.9
260.2
US Steel 1938
General Motors-1935
General Motors-1936
General Motors-1937
General Motors-1938
US Steel-1935
US Steel-1936
US Steel-1937
US Steel-1938
invest
317.6
391.8
410.6
257.7
209.9
355.3
469.9
262.3
value capital
3078.5
2.8
4661.7
52.6
5387.1
156.9
2792.2
209.2
1362.4
53.8
1807.1
50.5
2676.3
118.1
1801.9
260.2
Les index peuvent tre extraits en utilisant la fonction index . Par dfaut, les deux
index sont renvoys, mais on peut indiquer avec un second argument which le
ou les index que lon souhaite extraire en indiquant soit un nom, soit un index
numrique (1 pour lindex individuel, 2 pour lindex temporel)
> index(smallGr)
1
2
3
4
21
22
23
24
firm
General Motors
General Motors
General Motors
General Motors
US Steel
US Steel
US Steel
US Steel
year
1935
1936
1937
1938
1935
1936
1937
1938
Chapitre 1. Introduction
[1] General Motors General Motors General Motors General Motors US Steel
[6] US Steel
US Steel
US Steel
Levels: General Motors US Steel
> index(smallGr, 2)
Notons que les index peuvent galement tre extraits des sries contenues dans un
pdata.frame :
> z <- smallGr$invest
> index(z)
1
2
3
4
21
22
23
24
firm
General Motors
General Motors
General Motors
General Motors
US Steel
US Steel
US Steel
US Steel
year
1935
1936
1937
1938
1935
1936
1937
1938
1.3
Pour une coupe transversale ou une srie chronologique, une variable de lchantillon peut tre note xi avec i = 1 . . . I lindice de lobservation. La moyenne
arithmtique de la variable est :
I
x
=
1X
xi
I i=1
Sxx =
I
I
X
X
(xi x
)2 =
x2i I x
i=1
i=1
La variance empirique est obtenue en divisant cette expression par I (ou par I 1
pour corriger du nombre de degrs de libert).
Dans un panel, la variable doit tre doublement indice, par convention dabord
par lindice individuel (n = 1 . . . N ), puis par lindice temporel (t = 1 . . . T ) : xnt .
Trois types de moyenne empiriques peuvent tre calcules :
, qui est la moyenne arithmtique de toutes
la moyenne globale, que lon notera x
les observations (pour tous les individus et pour lensemble des priodes) :
PN
=
x
PT
n=1
t=1
xnt
NT
t=1
x
n. =
xnt
n=1
xnt
N X
T
X
)2
(xnt x
n=1 t=1
N X
T
X
(xnt x
n. )2
n=1 t=1
Chapitre 1. Introduction
bn
Sxx
N X
T
N
X
X
2
)2
=
(
xn. x) = T
(
xn. x
n=1 t=1
n=1
On peut montrer aisment que la variabilit totale est la somme des variabilits
intra et inter individuelles. En effet :
Sxx
PN PT
2
=
n=1 Pt=1 (xnt x)
PN
T
)]2
=
[(xnt x
n. ) + (
xn. x
n=1
PN
PTt=1
)2 + 2(xnt x
) 2
=
n. )2 + (
xn. x
n. )(
xn. x
nt x
n=1
t=1 (xP
P
N
T
bn
wn
)
+ 2 n=1 t=1 (xnt x
+ Sxx
n. )(
xn. x
= Sxx
PN
P
) Tt=1 (xnt x
Or, ce dernier terme est nul, car on peut lcrire n=1 (
xn. x
n. )
et la somme pour un individu des carts par rapport la moyenne individuelle
est ncessairement nulle. De la mme manire, on peut dcomposer la variabilit
totale en une variabilit within et between temporelle :
wt
=
Sxx
T
N X
X
(xnt x
.t )2
n=1 t=1
bt
Sxx
=
T
N X
X
)2 = N
(
x.t x
n=1 t=1
T
X
)2
(
x.t x
t=1
et
bt
wt
+ Sxx
Sxx = Sxx
N X
T
X
)2
(xnt x
n. xt + x
n=1 t=1
Soit encore :
wnt
Sxx
PN PT
) (xt x
)]2
xn. x
=
n=1
t=1 [(xnt x) (
bn
bt
= Sxx Sxx
Sxx
car on montre aisment que les doubles sommes des termes croiss sont nulles
laide du mme argument que prcdemment. On obtient donc une troisime
dcomposition de la variabilit :
wnt
bn
bt
Sxx = Sxx
+ Sxx
+ Sxx
plm fournit des fonctions qui permettent de calculer simplement les transformations prcdemment dcrites : Within calcule la transformation within alors que
ces deux dernires fonctions est que la premire renvoie un vecteur de longueur
N T , chaque moyenne individuelle tant rpte T fois alors que la seconde
renvoie un vecteur de longueur N .
Avec la variable invest pour le petit sous-ensemble des donnes Grunfeld , on
obtient :
> z <- smallGr$invest
> between(z)
General Motors
344.425
US Steel
324.350
> Between(z)
US Steel
324.350
> Within(z)
Ces transformations sont par dfaut ralises sur la dimension individuelle. Les
mmes oprations peuvent tre effectues sur la dimension temporelle en fixant le
second argument effect "time" :
> z <- smallGr$invest
> between(z, effect = "time")
1935
1936
1937
1938
263.75 373.55 440.25 260.00
Chapitre 1. Introduction
On constate, et cest le cas la plupart du temps, que la variabilit dans lchantillon est trs largement imputable aux diffrences entre individus. Ce rsultat est
galement illustr par la figure 1.1.
1.5
10
0.5
1.0
0.0
General Motors
Chrysler
IBM
Goodyear
Fig. 1.1 Variation intra et inter individuelle pour les donnes Grunfeld
1.4
Les mesures de variabilit que nous avons mises en vidence utilisent diffrentes
moyennes et des donnes transformes en cart par rapport ces diffrentes moyennes.
Une expression compacte de ces transformations peut tre obtenue en utilisant diffrents oprateurs matriciels, et en particulier le produit de Kronecker.
Le produit de Kronecker de deux matrices, not A B, correspond la matrice
obtenue en multipliant
chaque
1
AB = 0
2
0
2
0.5
6
1
1
4
=
0
2
6
2
6
2
6
4
2
0
8
6
4
2
0.5
8
6
4
2
1
8
6
4
8
4
8
4
8
2
6
0
0
4
12
4
8
0
0
8
16
0
0
1
3
2
6
Chapitre 1. Introduction
11
1
0
0
1
1
0
0
1
1/3
1/3
1/3
0
0
1
1 1 1 1 /3
1
1/3 1/3 1/3
1/3 1/3 1/3
1/3 1/3 1/3
1/3 1/3
0
0
0
1/3 1/3
0
0
0
1/3 1/3
0
0
0
0
0
1/3 1/3 1/3
0
0
1/3 1/3 1/3
0
0
1/3 1/3 1/3
On a alors :
(Bn x)> = (
x1 , x
1 , . . . , x
1 , x
2 , x
2 , . . . , x
2 , . . . , x
N. , x
N. , . . . , x
N. )
Pour obtenir la transformation inter-individuelle (within), on utilisera une matrice
de transformation note Wn dfinie par :
Wn = IN T In JT /T = IN T Bn
Ces deux matrices ont des proprits trs importantes :
elles sont symtriques, on a donc B > = B et W > = W ,
elles sont idempotentes, cest--dire que W W = W et B B = B. Considrons
par exemple loprateur between. Si on lapplique deux fois successivement x,
on obtient : (B B) x = B (B x). Cela revient calculer des moyennes
individuelles sur un vecteur contenant dj des moyennes individuelles, ce qui
laisse le vecteur inchang ; on a donc bien (B B) x = B x (le mme
raisonnement sapplique W ),
elles ralisent une dcomposition dun vecteur, cest--dire que Bx+W x = x.
En effet, W = I B. On a alors B x + W x = (B + W ) x = I x = x,
elles sont orthogonales, cest--dire que W > B = 0. En effet, en utilisant la
proprit de symtrie et par dfinition de W , on a : W > B = W B = (I B)
B = B B B = B B = 0.
12
1.5
On parle dhtrognit lorsque les individus (et/ou les priodes) prsentent des
diffrences systmatiques. Pour simplifier, nous ignorons pour linstant lhtrognit temporelle et nous raisonnons dans le cadre habituel du modle linaire
simple. On a donc le modle suivant :
y = + x +
Sur la figure 1.2, on constate que la seule forme dhtrognit entre les individus
correspond des niveaux moyens diffrents de la variable explicative, et donc de
Chapitre 1. Introduction
13
Autrement dit, on se ramne un modle linaire standard, et la mthode destimation des moindres carrs ordinaires est approprie.
Sur la figure 1.3, on constate que les points correspondant chaque individu
semblent aligns sur des droites parallles, cest--dire des droites dont les pentes
sont identiques, mais dont les ordonnes lorigine sont propres lindividu.
Dans ce cas, le modle estimer peut scrire sous la forme :
ynt = + xnt + nt avec nt = n + nt
et lordonne lorigine propre lindividu n scrit : + n . On est alors dans le
cadre du modle erreurs composes qui fera lobjet dun traitement dtaill dans
les deux section suivantes.
Sur la figure 1.4, on constate que les points correspondants chaque individu sont
aligns sur des droites diffrentes et non parallles. Dans ce cas, le modle estimer
scrit :
ynt = + n xnt + nt avec nt = n + nt
Les points correspondant lindividu n sont alors aligns sur une droite dordonne
lorigine +n et de pente n . Le modle appropri ce cas est le modle coefficients variables et une estimation correcte de ce modle ncessite une dimension
temporelle suffisamment longue.
14
Chapitre 2
2.1
2.1.1
Notations et hypothses
Notations
(2.1)
Dans certains cas, il sera plus clair de rassembler la constante et les pentes dans
le mme vecteur de coefficients. En notant > = (, > ) le vecteur complet de
>
paramtres estimer et znt
= (1, xnt ) le vecteur de variables explicatives associs,
le modle estimer se rcrit alors :
>
ynt = znt
+ nt
(2.2)
(2.3)
16
les observations dabord par individu, puis par priode. Nous supposerons pour
linstant que le panel est cylindr, cest--dire que chaque individu est observ le
mme nombre de fois. Dans ce cas, y est un vecteur de longueur N T et X une
matrice de dimension N T K.
x11
x211 . . . xK
y11
11
y12
x112
x212 . . . xK
12
..
..
..
..
..
.
.
.
.
.
y1T
x1T x21T . . . xK
1T
2
K
y21
x21
x21 . . . x21
y22
x22
x222 . . . xK
22
..
..
..
.
..
..
.
.
y=
. et X = 1.
K
2
y2T
x
.
.
.
x
x
2T
2T
2T
.
.
..
..
..
..
..
.
.
.
K
2
yN 1
x1
N 1 xN 1 . . . xN 1
2
K
yN 2
x1
N 2 xN 2 . . . xN 2
.
.
..
..
..
..
..
.
.
.
yN T
x1N T
x2N T
...
xK
NT
(2.4)
(2.5)
est la somme dun vecteur de longueur N T contenant la composante idiosyncratique du terme derreur et de leffet individuel de longueur N dont chaque
lment est rpt T fois. On peut lexprimer sous la forme matricielle suivante :
= (IN jT ) +
(2.6)
(2.7)
y = Z +
(2.8)
(2.9)
17
2.1.2
(2.11)
18
(2.12)
Enfin, nous supposerons tout au long de ce chaptre que les deux composantes du
terme derreur sont non-corrles avec les diffrentes variables explicatives :E( |
x) = E( | x) = 0.
2.2
Dans le chapitre 1, nous avons montr que la variabilit dans un panel peut tre
dcompose en deux :
la variabilit between ou inter-individuelle qui correspond la variabilit des
variables du panel mesures en moyenne individuelle, soit zn ou sous forme
matricielle Bz.
la variabilit within ou intra-individuelle qui correspond la variabilit des variables du panel mesures en cart par rapport la moyenne individuelle, soit
znt zn ou sous forme matricielle W z = z Bz,
Trois estimations par les moindres carrs ordinaires sont donc envisageables : la
premire sur les donnes non-transformes, la seconde sur les donnes transformes en moyennes individuelles (modle between) et la troisime sur les donnes
transformes en carts par rapport la moyenne individuelle (modle within).
2.2.1
Estimateur des moindres carrs ordinaires sur les variables non transformes
Z > = 0
19
(2.13)
(2.14)
On retrouve ici le rsultat bien connu que la droite de rgression des moindres
carrs ordinaires passe ncessairement par le centre du nuage de points, cest-dire par le pointPde P
coordonnes (
x, y). Les K autres conditions de premier ordre
impliquent que n t nt xknt = 0, soit encore, le rsidu moyen tant nul :
XX
(
nt
)(xknt x
k )/(N T ) = 0
(2.15)
n
ce qui signifie que les covariances empiriques entre les rsidus et les diffrentes
variables explicatives sont nulles sur lchantillon. En rsolvant (2.13), on obtient
lestimateur des moindres carrs ordinaires du vecteur tendu des coefficients :
mco = (Z > Z)1 Z > y
(2.16)
(2.17)
Pour obtenir lestimateur restreint aux coefficients associs aux variables explicatives, on dcompose Z en (j, X) et > en (
, > ) :
=
O
X >j
j>X
X >X
1
j>y
X >y
1
X > (I J)y
(2.18)
cest--dire une formule similaire (2.16), mais avec des variables prmultiplies
cette transformation ayant pour effet denlever chaque variable sa
par I J,
moyenne. Concernant la constante estime
, on retrouve lexpression (2.14). Afin
20
1
X > (I J)
= ) si E X > (I J)
T X > (I J)X
N
1
plim
T X > (I J)
N
Lestimateur est donc convergent si la matrice de covariance des variable explicative est dfinie et si la covariance entre les variances explicatives et les erreurs du
modle sont nulle. La variance de lestimateur des mco est donne par :
V (
mco ) = E (
mco )(
mco )> = (Z > Z)1 Z > Z(Z > Z)1
(2.19)
Notons que pour le modle erreur composes, la matrice de variance des erreurs
du modle ne se rduit pas un multiple de la matrice identit du fait de
la corrlation gnre par les effets individuels. Par consquent, la variance de
lestimateur des mco ne se rduit pas V (
mco ) = 2 (Z > Z)1 et lutilisation de
cette expression pour construire des statistiques de test conduirait une infrence
biaise.
En conclusion, lestimateur des mco, mme sil est non-biais et convergent prsente deux limites :
la premire est que lestimation de la variance utilise habituellement dans le
cadre de lestimation des mco nest pas adapte et doit tre remplace par une
expression plus complexe,
la seconde est que, dans ce contexte, le modle des mco nest pas le meilleur
estimateur linaire non-biais, ce qui signifie quil existe dautres estimateurs
linaires non-biaiss plus efficaces.
2.2.2
Lestimateur between
21
1
X > (B J)y
(2.20)
1
X > (B J)
> 1 X > (B J)(B
> 1
V b = X > (B J)X
J)X
X > (B J)X
= 2 (B J).
Par
Or, lexpression d donne par (2.12) implique que (B J)
1
Z > By
1
Z > BZ >
(2.22)
(2.23)
Pour estimer 2 , on part de la somme des carrs des rsidus du modle between
estim : qb = > B
.
B
= B BZ(Z > BZ)1 Z > B B = M B
La matrice M est idempotente et sa trace est tr(M ) = tr(B)tr(IK+1 ) = N K
1. On a donc qb = > BM M B et E(
qb ) = E(tr(> BM B)) = E(tr(BM B> )) =
2
tr(BM B)) = tr(M ) Lestimateur sans biais de 2 est donc
2 = qb /(N K
1). Celle renvoye par le logiciel est : qb /(O K 1) et la matrice de covariance
des coefficients renvoye doit donc tre multiplie par (O K 1)/(N K 1).
2.2.3
Lestimateur within
22
Lapplication de lestimateur des mco sur le modle transform abouti lestimateur within :
w = X > W X >
1
X >W y
(2.24)
La variance de w scrit :
1 >
1
X W W X X > W X >
V w = X > W X >
Or, W = W ( W + B) = W . La transformation within introduit donc une
corrlation entre les erreurs du modle. Lexpression de la variance du modle
within se ramne :
1
V w = 2 X > W X >
(2.25)
et on retrouve donc, malgr cette corrlation, lexpression classique de la variance.
Pour estimer 2 , on utilise la somme des carrs des rsidus du modle within
estim : qw > W
W = W W X(X > W X)1 X > W W = M W
La matrice M est idempotente et sa trace est tr(M ) = tr(W )tr(IK ) = ON K.
On a donc qw = > W M M W et E(
qw ) = E(tr(> W M W )) = E(tr(W M W > )) =
2
2 = qw /(O
tr(W M W )) = tr(M ). Lestimateur sans biais de 2 est donc
N K), alors que celle renvoye par le logiciel est : qw /(O K 1). La matrice de
covariance des coefficients renvoye doit donc tre multiplie par (O K 1)/(O
N K).
Le modle within est galement appel modle effets fixes, car il est quivalent
un modle linaire dans lequel les effets individuels sont estims et donc considrs
comme des paramtres fixes. Ce dernier modle scrit :
y = X + (IN jT ) +
o est dsormais un vecteur de paramtres estimer, il y a donc au total N + K
paramtres estimer. Lestimation du modle sous cette forme est possible si N
nest pas trop grand. En revanche, sur un panel micro de grande taille, elle devient
rapidement impossible.
Lquivalence entre les deux modles peut tre tablie en utilisant le thorme de
Frish-Waugh ou en utilisant la formule de linverse dune matrice partitionne.
Le thorme de Frish-Waugh indique quil est quivalent destimer y en fonction
dun ensemble de variables explicatives X1 , X2 ou destimer les rsidus destimation
de y en fonction de X2 en fonction des rsidus destimation de X1 en fonction de
X2 . Lapplication du thorme de Frish-Waugh dans notre contexte consiste
rgresser chaque variable par rapport X2 = IN jT et rcuprer les rsidus.
Ici, pour chaque observation, le rsidu scrit znt n . Or, la condition de premier
ordre de la minimisation de la somme des carrs des rsidus est X2> = 0. Or,
23
X2 tant ici une matrice qui slectionne les individus, on obtient pour chaque
individu :
T
X
t=1
(znt n ) =
T
X
znt T n = 0
t=1
Par consquent, on a n = zn. et les rsidus destimation sont donc les carts
de la variable par rapport sa moyenne individuelle. Par consquent, daprs le
thorme de Frish-Waugh, le modle effets fixe peut tre estim en appliquant
lestimateur des moindres carrs ordinaires aux variables transformes en cart par
rapport la moyenne individuelle, cest--dire en estimant par les moindres carrs
ordinaires W y en fonction de W X.
La diffrence entre les deux estimations est que, dans le second cas, les effets
individuels ne sont pas directement estims. On peut malgr tout les rcuprer
n = yn. x
>
n.
Dans le cas o on souhaite dfinir les effets individuels comme tant de moyenne
nulle dans lchantillon, on dfinit la constante gnrale
= y x
> et on obtient
)>
pour chaque individu de lchantillon n =
n
= (
yn. y) (
xn. x
2.3
2.3.1
Dans le cas o les erreurs sont non corrles avec les variables explicatives mais
sont caractrises par une matrice de covariance qui nest pas un multiple de la
matrice identit, lestimateur adapt est celui des moindres carrs gnraliss. Cet
estimateur scrit :
gls = Z > 1 Z
1
Z > 1 y
(2.26)
1
Z > 1
=
=
1 > 1
1
X > 1 X
X E > 1 X X > 1 X
1
X > 1 X
(2.27)
Les hypothses faites dans ce chaptre concernant les termes derreur induisent que
la matrice de covariance des erreurs est donne par (2.12), (2 W + (T 2 +2 )B)
24
qui ne dpend que de deux paramtres, les variances des deux composantes du
terme derreur (2 et 2 ). Nous avons montr dans le chaptre 1 que ces deux
matrices sont idempotentes (BB = 0 et W W = 0) et orthogonales (BW = 0).
Lexpression des puissances de est alors particulirement simple :
r = T 2 + 2
r
B + 2 W
(2.28)
que lon peut aisment vrifier par exemple pour r = 2. Ce rsultat est galement
valable pour r < 0 et r rationnel, on a ainsi :
1 =
1
1
B + 2W
T 2 +
1
1 >
1 >
1 >
1 >
Z
W
Z
+
Z
BZ
Z
W
y
+
Z
By
2
2
2
2
1
1 >
1 >
Z W Z + 2 Z BZ
V (
gls ) =
2
(2.29)
(2.30)
gls =
gls
1
1 >
1 >
X W y + 2 X (B J)y
2
(2.31)
1
1 >
1
=
X W X + 2 X > (B J)X
(2.32)
2
1 >
1
X W X + 2 X > (B J)X
2
T +
25
Lestimateur des moindres carrs gnraliss peut alors tre obtenu en estimant
par la mthode des moindres carrs ordinaires un modle pour lequel toutes les
variables (explicatives et explique) ont t transformes en les pr-multipliant par
0.5 , ou plus simplement 0.5 . En notant 2 = T 2 + 2 et = , cette
transformation consiste en une combinaison linaire des transformations between
et within de la variable, les pondrations tant respectivement de et de 1. Par
consquent, la variable transforme scrit :
xnt =
xn. + (xnt x
n. ) = xnt (1 )
xn.
Pour estimer ce modle, il faut connatre le paramtre de la transformation =
2 2 , qui dpend des variances des deux composantes du terme derreur, ou
T +
1+T
2.3.2
(2.33)
2
T
T
1X
1X
nt = n +
nt
T t=1
T t=1
1 2
= 12 /T
T
La variance de lcart par rapport la moyenne individuelle sobtient plus facilement en isolant les termes en nt :
V (
n. ) = 2 +
T
1X
1
1X
nt n. = nt
nt = 1
nt
st
T t=1
T
T
s6=t
1
1
T
2
2 +
1
(T 1)2
T2
26
V (nt n. ) =
T 1 2
12 = T
PN
2n.
n=1
N
PN
=T
n=1
PT
2n.
t= 1
T =T
PT
> B
> B
T =
N
N
and
T
=
T 1
n=1
PT
(nt n. )
T =
N
t=1
n=1
(nt n. )
> W
=
N (T 1)
N (T 1)
t=1
cest--dire des estimateurs bass sur les normes des erreurs transformes avec les
oprateurs between et within.
Les erreurs ne sont bien entendu pas observes, mais une estimation convergente
des variances estimes peut tre obtenue en remplaant les erreurs par les rsidus
obtenus dans le cadre dune estimation convergente du modle. Parmi les nombreux
estimateurs de ce type envisageables, le plus courament utilis est celui de Swamy
& Arora (1972). Il consiste utiliser les rsidus du modle between pour estimer
2 :
2 =
> B
N K 1
2 =
> W
N (T 1) K
2 =
2.4
2
2
T
27
Nous commencerons par analyser les relations existant entre ces diffrents estimateurs, puis nous comparerons leurs variances.
2.4.1
On peut sattendre ce que les estimateurs des mco et des mcg donnent des
rsultats intermdiaires entre les estimateurs within et between dans la mesure o
ils intgrent les deux sources de variabilit. A partir de lquation (2.31), on peut
crire lestimateur des moindres carrs gnraliss sous la forme suivante :
1
En utilisant (2.20) et (2.24), on peut alors exprimer mcg comme une moyenne
pondre des estimateurs within et between.
1
b
X > W X w + 2 X > (B J)X
Il en est de mme pour lestimateur des moindres carrs ordinaires mco qui correspond au prcdent dans le cas particulier o = 1.
X 1 X > W X w + X > (B J)X
b
mco = X > W X + X > (B J)
Dans le cas de lestimateur des mco, les pondrations sont trs intuitives puisquil
sagit des parts de la variance observe intra et inter-individuelle. Dans le cas du
modle des mcg, les pondrations intgrent non seulement la part des variances
des variables explicatives, mais galement celle des variances des erreurs, via le
paramtres . De manire gnrale ( 1), ce modle accorde moins de poids
la dimension between que le prcdent et admet deux cas particuliers :
0 ; cela signifie que est petit par rapport . Dans ce cas, lestimateur
des mcg converge vers lestimateur within,
1 ; cela signifie que est grand par rapport . Dans ce cas, lestimateur
des mcg converge vers lestimateur des mco.
La relation entre les diffrents estimateurs peut galement tre illustre par le fait
que lestimateur des mcg peut tre obtenu en empilant les deux transformations
within et between du modle :
Wy
WZ
W
=
+
(2.34)
By
BZ
B
La matrice de covariance des erreurs de ce modle empil est :
2
W
0
0
2 B
(2.35)
28
2.4.2
2.5
Exemples dapplication
La librairie plm fournit la fonction plm qui permet destimer les estimateurs dcrits
dans ce chaptre.
2.5.1
plm
29
assets
1.0286
> summary(banks.random)
Max.
4.1800
Coefficients :
Estimate Std. Error t-value Pr(>|t|)
(Intercept) -0.295205
0.100583 -2.9349 0.003386 **
assets
1.028565
0.007185 143.1548 < 2.2e-16 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Total Sum of Squares:
823.87
Residual Sum of Squares: 57.375
R-Squared
: 0.93036
Adj. R-Squared : 0.92915
F-statistic: 20493.3 on 1 and 1534 DF, p-value: < 2.22e-16
30
1
2
3
4
5
6
-0.4088325 -0.4814600 -0.4840704 -0.4333303 -0.4761411 -0.4434490
2
3
4
5
6
7
-0.07262754 -0.07523796 -0.02449779 -0.06730860 -0.03461650 -0.19118140
1
2
3
0.061133962 -0.011493577 -0.014104000
4
5
0.036636176 -0.006174642
6
0.026517461
31
(Intercept)
-0.40883248
pooling
within
between
random
1.0063604 1.0411285 0.9816273 1.0285650
[1] 0.415674
[1] 1.00636
T <- 12
N <- 128
siota2 <- deviance(banks.between) * T / (N - 2)
snu2 <- deviance(banks.within) / (N * (T - 1) - 1)
phi <- sqrt(snu2 / siota2)
32
On peut alors calculer les pondrations et lestimation pour le modle des moindres
carrs gnraliss :
> pondW <- SxxW / (SxxW + phi^2 * SxxB)
> pondW * coef(banks.within)[["assets"]] +
+
(1 - pondW) * coef(banks.between)[["assets"]]
[1] 1.028565
Enfin, les rsultats semblent indiquer que nous sommes dans le cas o lhypothse
dabsence de corrlation entre les effets individuels et la variable explicative est
vrifie. Dans ce cas, les quatre modles sont convergents et il doivent donner des
rsultats relativement proche, ce qui est le cas ici.
2.5.2
Mme sils ont peut dintrt pratique, les modles conomtriques pertinents
contenant en gnral plusieurs variables explicatives, les modles linaires simples
ont un intrt pdagogique vident car ils permettent la reprsentation graphique
des chantillons et des modles sous la forme de nuages de points et de droite de
rgression. Ils permettent en particulier de bien comprendre les relations entre les
diffrents estimateurs. Nous analyserons successivement 4 jeux de donnes.
Le premier, appel ForeignTrade a t utilis par Kinal & Lahiri (1993) pour
construire un modle complet du commerce extrieur pour les pays en dveloppement qui sera prsent dans le chaptre 6. Pour linstant, nous analyserons simplement la relation entre les importations (imports) et le produit intrieur (gnp).
Les deux variables sont en logarithmes et sont exprimes par habitant.
Les instructions suivantes crent un pdata.frame , en extrait la variable explicative et y applique la mthode summary qui calcule la dcomposition de sa variance.
Pour estimer tous les modles, on cre tout dabord un vecteur contenant les noms
de ces modles, puis on utilise la fonction sapply de manire extraire de ces
diffrents modles estims le coefficient associ la variable explicative.
> data("ForeignTrade", package = "pder")
> FT <- pdata.frame(ForeignTrade)
> summary(FT$gnp)
33
random.gnp between.gnp
0.76815599 0.04870833
Fig. 2.1 Importations en fonction du produit intrieur pour les donnes ForeignTrade
Les donnes TurkishBanks ont t utilises par El-Gamal & Inanoglu (2005) afin
danalyser les cots de production des banques. On estime le cot en fonction de
la production, les deux variables tant en logarithmes. En appliquant les mmes
calculs que pour lexemple prcdent, on obtient :
> data("TurkishBanks", package = "pder")
> TurkishBanks <- na.omit(TurkishBanks)
> TB <- pdata.frame(TurkishBanks)
34
> summary(log(TB$output))
bon
var std.dev share
idiosyncratic 0.3291 0.5737 0.604
individual
0.2156 0.4643 0.396
theta :
Min. 1st Qu. Median
Mean 3rd Qu.
0.6192 0.6509 0.6509 0.6474 0.6509
Max.
0.6509
bon
within.log(output) pooling.log(output)
0.5063813
0.8006578
random.log(output) between.log(output)
0.6470472
0.8531416
35
21
20
19
18
17
16
15
14
16
17
18
19
20
21
22
within.log(output) pooling.log(output)
2.6325286
1.1804164
random.log(output) between.log(output)
1.2259868
0.8688903
36
14
13
12
11
10
7.5
8.0
8.5
9.0
9.5
10.0
Le dernier jeu de donne est DemocracyIncome25 utilis par Acemoglu, Johnson, Robinson & Yared (2008). Les donnes concernent 25 pays et 7 observations
de 25 ans pour la priode 1850 2000. Les auteurs analysent la relation causale
dynamique entre le niveau de richesse dun pays et le degr de dmocratie. Leur
analyse sera reproduite en dtail dans le chaptre 7. Dans limmdiat, nous analyserons simplement la relation entre le niveau de dmocratie et le revenu retard
dune priode.
> data("DemocracyIncome25", package = "pder")
> DI <- pdata.frame(DemocracyIncome25)
> summary(lag(DI$income))
37
random.lag(income) between.lag(income)
0.2100902
0.2891701
1.0
0.8
0.6
0.4
0.2
1.9
2.0
2.1
2.2
Fig. 2.4 Dmocratie en fonction du revenu retard pour les donnes DemocracyIncome25
2.6
Les proprits des estimateurs sont souvent difficiles, voir impossible tablir
analytiquement. Dans ce cas, il est intressant davoir une approche par simulation
(approche dite de Monte-Carlo). Cette approche comporte plusieurs tapes :
on commence par dfinir parfaitement la manire dont les chantillons sont
gnrs,
on cr ensuite un grand nombre dchantillons laide dun gnrateur de
nombres alatoires,
on calcule pour chaque chantillon une statistique,
on sintresse la distribution de cette statistique (sa moyenne par exemple).
La fonction ci-dessous permet de gnrer un chantillon avec N individus et T
priodes, pour des carts-types des deux composantes du terme derreur donns,
38
1
2
3
4
5
6
id
y x
1 8.053460 7
1 8.420634 8
1 9.509192 9
2 10.725954 10
2 11.025958 11
2 11.940134 12
Pour mener bien nos simulations, on commence par dfinir la dimension de notre
panel, ici T = 4 et N = 100, ainsi que les carts-types des deux composantes du
terme derreur.
>
>
>
>
>
set.seed(4)
T <- 4
N <- 100
s.nu <- 0.6
s.eta <- 0.4
On a donc une variance totale pour les erreurs de 2 + 2 = 0.62 + 0.42 = 0.52 et
0.6
= 0.6.
le paramtre est ici gal : = 2 2 = 40.4
2 +0.6
T +
39
+
z$By <- tapply(z$y, z$id, mean)[as.character(z$id)]
+
O <- lm(y ~ x, z)
+
W <- lm(I(y - By) ~ I(x - Bx), z)
+
B <- lm(By ~ Bx, z)
+
s2.nu <- deviance(W) / (N * T - N - 1)
+
s2.lambda <- deviance(B) / (N - 2)
+
theta <- sqrt(s2.nu / s2.lambda)
+
G <- lm(I(y - (1 - theta) * By) ~ I(x - (1 - theta) * Bx), z)
+
result <- rbind(result,
+
c( coef(O)[2],
+
coef(B)[2],
+
coef(W)[2],
+
coef(G)[2]
+
)
+
)
+ }
> colnames(result) <- c("ols", "between", "within", "gls")
Pour vrifier que les estimateurs sont non-biaiss, on calcule la moyenne des valeurs
obtenues pour chaque estimateur.
> apply(result, 2, mean)
ols
between
within
gls
0.9968929 0.9966218 0.9972462 0.9969072
ols
between
within
gls
0.04940275 0.07565773 0.05477897 0.04486814
Lestimateur between est le moins prcis, ce qui nest pas surprenant car il est
estim sur seulement les N moyennes individuelles. Lestimateur des mcg est nettement plus prcis que celui des mco. Enfin, la prcision de lestimateur within est
moins bonne que celle de lestimateur mcg.
Enfin, on peut vrifier graphiquement (figure 2.5) pour un estimateur (par exemple
celui des mcg) que la distribution de lestimateur est proche de la normale.
> hist(result[, "gls"], probability = TRUE, ann = FALSE)
> curve(dnorm(x, mean = mean(result[, "gls"]),
+
sd = sd(result[, "gls"])), add = TRUE)
10
40
0.90
0.95
1.00
1.05
1.10
Chapitre 3
Le modle erreurs
composes : extensions
3.1
Lorsque lon souhaite intgrer des effets spcifiques chaque priode, on doit
considrer le modle suivant :
ynt = + xnt + n + t + nt
3.1.1
Les hypothses faites sur leffet temporel sont en tous points similaires celles que
lon a faites sur leffet individuel :
est desprance nulle et homoscdastique, on note 2 sa variance,
les effets temporels ne sont pas corrls entre eux E(t s ) = 0 t 6= s,
les effets temporels ne sont corrls ni avec les effets individuels, ni avec lerreur
idiosyncratique.
Avec ces hypothses, la matrice de covariance des erreurs scrit dsormais :
= 2 IN T + 2 IN JT + 2 JN IT
Comme dans le cas du modle erreurs composes avec effet individuel, on cherche
lexpression de la dcomposition spectrale de cette matrice qui est une combinaison
linaire de matrices idempotentes et orthogonales. A cet effet, on note :
1
JN T
Bn = IN JT /T , Bt = JT IN /N et J =
NT
Bn x renvoie comme prcdemment la moyenne individuelle x
n. , Bt x la
la moyenne globale de x
. Enfin, la matrice within
moyenne x
.t temporelle et Jx
42
doit ici raliser une double diffrence par rapport aux moyennes individuelles et
:
temporelles : xnt x
n. x
.t + x
W = I Bn Bt + J
Avec ces notations, on obtient :
= 2 W + (T 2 + 2 )Bn + (N 2 + 2 )Bt 2 J
On vrifie aisment que les diffrentes matrices sont idempotentes. En revanche,
on a Bn Bt = J 6= 0. En effet, le produit de ces deux matrices conduit calculer la moyenne temporelle des moyennes individuelles, ce qui renvoie la moyenne
n = Bn J et B
t = Bt J qui renvoient
globale. Pour cette raison, on utilise B
respectivement les moyennes individuelles et temporelles en cart par rapport la
moyenne globale. En regroupant les termes, on obtient finalement :
n + (N 2 + 2 )B
t + (T 2 + N 2 + 2 )J
= 2 W + (T 2 + 2 )B
Soit encore, en notant n = (T 2 + 2 )0.5 , t = (N 2 + 2 )0.5 et j = (T 2 +
N 2 + 2 )0.5 :
1
n /2n + B
t /2 + J/
2
=W +B
t
j
2
3.1.2
Comme dans le cas du modle effets individuels, le modle effets fixes peut
tre obtenu de deux manires diffrentes :
en estimant le modle par les moindres carrs ordinaires en introduisant dans
lestimation des variables indicatrices des individus et des priodes,
en estimant le modle par les moindres carrs ordinaires en introduisant dans
lestimation les variables transformes en cart par rapport aux moyennes individuelles et temporelles : znt zn. z.t + z.
Pour le modle des moindres carrs gnraliss, on transforme les variables du
modle en les prmultipliant par 0.5 ou plus simplement par 0.5 :
n + t B
t + j J
0.5 = W + n B
En regroupant les termes, on obtient la transformation ralise par la pr-multiplication
des variables du modle par cette matrice :
znt
= znt (1 n )
xn. (1 t )
x.t + (1 n t + j )x
3.1.3
Application
43
Les parts des trois composantes du terme derreur sont dsormais de 14% pour la
composante individuelle et 23% pour la composante temporelle.
Les effets individuels sont extraits du modle effets fixes laide de la fonction fixef laquelle on peut ajouter un second argument effect qui est gal
"individual" par dfaut et que lon peut fixer "time" pour extraire les effets
fixes temporels :
> fixef(rice.wd, effect = "time")
1
2
3
4
5
6
5.914708 5.842072 5.716913 5.544581 6.076116 6.038450
3.2
On rappelle que lestimateur de Wallace & Hussain (1969) est bas sur lestimation
du modle par la mthode des moindres carrs ordinaires. On a alors :
12 = T
N
X
e2n. /N
n=1
2 =
N X
T
X
(ent en. )2 /(N (T 1))
n=1 t=1
= y w x
ent = ynt
w xnt
44
12 = T
N
X
e2n. /N
n=1
2 =
N X
T
X
(ent en. )2 /(N (T 1)))
n=1 t=1
Pour lestimateur de Swamy & Arora (1972), on utilise deux estimations, celles du
modle within et du modle between.
2 =
T
N X
X
2
ew
nt /(N (T 1) K)
n=1 t=1
12 = T
N
X
ebnt /(N K 1)
n=1
Enfin, pour lestimateur de Nerlove (1971), on calcule lestimateur de 2 en calculant les effets individuels partir du modle within :
n = yn. w x
n.
2 =
N
X
(
n
)2 /(N 1)
n=1
2 =
N X
T
X
e2nt /(N T )
n=1 t=1
walhus
swar
amemyia
nerlove
(Intercept)
5.312634
5.312310
5.311825
5.302849
45
On constate que les diffrences entre les modles sont trs faibles, lestimateur de
Nerlove (1971) tant malgr tout un peu diffrent des autres. Cela est confirm en
analysant la transformation ralise avec cet estimateur :
> ercomp(rice.ne)
La part estime de leffet individuel dans lerreur est bien plus leve avec cet
estimateur quavec les autres (26% contre 10%) et par consquent les donnes sont
transformes en soustrayant une part plus importante de la moyenne individuelle
des variables.
3.3
46
I X(X > X)1 X > W I X(X > X)1 X >
Soit :
E(
qw )
=
n N tr (X > W X)(X > X)1 2
+ tr (X > U X)(X > X)1 (X > W X)(X > X)1 2
E(
qw )
Pour la seconde forme quadratique, qui utilise la matrice between, lesprance est :
E(
qb ) = tr
I X(X > X)1 X > B I X(X > X)1 X >
Soit encore :
E(
qb )
= N tr (X > X)1 (X > BX) 2
+
n + tr (X > U X)(X > X)1 (X > BX)(X > X)1 2tr (X > U X)(X > X)1
Swamy et Arrora
Ici, qw est calcul partir des rsidus within et qb partir des rsidus between.
Les deux matrices de trnansformation sont :
ew = W W X > (X > W X)1 X > W = Aw
eb = B BX > (X > BX)1 X > B = Ab
qw est calcul partir des rsidus within. On a alors :
>
qw = > A>
W W X(X > W X)1 X > W
w W Aw =
et donc :
E(
qw ) = (n N K)2
qb est calcul partir des rsidus between. On a alors :
>
qb = > A>
B BX(X > BX)1 X > B
B BAB =
et
E(
qb ) = (N K 1)2 + n tr (X > BX)1 (X > U X)
47
Le calcul des estimateur des variances est donc ici particulirement simple puisque
w .
avec
= y X
On a donc :
w
ea = (y y) (X X)
(3.1)
(3.2)
= (y y) (X X)
(3.3)
ew = + (X X)(X
W X)1 X >
En notant Jn la matrice dont tous les termes sont gaux 1/n, on obtient finalement lexpression de la matrice Aa qui transforme les erreurs du modles en les
rsidus dAmemyia :
Aa = (I Jn ) I X(X > W X)1 X > W
48
>
>
On a qw = e>
b = e>
a W ea = Aa W Aa et q
a Bea = Aa BAa .
>
1
Comme W U = 0, tr(W ) = n N , tr(W X(X W X) W > W ) = K lesprance de
la premire forme quadratique scrit simplement :
E(
qw ) = (n N K)2
Pour E(
qb ), notons que les matrices ayant aux extrmits B ou Jn dun ct et W
de lautre ont une trace nulle. On a donc :
E(
qb ) = tr(B Jn ) + tr W X(X > W X)1 (B Jn )X(X > W X)1 X > W 2 + (B Jn )U
Soit finalement :
X
E(
qb ) = (N 1+tr (X > W X)1 (X > BX) tr (X > W X)1 (X > Jn X) 2 + n
T n2 /N
n
3.3.1
Application
Pour illustrer lestimation dun panel non cylindr, nous utilisons les donnes Tileries qui concernent la production de carreaux en Egypte ; 25 entreprises sont
observes, le nombre dobservations variant entre 12 et 22.
> data("Tileries", package = "pder")
> head(Tileries, 3)
1
2
3
id week
area
output
labor machine
2
1 fayoum 5.650487 4.532599 4.663439
2
2 fayoum 6.522328 5.347108 4.234107
2
3 fayoum 6.302619 4.969813 4.234107
> pdim(Tileries)
bon
> summary(tile.r)
49
Max.
0.5992
Residuals :
Min.
1st Qu.
-0.187000 -0.027300
3rd Qu.
0.033400
Median
0.003070
Mean
0.000007
Max.
0.227000
Coefficients :
Estimate Std. Error t-value Pr(>|t|)
(Intercept) 0.278203
0.060791 4.5764 6.032e-06 ***
log(labor)
0.908630
0.030048 30.2390 < 2.2e-16 ***
log(machine) 0.023965
0.027062 0.8856
0.3763
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Total Sum of Squares:
4.8402
Residual Sum of Squares: 1.2969
R-Squared
: 0.73206
Adj. R-Squared : 0.72751
F-statistic: 655.722 on 2 and 480 DF, p-value: < 2.22e-16
3.4
50
2
>
ynt xnt n
21
1
e
f (ynt | n ) =
2
Pour une valeur donne de , la distribution de yn = yn1 , . . . , ynT est celle dun
vecteur de variables alatoires indpendantes, la distribution jointe est donc simplement le produit des densits individuelles :
f (yn | n ) =
1
22
T2n
e
212
PTn
t=1
f (yn ) = q
22
f (yn | n )e
12
2
d = q
22
1
22
T2n Z
e 2 A d
2
1
+ 2 = 2
2
X
1n
2
A=
2T
+
nt 2
n
n.
2
2
t
t=1
!
2
2
1 1n
1 X 2
2 2
A= 2
T n.
+ 2
nt Tn n. 2
1n
1n
t
:
notant n = 1n
f (yn ) =
1
22
T2n
n e
1n
d
212
P
2
1n
Or :
X
t
X
X
2
2
=
2nt Tn (1 2n )
2n. =
(nt (1 n )
n. )
2
1n
t
t
f (yn ) =
1
22
T2n
n e
212
51
n. )2
t (nt (1n )
Tn
1
1 X
Tn
2
ln 2
ln 2 + ln 2n 2
(nt (1 n )
n. )
2
2
2
2 t
Tn
ln 2
Tn
ln 2 +
1X
1 XX
2
(nt (1 n )
n. )
ln 2n 2
2 n
2 n t
ln L =
NT
NT
N
1 XX
2
ln 2
ln 2 +
ln 2 2
(nt (1 )
n. )
2
2
2
2 n t
(nt (1 )
n. ) =
XX
(nt n. ) + 2
(3.4)
ln L
NT
1
= 2 + 4 > W + 2 > B
2
2
2
(3.5)
N > B
ln L
= 2
2
2 22
(3.6)
1
= X > X
X > y
(3.7)
2 =
> W + 2 > B
NT
(3.8)
52
> W
(T 1)
> B
(3.9)
> library(pglm)
> rice.ml <- pglm(log(goutput)~log(seed)+log(totlabor)+log(size), Rice, family = gaussian)
> summary(rice.ml)
On constate que les rsultats sont trs similaires ceux obtenus avec les moindres
carrs gnraliss. Les deux paramtres appels "sd.eps" et "sd.mu" sont les
carts-type estims de la composante idiosyncratique de lerreur et de leffet individuel. L aussi, les valeurs obtenues sont quasiment identiques celles du modle
des moindres carrs gnraliss.
3.5
3.5.1
53
Trs souvent en conomie, le phnomne tudier nest pas dcrit par une quation,
mais par un systme dquations. Cest en particulier le cas en micro-conomie de la
consommation ou de la production. Par exemple, le comportement dun producteur
sera caractris par une quation de cot, une quation de demande de travail et
une quation de demande de capital. Il est dans ce cas prfrable de considrer le
systme dquations dans son intgralit pour deux raisons :
tout dabord, les termes derreur des diffrentes quations peuvent tre corrls
entre eux. Dans ce cas, mme si lestimation dune quation isole est convergente, elle est inefficace car elle ne prend pas en compte la corrlation des erreurs ;
ensuite, la thorie conomique impose parfois des restrictions sur diffrents coefficients du systme, par exemple lgalit de deux coefficients appartenant
deux quations diffrentes du systme. Dans ce cas, ces restrictions doivent tre
prises en compte en utilisant la mthode des moindres carrs contraints.
3.5.2
1
1
1 1 0
2 =
1 0 1
0
3
Pour calculer lestimateur des mco contraints, on forme le lagrangien :
L = e> e + 2> (R q)
avec e = y X et le vecteur des multiplicateurs de Lagrange associes aux
diffrentes contraintes 2 . En dveloppant, on obtient :
L = y > y 2 > X > y + > X > X + 2(R q)
Les conditions de premier ordre scrivent :
L
= 2X > y 2X > X + 2R> = 0
L
= 2(R q) = 0
2. Ces multiplicateurs de Lagrange sont multiplis par deux pour simplifier les conditions de
premier ordre.
54
X X R>
X y
=
R
0
q
Lestimateur des moindres carrs contraints sobtient en utilisant la formule de
linversion dune matrice partitionne.
A11
A21
A12
A22
1
=
B11
B21
B12
B22
=
1
1
A1
11 (I + A12 F2 A21 A11 ) A11 A12 F2
1
F2 A21 A11
F2
1
et F1 = A11 A12 A1
.
22 A21
>
1 > 1
On a ici F2 = R(X X) R
. Lestimateur contraint scrit alors : c =
>
>
B11 X y + B12 q, avec B11 = (X X)1 I R> (R(X > X)1 R> )1 R(X > X)1
1
et B12 = (X > X)1 R> R(X > X)1 R>
1 >
Lestimateur non-contraint tant nc = X > X
X y, on obtient finalement :
avec F2 = A22 A21 A1
11 A12
1
3.5.3
y1
X1 0 . . . 0
y2 0 X2 . . . 0
.. = ..
..
..
..
. .
.
.
.
yL
...
XL
= Xl l + l , avec l = 1 . . . L.
1
2
..
.
1
2
..
.
L
= E(> ) = E
1 >
1
2 >
1
..
.
1 >
2
2 >
2
..
.
...
...
..
.
1 >
L
2 >
L
..
.
L >
1
L >
2
...
L >
L
On supposera que les erreurs dun mme individu pour deux quations l et m sont
corrles et que la covariance, note lm , est constante. Dans ce cas, la matrice de
55
covariance scrit :
11 I
12 I
..
.
12 I
22 I
..
.
...
...
..
.
1L I
2L I
..
.
1L I
2L I
...
LL I
11
12
..
.
12
22
..
.
...
...
..
.
1L
2L
..
.
1L
2L
...
LL
=I
Du fait de la corrlation inter-quations, lestimateur efficace est celui des moindres
1 > 1
carrs gnraliss, qui scrit : = X1 X
X y. Cet estimateur, dvelopp par Zellner (1962) est connu par lacronyme sur pour seemingly unrelated
regression.
Il peut tre obtenu en appliquant lestimateur des moindres carrs ordinaires sur
les donnes transformes en pr-multipliant chaque variable par la matrice 0.5 .
Du fait de la structure d, cette matrice scrit simplement : 0.5 = 0.5 I. En
notant rlm les lments de 0.5 , la variable explique et les variables explicatives
transformes sont :
y =
et X =
r11 X1
r21 X1
..
.
r12 X2
r22 X2
..
.
...
...
..
.
r1L XL
r2L XL
..
.
rL1 X1
rL2 X2
...
rLL XL
Dans les faits, est une matrice de paramtres inconnus. Ceux-ci peuvent tre estims en utilisant les rsidus dune estimation convergente, mais inefficace, comme
celle des moindres carrs ordinaires. On obtient alors lestimateur en suivant les
tapes suivantes :
tout dabord, on estime chaque quation sparment par les mco et on note
E = (e1 , e2 , . . . , eL ) la matrice de dimension N N dont chaque colonne est le
vecteur de rsidus dune des quations du systme,
= E > E/N ,
ensuite, on estime la matrice de covariance des erreurs :
0.5
on calcule la matrice
et on lutilise pour transformer les variables du
modle y et X ,
enfin, on estime le modle par les moindres carrs sur les variables transformes.
56
3.5.4
Donnes de panel
Lapplication du modle sur aux donnes de panel ne pose pas de difficults particulires dans le cas o seule la variation between ou within des donnes est prise
en compte. Dans ce cas, il suffit simplement dappliquer les formules prcdentes
en utilisant les variables en moyennes individuelles (between-sur) ou en cart par
rapport aux moyennes individuelles (within-sur). La prise en compte des deux dimensions de la variabilit des donnes demande davantage dattention et conduit
au modle sur erreurs composes propos par Avery (1977) et Baltagi (1980).
Les erreurs du modles prsentent alors deux sources de corrlation :
la corrlation prise en compte dans le modle sur, cest--dire les corrlations
inter-quations,
la corrlation prise en compte dans le modle erreurs composes, cest--dire
les corrlations intra-individuelles.
Chaque observation est maintenant caractrise par trois indices : zlnt reprsente
lobservation de z pour la lime quation, le nime individu la time priode.
Les observations sont ranges dabord par quation, puis par individu. En notant
>
>
>
ime quation et le nime
>
ln = (ln1 , ln2 , . . . , lnT ) le vecteur derreurs pour la l
individu, on obtient :
E(ln >
mn ) = lm IT + lm JT
Labsence de corrlation entre erreurs associes des individus diffrents implique
la matrice suivante de corrlation pour deux quations et pour lensemble des
individus :
E(l >
m ) = IN (lm IT + lm JT )
= lm IN T + lm IN JT
= lm (W + B) + T lm B
= lm W + (lm + T lm )B
= lm W + 1lm B
Finalement, pour lensemble du systme dquations, on obtient, en notant et
1 les deux matrices de dimensions L L contenant les paramtres lm et 1lm ,
la matrice de covariance des erreurs suivantes :
= W + 1 B
Le modle sur erreurs composes peut tre obtenu en appliquant les moindres
carrs ordinaires sur les donnes transformes en pr-multipliant chaque variable
par 0.5 . Cette matrice scrit :
0.5 = 0.5
W + 10.5 B
(3.10)
1
et peut tre estime en utilisant les dcompositions de Cholesky de 1
et de 1
(voir Kinal & Lahiri, 1990).
Les deux matrices de covariance des erreurs tant inconnues, lestimateur sur
erreurs composes est obtenu en suivant les tapes suivantes :
57
1
qui est utilise pour obtenir les variables transformes y et X ,
enfin, on estime le modle par les moindres carrs sur les variables transformes.
3.5.5
Application
Une application classique du modle sur est lanalyse des cots de production.
La fonction de cot indique le cot minimum de production C compte tenu du
vecteur de prix des K facteurs de production p> = (p1 , p2 , . . . , pK ) et du niveau
de production q. La fonction de cot minimum scrit C(p, q). Elle vrifie plusieurs
proprits :
elle est homogne de degr 1 par rapport aux prix des facteurs : C(p, q) =
C(p, q),
les fonctions de demande de facteurs de production sont obtenues par drivation
du cot minimum par rapport aux prix des facteurs 3 , il sagit donc du gradient
de la fonction de cot : C
p (p, q) = x(p, q)
la matrice hessienne de la fonction de cot est symtrique :
2C
pi p>
j
2C
.
pi p>
j
PK
= 0 + q ln q + i=1 i ln pi
PK PK
+ 0.5qq ln2 q + 0.5 i=1 j=1 ij ln pi ln pj
PK
= 0 + q ln q + i=2 i ln pp1i
PK PK
p
+ 0.5qq ln2 q + 0.5 i=2 j=2 ij ln pp1i ln p1j
pi x i
ln C
C pi
Le lemme de shepard implique que : ln
pi = pi C = C = si , cest--dire que la
drive logarithmique du cot par rapport un prix est gale la part du facteur
58
ln C
pj
= j + jj ln
+
ln pj
p1
K
X
i=2&i6=j
ij ln
pi
p1
Il est dusage de rapporter chaque prix et la production la moyenne de lchantillon ; dans ce cas ln q et ln pi sont nuls la moyenne de lchantillon, ce qui donne
un sens intuitif aux coefficients de premier ordre. q est en effet llasticit du cot
par rapport la production la moyenne de lchantillon et i la part du facteur
i dans le cot de production la moyenne de lchantillon.
Les donnes utilises concernent le cot de production de 10 producteurs dlectricit du Texas pour 18 ans (de 1966 1983). Elles ont t utilises par Kumbhakar
(1996), Horrace & Schmidt (1996) et Horrace & Schmidt (2000). Trois facteurs de
production sont utiliss, le carburant, le travail et le capital. Pour chaque facteur,
on dispose des prix unitaires (pfuel, plab et pcap) et des dpenses (expfuel,
explab et expcap).
On commence par caluler les prix en logarithmes, en les divisant par la moyenne
de lchantillon et en les divisant galement par un des prix, par exemple le prix
du carburant :
>
>
>
>
On calcule ensuite le cot total de production en sommant les dpenses pour les
trois facteurs, puis les parts de facteurs et enfin on mesure le cot en logarithme
en le divisant par sa moyenne de lchantillon et par le prix de rfrence.
>
>
>
>
+ explab + expcap)
/ C)
/ C)
mean(C)) - pf)
On calcule enfin les carrs et les effets intractifs des diffrentes variables.
>
>
>
>
On dfinit les trois quations du systme, une pour le cot total et les deux autres
pour les parts de facteur 4 .
4. La part du facteur carburant est omise car, les trois parts se sommant 1, lintroduire dans
le systme gnrerait une colinarit parfaite.
59
Les parts de facteur tant drives de la fonction de cot, les restrictions suivantes
doivent tre imposes :
le coefficient de pl dans lquation de cot doit tre gal la constante de
lquation de part de travail,
le coefficient de pk dans lquation de cot doit tre gal la constante de
lquation de part de capital,
le coefficient de pll dans lquation de cot doit tre gal au coefficient associ
pl dans lquation de part de travail,
le coefficient de pkk dans lquation de cot doit tre gal au coefficient associ
pk dans lquation de part de capital,
le coefficient de plk dans lquation de cot doit tre gal au coefficient associ
pk dans lquation de part de travail et celui associ pl dans celle de part
de capital,
Ces restrictions (au nombre de 7) sont dfinie laide de la matrice R ci-dessous :
> R <- matrix(0, nrow = 6, ncol = 14)
> R[1, 2] <- R[2, 3] <- R[3, 5] <- R[4, 6] <- R[5, 6] <- R[6, 7] <- 1
> R[1, 9] <- R[2, 12] <- R[3, 10] <- R[4, 11] <- R[5, 13] <- R[6, 14] <- -1
60
***
***
***
***
***
***
***
*
0.1 1
- shlab
Estimate Std. Error t-value Pr(>|t|)
(Intercept) 0.2238329 0.0074131 30.194 < 2.2e-16 ***
pl
0.0845448 0.0075629 11.179 < 2.2e-16 ***
pk
-0.0877305 0.0076570 -11.458 < 2.2e-16 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
- shcap
Estimate Std. Error t-value Pr(>|t|)
(Intercept) 0.5935533 0.0201037 29.5246 < 2.2e-16
pl
-0.0877305 0.0076570 -11.4576 < 2.2e-16
pk
0.0869210 0.0090932
9.5589 < 2.2e-16
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
***
***
***
0.1 1
Chapitre 4
Afin de tester la prsence deffets individuels et/ou temporels, deux approches sont
possibles :
la premire est de partir du modle qui estime ces effets (modle within) et de
raliser un test dhypothse jointe que lensemble de ces coefficients estims sont
nuls,
le second est de partir du modle des moindres carrs ordinaires et dinfrer sur
lexistence des effets partir des caractristiques des rsidus de cette estimation.
4.1.1
Tests de F
w
Le modle
P
P w 2within est caractris par une somme des carrs des rsidus : SCR =
n
t ent et le nombre de degrs de libert est de N (T 1) K, o K est
le nombre de variables explicatives. On pose comme hypothse nulle labsence
deffets individuels. Le modle contraint est donc le modle des moindres carrs
ordinairess, dont la somme des carrs des rsidus et le nombre de degrs de libert
P P
2
scrivent respectivement : SCRp = n t eP
nt et N T K 1. Si H0 est vraie,
on a alors la statistique :
SCRP SCRW N T K 1
SCRw
N 1
qui suit un F de Fisher Snedecor avec N 1 et N T K 1 degrs de libert.
62
4.1.2
Tests de Breush-Pagan
Le test de Breusch & Pagan (1980) est un test de multiplicateur de Lagrange, bas
sur les rsidus des moindres carrs ordinaires.
ln L
,
Le test de multiplicateur de Lagrange est bas sur le vecteur de scores g() =
cest--dire de drives de la fonction de log de vraisemblance, valu pour un
modle contraint. La variance du vecteur de score est donn par :
ln L
H() = E
()
>
On estime un modle contraint caractris par un vecteur de paramtres ; on a
alors, si les hypothses sous jacentes sont vraies :
N (0, H())
g()
le score et sa variance valus pour le modle
Soit encore, en notant g et H
contraint :
1 g
g> H
qui suit un 2 dont le nombre de degrs de libert est gal au nombre dhypothses
imposes dans le cadre du modle contraint.
Dans le cas du modle effets individuels, on rappelle que la vraisemblance scrit,
2
en notant 2 = T 2 +
2 :
ln L =
NT
N (T 1)
N
1 XX
2
ln 2
ln 2 + ln(T 2 +2 ) 2
(ent (1 )
en. )
2
2
2
2 n t
g() =
!
=
w
N
+ SSR
24
212
b
T
+ T SSR
N
212
214
1)
N (T
2 2
SSRb
214
1
1
1
1
=
b
2
b
2
NT
NT 2
>
T SSR
T SSR
N2T4
2 4
6
2 4
6
1
63
Pour calculer la statistique, on pose lhypohse : H0 : 2 = 0 (absence deffets individuels). Dans ce cas, lestimateur est lestimateur des moindres carrs ordinaires
et lestimateur de
2 = SSRp /N T . Le score et sa variance scrivent alors :
!
0
=
g()
NT
T SSRb
2
2 1
2
NT
1 1
H() =
1 T
2
4
Dont linverse est :
1 =
H()
2
4
N T (T 1)
T
1
1
1
NT
2
2
1
T SSRb
2
2
2
4
N T (T 1)
=
NT
2(T 1)
1
T SSRb
SSRp
2
4.1.3
Application
Le test de F est disponible avec la fonction pFtest . Il prend comme argument deux
modles embot et ralise un test dhypothses jointes pour les effets individuels
estims dans un seul des modles. Par exemple, le test dabsence deffets individuels
peut tre ralis en utilisant le modle pooling et le modle within avec effets
individuels.
> pFtest(rice.w, rice.p)
F test for individual effects
data: log(goutput) ~ log(seed) + log(totlabor) + log(size)
F = 1.6623, df1 = 170, df2 = 852, p-value = 2.786e-06
alternative hypothesis: significant effects
On constate sans surprise que lhypothse dabsence deffets individuels est trs
fortement rejete.
Pour tester lhypothse dabsence deffets individuels et temporels, on utilisera :
64
65
4.2
66
Median
0.003459
Mean
0.000000
3rd Qu.
0.088070
Max.
0.334500
log(output)
Min.
:1.299
1st Qu.:1.473
Median :1.786
Mean
:1.720
3rd Qu.:1.970
Max.
:2.050
Le test de stabilit peut alors tre ralis en passant la fonction de test air.np
et air.pooling ou air.within selon que lon souhaite ou non poser sous H0
lhypothse dabsence deffets individuels.
67
F statistic
data: log(cost) ~ log(output)
F = 33.139, df1 = 10, df2 = 78, p-value < 2.2e-16
alternative hypothesis: unstability
F statistic
data: log(cost) ~ log(output)
F = 8.3319, df1 = 5, df2 = 78, p-value = 2.388e-06
alternative hypothesis: unstability
Lhypothse de stabilit est trs fortement rejete, mme dans sa version la plus
faible (constantes spcifiques). Les mmes tests peuvent tre raliss avec une interface formula-data, en prcisant grce largument model quel modle contraint
doit tre utilis.
> pooltest(log(cost)~log(output), Air, model = "within")
> pooltest(log(cost)~log(output), Air, model = "within")
4.2.1
Swamy (1970) a propos un modle dans lequel tous les coefficients du modle
sont propres lindividu. On a alors :
ynt = n> xnt + nt
On ferra lhypothse que nt N (0, 2 ), autrement dit nous ne faisons pas lhypothse dhomoscdasticit dans ce modle. On supposera galement que n
N (, ), soit encore n = n N (0, ). Le modle se rcrit alors :
ynt = > xnt + nt
avec nt = nt + n> xnt . Les erreurs du modles sont donc htroscdastiques
(en particulier parce que nous navons pas impos lhomoscdasticit de ) et les
erreurs dun mme individu sont corrles car elles contiennent le mme vecteur
de paramtres n . Pour un individu n, la matrice de variance des erreurs scrit
donc :
>
> >
n = E(n >
n ) = E (n + Xn n ) n + n Xn
68
2
>
n = E(n >
n ) = n IT + Xn Xn
n2 =
T
X
e2nt /(T K 1)
Une fois ces estimations obtenues, on peut galement calculer leur moyenne :
N
1 X
n
=
N n=1
zn = n
qui scrit, en dveloppant et en regroupant les termes :
zn
PN
>
= n + (Xn> Xn )1 Xn> n N1 n=1 nP+ (Xn> Xn )1 X
n n
P
>
>
= NN1 n + NN1 (Xn> Xn )1 Xn> n N1 m6=n m N1 m6=n (Xm
Xm )1 Xm
m
Lintrt de cette dernire expression est dcrire zn comme une combinaison linaire de diffrentes variables alatoires non corrles. Le calcul de la variance de
z en est largement simplifi car les covariances sont toutes nulles. On a alors :
E(zn2 ) =
N 1
N
2
+
N 1
N
2
n2 (Xn> Xn )1 +
69
1 X 2
N 1
>
+ 2
m (Xm
Xm )1
2
N
N
m6=n
N 1
N 2 2 >
1 X 2 >
+
n (Xn Xn )1 + 2
(X Xn )1
N
N
N n n n
On a alors :
E
2
n zn
=
=
E
(N 1) +
(N 1) +
N 2
N
N 1
N
1 X 2
z
N 1 n n
P 2 >
1
Pn n2 (Xn> Xn )1 +
n n (Xn Xn )
!
=+
1
N
n2 (Xn> Xn )1
1 X 2 >
(X Xn )1
N n n n
1 X 2
1 X 2 >
zn
(X Xn )1
N 1 n
N n n n
Le modle de Swamy (1970) est estim avec la fonction pvcm et largument model
gal "random".
> summary(pvcm(log(cost)~log(output), Air, model="random"))
70
0.48610
-0.18913
-0.189126
0.080597
On constate que la dispersion du coefficient associ la production est trs importante. Elle correspond un cart-type de de 0.28, la valeur moyenne du coefficient
tant de 1.65.
4.3
On a vu que, si les erreurs du modles ne sont pas corrles aux variables explicatives, les deux modles sont convergents. Pour comparer les deux modles,
on continuera de supposer que la composante idiosyncratique du terme derreur
(E(X > ) = 0) est non corrle avec les variables explicatives. Deux situations
peuvent alors tre distingues :
E(X > ) = 0 : les effets individuels ne sont pas non plus corrls avec les variables
explicatives ; dans ce cas, les deux modles sont convergents, mais le modle
effets alatoires est plus efficace que le modle effets fixes.
E(X > ) 6= 0 : les effets individuels sont corrls avec les variables explicatives ;
dans ce cas, le modle effet fixe est convergent car les effets individuels sont
des paramtres estims. En revanche, le modle effets alatoires nest pas
convergent car une composante des erreurs de ce modle sont les effets individuels qui sont corrls avec la variable explicative.
Afin de clarifier la relation entre les deux modles, Mundlak (1978) a considr le
modle suivant :
ynt = x>
nt + n + nt
avec
n = x
n. n + n
Autrement dit, les effets individuels sont corrls avec les variables explicatives,
plus prcisment, ils sont gaux la somme dune combinaison linaire des moyennes
individuelles de ces variables explicatives et dun terme derreur n . Le modle
estimer scrit alors, sous forme matricielle :
y = X + BX + (IN JT ) +
Le terme derreur = (IN JT ) + a les caractristiques habituelles du modle
erreurs composes, cest--dire une esprance nulle et une variance donne par :
= 2 IN T + 2 ((IN JT ) = 2 W + 12 B
71
Le modle des moindres carrs gnraliss consiste estimer le modle sur les
donnes transformes en pr-multipliant chaque variable par 0.5 = W + 1 B
On a alors y = W y + By, X = W X + BX et (BX) = BX. Lestimateur
des moindres carrs gnraliss scrit alors :
X > W + X > B
X > B
=
=
W X + BX
X > W X + 2 X > BX
2 X > BX
2 X > BX
2 X > BX
1
X > W + X > B
X > B
BX
1
X > W y + 2 X > By
2 X > By
(W y+B
A11
A21
A12
A22
1
=
1
(A11 A12 A1
22 A21 )
1
1
(A22 A21 A11 A12 ) A21 A1
11
1
1
A1
11 A12 (A22 A21 A11 A12 )
1
1
(A22 A21 A11 A12 )
On obtient finalement :
=
(X > W X)1
(X > W X)1
=
(X > W X)1
>
(X W X)1 + 12 (X > BX)1
X > W y + 2 X > By
2 X > By
=
w
b
et
V
= 2
(X > W X)1
(X > W X)1
(X > W X)1
>
(X W X)1 + 12 (X > BX)1
> V (
)1
72
On constate que lhypothse de non corrlation des variables explicatives avec leffet individuel est trs fortement rejete dans le cas des donnes sur les compagnies
ariennes, alors quelle ne lest pas avec les donnes sur les fermes de riz. Ce rsultat tait prsivible puisque les rsultats des modles effets fixes et effets
alatoires taient trs diffrents dans le premier cas et trs proches dans le second.
Chapitre 5
Autocorrlation et
htroscdasticit
74
Chapitre 6
Endognit
6.1
Introduction
On parle dendognit lorsque lerreur du modle est corrle avec (au moins) une
variable explicative. Ce phnomne est particulirement courant en conomtrie,
dans la mesure o, contrairement aux chercheurs en sciences exprimentales, lconomtre na pas la possibilit de contrler le processus gnrateur de donnes. Les
causes possibles dendognit sont multiples, on citera simplement pour mmoire
les trois principales :
la simultanit . Lquation dintrt comporte une variable explicative qui est
dtermine simultanment avec la variable explique : cest le cas par exemple
de lestimation dune quation de demande pour un bien, qui contient le prix
de ce bien. La quantit demande et le prix sont simultanment dtermins
par lgalisation de loffre et de la demande et, par consquent, une variation
du terme derreur de lquation de demande se traduira par un dplacement
de la courbe de demande et donc par une variation de la quantit et du prix
dquilibre.
lerreur de mesure sur une variable explicative . Si le vrai modle est y =
+ x + et que lon observe x = x + , le modle estim scrit alors :
y = + (x ) + , soit encore y = + x + avec = et est
corrl avec x.
les variables explicatives omises . Si le vrai modle est y = + x x + z z +
et que la variable z nest pas observe, le modle estim est y = 0 + x x + ,
avec = z z + . Lerreur du modle estim contient alors linfluence de la
variable omise et cette erreur est alors corrle x si x et z sont corrls.
Lestimateur du modle linaire simple y = X + scrit :
= X > X
1
X >y
76
1 >
X X
n
1
X >
n
>
6.2
Chapitre 6. Endogneite
77
1
Z >y
(6.1)
Sil y a plus dinstruments que de variables explicatives (L > K), Z > e ne peut pas
tre un vecteur de 0. Dans ce cas-l, deux approches permettent de dterminer
lestimateur optimal. La premire consiste pr-multiplier le modle par Z > .
Z > y = Z > X + Z >
(6.2)
=
=
1 > 1 >
1 >
X >Z Z >Z
Z X
X Z Z >Z
Z y
1
>
>
X PZ X
X PZ y
(6.3)
1 >
avec PZ = Z Z > Z
Z .
La seconde approche est celledes moments gnraliss.
On considre en effet un
vecteur de L moments E Z > = E Z > (y X) , dont la variance est V(Z > ) =
2 Z > Z. Dans le cadre de la mthode des moments gnraliss, on minimise la
forme quadratique du vecteur de moments en utilisant linverse de la matrice de
variance de ces moments :
1
1
1 >
(y > X > )Z Z > Z
Z(y X) = 2 (y > > X > )PZ (y X)
2
78
(6.4)
et peut donc tre obtenu en appliquant les moindres carrs ordinaires deux fois :
la premire fois en rgressant chaque variable explicative par rapport aux instruments,
la seconde fois en rgressant la variable explique par rapport aux valeurs prdites de la premire estimation.
La variance de lestimateur des variables instrumentales est :
1
>X
z
V = 2 X
z
On voit alors que lestimateur sera dautant plus efficace que la corrlation entre
X et Z est importante.
Estimateur des variables instumentales gnralis Dans le cas o les erreurs ne sont pas indpendament et identiquement distribues, la variance de
est note de manire gnrale et celle des erreurs du modle (6.2) est gale
Z > Z. Lestimateur des variables instrumentales gnralise est alors obtenu, soit
en appliquant les gls au modle (6.2), soit en utilisant la mthode des moments
gnraliss en minimisant :
1
1 >
(y > X > )Z Z > Z
Z(y X)
2
Dans les deux cas, lestimateur scrit :
1 > 1 >
1 >
g2sls = X > Z Z > Z
Z X
X Z Z > Z
Z y
(6.5)
Chapitre 6. Endogneite
Or :
L>
1 >
L>
1
On a donc :
PZ = L>
1
Z Z > Z
1
79
Z>
L>
1 >
En utilisant cette matrice de projection dans la formule de lestimateur des variables instrumentales (6.3), on obtient :
1
1
1 > > 1 >
=
X > L> L>
Z Z > Z
Z
L
LX
(6.6)
1
1 > > 1 >
(6.7)
La variance des erreurs de ce modle est alors : Z > U > U Z et lestimateur obtenu :
1 > > 1 >
1 > >
= X > U Z Z > U > U Z
Z U X
X U Z Z > U > U Z
Z U y
En choisissant U = 1 , on obtient lestimateur des variables instrumentales efficace :
1 > 1 1 > 1
1 > 1
e2sls = X > 1 Z Z > 1 Z
Z X
X Z Z > 1 Z
Z y
(6.8)
Lestimateur des variables instrumentales gnralises peut tre obtenu en appliquant lestimateur des variables instrumentales sur le modle Ly = LX + L en
utilisant comme instruments LZ, autrement dit en appliquant la mme transformation aux diffrents lments du modle (variable explique, variables explicatives
et instruments) 2 .
2. Cet estimateur est prsent en dtail par White (1986).
80
6.2.1
(6.9)
1
1
X > W PZW W y = X > PZW X
X > PZW y (6.10)
1 >
Z W . La dernire galit est obtenue en notant que
avec PZW = W Z Z > W Z
W est idempotente.
Un raisonnement similaire peut tre men pour le modle between. On considre la
transformation between du modle By = BX + B, avec la mme transformation
applique aux instruments (BZ). Lestimateur des variables instrumentales est
obtenue en pr-multipliant le modle par BZ :
Z > By = Z > BX + Z > B
(6.11)
1
X > PZB y
(6.12)
Le modle w2sls est convergent, mme si les effets individuels sont corrls avec
les variables explicatives. En revanche, le modle b2sls ne lest quen labsence de
corrlation. Si cette dernire hypothse est vrifie, aucun des deux nest efficace
car chacun ne prend en compte quune source de la variabilit.
Exemple 6.1
Cohen & Einav (2003) se sont intresss linfluence du port de la ceinture de
scurit sur le nombre de morts sur les routes aux Etats-Unis, en distinguant les
Chapitre 6. Endogneite
81
occupants des vhicules concerns par les accidents (environ 35000 morts par an) et
les non-occupants (environ 5000 morts par an). Ils utilisent des donnes de panel
pour les 50 Etats amricains pour la priode 1983-1997. La principale variable
explative est le taux dutilisation de la ceinture de scurit. Deux questions font
principalement lobjet de leur attention :
la premire concerne le test de la thorie de la compensation du comportement
dveloppe par Peltzman (1975). Daprs cette thorie, le port de la ceinture
met le conducteur plus en confiance et lamne adoter une conduite moins
prudente. Si leffet du port de la ceinture sur la mortalit des conducteurs en
cas daccident est naturellement ngatif, leffet global sur la mortalit peut tre
insignifiant, voir positif. En particulier, il est possible que le dveloppement du
port de la ceinture de scurit augmente la mortalit des non-occupants.
la seconde concerne la question de lendognit : si les conditions de conduite se
dgradent, par exemple pour des raisons mtorologiques, toutes choses gales
par ailleurs, la mortalit sur les routes va augmenter, mais lusage de la ceinture
de scurit va galement augmenter car les automobilistes peroivent laggravation du risque daccident. On a donc une corrlation entre le terme derreur de
lquation de mortalit et la variable explicative qui mesure le taux dusage de
la ceinture de scurit. Dans ce cas, la non prise en compte de lendognit se
traduira par un biais vers le bas de lestimation du coefficient associ lusage
de la ceinture de scurit.
Cohen & Einav (2003) proposent trois types destimation. La premire est une
estimation par les moindres carrs ordinaires qui ne prend donc nullement en
compte le problme dendognit. La seconde est une estimation du modle effets fixes ; dans le cadre de celle-ci, le problme dendognit entre la composante
individuelle du terme derreur et la variable explicative est pris en compte car la
transformation within limine leffet individuel. En revanche, subsiste le problme
de la corrlation entre la composante idiosyncratique du terme derreur et la variable explicative. Ce dernier problme est rsolu en estimant un modle w2sls.
Les instruments utiliss sont des variables de lois concernant la ceinture, qui sont
corrles avec lusage de la ceinture de scurit, mais pas avec le terme derreur. De
nombreuses variables de contrle sont galement introduites (voir la page daide
des donnes pour plus de prcision).
Lestimation dun modle avec variables instrumentales est ralise laide de la
fonction plm . Les variables instrumentales sont spcifies laide dune formule en
deux parties, disponible grce la librairie Formula (Zeileis & Croissant, 2010)).
La premire partie indique la liste des variables explicatives du modle alors que
la seconde indique la liste des variables instrumentales. Trs souvent, une partie
importante des variables explicatives sont utilises comme instrument. Afin dviter de rpter quasimment deux fois la mme liste de variables, il est possible
dutiliser une syntaxe diffrentielle en utilisant le signe .. Par exemple, si les variables explicatives sont x1, x2 et x3, que seule x2 est endogne et quil existe un
seul instrument extrieur z, la description du modle peut tre ralise de manire
quivalente laide des deux formules ci-dessous :
82
Cohen & Einav (2003) estiment successivement trois modles. Le premier est un
modle avec des effets fixes temporels (qualifi par les auteurs de modle mco
car il ny a pas de prise en compte des effets individuels), le second est un modle doubles effets fixes individuels et temporels et le dernier est un modle
doubles effets fixes avec des variables instrumentales afin de prendre en compte
lendognit du port de la ceinture de scurit.
>
>
>
+
+
+
+
+
>
>
>
+
+
Les rsultats attestent que le problme dendognit est trs important. Pour le
premier modle estim, on a un coefficient associ lutilisation de la ceinture de
scurit qui est positif et significatif. Il devient ngatif et significatif pour le modle
effets fixes, ce qui indique que la variable usage prsente une corrlation positive
importante avec les effets individuels. Enfin, ce coefficient augmente de manire
importante (en valeur absolue) si on utilise des variables instrumentales, ce qui
indique que la composante idiosincratique des erreurs est galement corrle avec
usage.
Pour tester lhypothse de la thorie de la compensation du comportement, les
auteurs estiment les mmes modles avec cette fois la mortalit des non-occupants
comme variable explicative. Si cette thorie est vraie, le dveloppement du port
de la ceinture devrait accrotre les comportements de conduite risque et donc
contribuer accrotre la mortalit des non-occupants.
> SeatBelt$noccfat <- with(SeatBelt, log(farsnocc / (vmtrural + vmturban)))
> nivfe <- update(ivfe, noccfat ~ . | .)
> coef(summary(nivfe))[1, ]
Estimate
-0.04237248
Std. Error
t-value
0.10311901 -0.41090855
Pr(>|t|)
0.68132529
Les rsultats indiquent que le port de la ceinture na pas dinfluence sur la mortalit
des non-occupant, en contradiction avec la thorie de Peltzman (1975).
Chapitre 6. Endogneite
6.2.2
83
Si les effets individuels sont non-corrls avec les variables explicatives, les estimateurs within et between sont convergents mais inefficaces. Pour obtenir un
estimateur efficace, il faut combiner les deux sources de variations, ce qui peut
tre ralis en empilant les deux modles et en appliquant les moindres carrs gnraliss (estimateur error component two stage least squares ec2sls de Baltagi
(1981)) ou en appliquant les moindres carrs gnraliss sur le modle transform
en quasi-diffrences (estimateur generalized two stage least squares g2sls de
Balestra & Varadharajan-Krishnakumar (1987)).
Lestimateur des doubles moindres carrs erreur compose
Baltagi (1981) part des quations (6.9) et (6.11) qui permettent dobtenir respectivement les estimateurs within et between. Il empile ces deux quations,
>
>
>
Z Wy
Z WX
Z W
=
+
Z > By
Z > BX
Z > B
ce qui a un sens, car le vecteur de paramtres estimer est le mme dans les
deux quations. Afin dappliquer les gls, on calcule la variance des erreurs du
modle empil :
V
Z >W
Z > B
=E
Z > W > W Z
Z > B> W Z
Z > W > BZ
Z > B> BZ
=
Z >W Z
0
0
1
>
2 Z BZ
avec 2 = T 2 +
2 . On applique ensuite la formule de lestimateur des moindres
carrs gnraliss :
"
=
>
>
X WZ
X >W Z
X BZ
X > BZ
Z >W Z
0
Z >W Z
0
1
Z >W X
1
>
Z
BZ
Z > BX
2
1 >
0
Z Wy
1
>
Z > By
2 Z BZ
0
#1
i1
1 >
Z > W X + 2 X > BZ Z > BZ
Z BX
h
1 >
1 > i
X >W Z Z >W Z
Z W y + 2 X > BZ Z > BZ
Z By
h
X >W Z Z >W Z
1
On obtient finalement :
1 > W
X PZ y + 2 X > PZB y
ec2sls = X > PZW X + 2 X > PZB X
(6.13)
84
On vrifie aisment, comme dans le modle erreur compose simple, que lestimateur ec2sls est une moyenne pondre des estimateurs within et between :
e2sls = DW w2sls + DB b2sls , avec :
1 > W
DW = X > PZW X + 2 X > PZB X
X PZ X
1 > B
DB = 2 X > PZW X + 2 X > PZB X
X PZ X
Lestimateur des doubles moindres carrs gnraliss
Cet estimateur, appel g2sls (pour generalised two stages least squares) a t
propos par Balestra & Varadharajan-Krishnakumar (1987). On part du modle
erreurs composes classique : y = X + , avec :
V() = = T 2 + 2 B + 2 W
Lestimateur propos est un estimateur des variables instrumentales efficaces obtenu en pr-multipiant toutes les variables du modle et les instruments par 0.5
ou plus simplement par 0.5
0.5 = W + q
B = W + B
T 2 +
xnt = (xnt x
n. ) +
xn. = xnt (1 )xn.
On considre alors le modle pr-multipli par 0.5 :
y = X +
pour lequel les erreurs sont identiquement distribues. On applique ce modle la
mthode des variables instrumentales, on note A la matrice dinstruments et PA
le sous-espace de projection des colonnes de A. Lestimateur obtenu scrit :
= X > PA X
1
X > PA y
(6.14)
White (1986) a montr que dans ce contexte, il est efficace dappliquer aux instruments la mme transformation quaux autres lments du modle. On a alors
A = 0.5 Z = W Z + BZ = Z
Lestimateur propos par (Baltagi, 1981) est galement un estimateur de la mme
famille, mais avec un choix dinstruments diffrents : A = (BX, W X) (Cornwell
et al., 1992). En effet, en introduisant PA = PZB + PZW dans (6.14), on obtient 3 :
3. Voir aussi Baltagi & Li (1992) et Baltagi & Liu (2009).
Chapitre 6. Endogneite
85
h
i1
>
(W X + BX) PZW + PZB (W X + BX)
>
(W X + BX) PZW + PZB (W y + By)
>
Lavantage de la formulation de Baltagi (1981) est que la liste des instruments within et celle des instruments between peut tre diffrente. On peut alors considrer
trois types de variables (Cornwell et al., 1992) :
les variables endognes sont corrles avec les deux composantes du terme derreur,
les variables simplement exognes sont corrles avec les effets individuels, mais
pas avec la composante idiosyncratique du terme derreur,
les variables doublement exognes ne sont corrles ni avec les effets individuels,
ni avec la composante idiosyncratique du terme derreur.
Dans le cadre dune estimation avec variables instrumentales, les variables doublement exognes peuvent tre utilises deux fois, une fois en utilisant leur transformation between et une fois en utilisant leur transformation within, comme le
suggre Baltagi (1981). Les variables simplement exognes en revanche ne peuvent
tre introduites comme instrument quavec leur transformation within.
Exemple 6.2
Kinal & Lahiri (1993) se sont intresss aux dterminants du commerce international pour les pays en dveloppement et en particulier la mesure des lasticits
prix et revenu du commerce international pour les pays en dveloppement. Ce sujet est particulirement important car il conditionne en grande partie la croissance
et lvolution de lendettement de ces pays. Le panel utilis contient 31 pays en
dveloppement, pour la priode 1964-1986. Ces donnes sont disponibles dans la
librairie pder sous le nom ForeignTrade.
Plus prcisment, ils estiment trois quations : la premire dfinit la demande
dimportations, la deuxime la demande dexportations et la troisime loffre dexportations. Plus prcisment, les auteurs supposent que :
la demande dimportations imports augmente avec le revenu domestique gnp,
diminue avec le prix des importations en devises locales rapporte au prix domestiques pmcpi et augmente avec le ratio des rserves sur les importations
resimp retard dune priode,
la demande pour les exportations exports augmente avec le revenu du reste du
monde gnpw et diminue avec le prix relatif des exportations et de leurs substituts
trangers pxpw,
loffre dexportations exports augmente avec le prix mondial exprim en devise
domestique rapport lindice des prix la consommation pwpci, avec le revenu
domestique potentiel pgnp (utilis comme proxy du stock de capital) et dpend
galement positivement dune variable qui reprsente le rle des importations
86
4. Les auteurs justifient lintroduction de cette variable par le fait que, pour la plupart des
pays en dveloppement, limportation de biens intermdiaires et de biens dquipement sont trs
importants pour produire des biens lexportation.
Chapitre 6. Endogneite
87
+
lag(consump) + lag(cpi) + lag(income) + lag(gnp) + pm +
+
lag(invest) + lag(money) + gnpw + pw + lag(reserves) +
+
lag(exports) + trend + pgnp + lag(px),
+
ForeignTrade, model = "within")
> r1 <- update(w1, model = "random", random.method = "kinla",
+
inst.method = "baltagi")
Lhypothse de non-corrlation entre les instruments et les effets individuels implique que les deux modles within et mcg sont convergent, le dernier tant plus
efficace. En revanche, si cette hypothse est rejete, seul le modle within est
convergent. Afin de tester cette hypothse, les auteurs utilisent un test dHausman
(1978).
> phtest(r1, w1)
Hausman Test
data: imports ~ pmcpi + gnp + lag(imports) + lag(resimp) | lag(consump) +
chisq = 11.0059, df = 4, p-value = 0.0265
alternative hypothesis: one model is inconsistent
...
Lhypothse de non-corrlation entre les instruments et les variables effets individuels est rejete 5 . Plutt que de rejeter lestimateur mcg et de se contenter de
lestimateur within, Kinal & Lahiri (1993), suivant en cela Cornwell et al. (1992),
choisissent de diffrencier deux types dinstruments :
ceux qui ne sont pas corrls avec les effets individuels, dans ce cas, ils peuvent
tre introduits doublement avec leur transformation between et within,
ceux qui sont corrls avec les effets individuels ; pour ceux-l, seule la transformation within est utilise comme instrument.
Un tel modle est dfini laide dune formule en trois parties :
la deuxime partie indique quelles sont les instruments introduits en utilisant
les deux transformations within et between,
la troisime partie indiquant les instruments introduits seulement en utilisant la
transformation within.
Ils aboutissent finalement la spcification prsente ci-dessous :
> r1b <- plm(imports ~ pmcpi + gnp + lag(imports) + lag(resimp) |
+
lag(consump) + lag(cpi) + lag(income) + lag(px) +
+
lag(reserves) + lag(exports) | lag(gnp) + pm +
+
lag(invest) + lag(money) + gnpw + pw + trend + pgnp,
+
ForeignTrade, model="random",
+
inst.method="baltagi", random.method="kinla")
> phtest(w1, r1b)
Hausman Test
data: imports ~ pmcpi + gnp + lag(imports) + lag(resimp) | lag(consump) +
chisq = 7.372, df = 4, p-value = 0.1175
alternative hypothesis: one model is inconsistent
...
5. Cest galement le cas pour les deux autres quations doffre dexportation et de demande
dexportation.
88
6.3
6.3.1
Dans le cas de systmes dquations, on prend souvent en considration la corrlation entre les erreurs dquations diffrentes pour la mme observation. Dans ce
cas, le modle estimer, qui contient L quations scrit :
Chapitre 6. Endogneite
y1
y2
..
.
yL
X1
0
..
.
0
X2
..
.
...
...
..
.
0
0
..
.
...
XL
1
2
..
.
1
2
..
.
89
L
Z1 0 . . . 0
0 Z2 . . . 0
..
.. . .
..
.
.
.
.
0
...
ZL
= V() = E >
1 >
1
2 >
1
..
.
...
...
..
.
1 >
L
2 >
L
..
.
L >
L >
. . . L >
1
2
L
11 I 12 I . . . 1L I
21 I 22 I . . . 2L I
..
..
.. = I
..
.
.
.
.
L1 I
avec :
1 >
2
2 >
2
..
.
L2 I
...
11
21
..
.
12
22
..
.
...
...
..
.
1L
2L
..
.
L1
L2
...
LL
(6.15)
LL I
1 > 1
X > Z Z > 1 I Z
Z X
1
Z >y
X > Z Z > 1 I Z
(6.16)
Dans le cas particulier o la matrice dinstruments est la mme pour toute les
quations, la formule se simplifie :
3sls = X > 1 PZ X
1
X > 1 PZ y
(6.17)
90
on estime les quations indpendemment les unes des autres en utilisant lestimateur des variables instrumentales, ce qui permet dobtenir une matrice de
rsidus e = (e1 , e2 , . . . , eL ) qui constitue une estimation convergente des erreurs
des diffrentes quations,
on estime la matrice de covariance des erreurs du systme : s = e> e/N
on calcule la dcomposition de Cholesky de cette matrice : l | lsl> = I,
on transforme les diffrents lments du modle : y = (l I)y, X = (l I)X
et Z = (l1 I)Z.
on applique la mthode des variables instrumentales sur le modle transform.
La transformation est particulirement simple ici :
y1
l11 y1 + l12 y2 + . . . l1L yL
y2 l21 y1 + l22 y2 + . . . l2L yL
y = (l I) . =
..
..
.
yL
X1
0
..
.
0
X2
..
.
...
...
..
.
0
0
..
.
...
XL
Z1
0
..
.
0
Z2
..
.
...
...
..
.
0
0
..
.
...
ZL
X = (l I)
Z = (l I)
l11 X1
l21 X1
..
.
l12 X2
l22 X2
..
.
...
...
..
.
l1L XL
l2L XL
..
.
lL1 X1
lL2 X2
...
lLL XL
(l1 )11 Z1
(l1 )21 Z1
..
.
(l1 )12 Z2
(l1 )22 Z2
..
.
...
...
..
.
(l1 )1L ZL
(l1 )2L ZL
..
.
(l1 )L1 Z1
(l1 )L2 Z2
...
(l1 )LL ZL
Lestimateur des triples moindres carrs within et between nappelle aucun dveloppement complmentaire. Il suffit simplement dappliquer lestimateur prcdemment dcrit aux donnes transformes en cart par rapport la moyenne
individuelle (within) ou en moyenne individuelle (between).
6.3.2
Chapitre 6. Endogneite
91
En notant >
ln = (ln1 , . . . , lnT ), le vecteur derreurs pour lindividu n et lquation
l, le vecteur derreurs pour le systme dquation scrit :
>
>
>
>
>
>
>
>
> = (>
11 , 12 , . . . , 1N ), (21 , 22 , . . . , 2N ), . . . , (L1 , L2 , . . . , LN )
La variance des erreurs du modle est alors :
= V() = (IN JT ) + (IN IT )
Seule la prsence des effets individuels rend le modle spcifique par rapport
lestimateur classique des triples moindres carrs. Par rapport au modle erreurs
composes standard, les scalaires 2 et 2 sont remplacs par les deux matrices de
covariances et .
Exemple 6.3
Kinal & Lahiri (1993) estiment le systme constitu de lquation de demande
dimportations et de celle de demande dexportations par la mthode des triples
moindres carrs. Pour raliser cette estimation avec plm , il faut indiquer comme
premier argument une liste contenant la description des diffrentes quations du
modle.
>
+
+
+
>
+
+
+
>
+
+
+
>
92
t-value
3.3572
-2.4855
2.0721
80.0995
6.2304
Pr(>|t|)
0.0008083
0.0130505
0.0384327
< 2.2e-16
6.123e-10
***
*
*
***
***
- export.demand
Estimate Std. Error t-value Pr(>|t|)
(Intercept)
0.143130
0.139472 1.0262 0.30496
pxpw
-0.061362
0.019462 -3.1530 0.00165 **
gnpw
0.114368
0.053353 2.1436 0.03224 *
lag(exports) 0.946532
0.013298 71.1772 < 2e-16 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
demande dimportations sont proches de ceux obtenus avec le modle des doubles
moindres carrs. Le gain en termes defficacit se traduit par une lgre rduction
des carts-types, comme illustr ci-dessous.
> rbind(ec2sls = coef(summary(r1b))[-1, 2],
+
ec3sls = coef(summary(r12), "import.demand")[-1, 2])
pmcpi
gnp lag(imports) lag(resimp) (Intercept)
pxpw
ec2sls 0.02179875 0.006871687
0.01281239 0.006683680 0.02179875 0.006871687
ec3sls 0.02169995 0.005286002
0.01186829 0.006341284 0.13947240 0.019461702
gnpw lag(exports)
ec2sls 0.01281239
0.00668368
ec3sls 0.05335346
0.01329825
6.4
Estimateur dHausman-Taylor
Le modle erreurs composes amne choisir entre le modle within et le modle mcg. Lavantage du modle within est quil est convergent mme si les effets
Chapitre 6. Endogneite
93
individuels sont corrls avec les variables explicatives. Le dsavantage est que, si
certaines variables explicatives ne prsentent aucune variation intra-individuelle,
elles disparaissent de lestimation. Or, ces variables sont souvent des variables essentielles. Par exemple, dans le cadre dune estimation dune fonction de salaire,
des variables telles que le genre, le niveau dducation et lorigine ethnique sont
souvent au centre de lattention, mais le chercheur na alors que le choix entre :
un estimateur mcg qui renvoit des coefficients associs ces variables, mais qui
nest pas un estimateur convergent compte tenu de la corrlation entre les effets
individuels et les variables explicatives,
un estimateur within qui est convergent mais qui ne donne aucune information
sur linfluence de ces variables.
Si on reprend la typologie de Cornwell et al. (1992), Hausman & Taylor (1981)
considre un modle qui ne contient pas de variables endognes, cest--dire que
des variables non corrles avec la composante idiosyncratique du terme derreur.
Certaines de ces variables sont simplement exognes (donc corrles avec les effets individuels), dautre sont doublement exognes (non corrles avec les effets
individuels).
De plus, on prendra explicitement en compte le fait quun sous-ensemble de variables ne prsentent pas de variations intra-individuelles.
En croisant ces deux lments de typologie, on obtient quatre catgories de variables (Cx , Ce , Vx et Ve ) en notant C et V les variables sans / avec variation
intra-individuelle et x et e les variables doublement / simplement exognes.
Lide est de construire un estimateur de variables instrumentales sans avoir recours des instruments extrieurs au modle, souvent difficiles trouver. Pour
chaque type de variable, on dcompte le nombre dinstruments :
les variables Vx , au nombre de Kvx , fournissent chacune deux instruments (within et between),
les variables Ve , au nombre de Kve fournissent chacune un instrument (within),
les variables Cx au nombre deKcx fournissent chacune un instrument,
les variables Ce au nombre de Kce ne fournissent aucun instrument.
On a donc L = 2Kvx + Kve + Kcx instruments et K = Kvx + Kve + Kcx + Kce
variables explicatives. Par consquent, le modle est identifi (L K) si Kvx
Kce .
Si cette condition est vrifie, lestimateur propos par Hausman & Taylor (1981)
est un estimateur des mcg qui utilise (W Vx , BVx , W Ve , Cx ) comme instruments.
Pour raliser cette estimation, il faut au pralable estimer les variances des composantes du terme derreur. A cet effet, il faut disposer dune estimation convergente
des rsidus et le choix naturel est celui de lestimateur within. Cet estimateur (w )
est obtenu en rgressant W y en fonction de (W Vx , W Ve ). Cette estimation est
convergente car toutes les variables sont supposes non corrles avec les effets
individuels. De cette estimation within, on rcupre les rsidus w qui permet de
calculer lestimateur de 2 utilis par Amemiya (1971) et Swamy & Arora (1972),
cest--dire :
2 = >
w /(O N K)
wW
94
(6.18)
2 = > B
/N
(6.19)
> coef(summary(wm))[1:7, ]
Chapitre 6. Endogneite
95
Pour les auteurs, leffet individuel, indiquant une propension commercer avec un
pays donn pour des raisons de proximits gographique et culturelle est vraisemblablement corrl avec la distance. Cette variable, la seule sans variation temporelle, est donc corrle avec leffet individuel. Au niveau des variables qui varient au
cours du temps, les trois variables qui mesurent les dotations relatives en facteur
et lindice de similitude sont considres comme doublement exognes, alors que
les autres sont supposes tre corrles avec la composante individuelle du terme
derreur.
> ht <- pht(lrex ~ ldist + lkldist + lgdt + lkgdt + lsimi + lrk +
+
lrh + lrl + factor(year) | lsimi + lrk + lrh +lrl +
+
factor(year), TradeUS, model= "ht")
exo
endo
exo
endo
Median
Mean
Max.
0.9320
3rd Qu.
Max.
96
0.03040
0.00016
0.26400
1.48000
Coefficients :
Estimate Std. Error t-value
(Intercept) -60.1815522 13.6941742 -4.3947
ldist
-1.6473986
0.7996188 -2.0602
lkldist
-0.3500265
0.3183469 -1.0995
lgdt
3.0224557
0.4016546 7.5250
lkgdt
-0.0045699
0.0060232 -0.7587
lsimi
1.2692939
0.2026840 6.2624
lrk
3.4976621
2.7600926 1.2672
lrh
0.1232587
0.0784673 1.5708
lrl
-2.8425857
2.7783193 -1.0231
--Signif. codes: 0 *** 0.001 ** 0.01 *
Pr(>|t|)
1.109e-05
0.03938
0.27154
5.272e-14
0.44802
3.790e-10
0.20507
0.11622
0.30625
***
*
***
***
0.05 . 0.1 1
Limpression des rsultats rappelle la typologie des variable. Le modle est ici
identifi parce que le nombre de variables constantes endognes est bien infrieur
au nombre de variables exognes variables (1 contre 4 + 10 variables indicatrices
de lanne).
Chapitre 7
98
et Arellano & Bond (1991) qui ont introduit lutilisation de la mthode destimation des moments gnraliss pour les panels dynamiques 1 . Celle-ci est devenue
la mthode destimation privilgie et la plus grande partie de ce chapitre sera
consacre sa prsentation. Il faut cependant noter que le champ dapplication de
cette mthode pour les panels nest pas limite aux modles dynamiques et quelle
peut galement tre utilise avec profit pour des modles statiques.
Exemple 7.1
Tout au long de ce chapitre, nous utiliserons larticle de Acemoglu, Johnson, Robinson & Yared (2008) afin dillustrer les rsultats. Cette tude traite de la relation
causale entre le niveau de richesse et le niveau de dmocratie des pays. Les auteurs
utilisent diffrentes donnes de panel. Parmi celles-ci, nous en avons retenu deux :
les premires correspondent une frquence dobservation de 5 ans, avec 11
observations sur la priode 1950 2000 pour 211 pays ;
les secondes correspondent une frquence dobservation de 25 ans, avec 7 observations sur la priode 1850 2000 pour 25 pays.
Ces donnes sont disponibles dans la librairie pder sous le nom de DemocracyIncome pour les premires et de DemocracyIncome25 pour les secondes.
> data("DemocracyIncome", package = "pder")
> data("DemocracyIncome25", package = "pder")
> head(DemocracyIncome, 4)
1
2
3
4
country
Andorra
Andorra
Andorra
Andorra
1. Il existe de nombreuses revues de cette littrature, en particulier, Harris et al. (2008), Bond
(2002), Roodman (2009a).
99
1.0
1.2
Bolivia
Croatia
Chile
El
Salvador
St. Vincent
and the Grenadines
Korea, Rep.
Dominican
Jamaica
Republic
Thailand
Trinidad
and
Tobago
Mexico
Moldova
RomaniaBulgaria
India Philippines
0.6
Senegal
Malawi
Nepal
Bangladesh
Mozambique
Nicaragua
Honduras
0.4
Burkina Faso
Nigeria
GuineaBissau
Niger
Tanzania
Guatemala
Venezuela,
Brazil
RBSeychelles
Indonesia
SriEcuador
Lanka Peru
Macedonia, FYR
Colombia
Albania
Jordan
Paraguay
Turkey
Ukraine
Georgia
Armenia
Lesotho
Ethiopia 1993
Togo
Yemen
Zambia
0.2
democracy
0.8
Benin
Madagascar
Ghana
Mali
Burundi
0.0
Iceland
St. Kitts and
Nevis
Hungary
Sweden
New
Zealand
Germany
Norway
Netherlands
Estonia
Barbados
Slovakia
Italy
Canada
Belgium
United
Kingdom
St.Belize
Lucia
Switzerland
Ireland
Czech
Republic
Denmark
Greece
Slovenia
Australia
Japan
Lithuania
Spain
Uruguay
Israel
Dominica
United
Costa
Latvia
Africa
Argentina
Mauritius
France
States
Finland
Luxembourg
Poland
Portugal
Rica
Grenada
South
Austria
Cape Verde Panama
Morocco
Antigua
Gabon
Russia
Malaysia
Uganda Kenya
Congo,
Rep.
Pakistanpost1972
Azerbaijan
Kyrgyz
Republic
Cote
d'Ivoire
Tajikistan
Comoros
Zimbabwe
Guinea
Swaziland
Tunisia
Iran
Egypt, Arab
Rep.
Chad
Lebanon
Algeria
Kazakhstan
Belarus
Gambia, The
Rwanda
Syrian Arab
Republic
Equatorial
Guinea
China
Cameroon
10
income
7.1
100
7.1.1
Du fait de cette corrlation, lestimateur des moindres carrs ordinaires (ainsi que
celui des moindres carrs gnraliss) nest pas convergent. Cet estimateur scrit :
=
PT
t=2 ynt yn(t1)
n=1
PN PT
2
n=1
t=2 yn(t1)
PN
PN
=+
n=1
PT
t=2 (n
+ nt )yn(t1)
PT 1 2
n=1
t=1 ynt
PN
t+S
t+S yn(S) + 1
1 n
nt + n(t1) + 2 n(t2) + . . . t+S1 n(S+1)
=
+
(7.1)
En supposant que les valeurs initiales de y sont fixes, on obtient alors, pour le
dnominateur de lestimateur des mco les limites suivantes, dabord par rapport
N , puis par rapport T :
2
N
1 t+S
1 2(t+S) 2
1 X 2
ynt =
2 +
lim
N + N
1
1 2
n=1
N
T
2
1 XX 2
2
ynt =
+
T + N + N T
(1 )2
1 2
n=1 t=1
lim
lim
(7.2)
Pour le numrateur, avec lhypothse dabsence de corrlation entre leffet individuel et les innovations, on obtient :
1 X
1 t+S1 2
(n + nt )yn(t1) =
N + N
1
n
lim
2
1 XX
(n + nt )yn(t1) =
N + T + N T
1
n
t
lim
lim
(7.3)
2
1
2
(1)2
2
1 2
=+
(1 2 )2
(1 + )2 + (1 )2
Au vue de cette expression, lestimateur des mco est biais vers le haut. Le biais
tend vers 0 lorsque 2 tend vers 0.
101
Exemple 7.2
Dans le modle estim par Acemoglu et al. (2008), la variable explique est lindice
de dmocratie et les variables expliques lindice de dmocratie et le revenu par
tte retards dune priode. Des variables indicatrices des annes sont galement
introduites et lestimation est ralise sur le sous-ensemble dobservations dfini
par la variable sample. Lestimation du modle des mco laide de la fonction
lm de R est ici malaise du fait de la prsence de retards. En effet, la mthode
lag utilise sera alors celle qui est approprie pour les sries temporelles et non
pour les donnes de panel 2 . Pour cette raison, on utilisera la fonction plm de
la librairie plm en fixant largument model "pooling", de manire utiliser
les donnes non transformes. Le -1 dans la formule indique que lon ne veut pas
estimer de constante gnrale, mais un coefficient pour toutes les modalits de la
variable year, ce qui est sans consquence sur lestimation.
> mco <- plm(democracy ~ lag(democracy) + lag(income) + year - 1,
+
DemocracyIncome, index = c("country", "year"),
+
model = "pooling", subset = sample == 1)
Ce mme modle peut galement tre estim en fixant largument model "within"
et en indiquant que lon souhaite introduire des effets fixes temporels :
> mco <- plm(democracy ~ lag(democracy) + lag(income),
+
DemocracyIncome, index = c("country", "year"),
+
model = "within", effect = "time",
+
subset = sample == 1)
> coef(summary(mco))
Deux rsultats ressortent de ce premier modle. Dune part, la variable democracy semble assez persistante puisquon obtient un coefficient estim gal 0.71.
Cependant, nous savons que lestimateur des mco souffre dun biais vers le haut.
Dautre part, le revenu retard semble avoir une influence significativement positive sur lindice de dmocratie.
7.1.2
Lestimateur within
102
PN
PT
yn )(yn(t1)
yn(1) )
nt
n=1 P t=2 (y
PT
N
(y
yn(1) )2
PNn=1PTt=2 nt
yn(1) )(nt
n )
n=1 P t=2 (y
Pn(t1)
N
T
yn(1) )2
n=1
t=2 (ynt
Les effets individuels (et donc le problme de biais) prsents dans lestimateur des
mco ont bien disparu. En revanche, une seconde source de biais a t ajoute. En
1
1
(yn1 + . . . + yn(T 1) ) et t T 1
(n2 + . . . + nT ) sont corrls.
effet, yn(t1) T 1
1
1
Pour t > 2, on a un terme en T 1 ynt nt , un terme en yn(t1) T 1
n(t1)
1
et T 2 termes en (T 1)2 ynt nt . Chaque terme en nt ynt ayant une esprance de
2 , on obtient finalement :
1
1
T 2
T
2
+
= 2
2
T 1 T 1 (T 1)
(T 1)2
et le biais est donc ngatif 3 . Plus prcisment, on peut montrer que 4 :
1+
plim =
T 11
T
1 1
T 1
2
(1)(T 1)
1 T
T (1)
Ce biais prsente deux caractristiques qui le diffrencie de celui des mco. Tout
dabord, il est ngatif et ensuite il tend vers 0 lorsque T tend vers linfini. Ce biais
ne peut cependant pas tre ignor dans le cas de panels micros o la dimension
temporelle est rduite. Par exemple, pour T = 10 (soit une dure assez longue) et
= 0.5, le biais est de 0.167.
Exemple 7.3
Le modle within est obtenu avec plm en fixant les arguments model et effect
"within" et "twoways", puisque lon souhaite introduire des effets temporels et
individuels. Le modle peut tre estim simplement en actualisant le modle des
mco prcdemment estim :
> within <- update(mco, effect = "twoways")
> coef(summary(within))
Estimate Std. Error
t-value
Pr(>|t|)
lag(democracy) 0.37862837 0.03344426 11.3211770 1.251513e-27
lag(income)
0.01041497 0.02640112 0.3944898 6.933266e-01
Par rapport au modle des mco, le coefficient autorgressif est plus petit (0.38
contre 0.71), ce qui tait attendu dans la mesure o lestimateur within est biais
vers le bas alors que celui des mco est biais vers le haut. On constate galement
quavec lintroduction des effets individuels, le coefficient du revenu devient trs
proche de 0 et est non significatif.
3. Nickel (1981).
4. Voir par exemple Hsiao (2003) p.72.
7.1.3
103
Les mthodes destimation les plus courantes utilises dans le cas de modles statiques tant inadaptes, plusieurs stratgies destimation peuvent tre envisages
afin dobtenir un estimateur convergent.
la premire est dutiliser la mthode du maximum de vraisemblance. Elle prsente cependant linconvnient majeur dtre extrmement sensible aux hypothses faites sur les valeurs initiales de la variable explique. Suivant que ces
valeurs sont considres comme fixes ou alatoires et corrles ou non avec les
effets individuels, on obtient des modles sensiblement diffrents et les biais destimation peuvent tre svres dans le cas o la spcification retenue nest pas
la bonne. Pour cette raison, cette mthode destimation nest plus beaucoup
utilise et ne sera pas prsente ici 5 ;
la seconde consiste partir dun estimateur biais et de corriger ce biais. Cest la
dmarche suivie par Kiviet (1995) qui propose un estimateur within corrig du
biais analys prcdemment. Cependant, lintrt de cette approche est limit
par le fait quelle nest applicable quaux panels cylindrs et quelle ne prend
pas en considration lventuelle endognit des autres variables explicatives 6 ;
la troisime est dutiliser la mthode des variables instrumentales, les instruments utiliss tant des retards en niveau ou en diffrences de la variable explique. La mthode des moments gnraliss, qui est une extension de la mthode
des variables instrumentales est de plus en plus utilise.
La mthode des variables instrumentales est utilise sur un modle qui a t pralablement transform de manire liminer les effets individuels. La transformation within apparat de prime abord comme un choix naturel, elle est cependant
peu adapte. En effet, en labsence dinstruments extrieurs pertinents, les seules
variables instrumentales disponibles sont souvent la variable explicative retarde,
cest--dire ici la variable explique
PT retarde au moins deux fois. Or, avec le modle
1
within, lerreur est : nt T 1
t=2 nt . Elle contient donc lensemble des ralisations de nt et est donc corrle avec lensemble des valeurs retardes de ynt .
Deux transformations alternatives peuvent tre utilises avec profit, la diffrence
premire et la dviation orthogonale.
5. Pour une prsentation dtaille de lestimation dun panel dynamique par le maximum de
vraisemblance, voir Hsiao (2003), chapitre 4.
6. Voir Roodman (2009a), p. 103.
104
1 1 0 . . . 0
0
0 1 1 . . . 0
0
0 0
1 ... 0
0
D= .
..
..
..
..
..
..
.
.
.
.
.
0 0
0 . . . 1 0
0 0
0 . . . 1 1
Lavantage de cette transformation est quelle est simple et intuitive. Elle prsente
cependant trois inconvnients :
le premier est quune observation, la premire, est ncessairement perdue ;
le second est que si les erreurs initiales sont non corrles, celles du modle
transform le sont. En effet, on a t t1 = (t t1 )(t1 t2 ) et donc,
si les sont homoscdastiques
et non corrles, les erreurs transformes sont
homoscdastiques E t2 = 22 , mais corrles pour deux erreurs successives
E (t t1 ) = 2 ;
le dernier est que, pour chaque priode t o une observation est manquante,
deux observations t et t + 1 sont perdues en diffrence.
La transformation en dviations orthogonales ne souffre pas des deux derniers
problmes, elle est par contre moins intuitive car elle consiste calculer la diffrence entre une observation et la moyenne des observations postrieures celle-ci.
Formellement, on a :
!
T
1 X
znt = cnt znt
zns
Tnt s>t
o Tnt est le nombre dobservations
postrieures t pour lindividu n et cnt un
q
Tnt
facteur dchelle gal Tnt +1 .
Comme pour la transformation en diffrences premires, une observation est perdue, mais il sagit dsormais de la dernire. Sous forme matricielle, pour un panel
cylindr, la transformation scrit zt = Oz, avec z = (z1 , z2 , . . . zt ) et :
q
T 1
1
1
...
1
1
T
T (T 1)
T (T 1)
T (T 1)
T (T 1)
T 2
1
1
1
0
...
T 1
(T 1)(T 2)
(T 1)(T 2)
(T 1)(T 2)
q
T 3
1
1
O=
0
0
. . .
T 2
(T 2)(T 3)
(T 2)(T 3)
..
..
..
..
..
..
.
.
.
.
.
q
q.
1
0
0
0
...
12
2
En supposant que les erreurs initiales sont homoscdastiques et non corrles, on
a alors, pour les erreurs transformes :
105
V(
) = E(
> ) = E(O > O> ) = 2 OO> = 2 I
Le dernier rsultat est d au fait que les lignes de O sont mutuellement orthogonales.
De plus, en cas dobservations manquantes pour une priode, seule cette observation sera perdue pour lestimation, contre deux pour le modle estim en diffrences
premires.
Lestimateur propos par Anderson & Hsiao (1982) utilise le modle crit en diffrences premires de manire liminer les effets individuels. La variable explicative yn(t1) = yn(t1) yn(t2) est alors corrle avec lerreur en diffrences
nt = nt n(t1) . Si les innovations ne sont pas auto-corrles, yn(t1) peut
tre instrument soit par yn(t2) = yn(t2) yn(t3) , soit par yn(t2) . Dans les
faits, il savre que yn(t2) est un bien meilleur instrument que yn(t2) .
Exemple 7.4
Afin de calculer lestimateur de Anderson & Hsiao (1982), on doit spcifier que les
variables explicatives et explique sont en diffrences et que lendogne retarde
en diffrence est intrumente par lendogne en niveau retarde de deux priodes.
Acemoglu et al. (2008) ont choisi galement dinstrumenter le revenu par tte en
utilisant un deuxime retard. Le modle est dcrit simplement en utilisant une
formule deux parties 7 , la premire partie indiquant les variables explicatives et
la seconde les instruments, les deux parties tant spares par le signe |.
> ahsiao <- plm(diff(democracy) ~ lag(diff(democracy)) +
+
lag(diff(income)) + year - 1 |
+
lag(democracy, 2) + lag(income, 2) + year - 1,
+
DemocracyIncome, index = c("country", "year"),
+
model = "pooling", subset = sample == 1)
> coef(summary(ahsiao))[1:2, ]
106
7.2
7.2.1
Cet estimateur prend en compte le fait que le nombre dinstruments valides augmente avec t. Le caractre dynamique du modle rend la premire observation
inutilisable. Le fait que le modle soit estim en diffrences premires fait perdre
la seconde observation. Par consquent, la premire observation utilisable est la
troisime, pour laquelle le modle scrit :
yn3 yn2 = (yn2 yn1 ) + (n3 n2 )
Pour cette observation, yn1 est le seul instrument valable. Pour la quatrime observation, lerreur est n4 n3 , yn2 et yn1 sont des instruments valables. Ainsi,
un instrument supplmentaire est ajout ds que t augmente de 1. Pour lindividu
n, la matrice dinstruments scrit :
Zn =
yn1
0
0
..
.
0
yn1
0
..
.
0
yn2
0
..
.
0
0
yn1
..
.
0
0
yn2
..
.
0
0
yn3
..
.
...
...
...
..
.
0
0
0
..
.
0
0
0
..
.
0
0
0
..
.
0
0
0
..
.
...
...
...
yn1
yn2
...
yn(T 2)
(7.4)
N
N
1 X >
1 X
mn =
Z (yn Xn )
N n=1
N n=1 n
(7.5)
107
N
X
!1
Zn> Xn
n=1
N
X
!
Zn> yn
n=1
n Xn Zn A
n Zn yn
7.2.2
(7.7)
Pour que cet estimateur puisse tre calcul, il faut choisir une matrice de pondrations. Le choix le plus simple pour A est la matrice identit. Dans ce cas, la
fonction minimiser est simplement la somme des carrs des diffrents lments
du vecteur. Cette solution nest pas efficace dans le cas o les variances de ces
diffrents lments sont diffrentes. Dans ce cas, intuitivement, il est plus efficace
daccorder un poids dautant plus lev un lment du vecteur que sa variance est
faible. La matrice de pondration est alors une diagonale contenant linverse de la
variance de chaque lment. De plus, si des lments du vecteur sont corrls, leurs
poids conjoints doivent tre rduits car ces lments vhiculent une information
similaire. De manire gnrale, la matrice optimale de pondrations est linverse
de la matrice de variance-covariance du vecteur de moments 8 . On a donc :
!
N
N
1 X
1 X
1
mn = 2
V(mn )
A = V(m)
=V
N n=1
N n=1
8. Voir Hansen (1982).
108
h = DD =
>
2
1
0
..
.
1
2
1
..
.
0
1
2
..
.
...
...
...
..
.
0
0
0
..
.
(7.8)
N
N
2 X >
1 X
V(m
)
=
Z hZn
n
N 2 n=1
N 2 n=1 n
(7.9)
2 est un scalaire inconnu qui ne joue aucun rle dans lestimation et qui peut donc
tre ignor. Lestimateur qui utilise cette matrice de pondrations est qualifi desP
1
N
>
timateur en une tape. Il sobtient simplement en substituant
n=1 Zn hZn
A dans lquation (7.7). Afin de calculer sa variance, on commence par remplacer
yn dans (7.7) par Xn + n . On obtient alors :
(1)
h P
P >
1 P >
i1
>
n Xn Zn
n Zn hZn
n Zn Xn
h P
P >
1 P >
i
>
X
Z
Z
hZ
Z
n
n
n
n
n
n
n
n
n
X
Z
Z
hZ
n
n n
n
P
Pn n >
>
Z
E
Z
n
n i
n
1 P n > n
P n>
Z
hZ
Z
X
n
n
n n
n n
h P
P >
1 P >
i1
>
X
Z
Z
Z
hZ
X
n
n
n
n
n
n n
n n
(7.10)
(7.11)
109
(1)
= 2
Xn> Zn
!1
!1
!
X
Zn> hZn
Zn> Xn
(7.12)
(7.14)
Si, contrairement aux hypothse faites, les erreurs sont htroscdastiques et/ou
autocorrles, lestimateur en une tape demeure convergent, mais deux problmes
classiques se posent :
dune part, la matrice de pondrations utilise nest pas une estimation convergente de la bonne matrice de pondration, ce qui se traduit par une perte
defficacit ;
dautre part, lestimation de la variance donne par lquation (7.14) nest pas
convergente. Par consquent, tous les tests bass sur cette variance estime seront biaiss.
7.2.3
(1)
(1)>
(1) une matrice bloc diagonale constitue des blocs :
avec
n
n
pour
110
=
X > Z
(1) Z
Z >
1
X > Z
(1) Z
Z >
1
Z > X
Z > y
1
(7.16)
(7.17)
111
Tous les retards disponibles tant utiliss, le nombre dinstruments est trs important. On a en effet : 0.5 (11 1) (11 2) = 45 instruments gmm plus les
9 variables indicatrices de la priode et le revenu retard de deux priodes, soit
J = 55.
Notons que ces rsultats sont proches de ceux du modle dAnderson & Hsiao
(1982) ( coefficient autorgressif proche de 0.5 et coefficient du revenu non significatif).
7.2.4
112
variable explique y par rapport aux valeurs prdites des estimations prcdentes
Plus le nombre dinstruments J sera important, meilleurs seront les rsultats
X.
sera dautant plus proche de X que
des premires estimations, cest--dire que X
J sera lev. Si J devient suprieur ou gal au nombre dobservations, on aura
= X et lestimateur des variables instrumentales sera identique celui des
X
moindres carrs ordinaires. On parle de problme d over-fitting 9 .
Afin de limiter le nombre dinstruments, plusieurs solutions sont envisageables. La
premire consiste limiter le nombre de retard pour les instruments. Par exemple,
pour T = 10, si on limite le nombre de retards 3, on obtient 1 instrument pour
t = 3, 2 pour t = 4, 3 pour t = 5 . . . 10, soit au total 21 instruments contre 36 si
tous les retards sont utiliss.
La seconde consiste agglomrer les conditions de moments 10 . Dans ce cas, la
matrice dinstruments (7.4) est remplace par la matrice suivante :
yn1
yn2
yn3
..
.
Zn =
yn(T 3)
yn(T 2)
0
yn1
yn2
..
.
0
0
yn1
..
.
0
0
0
..
.
yn(T 4)
yn(T 3)
yn(T 5)
yn(T 4)
yn(T 6)
yn(T 5)
...
...
...
..
.
0
0
0
..
.
. . . yn2
. . . yn3
0
0
0
..
.
yn1
yn2
P
1
0
0
0
..
.
0
yn1
(7.18)
Nous estimons le modle gmm en diffrences avec les deux variables democracy
et income utilises comme instruments gmm en utilisant lensemble des retards
disponibles.
> diff25 <- pgmm(democracy ~ lag(democracy) + lag(income) |
+
lag(democracy, 2:99) + lag(income, 2:99),
+
DemocracyIncome25, model = "twosteps")
9. Voir Roodman (2009a), pp.98-99.
10. Voir Roodman (2009b), p.148.
113
[,1]
[,2]
[,3]
lag(democracy) 0.4066085 0.4678152 0.50272735
lag(income)
-0.1713431 -0.1257871 -0.04221125
On constate que les rsultats des trois modles sont relativement similaires.
7.3
7.3.1
114
Le seul instrument disponible pour cette observation est yn1 . Lestimateur des
moments gnraliss se ramne donc lestimateur des variables instrumentales,
yn2 tant instrument par yn1 . En appliquant la dmarche des doubles moindres
carrs, on estime dans un premier temps yn2 en fonction de yn1 , puis dans un
second temps yn3 en fonction de
yn2 . La premire estimation correspond au
modle linaire suivant :
yn2 = yn1 + n
Le modle structurel tant ynt = yn(t1) + n + nt , lquation estimer peut
galement scrire :
yn2 = ( 1)yn1 + n + n2
Lestimateur des mco est alors :
= ( 1) +
1/N
yn1 (n + n2 )
P 2
1/N n yn1
n
k
2 /2 + k
(7.19)
7.3.2
Arellano & Bover (1995) et Blundell & Bond (1998) ont montr quavec des hypothses faibles sur la manire dont les donnes sont gnres, une condition de
moment supplmentaire existe pour lquation en niveau qui scrit :
ynt = yn(t1) + n + nt
Les conditions de moment supplmentaires scrivent :
E yn(ts) (n + nt ) = 0 s = 1 . . . t 1
Elles indiquent donc que yn(ts) sont des instruments valides pour yn(t1) dans
lquation en niveau. Si les conditions de moments pour le modle en diffrences
115
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
1.0
(7.20)
( + 4 )y3
(7.21)
( + 4 )y2
(7.22)
(7.23)
(4 3 )y2
(7.24)
(4 3 )y1
(7.25)
116
On a donc : mn(t1) = 0 mnt = 0. Cette quation indique donc que la condition de moment est soit vrifie pour toutes les priodes, soit pour aucune. Cette
situation est illustre sur la figure 7.3 13 . Une interprtation plus pragmatique de
cette quation est que mn dcrot au cours du temps un taux donn par . Si
le processus a dbut il y a longtemps, y est proche de sa valeur stationnaire et
la condition de moment est acceptable, mme si elle nest pas exactement vrifie.
Cette situation est illustre sur la figure 7.4.
7.3.3
Lestimateur qui ajoute au modle estim en diffrences des conditions de moments sur le modle en niveau est appel estimateur des moments gnraliss en
systme ou sys-gmm. Cet estimateur est obtenu en utilisant le vecteur derreurs
en diffrence et en niveau :
+
n = (n , n ) = (n , n )
et la matrice de moments augmente suivante :
Zn
0
0
...
0 yn2
0
.
..
+
Zn =
0
0
yn3 . . .
0
0
0
...
0
0
0
yn(T 1)
13. Cette figure et la suivante sont inspires de Roodman (2009b) p.145 et 147.
117
12
10
0
0
10
15
20
25
30
10
10
15
20
25
30
Fig. 7.4 Le cas o la condition est quasiment vrifie pour les dernires priodes
118
Zn+>
n ()
n ()
!>
=
yn1 n3 ,
yn1 n4 ,
yn1 nT ,
yn2 n4 , . . . ,
yn2 nT , . . . ,
yn(T 2) nT ,
!>
n3 yn2 ,
n4 yn3 , . . . ,
nT yn(T 1)
Le choix dune matrice de pondration initiale est moins vident que dans le cas
du modle en diffrence. En effet, dans celui-ci, seul le vecteur des erreurs en diffrences est utilis et par consquent la variance de ce vecteur est, avec les hypothses
dabsence dautocorrlation et dhomoscdasticit des innovations, proportionnelle
une matrice connue, le coefficient de proportionnalit tant 2 dont lestimation
nest pas ncessaire (voir 7.8). En revanche, ici, le vecteur derreurs augment inclue les erreurs en niveaux, et donc les effets individuels. Dans ce cas, la matrice
de variance dpend de 2 et de 2 . Pour rsoudre ce problme et disposer dune
matrice initiale connue, on peut supposer 2 = 0. Dans ce cas :
V(+
n)
=E
n
n
n> , n>
=E
Dn n> D>
n n> D>
Dn n>
n n>
=
h
D>
D
I
Exemple 7.7
Le modle gmm en systme est obtenu dune manire similaire au modle en diffrence, la seule diffrence tant que largument transformation doit tre fix "ld"
(pour level et difference), sa valeur par dfaut tant "d" pour difference.
> sys2 <- pgmm(democracy ~ lag(democracy) + lag(income) |
+
lag(democracy, 2:99)| lag(income, 2),
+
DemocracyIncome, index = c("country", "year"),
+
model = "twosteps", effect = "twoways",
+
transformation = "ld")
> coef(summary(sys2))
7.4
119
Infrence
Lestimation dun modle par la mthode des moments gnraliss pose deux types
de problmes en termes dinfrence :
le premier est que, mme si lestimation du modle est convergente, il nen est pas
ncessairement de mme pour la matrice de variance-covariance des coefficients
si la formule classique de cette matrice est applique. On peut alors mettre en
oeuvre des estimateurs robustes de cette matrice ;
le second est que lestimation nest convergente que si certaines hypothses sont
vrifies : en particulier lhypothse dabsence de corrlation des innovations et
celle de validit des conditions de moments.
7.4.1
estimateur convergent de la variance des moments, ce qui permet, en introduisant cette expression dans (7.11), dobtenir lestimateur robuste de la variance des
coefficients du modle en une tape :
1
>
>
1 >
X Z(Z HZ) Z X
Lexpression de lestimateur en deux tapes est donne par (7.16). La difficult est
(1) , qui dpend lui-mme de (1) et donc de y. Par
que lestimateur dpend de
imprcise pour deux raisons. La premire est que le nombre de paramtres est
trs important (J (J + 1)/2). La seconde est que ces paramtres sont des moments dordre 2 de moments dordre 2, donc des moments dordre 4 des donnes
originales 14 . La dmarche propose par Windmeijer (2005) permet dobtenir une
estimation convergente de la variance de lestimateur en deux tapes. Pour commencer, on remplace dans (7.16) y par X + . On obtient alors :
1
1
>
(1) Z
(2) =
X > Z Z >
Z
X
(7.27)
1
>
(1) Z
X > Z Z >
Z
120
=
g(y, )
X > Z Z > Z
Z > X
1
Z >
X > Z Z > Z
(7.28)
) |
D=
g(y,
=
Le dveloppement limit scrit alors :
(1) ) g(y,
) + D((1) )
g(y,
(2) g(y,
) + Dg(y, H) g(y,
) + Dg(y, H)
V
Soit encore :
(2)
V
(7.29)
par
(1) , g(y,
)g(y,
)> et g(y,
)g(y, H)>
En remplaant par
(1) et
h
i
1
(2) = X > Z(Z >
(1) Z)1 Z > X
sont tous les deux approxims par V
. De
(1)
1
. On obtient
= V
plus, g(y, H)g(y, H)> = X > Z(Z > HZ)1 Z > X
donc finalement lexpression de la matrice de variance robuste de lestimateur en
deux tapes :
(2)
(2) D> + DV
(1) D> + V
(2) + DV
(2)
V
=V
Lexpression de D est donne par Windmeijer (2005).
Exemple 7.8
La fonction vcov permet dobtenir lexpression classique et non convergente de
la variance et vcovHC permet dobtenir la version robuste (quations 7.26 pour le
modle en une tape et 7.29 pour le modle en deux tapes). Nous extrayions cidessous les carts-types des deux premiers coefficients pour le modle en diffrences
en deux tapes.
121
> sqrt(diag(vcov(diff2)))[1:2]
lag(democracy)
0.04794953
lag(income)
0.04645903
> sqrt(diag(vcovHC(diff2)))[1:2]
lag(democracy)
0.10783032
lag(income)
0.06053787
7.4.2
Si P
les conditions de moments sont valides, le vecteur de moments empiriques m
=
1
>
est
desprance
nulle.
Si
cette
hypothse
est
vrifie,
la
statistique
Z
n
n n
N
de Wald :
m
> V(m)
1 m
(2)> Z
1
>
N 2 Z (1) Z
(1) Z
Z >
1
1
1 >
(2)
N Z
Z >
(2)
122
La probabilit critique pour le modle qui utilise toutes les conditions de moment
est proche de 1, alors que celles des deux autres modles sont bien infrieure ; en
particulier, pour le modle qui limite le nombre de retards 3, lhypothse de
validit des conditions de moment est rejete au seuil de 5%.
7.4.3
123
= X( )
En insrant cette expression dans la statistique de test, on obtient :
al = 1N > ( )> X > l X l ( )
= 1N > l
1
>
l
N ( )
N X
> 1
N ( ) N X > l
N ( )> 1 1 X > X l N ( )
+
N N
)X
V(
)
l +
l> X V(
N
)
2
l> X(X > ZAZ > X)1 XZAZ > V(
l
La statistique de test est alors obtenue en divisant al par la racine carr de lexpression prcdente et elle suit une distribution normale si lhypothse dabsence
dautocorrlation est vrifie. Le modle tant exprim en diffrence, le test dautocorrlation dordre 1 nest pas pertinent car nt = nt n(t1) est corrl
124
avec n(t1) = n(t1) n(t2) du fait de la prsence de n(t1) dans les deux
diffrences successives. En revanche, le test dautocorrlation dordre 2 est pertinent, puisquil consiste analyser la corrlation entre nt = nt n(t1) et
n(t2) = n(t2) n(t3) , qui existe si n(t1) est corrl n(t2) , cest--dire
si les innovations en niveau prsentent une autocorrlation dordre 1.
Exemple 7.10
Le test dautocorrlation des innovations de Arellano & Bond (1991) est obtenu
laide de la fonction mtest . Largument order est ici fix 2 conformment la
remarque prcdente.
> mtest(diff2, order = 2)
Autocorrelation test of degree 2
data:
normal = 0.8809, p-value = 0.1892
Median
0.000000
838
Mean
0.001891
3rd Qu.
0.000000
Max.
1.079000
Coefficients
Estimate Std. Error z-value Pr(>|z|)
lag(democracy) 0.5540073 0.1078303 5.1378 2.78e-07 ***
lag(income)
0.0018436 0.0605379 0.0305
0.9757
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Sargan Test: chisq(44) = 49.8814 (p.value=0.25098)
Autocorrelation test (1): normal = -4.457875 (p.value=4.1388e-06)
Autocorrelation test (2): normal = 0.8592423 (p.value=0.1951)
Wald test for coefficients: chisq(2) = 28.13308 (p.value=7.78e-07)
Wald test for time dummies: chisq(9) = 33.6682 (p.value=0.00010211)
7.5
125
Exemples dapplication
Les articles utilisant la mthode des moments gnraliss en panel sont trs nombreux. Nous nous contenterons ici de dcrire ceux pour lesquels les donnes sont
disponibles dans les librairies plm et pder.
Ltude de Levine et al. (2000) vise analyser sil existe une relation de causalit
entre la qualit du systme financier (qui permet de limiter les asymtries dinformation et de faciliter les transactions) et la croissance conomique. A cet effet, ils
estiment un modle dans lequel la croissance conomique est estime en fonction
dun ensemble de variables de contrle et des caractristiques exognes du systme financier. Ils utilisent un panel de 74 pays pour lequel ils ont 7 observations
de priodes de 5 ans allant de 1960 1995. Le taux de croissance en logarithme
est rgress en fonction du niveau de richesse initiale en logarithme, et de trois
indicateurs de la qualit du systme financier : le degr de liquidit du systme
financier, le rapport entre les dpts des banques commerciales et la somme des
dpts des banques commerciales et de la banque centrale et le rapport entre les
crdits accords lconomie et le PIB. Les deux modles gmm en diffrences et
en systme sont estims et les trois indicateurs de la qualit du systme financier
ont une influence significativement positive sur la croissance, en particulier dans
le cadre de lestimation en systme. Roodman (2009b) revient sur cette tude en
sintressant au problme de prolifration des instruments, susceptible daboutir
une validation fallacieuse de lhypothse de validit des conditions de moments. En
particulier, dans ltude originale, la probabilit critique du test de Hansen pour
les conditions de moments du modle en niveau est de 0.97. Des spcifications diffrentes, plus conomes en termes de nombre dinstruments, utilises par Roodman
(2009b) donnent des rsultats bien diffrents. En effet, la probabilit critique est
de 0.001 et lhypothse de validit des conditions de moments supplmentaires du
modle en systme est rejete. Les donnes permettant de reproduire ces rsultats
sont disponibles sous le nom de FinGrowth dans la librairie pder.
Forbes (2000) sintresse linfluence de lingalit de la distribution des revenus
sur la croissance conomique. A cet effet, un panel de 45 pays pour 6 priodes
quinquennales allant de 1960 1995 est utilis. La croissance est estime en fonction du revenu par tte en logarithme retard dune priode, du coefficient de Gini
retard dune priode, du niveau dducation des hommes et des femmes et du niveau de prix de linvestissement. Plusieurs mthodes destimation sont utilises, en
particulier lestimateur gmm en diffrences de Arellano & Bond (1991). Le rsultat
principal de ltude est que le coefficient associ lindice de Gini est positif et
significatif au seuil de 5%. Ce rsultat est en contradiction avec beaucoup dtudes
ralises en coupe transversale qui concluent une relation ngative entre ingalit et croissance. Cette tude a t reprise par Roodman (2009b) afin dillustrer le
risque dutiliser des instruments faibles et nombreux. En effet, le coefficient autorgressif est proche de 1 et le nombre dinstruments est trs lev (80, alors quil ny
a que 138 observations). Roodman (2009b) utilise plusieurs autres spcifications
qui limitent le nombre dinstruments et, dans ce cas, lindice de Gini nest plus
126
significatif.
Caselli et al. (1996) sintressent lanalyse de la croissance conomique des pays
et en particulier au phnomne de convergence. Il partent des rsultats obtenus
dans de nombreuses tudes ralises en coupe transversale qui aboutissent pour
la plupart la conclusion que les pays convergent vers leur tat stationnaire un
taux trs faible, gal environ 2-3%. Leur argument est que ces tudes souffrent
de deux problmes de spcification : le premier est la non prise en compte de
la nature dynamique du modle et le second est la non prise en compte de la
possible endognit des variables explicatives. Les auteurs appliquent lestimateur
de Arellano & Bond (1991) sur un panel de 93 pays et 6 priodes quinquennales
de 1965 1985. Ils aboutissent un taux de convergence beaucoup plus lev, de
lordre de 10%. Bond et al. (2001) indiquent que les rsultats obtenus doivent tre
pris avec circonspection dans la mesure o la variable explique tant quasiment
une variable racine unitaire, les instruments utiliss dans le modle sont faibles.
Ils restiment le mme modle en utilisant lestimateur de Blundell & Bond (1998)
et ils obtiennent alors un taux de convergence beaucoup plus faible, de lordre de
2-4%.
Dans leur article fondateur, Arellano & Bond (1991) ont utilis des donnes de 140
entreprises britanniques de 1976 1984 afin destimer une quation de demande de
travail. Celle-ci est dynamique du fait de linclusion de deux retards de la variable
explique. Les autres variables explicatives utilises, elles aussi avec deux retards,
sont le taux de salaire, le stock de capital et le niveau de production. Ces donnes
ont t utilises dans de nombreux autres articles, en particulier Blundell & Bond
(1998), Windmeijer (2005) et Roodman (2009a). Elles sont disponibles sous le nom
de EmplUK dans la librairie plm.
Alonso-Borrego & Arellano (1999) mnent une tude sur des donnes similaires
concernant 738 entreprises espagnoles sur la priode 1983-1990. Un modle var
est utilis pour lemploi et le taux de salaire. Ces donnes sont disponibles sous le
nom de Snmesp dans la librairie plm.
Mairesse & Hall (1996), Blundell & Bond (2000) et Bond (2002) ont estim une
fonction de production Cobb-Douglas sur un panel de 509 entreprises amricaines
sur la priode 1982-1989. Les variables explicatives sont, en logarithme, lendogne
retarde et les deux facteurs de production (travail et capital) contemporains et
avec un retard. Les rsultats de Mairesse & Hall (1996), obtenus en utilisant lestimateur de Arellano & Bond (1991) sont surprenants : lhypothse de rendements
constants est rejete et le coefficient associ au capital est faible et non-significatif.
Blundell & Bond (2000) montrent que ces mauvais rsultats sont ds au fait que
les variables utilises sont proches dtre des processus de racine unitaire. Dans
ce cas, on sait que lestimateur gmm en diffrences donne de mauvais rsultat car
les instruments sont faibles. En revanche, les rsultats quils obtiennent en utilisant lestimateur en systme donne des rsultats plus plausibles (hypothse de
rendements constants non rejete et coefficient associ au capital significatif). Ces
donnes sont disponibles sous le nom de RDPerfCompanies dans la librairie pder.
Bond (2002) prsente un exemple destimation de modle autorgressif simple en
127
utilisant une srie de taux dinvestissement pour 703 entreprises amricaines sur
la priode 1987-2000. Ces donnes sont disponibles sous le nom de InvRate dans
la librairie pder.
Kessler et al. (2011) sintressent linfluence des transferts inter-rgionaux dans
un Etat fdral sur les ingalits entre les rgions. Leur modle thorique prdit
que, contrairement lintuition, ces transferts peuvent aggraver les ingalits interrgionales. Ils utilisent des donnes pour 17 pays de lOCDE sur la priode 19821999, en utilisant en particulier la mthode destimation de Arellano & Bond
(1991). Les rsultats indiquent effectivement quun accroissement des transferts
aggrave les ingalits inter-rgionales. Ces donnes sont disponibles sous le nom
de RegIneq dans la librairie pder.
128
Chapitre 8
8.1
8.1.1
Le modle binomial
Introduction
On considre une modle pour lequel la variable explique est binomiale, les deux
valeurs possibles tant notes 0 et 1. On dfinit une variable latente y , qui est
une variable continue inobservable. Cette variable latente est relie la variable
binomiale observe y par la rgle dobservation suivante :
130
y > y = 1
y y = 0
Sans perte de gnrait, on peut supposer que = 0. La valeur de la variable
latente est la somme dune combinaison linaire de variables explicatives et dun
terme derreur.
y = > x +
Les probabilits associes aux deux valeurs possibles de la variable explique sont
alors :
P (y = 0) = P ( > x)
P (y = 1) = P ( > > x)
En notant F la fonction de densit cummule de , nous avons :
P (y = 0) = F ( > x)
P (y = 1) = 1 F ( > x) = F ( > x)
la dernire expression tant valable si la densit de est symtrique. En notant
q = 2y 1, qui est gal 1, +1, la probabilit peut tre exprime en utilisant
lexpression compacte suivante :
P (y) = F (q > x)
La moyenne et la variance de la variable latente ne sont pas identifies. Deux
fonctions de distribution sont couramment utilises. La distribution normale :
Z
2
1
e
F () = () =
2
e
1 + e
avec :
131
Fi
i
et la hessienne :
X
2 ln L
=
>
fi0
Fi
fi
Fi
2 !
qi2 xi x>
i
1
+
ez i
i
X ezi
2 ln L
=
q 2 x x>
>
zi i i i
1
+
e
i
alors que pour le modle probit, on obtient :
ln L X i
=
qi xi
i
i
X i
i
2 ln L
=
zi +
qi2 xi x>
i
>
i
i
i
8.1.2
Panel
ynt
= > xnt + n + nt
Le terme derreur est classiquement la somme de deux composantes, un effet individuel n et un terme isiosyncratique nt . Deux observations du mme individu
sont alors corrles du fait de la prsence de n . Si le vecteur contient une
constante, on peut suposer sans perte de gnralit que E() = 0.
ynt
= > xnt + n + nt
132
T
Y
F qnt ( > xnt + n )
t=1
T
+ Y
1
2
e0.5( ) d
F qnt ( > xnt + )
2
t=1
d
v=
dv =
2
2
1
Ln =
T
+ Y
2
F qnt ( > xnt + 2v) ev dv
t=1
Il ny a pas dexpression analytique pour cette intgrale, mais elle peut tre approxime numriquement de manire efficace en utilisant les quadrature dHermite.
On a alors :
R
T
R
Y
1 X
1 X
wr
F qnt ( > xnt + 2vr ) =
wr Fir
Ln =
r=1
t=1
r=1
avec : Fir =
QT
t=1
2vr )
r
gnt
=
hrnt =
r
ln Fnt
r
znt
r
2 ln Fnt
2
r
znt
Ln r=1 n
t=1
2 ln Ln
>
8.1.3
133
" T
R
X 2
1 X r
xnt
r
r
=
x>
,
2vr
Fn w r
qnt hnt
nt
2vr
Ln r=1
t=1
!#
! X
T
T
X
x
nt
r
r
x>
ant gnt
+
ant gnt
nt , 2vr
2vr
t=1
t=1
>
ln Ln
ln Ln
Application
134
**
.
*
*
*
.
*
*
. 0.1 1
On constate que la probabilit de rlection est plus forte dans les pays en dveloppement, dans les pays nouvellement dmocratique et pour les systmes lectoraux
majoritaires. Le taux de croissance du pib a galement leffet positif attendu sur la
probabilit de rlection. Concernant la politique budgtaire, les coefficients associs aux deux variables indiquant la variation du surplus budgtaire lapproche de
llection sont positifs ; cela signifie quune politique budgtaire lectoraliste na
pas deffet positif systmatique sur la rlection. A linverse, les rsultats indiquent
que les lecteurs auraient plutt tendance pnaliser ce type de politique.
8.2
8.2.1
Modle ordonn
Introduction
Un modle ordonn est un modle pour lequel la variable explique peut prendre
J valeurs (avec J > 2). La modlisation est similaire au modle binomial. On
considre une variable latente, gale comme prcdemment la somme dune combinaison linaire de variables
explicatives et dun terme derreur :
y = > x +
Notons = (1 , 1 , . . . , J , J+1 ) un vecteur de paramtres, avec 1 = et
J+1 = +. La rgle dobservation pour les diffrentes valeurs de y scrit alors :
y
y
= 1
= 2
..
.
..
.
y
y
= J 1
= J
J1
1
2
..
.
>x +
>x +
..
.
2
3
>x +
J
> x + J+1
135
wyn +1
wyn
Pyn
Pyn
2 ln Ln
>
xn
wyn +1
ln Ln
8.2.2
>
x>
n , wyn +1
ln Ln
fyn +1
Py n
xn
wyn
>
x>
n , wyn
fyn
Py n
>
Panel
Le raisonnement est similaire celui adopt pour le modle binomial. La probabilit jointe pour un individu n pour une valeur donne de leffet individuel est :
T
Y
F ynt +1 > xnt n F ynt > xnt n
t=1
Z
Ln =
T
+ Y
t=1
1
2
F ynt +1 > xnt n F ynt > xnt n
e0.5( ) d
2
1
Ln =
T h
+ Y
i
2
F ynt +1 > xnt 2v F ynt > xnt 2v ev dv
t=1
1 X
Ln =
wr
F ynt +1 > xnt 2vr F ynt > xnt 2vr
r=1
t=1
136
En notant :
r
mrnt = m(z
nt )
xn
= wynt
Mnt
2vr
+r
znt
= ynt +1 > xnt 2vr
+r
m+r
nt = m(z
nt )
xn
r+
Mnt = wynt +1
2vr
R
T
Y
+r
1 X
r
Ln =
wr
Fnt Fnt
r=1
t=1
QT +r
r
Fnt
avec > = ( > , > , ) le vecteur complet de paramtres estimer, Fnr = t=1 Fnt
+r
+r
r
r
ln[Fnt
Fnt
2 ln[Fnt
Fnt
] r
]
r
=
gnt
, hnt =
le gradient et la hessienne scrivent :
z r
z r 2
nt
nt
R
X
1
ln Ln
=
Ln
ln Ln
>
Ln
R
X
r=1
wr Pnr
e+r
ynt
t=1
r
Fy+r
nt Fynt
8.2.3
ln Ln
r
fyrnt Mnt
Fy+r
nt
ln Ln
r
r
gnt
Mnt
T
X
!>
+r
+r
gnt
Mnt
r
r
gnt
Mnt
t=1
>
r
r
gnt
Mnt
!
+r
+r
gnt
Mnt
+r
+r
Mnt
Mnt
+r
Mnt
fy+r
nt
)
+r
+r
gnt
Mnt
t=1
t=1
T
X
t=1
T
X
r=1
T
X
T
X
(
wr Fnr
T
X
erynt
t=1
r
Fy+r
nt Fynt
r
r >
Mnt
Mnt
+r
r
Mnt
fyrnt Mnt
fy+r
nt
2
Fyrnt
> !)
>
Application
Raux et al. (2009) ont analys lquit perue de diffrents type de rationnement
de la demande laide dune enqute dans laquelle les individus devaient indiquer
sur une chelle ordinale leur avis sur une proposition de rationnement concernant
soit lallocation de places de TGV, soit de places de parking. La variable explique
answer prend des valeurs entires de 0 (trs injuste) 3 (trs juste). La principale
variable explicative indique le type de rationnement propos : tarification de pointe
peak, rgle administative admin, tirage au hasard lottery, offre complmentaire
addsupply, file dattente queuing, rgle morale moral et rgle de compensation
compensation. Les autres variables explicatives indique que le rationnement est
rcurrent ou non reccuring, que la personne interroge a un diplme education
et quelle dispose ou non dun permis de conduire driving. Lestimation suivante
137
8.3
8.3.1
Modle tobit
Introduction
138
vraisemblance dpend alors du fait que cette observation soit nulle ou positive.
Pour une observation nulle, il sagit dune probabilit :
>x
P(y = 0) =
alors que pour une observation positive, il sagit de la densit :
1
f (y) =
y >x
ce qui conduit la fonction de log de vraisemblance :
n
X
1 (yn > xn )2
> xn
1
2
+
0
ln(2 ) +
In
ln L =
In ln
2
2
2
i=1
Le gradient et la hessienne ont pour expression :
ln Ln
=
ln Ln
=
2
In0 n
yn en
+ 2
n
In0 > xn n
In+
23 n
22
xn
1
e2n
2
1
n n
> xn
2 ln Ln
0
=
+
+
y
xn x>
I
n
n
>
2 n
n n
2 ln Ln
=
2
In0
1 n
> xn
n n > x n
+ en
I
xn
+
+
n 4
2 3 n
n n 2 4
2 ln Ln
1
=
4
24
e0n
n
n
0
0
+
+2
3 en +
en + In (1 2 en
n
n
8.3.2
139
Panel
P(yn | n ) =
t=1
La probabilit non conditionnelle sobtient en intgrant lexpression prcdente
par rapport leffet individuel :
P(yn ) = q
1
22
P(yn | n )e
1
P(yn ) =
+ Y
t=1
2
12
> xnt +
,
2
22 z
on obtient :
1ynt
1
22 z
P(yn )
(
2 1ynt
2
> xnt + 2
ynt > xnt 2
vr
vr
1
t=1
PR
wr
PR
r
wr Pnt
r=1
r=1
QT
avec :
r
ln Pnt
q
q
T
> xnt + 22 vr
ynt > xnt
X
2
0.5ynt
=
(1 ynt ) ln
ln(2 ) +
2
t=1
Le gradient scrit :
R
x
X
p
ln Ln
1
(1 ynt ) rnt
ynt
nt
r
2v
=
w
P
+
e
2
nt
r nt
r
2vr
(, 2 )
rnt
2
2Ln r=1
140
p
2
>
ent 22 v
r
2
v
)
(1
y
)(
x
+
1
ln Ln
ynt
nt
nt
r nt
r
=
2 1
wr Pnt
3/2
2
rnt
2
2
2Ln r=1
2
R
X
8.3.3
Application
Porto & Revelli (2012) se sont intress aux dterminants du niveau dune taxe
rgionale sur les automobiles en Italie. Les donnes concernent une panel constitu des 100 rgions italiennes sur 7 ans (2000-2007). La variable explique tax
est censure car certaines rgions certaines annes ont choisi de ne pas appliquer
cette taxe. Les variables explicatives sont le fait quil y ait ou non une lection
rgionale election, le fait que le gouvernement rgional soit ou non de droite
right, le montant de subventions reu par la rgion grants en euros par tte, le
revenu rgionale par tte income et le nombre de vhicules immatriculs lanne
prcdente vehicules.
> data("VehiculeTax", package="pder")
FALSE
TRUE
0.8785714 0.1214286
Le taux de taxe moyen est de 16.5% et il est nul pour 12% des observations.
Lestimation du modle tobit effets alatoires nous donne :
> summary(z <- pglm(tax~right+log(grants)+log(income)+vehicules+election,
+
VehiculeTax, family="tobit", R=30))
141
log(grants) 1.96307
0.51455 3.8151 0.0001361 ***
log(income) 6.54658
2.22255 2.9455 0.0032241 **
vehicules
-3.34148
1.26429 -2.6430 0.0082182 **
election
0.10314
0.51589 0.1999 0.8415450
sd.eps
4.96077
0.15649 31.7012 < 2.2e-16 ***
sd.mu
5.68479
0.51949 10.9431 < 2.2e-16 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
--------------------------------------------
8.4
8.4.1
Poisson
Introduction
On considre dsormais un modle pour lequel la variable explique est une variable
de comptage. Nous supposons dans un premier temps que la distribution de y est
une loi de Poisson de paramtre n (qui est la fois la moyenne et la variance
de la variable). Avec cette hypothse de distribution, la probabilit associe yn
scrit :
P (yn ) =
en nyn
yn !
En utilisant le lien logarithmique, le paramtre de Poisson est une fonction loglinaire des variables explicatives :
n = e
>
xn
ee
> xn
e
yn !
>
xn yn
n
X
>
xn
i=1
n
X
i=1
> xn yn
n
X
i=1
>
ln L X
=
yn e xn xn
i=1
n
X
>
ln L
=
e xn xn x>
n
>
i=1
ln yn !
142
8.4.2
Panel
>
xnt
ce qui signifie que lon suppose que leffet individu est multiplicatif. Pour une valeur
donne de cet effet individuel, la probabilit associe ynt scrit :
P(ynt | xnt , n , ) =
ynt
ent nt
en nt (n nt )ynt
=
ynt !
ynt !
PT
Soit Yn = t=1 ynt la somme des ralisations de la variable pour lensemble des
PT
priodes pour lindividu n et n = t=1 nt la somme des paramtres de Poisson.
La somme de variables de Poisson est une variable de Poisson dont le paramtre
est gal la somme des paramtres des variables sommes. Par consquent, nous
avons :
P(Yn | xn , n , ) =
en n (n n )Yn
Yn !
(8.1)
P(yn | xn , n , ) =
en
PT
t=1
nt
QT
QT
t=1
t=1 (n nt )
ynt !
ynt
en i nYn
=
QT
t=1
QT
t=1
ynt !
yntnt
(8.2)
P(yn | xn , n , )
P(Yn | xn , n , )
ce qui implique :
P(yn | xn , , Yn ) =
T
Yn ! Y yntnt
Ynn t=1 ynt !
(8.3)
Yn est une statistique suffisante, ce qui signifie quelle permet dliminer leffet individuel. En prenant le logarithme de cette expression et en sommant pour
lensemble des individus, on obtient le modle de Poisson within :
n
X
ln L(y | x, , Y ) =
ln Yn ! Yn ln
T
X
nt +
t=1
i=1
T
X
143
!
(ynt ln nt ln ynt !)
(8.4)
t=1
ab ax b1
e
x
(b)
avec
Z
(z) =
tz1 et dt
f () =
1
e
()
P(Yn | xn , ) =
P(Yn , xn , , )f ()d =
0
+
Z
P(yn , xn , ) =
P(yn , xn , , )f ()d =
0
n Yn
(Yn + )
Yn ! () (n + )Yn +
T
Y
yntnt
(Yn + )
Y +
y
!
()
(
nt
n + ) n
t=1
ce qui conduit aux fonctions de log de vraisemblance pour les deux modles :
ln L(Y | x, )
ln L(y | x, )
Pn
nt ln Yn ! + ln
i
PT
ln () + ln (Yn + ) (Yn + ) ln
t=1 nt
Pn
i=1
[Yn ln
(8.5)
(8.6)
144
8.4.3
Application
Drakos (2007) sest intress la mesure des actions terroristes. Plus prcisment,
lhypothse teste est quil y a un biais vers le bas dans la publicit faite par les
autorits sur les actions terroristes menes sur leur sol et que ce biais est dautant
plus important que le pays est peu dmocratique, et en particulier que la libert
de la presse nest pas respecte. A cet effet, on souhaite estimer un modle dans
lequel la variable explique est le nombre dactions terroristes (incidents) et les
deux variables explicatives polity qui est un index de rgime politique qui varie de
-10 (rgime trs autocratique) +10 (rgime trs dmocratique) et press qui est
une variable catgorielle avec trois modalits : notFree, partlyFree et Free.
> data("Terrorism", package="pder")
On commence par estimer le modle effets alatoires, qui est le modle par
dfaut :
> ea <- pglm(incidents~polity+press, data = Terrorism,
+
index = c("country", "year"), family = poisson)
> summary(ea)
Le coefficient associ la variable polity est de signe positif et est trs significative. Les coefficients associs aux trois modalits de la variable press sont classs
conformment ce qui tait attendu. Pour tester la significativit de cette variable,
on peut raliser un test de Wald :
> stpress <- as.numeric(coef(ea)[3:4]%*%solve(vcov(ea))[3:4,3:4]%*%coef(ea)[3:4])
> stpress
[1] 5.685158
145
[1] 0.05827518
Lhypothse que la variable press na pas dinfluence nest pas rejete au seuil de
5%, mais elle lest au seuil de 10%.
Les autres modles (pooling, within et between) sont aisment estim en mettant
jour le modle prcdemmment estim :
>
>
>
>
Les rsultats des modles within et effets alatoires sont trs proches, ce qui doit
tre le cas en labsence de problmes de corrlation entre leffet individuel et les
variables explicatives.
8.5
8.5.1
Negbin
Introduction
Les variables de comptage prsentent souvent un phnomne de dispersion excdentaire, ce qui signifie que la variance est souvent suprieure la moyenne. Dans
ce cas, le modle NegBin est une alternative intressante au modle de Poisson.
Ce modle, dans un contexte de coupe transversale, est trs similaire au modle
de Poisson erreurs composes.
Supposons que yn est une variable alatoire qui suit une distribution de Poisson
>
de paramtre n = n n avec n = e xn si le lien est logarithmique, n tant
une variable alatoire.
La probabilit conditionelle pour yn est :
146
P(yn | xn , n , ) =
en n (n n )yn
en nyn
=
yn !
yn !
On suppose que n suit une distribution gamma et, comme on la vu prcdemment, la moyenne nest pas identifie de fait quune distribution un paramtre
est choisie, qui impose une moyenne unitaire.
f () =
1
e
()
P (yn | xn ) =
0
P (yn | xn ) =
n
n + n
ei (i )yi 1
e
d
yi !
()
n
n
n + n
yn
(yn + n )
(yn + 1)(n )
1 2
n n
2k
n
8.5.2
Panel
(nt + ynt )
(nt )(ynt + 1)
t=1
(n )(Yn + 1)
(n + Yn )
(8.7)
(n + Yn ) (a + b)(a + n )(b + Yn )
(n )(Yn + 1) (a)(b)(a + b + n + Yn )
(8.8)
P(yn | xn , , Yn ) =
P(Yn | xn , ) =
T
Y
(a + b)(a + n )(b + Yn )
P(yn , xn , ) =
(a)(b)(a + b + n + Yn )
T
Y
(nt + ynt )
(nt ) + (ynt + 1)
t=1
147
!
(8.9)
148
Chapitre 9
Racines unitaires et
cointgration
9.1
Introduction
1 t 2
1
2
1
1
150
10
20
30
40
10
20
30
40
151
2.5%
-2.114024
97.5%
1.990031
FALSE TRUE
0.943 0.057
On constate que les quantiles empiriques sont trs proches des valeurs attendues et
le pourcentage de cas o une relation significative entre les deux variables apparat
est de lordre de 5%. Faisons maintenant la mme exprience avec deux sries
contenant une racine unitaire :
>
>
>
>
2.5%
-9.158448
97.5%
8.227059
FALSE TRUE
0.379 0.621
152
yt = ( 1)yt1 + t
Le test de prsence de racine unitaire se ramne alors un test que le coefficient
estim associ yt1 lorsque la variable explique est yt est nul. On peut alors
penser utiliser une statistique de Student classique, obtenue en divisant 1 par
son cart-type. En posant HO : = 1 vs H1 : < 1, on rejettera alors lhypothse
de racine unitaire au seuil de 5% si la statistique est infrieure 1.64. A cet effet,
on ralise de nouveau un exercice de simulations :
>
>
>
>
+
+
+
+
+
+
R <- 1000
T <- 100
result <- c()
for (i in 1:R){
y <- autoreg(rho=1, T=100)
Dy <- y[2:T] - y[1:(T-1)]
Ly <- y[1:(T-1)]
z <- lm(Dy ~ Ly)
result <- c(result, coef(z)[2] / sqrt(diag(vcov(z))[2]))
}
0.0
0.1
0.2
0.3
0.4
0.5
153
ce qui conduirait rejeter lhypothse nulle de racine unitaire alors quelle est
vraie environ une fois sur deux. Le test que lon vient de raliser est le test de
Dickey-Fuller, il ncessite lutilisation de valeurs critiques spcifiques qui ne sont
pas celles correspondant une densit normale. On peut galement raliser ce
test en introduisant en plus une constante et/ou un trend dterministe et on peut
galement ajouter des retards de y de manire en prendre en considration une
ventuelle autocorrlation de .
La rgression de deux sries prsentant toutes les deux une racine unitaire est
pertinent si ces deux sries prsentent une relation structurelle de long terme, on
parle alors de co-intgration. Plus prcisment, on dira que deux variables x et y
sont co-intgrs si il existe tel que :
y = x +
avec qui ne contient pas de racine unitaire. Un test simple de cointgration peut
alors tre ralis de la manire suivante :
1. on utilise un test de Dickey-Fuller pour vrifier que x et y ont une racine
unitaire,
2. on estime alors y en fonction de x et on rcupre les rsidus destimation e,
3. on utilise un test de Dickey-Fuller sur e : si on rejette lhypothse de racine
unitaire, x et y sont cointgrs et la rgression de y en fonction de x a du
sens, sinon x et y ne sont pas cointgrs et la rgression de y en fonction de
x est falacieuse.
9.2
Le test classique de racine unitaire est souvent appel adf pour augmented
Dickey-Fuller. Plusieures extensions de ce test ont t proposes afin de le rendre
utilisable et efficace sur donnes de panel.
Rsultats prliminaires
Certains de ces tests sont obtenus en appliquant des tests adf pour chaque individu
de lchantillon. Pour raliser ces tests prliminaires, il faut choisir le nombre de
retards dans la rgression suivante :
ynt = ( 1)yn(t1) +
Ln
X
yn(ts)
s=1
154
2n
2
t=Ln +1 ent
dfn
9.2.1
Test de Levin-lin-Chu
Levin et al. (2002) sont les premiers avoir propos un test de racine unitaire en
panel. Pour raliser ce test, on ralise deux rgressions prliminaires qui consistent
regresser ynt et yit1 en fonction de yitL et dmt de manire rcuperer
deux vecteurs de rsidus nots znt et vnt .
Ces deux rsidus sont ensuite normaliss en les divisant par lcart-type estim, et
on ralise alors une rgression sur lensemble de lchantillon de znt /
n en fonction
de vnt /
n de manire obtenir , son cart-type
(
) et la statistique de Student
t = /
(
).
La variance de long-terme de yn est alors estime :
y2n
"
#
K
T
T
X
X
1
1 X
2
=
wKL
ynt
+2
ynt yntL
T 1 t=2
T 1
L=1
t=2+L
yi
n
PN
s =
i=1 sn
N
Levin et al. (2002) montrent alors que la statistique :
t =
t nTs
2
(
)mT
m
T
suit une distribution normale sous lhypothse nulle de racine-unitaire. Les valeurs
de mT sont m
donnes dans larticle.
T
9.2.2
155
Un des dfaut du test de Levin et al. (2002) est que lhypothse alternative suppose
que est diffrent de 1, mais prend la mme valeur pour tous les individus. Le
test propos de Im et al. (2003) dpasse cette limitation puisque lhypothse nulle
est toujours que = 1 pour tous les individus, mais lhypothse alternative est
dsormais que les valeurs de peuvent tre diffrentes dun individu un autre,
mais que n < 1 pour au moins certains individus.
La statistique de test est base sur la moyenne des statistique de Student pour
obtenues pour chaque individu :
n
1X
tn
t=
n n=1
z=
n (t E(t))
p
V(t)
qui, sous lhypothse nulle de racine unitaire, suis une distribution normale centre
rduite. Les valeurs de E(t) et de V(t) sont donnes dans larticle de Im et al. (2003)
9.2.3
Le test de Madalla et Wu
Maddala & Wu (1999) ont propos un test trs similaire au prcdent, qui nimpose
pas non plus que les valeurs de soient identiques dans lhypothse alternative.
Il est bas sur les N probabilits critiques pn obtenue dans le cadre de test adf
raliss pour chaque individu. La statistique de test scrit alors simplement :
P = 2
N
X
ln pn
n=1
et, sous lhypothse nulle de racine unitaire pour les N individus, suit une distribution de chi deux N degrs de libert.
156
Chapitre 10
Panels spacials
Bibliographie
Acemoglu A.D., Johnson S., Robinson J.A. & Yared P. (2008). Income and democracy. American Economic Review, 98(3), 808842.
Alonso-Borrego C. & Arellano M. (1999). Symmetrically normalized instrumentalvariable estimation using panel data. Journal of Business and Economic Statistics, 17(1), 3649.
Amemiya T. (1971). The estimation of the variances in a variancecomponents
model. International Economic Review, 12, 113.
Amemiya T. & MaCurdy T.E. (1986). Instrumental-variable estimation of an
error-components model. Econometrica, 54(4), 86980.
Anderson T. & Hsiao C. (1982). Formulation and estimation of dynamic models
using panel data. Journal of Econometrics, 18, 4782.
Arellano M. & Bond S. (1991). Some tests of specification for panel data : Monte
carlo evidence and an application to employment equations. Review of Economic
Studies, 58, 277297.
Arellano M. & Bover O. (1995). Another look at the at the instrumental variables
estimation of error components. Journal of Econometrics, 68, 2951.
Avery R. (1977). Error components and seemingly unrelated regressions. Econometrica, 45, 199209.
Balestra P. & Nerlove M. (1966). Pooling cross-section and time-series data in the
estimation of dynamic models : The demand for natural gas. Econometrica, 34,
585612.
Balestra P. & Varadharajan-Krishnakumar J. (1987). Full information estimations
of a system of simultaneous equations with error components. Econometric
Theory, 3, 223246.
Baltagi B. (1980). On seemingly unrelated regressions with error components.
Econometrica, 48, 15471551.
160
Bibliographie
161
Croissant Y. & Millo G. (2008). Panel data econometrics in R : The plm package.
Journal of Statistical Software, 27(2). http://www.jstatsoft.org/v27/i02/.
Drakos K. (2007). The size of under-reporting bias in recorded transational terrorist activity. Journal of the Royal Statistical Society, Series A (Statistics in
Society), 170(4), 909921.
Egger P. & Pfaffermayr M. (2004). Distance, trade, and fdi : A hausman-taylor
sur approach. Journal of Applied Econometrics, 19(2), 22746.
El-Gamal M. & Inanoglu H. (2005). Inefficiency and heterogeneity in turkish
banking : 1990-2000. Journal of Applied Econometrics, 20(5), 641664.
Forbes K.J. (2000). A reassessment of the relation between inequality and growth.
American Economic Review, 90(4), 869887.
Hansen L. (1982). Large sample properties of generalized method moments estimators. Econometrica, 50, 10291054.
Harris M.N., Matyas L. & Sevestre P. (2008). Dynamic models for short panels.
Dans The Econometrics of Panel Data, rd. L. Matyas & P. Sevestre, pp. 249
278. Springer.
Hausman J. (1978). Specification tests in econometrics. Econometrica, 46, 1251
1271.
Hausman J. & Taylor W. (1981). Panel data and unobservable individual effects.
Econometrica, 49, 13771398.
Holtz-Eakin D., Newey W. & Rosen H. (1988). Estimating vector autoregressions
with panel data. Econometrica, 56, 13711395.
Honda Y. (1985). Testing the error components model with nonnormal disturbances. Review of Economic Studies, 52, 681690.
Horrace W. & Schmidt P. (1996). Confidence statements for efficiency estimates
from stochastic frontier models. Journal of productivity analysis, 7, 257282.
Horrace W. & Schmidt P. (2000). Multiple comparisons with the best, with economic applications. Journal of applied econometrics, 15(1), 126.
Hsiao C. (2003). Analysis of Panel Data. Cambridge University Press, Cambridge.
Im K., Pesaran M. & Shin Y. (2003). Testing for unit roots in heterogenous panels.
Journal of econometrics, 115(1), 5374.
Kessler A.S., Hansen N.A. & Lessman C. (2011). Interregional redistribution and
mobility in federations : a positive approach. The Review of Economic Studies,
78, 134578.
162
Khan M.S. & Knight M.D. (1988). Import compression and export performance
in developing countries. Review of economics and statistics, 70(2), 315321.
Kinal T. & Lahiri K. (1990). A computational algorithm for multiple equation
models with panel data. Economic letters, 34, 143146.
Kinal T. & Lahiri K. (1993). On the estimation of simultaneous-equations errorcomponents models with an application to a model of developing country foreign
trade. Journal of applied econometrics, 8, 8192.
Kiviet J.F. (1995). On bias, inconsistency, and efficiency of various estimators in
dynamic panel data models. Journal of Econometrics, 68, 5378.
Kumbhakar S. (1996). Estimation of cost efficiency with heteroscedasticity : an
application to electric utilities. Journal of the royal statistical society, series D,
45, 319335.
Levin A., Lin C. & Chu C. (2002). Unit root test in panel data : asymptotic and
finite sample properties. Journal of Econometrics, 108, 124.
Levine R., Loayza N. & Beck T. (2000). Financial intermediation and growth :
causalty and causes. Journal of Monetary Economics, 46, 3177.
Maddala G. & Wu S. (1999). A comparative study of unit root tests with panel
data and a new simple test. Oxford bulletin of economics and statistics, 61,
63152.
Mairesse J. & Hall B. (1996). Estimating the productivity of research and development in french and us manufacturing firms : an exploration of simultaneity
issues with gmm methods. Dans International productivity differences and their
explanations, rd. K. Wagner & B. Van-Ark, pp. 285315. Elsevier Science.
Mundlak Y. (1978). On the pooling of time series and cross section data. Econometrica, 46(1), 6985.
Nerlove M. (1971). Further evidence on the estimation of dynamic economic relations from a timeseries of crosssections. Econometrica, 39, 359382.
Nickel S. (1981). Biaises in dynamic models with fixed effects. Econometrica, 49,
14171426.
Peltzman S. (1975). The effects of automobile safety regulation. Journal of Political
Economy, 83(4), 677725.
Pirotte A. (2011). Economtrie des donnes de panel. Economica.
Porto E.D. & Revelli F. (2012). Tax limited reaction functions. Journal of applied
econometrics.
Bibliographie
163
Raux C., Souche S. & Croissant Y. (2009). How fair is pricing perceived to be ?
an empirical study. Public Choice, 139(1), 227240.
Roodman D. (2009a). How to do xtabond2 : an introduction to difference and
system gmm in stata. The Stata Journal, 9, 86136.
Roodman D. (2009b). A note on the theme of too many instruments. Oxford
Bulletin of Economics and Statistics, 71, 135158.
Sargan J. (1958). The estimation of economic relationships using instrumental
variables. Econometrica, 26, 393415.
Sevestre P. (2002). Economtrie des donnes de panel. Dunod.
Swamy P. (1970). Efficient inference in a random coefficient regression model.
Econometrica, 38, 311323.
Swamy P. & Arora S. (1972). The exact finite sample properties of the estimators
of coefficients in the error components regression models. Econometrica, 40,
261275.
Wallace T. & Hussain A. (1969). The use of error components models in combining
cross section with time series data. Econometrica, 37(1), 5572.
White H. (1986). Advances in statistical analysis and statistical computing, vol.
1, chap. Instrumental variables analogs of generalized least squares estimators.
Mariano, R.S.
Windmeijer F. (2005). A finite sample correction for the variance of linear efficient
twosteps gmm estimators. Journal of Econometrics, 126, 2551.
Zeileis A. & Croissant Y. (2010). Extended model formulas in R : Multiple parts
and multiple responses. Journal of Statistical Software, 34(XYZ), 112. http:
//www.jstatsoft.org/v34/iXYZ/.
Zellner A. (1962). An efficient method of estimating seemingly unrelated regressions and tests of aggregation bias. Journal of the american statistical association, 57, 500509.
Index
objets
data.frame, 3
pdata.frame, 3, 5, 28, 32
fonctions
as.matrix, 5
Between, 8
between, 8
ercomp, 29
fixef, 30, 43
index, 4
lag, 100
lm, 30, 100
mtest, 123
pdata.frame, 3
pdim, 4
pFtest, 63
pglm, 52
pgmm, 109
phtest, 72
plm, 28, 42, 59, 81, 91, 101, 102,
110
plmtest, 64
pooltest, 65
print, 29, 66
pvcm, 65, 66, 69
sapply, 32
sargan, 121
summary, 9, 29, 32, 66, 124
vcov, 120
vcovHC, 120
Within, 7
donnes
DemocracyIncome, 98
DemocracyIncome25, 36, 37, 98
EmplUK, 126
FinGrowth, 125
ForeignTrade, 32, 33
Grunfeld, 8
InvRate, 126
LargeBanks, 28
RDPerfCompanies, 126
RegIneq, 126
Snmesp, 126
TexasElectr, 34, 36
Tileries, 48
TurkishBanks, 33, 35
USAirlines, 66
arguments
data, 3, 28, 29
drop.index, 3
effect, 8, 42, 43, 64, 102, 110
family, 52
formula, 28, 29, 110
index, 3, 28
inst.method, 86
mode, 66
model, 28, 59, 67, 69, 101, 102,
110
order, 123
random.method, 28, 44, 86
restrict.matrix, 59
restrict.rhs, 59
robust, 124
transformation, 118
type, 30
Index
which, 4
165
166
2.1
2.2
2.3
2.4
2.5
7.1
7.2
7.3
7.4
9.1
9.2
pour
. . .
. . .
. . .
.
.
.
.
.
.
.
.
.
.
.
.
10
12
13
14
33
35
36
37
40