Macro
Macro
Macro
Macro-Econométrie
Méthodes de Moments
Christophe Hurlin
Documents et Supports
Contents
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Modèle à anticipations rationnelles : Définitions et problème d’es-
timation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Modèle à anticipations rationnelles : Biais des MCO . . . . . . . . 4
2 La Méthode de Moments Généralisés . . . . . . . . . . . . . . . . . . . 7
2.1 Exemple d’estimateurs des moments . . . . . . . . . . . . . . . . 7
2.2 La méthode des Moments Généralisés . . . . . . . . . . . . . . . . 10
2.2.1 Principe général : conditions d’orthogonalité, identification
et estimation . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Cas particulier : Moindre Carré Ordinaires . . . . . . . . . 13
2.2.3 Cas particulier : Variables Instrumentales . . . . . . . . . 14
2.3 Des moments conditionnels aux moments non conditionnels : Mod-
èles Dynamiques sous Anticipations rationnelles . . . . . . . . . . 14
2.3.1 Des moments conditionnels aux moments non conditionnels 15
2.3.2 Cas Particulier : Système d’Equations Simultanées non
Linéaires et Modèle Dynamique sous AR . . . . . . . . . . 15
3 Matrice de poids optimale . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1 Méthode de GMM en deux étapes . . . . . . . . . . . . . . . . . . 20
3.2 Méthode de GMM itératif . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Méthode de continuous-updating GMM . . . . . . . . . . . . . . . 21
3.4 Estimateurs de la matrice de poids en présence de corrélations . . 22
4 Distribution asymptotique des GMM . . . . . . . . . . . . . . . . . . . 25
4.1 Distribution asymptotique des GMM . . . . . . . . . . . . . . . . 25
4.2 Illustrations dans des cas particuliers . . . . . . . . . . . . . . . . 28
4.2.1 Cas particulier : Moindre Carré Ordinaires . . . . . . . . . 28
4.2.2 Cas particulier : Variables Instrumentales . . . . . . . . . 31
5 Résumé des GMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
6 Application SAS : procédure MODEL . . . . . . . . . . . . . . . . . . . 33
6.1 Spécification du modèle et des instruments . . . . . . . . . . . . . 34
6.2 La procédure d’estimation . . . . . . . . . . . . . . . . . . . . . . 37
6.3 Estimation du modèle d’Hansen et Singleton (1982) sous SAS . . 39
7 Inférence avec les GMM . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Master ESA. Macro-Econometrie. Cours de C. Hurlin 2
1. Introduction
Les anticipations, et plus particulièrement les anticipations rationnelles (AR par
la suite), jouent un rôle essentiel en théorie économique, que ce soit en micro-
économie, macro-économie, finance etc. Au niveau de l’application économétrique
des ces théories, on peut tout d’abord chercher à appliquer la théorie des AR
de Muth qui suppose que l’on spécifie un modèle macro-économique complet
afin de déterminer de façon rationnelle les anticipations. Dans cette optique
figurent les méthodes d’estimation dites à information complète comme
par exemple le maximum de vraisemblance à information complète (FIML pour
Full Information Maximum Likelihood). On doit alors spécifier le ”vrai” modèle
complet de l’économie qui permet aux agents de former leurs anticipations de
façon compatible à ce modèle. Toute l’histoire est alors spécifiée : la relation
entre variables anticipées et variables réalisées, le processus de formation des
anticipations (AR) et le modèle (souvent appelé modèle auxiliaire) qui sert
aux agents pour former leurs anticipations. Mais bien évidemment, ces méthodes
ne peuvent être appliquées que pour des ”petits modèles” comme par exemple les
modèles de courbe de Phillips de type nouveau-keynesien.
Au contraire de ces méthodes, la plupart des travaux appliqués se contentent
d’estimer une équation voir un système de quelques équations faisant intervenir
quelques variables d’anticipations. On ne cherche pas alors à spécifier le modèle
sous jacent qui permet aux agents de formuler leurs anticipations. On parle alors
de méthodes à information limitée, parmi lesquelles figurent notamment les
méthodes de moments et plus spécifiquement les GMM. Par exemple, dans la
théorie des anticipations pures de la structure par terme des taux d’intérêt, le taux
long sur les obligations dépend des anticpations sur les taux d’intérêt de court
terme. Suivant que l’on spécifie ou non un modèle permettant de former les AR
sur les taux courts on parle d’approche à information complète ou à information
limitée.
Dans le cadre de ce cours nous aborderons dans un premier temps les ap-
proches à information limitée et plus spécifiquement les GMM. Mais avant de
présenter ces méthodes, nous commencerons par définir précisèment le concept
d’AR ce qui nous permettra dans un second temps d’évoquer les problèmes spé-
cifiques d’estimation qui se posent dans un modèle où interviennent des variables
anticipées de façon rationnelle.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 2
yt = β xet+j + µt (1.1)
• Soit l’on dipose de données d’enquêtes sur E [xt+j | Ωt ], et l’on peut estimer
directement le modèle
• Soit l’on ne dipose pas de données sur E [xt+j | Ωt ] et l’on pose des hy-
pothèses auxiliaires sur cet terme d’anticipation. Il n’existe donc pas de
test propre au modèle (1.1) : on testera à la fois le modèle et les hypothèses
auxiliaires sur E [xt+j | Ωt ] (exemlple : théorie de la structure par terme des
taux d’intérêt).
Quel que soit le modèle d’anticipation que lon retient, il existe trois principaux
éléments :
avec
E [ω t+1 | Ωt ] = 0 (1.4)
E ω 2t+1 Ωt = σ 2ω (1.5)
E ω t+1 ω t+1+j Ωt = 0 ∀j (1.6)
L’erreur de prévision des AR pour la période suivante est donc un bruit blanc
ou une innovation conditionnelle à l’ensemble d’information complet Ωt et est
orthogonal à tout sous ensemble Λt ⊂ Ωt
E [ω t+1 | Λt ] = 0 Λt ⊂ Ωt (1.7)
Il est une propriété supplémentaire qui est utile pour anlyser les AR qui con-
cerne la révision des anticipations. La révision à une période des anticipa-
tions dépend seulement de l’information qui arrive entre t et t + 1. En
effet :
E [ xt+j | Ωt+1 ] − E [xt+j | Ωt ] = φj−1 εt+1 (1.11)
La révision à deux périodes dépend naturellement de εt+1 et εt+2 et est
M A (1) .
E [xt+j | Ωt+2 ] − E [xt+j | Ωt ] = φj−2 εt+2 + φj−1 εt+1 (1.12)
De façon générale, on a pour j > k :
j−k−1 j−1
E [xt+j | Ωt+k ] − E [xt+j | Ωt ] = φh εt+j−h − φh εt+j−h
h=0 h=0
j−1
= φhεt+j−h
h=j−k−1
0
εt+1 = xt+1 − E [xt+1 | Ωt ] = φhξ t+1−h = ξ t+1
h=0
D’où
vt = µt − δ 1 εt+1 − δ2 εt+2
= µt − δ 1 ξ t+1 − δ 2 ξ t+2 + φξ t+1
= µt − (δ 1 + δ 2 ) ξ t+1 − δ 2 φξ t+2
yt = βxet+1 + µt (1.18)
Or on sait que :
T T T
1 1 2 1
plim x2t+1 = plim xet+1 + plim ε2t+1
T t=1
T t=1
T t=1
De plus,
T T T
1 1 1
plim xt+1 zt = plim xt+1 µt − βplim xt+1 εt+1
T t=1
T t=1
T t=1
T
1
= −βplim xt+1 εt+1
T t=1
T
1
= −βplim xet+1 + εt+1 εt+1
T t=1
T
1
= −βplim ε2t+1
T t=1
• La méthode des doubles moindres carrés à deux étapes (Cumby et al. 1983).
Dans ce cours, nous présenterons la méthode des moments généralisés ou
GMM.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 7
Mais plutôt que d’utiliser l’ensemble des moments g (1) , g (2),.. g (h) pour estimer
v on peut se contenter d’utiliser un sous ensemble de moments. Supposons que
v > 2, alors on sait en particulier que les deux premiers moments (non centrés)
sont tels que :
v
µ1 = E (Yt ) = 0 µ2 = E Yt2 = var (Yt ) = (2.4)
v−2
Dans ce cas précis, si l’on connaît la valeur de E (Yt2 ) on peut end déuire la
valeur de v :
2E (Yt )
v= (2.5)
[E (Yt ) − 1]
Soit µ2,T le moment empirique non centré d’ordre deux :
T
1
µ2,T = yt2
T i=1
3v 2
µ4 (v) = E Yt4 = (2.11)
(v − 2) (v − 4)
T
On aurait pu alors utiliser le moment empirique d’ordre 4, µ4,T = (1/T ) i=1 yt4
et résoudre l’équation :
3v 2
µ4,T =
(v − 2) (v − 4)
afin d’en déduire l’estimateur des moments v.
L’idée de base des GMM consiste à déterminer une valeur de θ telle que les
r moments empiriques g (YT , θ) soient aussi proches que possible de zéro.
g (YT , θ) 0 pour θ = θT
Ainsi, on peut définir l’estimateur GMM de la façon suivante.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 11
telle que :
Q (θ, YT ) = [g (YT , θ)] WT g (YT , θ) (2.18)
(1,r) (r,r) (r,1)
Supposons que E [h (θ, wt )] soit continue en θ et que θ0 soit la seule valeur telle
que E [h (θ0 , wt )] = 0. Dès lors, sous des conditions de stationnarité, de continuité
et des conditions sur les moements, la valeur θT qui rend minimum le critère
Q (θ, YT ) donne un estimateur convergent de θ 0 .
soit
2µ2,T
v= (2.21)
µ2,T − 1
On retrouve donc l’estimateur de la méthode classique des moments.
g YT , θ T =0 (2.22)
Résultat Un des nombreux avantages des GMM est que c’est une
méthode englobante permettant de retouver comme cas partic-
uliers un grand nombre d’estimateurs usuelsparami lesquels
- les Moindres Carrés Ordinaires
- les Variables Instrumentales et Doubles Moindres Carrés
- les Moindres Carrés non Linéaires
- le Maximum de vraisemblance.
g YT , θ T =0 (2.26)
où g (YT , θ) désigne le vecteur des moments empiriques correspondant aux k con-
ditions d’orthogonalité.
T T
1 1
g (YT , θ) = h (θ, wt ) = xt (yt − xt β)
T t=1
T t=1
On a donc à résoudre le système suivant :
T
1
g YT , θT = xt yt − xt β T =0
T t=1
Ce qui peut se réécrire sous la forme :
T T
xt yt = xt xt βT
t=1 t=1
T −1 T
⇐⇒ β T = xt xt xt yt = β MCO (2.27)
t=1 t=1
E [h (θ0 , wt )| zt ] = 0 (2.34)
C’est cette propriété qui va nous permettre d’appliquer les GMM à des moe-
ments conditionnels et en particulier aux modèles à AR.
yt = f (θ, zt ) + ut (2.37)
(n,1) (n,1) (n,1)
Soit xit un vecteur d’instruments non corrélés avec le ième élément uit des
résidus.
E xi,t ui,t =0
(ri ,1)(1,1)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 16
Pour chaque résidu d’équation uit on peut donc avoir plusieurs conditions
d’orthogonalité. Supposons qu’au total on dispose de r = ni=1 ri conditions
d’orthogonalité :
[y1t − f1 (θ, zt )] x1t
[y2t − f2 (θ, zt )] x2t
h (θ, wt ) =
...
[ynt − fn (θ, zt )] xnt
avec wt = (yt xt zt ) . L’estimateur GMM est alors obtenu en minimisant la fonc-
tion critère :
T T
1 1
Q (θ, YT ) = h (θ, wt ) WT h (θ, wt ) (2.38)
T t=1
T t=1
dès lors que l’agent détient une part non nul dans tous les actifs.
c1−γ
t si γ > 0 et γ = 1
u (ct ) = 1−γ
log(ct ) si γ = 1
c−γ
t = βEt (1 + ri,t+1 ) c−γ
t+1
ou encore
−γ
ct+1
1 = βEt (1 + ri,t+1 ) (2.43)
ct
puisque la variable ct est connue à la date t. Cette expression signifie que chaque
variable aléatoire définie par
−γ
ct+1
1 − β (1 + ri,t+1 ) i = 1, ..m
ct
r =n×m
conditions d’orthogonalité.
−γ
ct+1
1 − β (1 + r1,t+1 ) xt
ct
(n,1)
−γ
1 − β (1 + r2,t+1 ) ct+1
xt
h (θ, wt ) =
ct
(n,1)
(2.44)
(nm,1) ...
ct+1
−γ
1 − β (1 + rm,t+1 ) ct
xt
(n,1)
ou de façon équivalent :
h (θ, wt ) = h (θ, wt ) ⊗ xt
(nm,1) (m,1) (n,1)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 18
−γ
ct+1
1 − β (1 + r1,t+1 ) ct
−γ
1 − β (1 + r2,t+1 ) ct+1
⇐⇒ h (θ, wt ) =
ct ⊗ xt
(nm,1) ... (n,1)
ct+1
−γ
1 − β (1 + rm,t+1 ) ct
∞ ∞
S = Γv = E h (θ 0 , wt ) h (θ 0 , wt−v ) (3.1)
(r,r)
j=−∞ j=−∞
WT∗ = S −1 (3.4)
Comment estimer cette matrice de poids optimale WT∗ ? Lorsque les élé-
ments du vecteur h (θ0 , wt ) sont non corrélés et non autocorrélés, alors S = Γ0 =
E h (θ0 , wt ) h (θ0 , wt ) . Dans ce cas, la matrice S peut être estimée par la quan-
tité ST∗ :
T
1
ST∗ = h (θ0 , wt ) h (θ0 , wt ) (3.6)
T t=1
Mais puisque la calcul de cette quantité requiert la connaissance de θ0 , on
construit l’estimateur ST défini de la façon suivante.
et ainsi de suite. Etant donné que tous les estimateurs θj ont exactement la même
distribution asympotique, ce processus s’arrête dès lors que :
θj θj−1 (3.13)
La valeur θj est alors estimateur GMM itératif. Dans le logiciels usuels cette
procédure suppose de définir un critère de convergence. Par exemple, si l’on
note θj = θ j,1 , .., θj,a un critère du type :
a
max θj,z − θj−1,z <C (3.14)
z=1
Si cette condition est vérifié, l’algorithme s’arrête. Cette condition se double
généralement d’une condition sur le nombre d’itération. Si ce dernier excède une
une certaine valeur, par exemple 100, l’algorithme s’arrête et un message apparaît
signifiian,t que l’algorithme n’a pas convergé.
Dès lors les formules précedentes permettant d’estimer S ne sont plus valables.
Considérons l’estimateur Γv de la matrice d’autocovariance d’ordre v, Γv :
T
1
Γv = h θ, wt h θ, wt−v (3.16)
T t=v+1
Sachant que
Γ−v = Γv (3.17)
un estimateur de la matrice S pourrait être donné par la quantité
∞ ∞
S= Γv = Γ0 + Γv + Γv (3.18)
v=−∞ v=1
3 sin (6πu/5)
K (u) = 2 − cos (6πu/5) u=0 (3.22)
(6πu/5) 6πu/5
= Γ0 + 0.85 Γ1 + Γ1 + 0.5 Γ2 + Γ2 + ..
Un estimateur similaire est proposé par Gallant (1987) à partir d’un Kernel
de Parzen.
∂g (YT , θ)
× ST−1 × g YT , θ = 0 (4.7)
∂θ θ (r,r) (a,1)
(r,1)
(a,r)
∂g(YT ,θ)
Il faut bien comprendre ici que la matrice ∂θ
désigne une matrice
θ
de dimension (r, a) dans laquelle figurent les dérivées de la fonction vectorielle
g (YT , θ) par rapport aux a éléments du vecteur θ et que ces dérivées sont évaluées
au point θ = θ, estimateur GMM.
∞ ∞
où S = v=−∞ Γv = v=−∞ E h (θ0 , wt ) h (θ0 , wt−v ) telle que :
√ L
En effet, on rappelle que d’après l’énoncé du TCL T h−E h −→
T →∞
N 0, V h , avec ici E h = E (h (θ0 , wt )) = 0 et V h = S.
∂g (YT , θ) ∂g (YT , θ)
plim = plim =D (4.11)
∂θ θT ∂θ θ0 (a,r)
avec
−1
V = D S −1 D (4.13)
(a,a) (a,r) (r,r) (r,a)
VT
θT ∼
=N θ0 , (4.15)
T
−1
où l’estimateur VT = DS −1 D de la matrice de variance covariance
asympotique est construit à partir de :
∂g (YT , θ)
D= (4.16)
∂θ θ=θT
T
1
ST = h θT , wt h θT , wt (4.17)
T t=1
ou en présence de corrélation :
q
v
S = Γ0 + 1− Γv + Γv (4.18)
v=1
q+1
T
1
Γv = h θ, wt h θ, wt−v (4.19)
T t=v+1
yt = xt β 0 + ut (4.20)
h (θ, wt ) = xt (yt − xt β)
E [h (θ0 , wt )] = 0
Master ESA. Macro-Econometrie. Cours de C. Hurlin 29
Ici on a donc :
∞ T
1
S = lim E xt ut (xt−v ut−v )
T →∞ T
v=−∞ t=1
∞ T
1
= lim E ut ut−v xt xt−v (4.25)
T →∞ T v=−∞ t=1
Supposons tout d’abord que les résidus sont non auto-corrélés, alors :
σ 2ε E (xt xt ) pour v = 0
E ut ut−v xt xt−v = (4.26)
0 sinon
avec
T
1
σ 2ε = u2t (4.28)
T t=1
T −1
= T σ 2ε xt xt
t=1
On retrouve ici la formule de la matrice de variance covariance des MCO (la seule
différence étant la définition de l’estimateur de la variance des résidus).
où ST est un estimateur de
∞ T
1
S = lim E ut ut−v xt xt−v
T →∞ T
v=−∞ t=1
avec
T
1 2
σ 2T = yt − zt β T .
T t=1
T −1 T T −1
1 1
σ 2T zt xt xt xt xt zt
T t=1 t=1
T t=1
E [h (θ0 , wt )] = 0 (5.1)
(r,1)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 33
et où ST est un estimateur de :
T ∞
1
S = lim E h (θ0 , wt ) h (θ0 , wt−v ) (5.4)
(r,r) T →∞ T
t=1 v=−∞
VT
θT ∼ N θ0 , (5.5)
T
avec : −1
VT = DST−1 D (5.6)
∂g (YT , θ)
D = (5.7)
∂θ θ=θT
E (εt ) = 0 (6.3)
E (εt εt ) = Σ (6.4)
La première étape de la procédure model consiste à spécifier le modèle. Pour
cela, considérons le cas d’une équation. On spécifie une équation sous la forme
d’un résidu. Supposons que l’on veuille spécifier l’équation :
EQ.[name]=a+b*log(c*y+d*x);
Dans ce cas, on ne peut pas utiliser les MCO et l’on peut dans ce cas estimer le
système par la méthode des Triples Moindres Carrés Ordinaires (N3SLS). Cette
méthode requiert de spécifier des instruments : dans ce cas on utilise les variables
prédéterminées prixt−1 et prixt−2 , mais aussi les variables exogènes du système :
la variable de revenu et une autre varaible non utilisée dans le système, à savoir la
variable la valeur du dollar qui impacte la demande energétique (variable EXVUS,
WEIGHTED-AVERAGE EXCHANGE VALUE OF U.S.) On a donc au total 4
variables instrumentales : EXVUS, CCITC, lag(EEGP) et lag2(EEGP). Cette
Master ESA. Macro-Econometrie. Cours de C. Hurlin 36
L’option EXCLUDE= (parameters) spécifie que tous les paramètres sauf ceux
entre paramètres sont considérés dans la liste des instruments. Différentes options
peuvent être utilisées. NOINTERCEPT ou NOINT permet de ne pas mettre
de constante dans la liste des instruments. Par défaut il y a toujours une constante
dans la liste des instruments.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 37
E (εt ) = 0 (6.10)
E (εt εt ) = Σ (6.11)
Résultat Sous SAS, dans le cas des GMM en deux étapes, la matrice de
variance covariance asymptotique est estimée suivant la formule
T −1
τ
S= w D c Γτ Dc (6.12)
τ =−T +1
l (T )
T
Γv = h θ, wt h θ, wt−v
t=v+1
T
= q yt , xt , θ ⊗ zt q yt−v , xt−v , θ ⊗ zt−v (6.13)
t=v+1
q
S = Γ0 + w (v, q) Γv + Γv
v=1
q
v
= w Γv
v=−q
l (T )
T −1
v
= w Γv
l (T )
v=−(T −1)
car sir v > q alors w(v/q) = 0. La seconde différence réside dans la matrice de
correction Dc utilisée pour la correction de l’estimation de la matrice
de variance covariance dans les petits échantillons (Gallant,1987). La forme
de cette matrice dépend de l’option VARDEF. Cette matrice Dc est une matrice
diagonale dont les élements Di de la diagonale sont définis comme suit :
√
• Di = 1/ T si VARDEF=N
√
• Di = 1/ T − dfi si VARDEF=DF, où dfi désigne le nombre de degré de
liberté de l’équation i.
KERNEL=(PARZEN | QS | BART , c , e)
Par défaut SAS utilise un kernel de type Parzen. Les paramètres c et e servent
à spécifier le paramètre bandwidth selon la formule :
l’agent puisse épargner et investir dans m titres indicés i = 1, ., m qui pour tout
euro investit à la date t lui rapportent 1 + ri,t+1 à la période suivante. Pour une
fonction d’utilité de type CRRA
c1−γ
u (ct ) = t siγ > 0 et γ = 1
1−γ
où γ désigne le coefficient d’aversion relative pour le risque, les conditions d’ar-
bitrage inter-temporelle se ramènent à :
−γ
ct+1
1 − βEt (1 + ri,t+1 ) =0 i = 1, ..m (6.21)
ct
Soit θ = (β γ) le vecteur de paramètres du modèles. Soit wt = (r1t+1 r2t+1 ...rmt+1 ct+1 /ct xt )
l’ensemble des variables observées par l’économètre à la date t. Au total si xt a
contient n variables, on obtient pour chaque actif n conditions d’orthogonalité,
soit un total de r = n × m, conditions d’orthogonalité.
−γ
ct+1
1 − β (1 + r1,t+1 ) ct
−γ
1 − β (1 + r2,t+1 ) ct+1
h (θ, wt ) = h (θ, wt ) ⊗ xt = c t ⊗ xt
(nm,1) (m,1) (n,1) ... (n,1)
−γ
1 − β (1 + rm,t+1 ) ct+1
ct
• Rendements réels sur les obligations émises par les entreprises. Variable :
CB
Les rendements réels sont obtenus en dividant les rendements nominaux par
l’indice de prix à la consommation correspondant à l’indice de consommation
utilisé. En ce qui concerne les instruments xt , les auteurs considèrent au total
9 instruments (n = 7). Ils considèrent les rendements réels (variable RINST)
et de la croissance de la consommation réelle (variable CINST) retardées de 1
à 3 périodes. Toutes ces variables sont donc connues de l’agent à la date t. Le
neuvième instrument correspond par défaut à la constante.
Danc ce programme (figure 6.3) on estime le modèle par la méthode des GMM
itérés (ITGMM) en utilisant une fonction kernel de type Parzen. Les conditions
initiales sur β et sur γ sont fixées 0.1. Pour ces quatre équations avec 7 instru-
ments, on dipose de 28 conditions d’orthogonalité pour estimer 2 paramètres.
Le système est donc largement sur-identifié. Les résultats de la procédure sont
reproduits sur les figures (6.4), (6.5) et (6.6).
Sur la figure figures (6.4), on vérifie que le model comporte au total 5 vari-
ables dont une endogène (CONRAT) et quatre exogènes (GB, CB, D1 et D10).
Ce modèle comporte deux paramètres (β et γ) et quatre équations (nommées
h1 , h2 , h3 et h4 ), représentées par le vecteur h (θ, wt ) . Un message prévient que
ces deux paramètres sont présents dans les quatre équations : ce qui implique
notamment que si l’on spécifie par exemple β dans la litse des instruments, les
dérivées des quatre équations par rapport à β seront considérées comme intru-
ments. SAS fournit enfin la liste des 7 variables instruments, la constante etant
nommée 1. Un message prévient que l’algorithme d’optimisation a convergé.
Sur la figure (6.5) les détails de la procédure d’estimation GMM iétartif sont
donnés. On rappelle le nombre de paramètres a estimer, a = 2, le choix du kernel
(Parzen). La valeur du paramètre du bandwitdh parameter est donnée bandwidth
Master ESA. Macro-Econometrie. Cours de C. Hurlin 42
Enfin sur la figure (6.6), figurent les résultats d’estimation a proprement parlé.
On remarquera qua la valeur estimé de β au point moyen est supérieure à l’unité ce
qui viole la condition de convergence théorique d’un tel modèle. Une contrainte
du type BOUNDS beta<c, où c < 1 permet alors d’éviter ce problème, mais
Master ESA. Macro-Econometrie. Cours de C. Hurlin 43
l’estimateur obtenu bute alors sur la contrainte. Figure parmi les résultats la
valeur de la J statistique du test de sur-identification d’Hansen (1982) définie par
Objective*N.
Dans cette expression les moments empiriques g (YT , θ) sont évalués pour la
vraie valeur des paramètres θ0 . Une première intuition consisterait à se
dire que convergence resterait vraie si l’on remplaçait θ 0 par son esti-
mateur convergent θT . Or ceci n’est pas vrai. En effet, il existe a combi-
naisons linéaires des r éléments g YT , θT qui valent précisèment par définition
de l’estimateur θ T . Ces a combinaison linéaires sont obtenues en prémultipliant
g YT , θT par la matrice :
∂g (YT , θ)
× ST−1 (7.2)
∂θ θ (r,r)
(a,r)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 45
avec
T
1
g (YT , θ1 ) = h (θ1 , wt ) (7.7)
T0 t=1
avec si les résidus sont non auto-corrélés :
T0
1
ST−1 = h θ1,T0 , wt h θ1,T0 , wt (7.8)
0
T0 t=1
On sait qu’alors :
L
T0 θ1,T0 − θ1 −→ N (0, V1 ) (7.9)
T →∞
−1
−1
V1,T0 = D1,T0 S1,T0
D1,T0 (7.10)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 47
∂g (YT , θ 1 )
D = (7.11)
∂θ1 θ=θ1,T0
On peut de façon similaire construire un estimateur θ2,T −T0 basé sur les T −T0
dernières observations :
L
T − T0 θ2,T −T0 − θ2 −→ N (0, V2 ) (7.12)
T →∞
avec
1 1
W = V1,T0 + V2,T −T0 (7.16)
π 1−π
On peut aller encore plus loin dans cette optique et tester la
rupture pour un ensemble de dates T0 allant par exeple de 0.15T
à 0.85T et choisir la plus grande valeur pour la statistique λt (test
d’Andrews, 1993)
1 pour t ≤ T0
d1t = (7.17)
0 pour t > T0
Master ESA. Macro-Econometrie. Cours de C. Hurlin 48
Dans le cas précis des EMM, les moments (ou modèle auxiliaire) correspondent
au score de la log-vraisemblance associés aux paramètres β. Naturellement l’iden-
tification des paramètres θ implique en particulier que k ≥ a, on supposera ici
que a = k. Le choix du modèle auxiliaire est laissé libre : il convient de choisir
un model permettant de bien approximer la dynamique du DGP tout
en conservant la faisabilité du maximum de vraisemblance.
∂f (yt | yt−1 , β)
sf (Yt , β) = (9.3)
∂β
De plus, on peut construire un estimateur de la matrice de variance covariance
asymptotique du score du modèle théorique à partir du pseudo score sf Yt , β i
de la façon suivante (Gaalnt et Long, 1987) :
T
1
VT = sf Yt , β sf Yt , β
T t=1
T
notée Yts (θ) , permettent d’annuler le score du pseudo modèle considéré
t=1
pour la valeur estimée (sur données historiques) des paramètres β. On cherche
donc θ tel que :
θ = ArgM in mS θ, β VT−1 mS θ, β (9.4)
{θ∈Ra }
Il faut comprendre ici que la moyenne obtenue sur les S simulations permet
de se ”débarasser” du conditionnement par rapport au tirage du choc ε. Le score
T
sf Yts (θ) , β est évaluée pour trajectoire Yts (θ) particulière condition-
t=1
nellement à une certaine valeur de θ et à partir des pseudo paramètres estimés
sur données historiques β (et non sur données simulées).
Vθ = Dθ VT−1 Dθ (9.6)
∂mS θ, β
Dθ = (9.7)
∂θ
θ=θ
yt = σ t zt (9.8)
θ = (a b s ) (9.12)
β = (ω α γ) (9.15)
avec
1 y2
log f (yt | yt−1 , β) = − log (2π) − log (ht ) − t (9.16)
2 2ht
D’où l’on tire que :
avec
2
ht = ω + αyt−1 + γht−1 (9.21)
Master ESA. Macro-Econometrie. Cours de C. Hurlin 54
Reste à définir cette matrice VT qui servira de poids dans la procédure GMM.
T
1
VT = sf Yt , β sf Yt , β (9.22)
T t=1
Cette matrice V doit être crée de la façon suivante sous SAS. Chaque ligne et
chaque colonne de cette matrice est associée à une équation et à un instrument.
La position de chaque élément dans la matrice V est donné par le
nom de l’équation et le nom de l’instrument (1 pour la constante)
de la ligne et le nom de l’équation et le nom de l’instrument de la
colonne. Plutôt que de spécifier ligne=1 et colonne=1 pour identifier l’élément
V1,1 , on donne pour identifant de la ligne et de la colonne un nom d’équation et
un nom d’instrument. Ainsi pour V1,1 cela correspond à la variance associée à de
la condition d’orthogonalité de l’équation 1 pour l’intrument x1 si cette variable
apparaît en premier dans la liste des instruments. La colonne de cet élémént est
repérée par le couple (y1 , x1 ) et sa ligne par le même couple (y1 , x1 ). L’élément
V1,1 correspond à la covariance entre les résidus de la condition d’orthogonalité
de l’équation y1 avec l’instrument x1 et la condition d’orthogonalité de l’équation
y1 et l’instrument 1 (pour la constante). La ligne de cet élément est repérée par
Master ESA. Macro-Econometrie. Cours de C. Hurlin 55
le couple (y1 , x1 ) et sa colonne par le couple (y1 , 1) . Ces couples sont stockés dans
des variables :
Une variable _TYPE_ doit contenir le terme GMM pour chaque élémént.
Enfin la valeur de Vi,j est indiquée dans la variable VALUE.
avec
2
ht = ω + αyt−1 + γht−1 (9.25)
Pour cela on utilise la procéudre AUTOREG3 . Reste alors à définir la matrice
de variance covariance asymptotique à partir des scores VT qui servira de poids
dans la procédure GMM.
T
1
VT = sf Yt , β sf Yt , β (9.26)
T t=1
Ceci est fait dans la procédure DATA de la figure (9.6). Cette matrice de
dimension (3, 3) ne nécissite la spécification que 6 élements :
V1,1 V1,2 V1,3
V = − V2,2 V2,3 (9.27)
− − V3,3
On récupère ces éléments dans le dernier éléments des variables v (1) à (6) définies
par accumlation partielle des éléments des matrices v t 1 à v t 6. Plus précisè-
ment dans les v t 1 à v t 6 figurent pour chaque date les 6 éléments de la matrice
sf Yt , β sf Yt , β . Reste alors à sommer ces éléments pour les date t = 1 à
T = T. Ce qui est fait en utilisant les sommes partielles définies dans les variables
v (1) à (6). Ainsi sur la figure () sont reportées les valeurs de v (1) à (6) . Seules
celles pour la 1000ème ligne nous servent à constituer la matrice de variance VT .
A partir de ces éléments, il convient de construire une matrice de poids pour
la procédure MODEL comme exposé précédemment. Cette partie est reportée
sur la figure (9.8).
Le résultat de cette mise en forme est de la forme suivante (figure 9.9) :
A partir de ces différents élements, ne reste plus alors qu’à construire l’esti-
mateur EMM en utilisant la commande SOLVE de la procudre MODEL (figure
9.10).
3
Voir poly de cours Econométrie pour la Finance.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 58
10. Bibliographie
Bansal, R., Gallant, A.R., Hussey, R., Tauchen, G.E. (1993), ”Computational
Aspects of Nonparametric Simulation Estimation.” In Belsey, D.A. (Ed.), Com-
putational Techniques for Econometrics and Economic Analysis. Boston, MA:
Kluwer Academic Publishers, 3-22.
Bansal, R., Gallant, A.R., Hussey, R., Tauchen, G.E. (1995), ”Nonparametric
Estimation of Structural Models for High-Frequency Currency Market Data,”
Journal of Econometrics, 66, 251-287.
Gallant, A.R. and Tauchen, G.E. (1996), ”Which Moments to Match?” Econo-
metric Theory, 12, 657-681.
Gallant, A.R. and Tauchen, G.E. (2001), ”Efficient Method of Moments,”
Working Paper. [http://www.econ.duke.edu/ get/wpapers/ee.pdf] , accessed 12
September 2001.
Master ESA. Macro-Econometrie. Cours de C. Hurlin 59