TD Econométrie Gestion - 2019-2020
TD Econométrie Gestion - 2019-2020
TD Econométrie Gestion - 2019-2020
FASEG
Licence 2017-2018
Supposons que la variable kids représente le nombre d’enfants que possèdes une
femme et la variable educ le nombre d’année d’éducation de cette femme. Un modèle
simple reliant la fertilité au nombre d’années d’éducation est donné par :
kids = β0 + β1educ + u
où u représente les termes d’erreur.
1- Quels types de facteurs sont contenus dans u ? Sont-ils corrélés avec le niveau
d’éduction ?
2- Une analyse de régression simple recourra-t-elle à l’effet ceteris paribus de
l’éducation sur la fertilité ? Expliquer. CS50: Introduction to Computer Science
Exercice 2 :
Dans un modèle de régression linéaire simple y = β0 + β1x + u , supposons que
avec la même pente, mais avec de nouvelles constante et erreur, où le nouveau terme
d’erreur a une espérance mathématique nulle.
Exercice 3 :
Le tableau suivant contient les scores ACT et la moyenne des points GPA pour 8
universités. La moyenne des points est basée sur une échelle de quatre-points et a été
arrondie à un chiffre après la virgule.
1
1- Estimer la relation entre GPA et ACT en utilisant les MCO ; c'est-à-dire, obtenir
l’estimation de la constante et de la pente dans l’équation :
GPA = βˆ0 + βˆ1ACT
Commenter la direction de la relation. Est-ce que la constante a une bonne
interprétation ici ? Expliquez. Quel est le niveau de prédiction de GPA si la variable
ACT augmente de 5 points ?
2- Calculer les valeurs prédites et les résidus pour chaque observation et vérifier que
la somme des résidus est (approximativement) égale à zéro.
3- Quelle est la valeur prédite de GPA quand ACT = 20 ?
4- Quel niveau de variation de GPA pour cet échantillon de 8 étudiants est expliqué
par ACT ? Expliquez.
Exercice 4 :
La base de données CEOSAL2.RAW contient les informations sur les PDGs des
sociétés américaines. La variable salary est la rémunération annuelle, en milliers de
dollars, et ceoten est le nombre d’années passées au poste de PDGs de société.
1- Déterminer le salaire moyen et la durée moyenne passée au poste de PDGs dans
l’échantillon.
2- Combien de PDGs sont dans leurs premières années au poste de PDG de société
(c'està-dire, ceoten = 0) ? Quelle est la plus longue durée au poste de PDG ?
3- Estimer le modèle de régression simple
log (salary ) = β0 + β1coeten + u
et reporter les résultats sous la forme standard. Quelle est approximativement
l’augmentation prédite en pourcentage des salaires suite à une année supplémentaire
au poste de PDG.
2
TD N°2 du cours d’Introduction à l’Econométrie
Chapitre 3 : Modèle de Régression Multiple : Estimation
Exercice 1 :
Lesquels des points suivants peuvent entrainer le biais des estimateurs MCO.
1- Hétéroskedascticité.
2- Omission d’une variable importante.
3- Une simple corrélation de coefficient à 95% entre deux variables indépendantes
incluses dans le modèle.
Exercice 2 :
où price est le prix domestique mesuré en milliers de dollar, sqrft la taille en pieds au
carré, bdrms le nombre de chambre et u les termes d’erreur.
Exercice 3:
On veut estimer, par la méthode des moindres carrés ordinaires (MCO), le modèle
yi = β0 + β1x i + ui . Pour cela, on utilise des données du tableau suivant :
3
xi 2 3 0 -1 1
yi 2 5 -2 2 3
( )
−1
matrice X ′X ainsi que la matrice X ′X . Calculer également X ′y .
c) Déterminer le vecteur β̂ des paramètres estimés. Comparer ce résultat avec ceux
obtenus à la question a).
d) Donner l’équation du modèle estimé, puis calculer toutes les valeurs estimées de la
variable expliquée. En déduire, les différentes valeurs des résidus estimés.
e) Calculer la somme des carrés des résidus estimés (SCR) ainsi que la somme totale
des carrés (STC). Donner les valeurs des variances estimées de β̂0 et β̂1 .
Exercice 4 :
yt = β0 + β1x 1t + β2x 2t + ut
2- Interpréter β1 .
4
3- Estimer la variance des erreurs et déduire la matrice de variance-covariance des
estimateurs.
4- Calculer la somme des carrés expliqués (SCE) et la somme totale des carrés (STC).
Déduire les coefficients de détermination R2 et R2-ajusté.
5
TD N°3 du cours d’Introduction à l’Econométrie
Chapitre 4 : Modèle de Régression Multiple : Inférence
Exercice 1 :
2- Tester les hypothèses que l’intensité des R&D ne change pas avec sales contre
l’alternative qu’elle augmente avec les ventes. Faire le test aux seuils de 5% et 10%.
Exercice 2 :
6
log (rent ) = 0, 043+ 0, 066 log(pop) + 0, 507 log(avginc) + 0, 0056 pctstu + u
(0,844) (0,039) (0,081) (0,0017)
2
n = 64, R = 0, 458
Qu’est ce qui n’est pas juste dans cette affirmation : ‘‘Une augmentation de 10% dans
la population est associée à une augmentation de 6,6% du loyer’’.
Exercice 3 :
7
TD N°4 du cours d’Introduction à l’Econométrie
Chapitre 5 : Modèle de Régression Multiple : Propriétés Asymptotiques des MCO
Exercice 1 :
1- Estimer l’équation :
wage = β0 + β1educ + β2exper + β3tenure + u
Enregistrer les résidus et représenter un histogramme.
2- Répéter la question 1-), mais avec log(wage) comme la variable dépendante.
3- Pouvez-vous dire que l’hypothèse MLR.6 est peut-être satisfaite pour le modèle en
niveau (niveau-niveau) ou le modèle semi-log (log-niveau) ?
Exercice 2 :
8
TD N°5 du cours d’Introduction à l’Econométrie
Chapitre 6 : Modèle de Régression Multiple : Autres Problèmes
Exercice 1 :
Les trois équations suivantes sont estimées en utilisant les 1534 observations de la
base de données 401K.RAW :
prate = 80,29+ 5, 44 mrate + 0,269 age − 0, 0013 totemp
(0,78) (0,52) (0,045) (0,00004)
2 2
R = 0,100, R = 0, 098
prate = 97, 32+ 5, 02 mrate + 0, 314 age − 2, 66 log (totemp )
(1,95) (0,51) (0,044) (0,28)
2 2
R = 0,144, R = 0,142
prate = 80, 62+ 5, 34 mrate + 0, 290 age − 0, 00043 totemp + 0, 0000000039 totemp 2
(0,78) (0,52) (0,045) (0,00009) (0,0000000010)
2 2
R = 0,108, R = 0,106
Exercice 3 :
1- Estimer le model
sat = β0 + β1hsize + β2hsize 2 + u
où hsize est la taille de la classe (en centaines), et écrire les résultats sous la forme
standard. Le terme quadratique est-il statistiquement significatif ?
2- En utilisant l’équation estimée de la question 1-), quelle est la taille ‘‘optimale’’
d’un lycée ? Justifiez votre réponse.
3- Cette analyse est-elle représentative de la performance académique de tous les
lycées ? Expliquer.
4- Trouver la valeur estimée de la taille optimale d’un lycée, en utilisant log(sat)
comme variable dépendante. Est-elle trop différente de ce que vous avez obtenu à la
question 2-) ?
9
TD N°6 du cours d’Introduction à l’Econométrie
Chapitre 7 : Modèle de Régression Multiple avec Information Qualitative : Variables
Binaires
Exercice 1 :
sleep = 3840, 83− 0,163 totwrk − 11, 71 educ − 8, 70 age + 0,128 age 2 + 87, 75 male
(235,11) (0,018) (5,86) (11,21) (0,134) (34,33)
2 2
n = 706; R = 0,123; R = 0,117
Exercice 2 :
10
TD N°7 du cours d’Introduction à l’Econométrie
Exercice 1 :
Exercice 2 :
Exercice 3 :
11
TD N°8 du cours d’Introduction à l’Econométrie
Chapitre 9 : Spécifications et Problèmes de Données
Exercice 1 :
Nous pensons que tvhours* est mesuré avec erreur dans notre base. Supposons que
tvhours représente le nombre d’heure par semaine passé à suivre la télé.
1- Est-ce que les hypothèses classiques des erreurs dans les variables (CEV) sont
nécessaires dans cette application.
2- Pensez-vous que les hypothèses CEV sont probablement vérifiées ? Expliquer.
Exercice 2 :
où scrap est le taux de renoncement des firmes et grant est une variable muette
indiquant si une firme reçoit une subvention à l’emploi. Quelles sont les raisons pour
lesquelles les facteurs inobservables dans u peuvent être corrélés avec grant ?
2- Estimer le modèle de régression en utilisant les données de 1998. (Vous aurez 54
observations). Est-ce-que recevoir une subvention de formation d’emploi réduit
significativement le taux de renoncement des firmes ?
3- Maintenant, ajouter une variable explicative log(scrap87). Comment cela change
l’effet estimé de grant ? Interpréter le coefficient de grant. Est-il statistiquement
significatif au seuil de 5% contre l’alternative H1: βgrant <0 ?
4- Tester l’hypothèse nulle que le paramètre de log(scrap87) est égale à un contre les
deux alternatives. Reporter la p-value du test.
5- Reprendre les questions 3-) et 4-), en utilisant l’héréoscédasticité-robust de l’écart
type des erreurs, et discuter brièvement toutes les différences notables.
12
TD N°9 du cours d’Introduction à l’Econométrie
Chapitre 10 : Les Séries Temporelles
Exercice 1 :
où ut est non corrélé avec intt, intt−1, et toutes les autres valeurs des taux d’intérêt.
Supposer que la Fédérale Reserve suite la règle de politique :
intt = γ 0 + γ1 (gGDPt −1 − 3) + νt
où γ1 > 0. Quand la dernière année de croissance du PIB est au-dessus de 3%, la Fed
augmente les taux d’intérêt pour prévenir une ‘‘surchauffe’’ de l’économie. Si νt n’est
pas corrélé avec toutes les valeurs passées de intt et ut, argumenter que intt doit être
corrélée avec ut−1. [Indication : Retarder la première équation d’une période et
substituer gGDPt−1 dans la seconde équation]. Quelle hypothèse de Gauss Markov cela
viole ?
Exercice 2 :
13
Exercice 3:
Y a-t-il des variables, autres que la tendance, qui soit statistiquement significative?
2- Dans l'équation estimée à la partie 1-), tester la significativité conjointe des
variables sauf la tendance temporelle. Que concluez-vous?
3- Ajouter des variables mensuelles muettes à cette équation et tester la saisonnalité.
Est-ce que l'inclusion des variables muettes mensuelles change tout autre estimateur
ou son erreur type standard de manière importante ?
14