Université Du Québec Montréal
Université Du Québec Montréal
Université Du Québec Montréal
MÉMOIRE
PRÉSENTÉ
COMME EXIGENCE PARTIELLE
DE LA MAÎTRISE EN ÉCONOMIQUE
PAR
TAMARA CAP
SEPTEMBRE 2015
UNIVERSITÉ DU QUÉBEC À MONTRÉAL
Service des bibliothèques
Avertissement
La diffusion de ce mémoire se fait dans le respect des droits de son auteur, qui a signé
le formulaire Autorisation de reproduire et de diffuser un travail de recherche de cycles
supérieurs (SDU-522 - Rév.01-2006) . Cette autorisation stipule que «conformément à
l'article 11 du Règlement no 8 des études de cycles supérieurs, [l 'auteur] concède à
l'Université du Québec à Montréal une licence non exclusive d'utilisation et de
publication de la totalité ou d'une partie importante de [son] travail de recherche pour
des fins pédagogiques et non commerciales. Plus précisément, [l 'auteur] autorise
l'Université du Québec à Montréal à reproduire, diffuser, prêter, distribuer ou vendre des
copies de [son] travail de recherche à des fins non commerciales sur quelque support
que ce soit, y compris l'Internet. Cette licence et cette autorisation n'entraînent pas une
renonciation de [la] part [de l'auteur] à [ses] droits moraux ni à [ses] droits de propriété
intellectuelle. Sauf entente contraire , [l'auteur] conserve la liberté de diffuser et de
commercialiser ou non ce travail dont [il] possède un exemplaire."
ii
REMERCIEMENTS
Les analyses contenues dans ce texte ont été réalisées au Centre interuniversitaire
québécois de statistiques sociales (CIQSS), membre du Réseau canadien des centres
de données de recherche (RCCDR). Les activités du CIQSS sont rendues possibles
grâce à l'appui financier du CRSHC, des IRSC, de la FCI, de Statistique Canada, du
FRQSC ainsi que de l'ensemble des universités québécoises qui participent à leur
financement. Les idées exprimées dans ce texte sont celles de l'auteur et non celles
des partenaires financiers.
111
DÉDICACE
.Merci pour votre support constant depuis le premier jour où j'ai entrepris ce
périple. Plusieurs hauts, plusieurs bas, mais enfin le bout du tunneL
IV
LISTE DES TABLEAUX .... .. ... ..... .... .. .. ........ ........ ....... .... .. ...... .... ...... .... .. ..... .. .. ... .. ..... ... .. .... .. vi
RÉSUMÉ ............ .... .... ... .... ..... ... ..... ..... .......... ... .... ... ... ... ... ... .... ........... ............ .. .... ......... ..... ... vii
INTRODUCTION ..... ... ..... .. .. ..... ........... ... ..... ........ ........ ....... ...... .... ... ... ....... .... .. ....... ....... .. .... ..
CHAPITRE I
DONNÉES .... ...... .... ...... .... .... ..... .. .. .... .. ...... ..... ...... ..... .. ..... ... .... .... ... ..... ...... ..... ... ...... ...... .......... 9
1.1 Échantillon initial .. .. ... .. .. ... .. .. .. .. . .. ...... . .. .. .. ... .. ... .. .. . .. .. .. . .. .. .. . .. .... . .. .. .. .. .. .. .. .. .. .. .. .. .... .. .. .. 9
1.2 Échantillon final .... .... .. ...... .. ....... ....... ........ .... .. ..... .. ... ... ..... ... ... .. .. ...... ... .... .... ...... .... ..... 12
MÉTHODOLOGIE .......... ... ....... ... ..... ... .... .... .... ..... ..... .... .... ... ... .... .. ........ .. .. ... .. ... ......... .. ... .. .. . 23
CHAPITRE II
MODÈLES ...... ... ....... .. ... .... .. .... .... ................ .... .. ... ......... ........ ... .... ..... ..... .. ........ .. .... ..... .. ........ 26
2.1 Modèles de base .. ... .......... ....... .. .. ................ .. .... .......... .. .. .... ... .. .... .............................. .. 27
2.1.1 Modèle d ' estimation avec effets aléatoires ... .. ...... ....... ... ............................... ... 27
2.1.2 Modèle d'estimation à effets fixes ... .. .. .. .. .. .. .... .. ... ... .... ..... .. ... ..... .... .. .. ...... .... .... 28
2.1.3 Modèle de régression linéaire par moindre carré ordinaire ....... ...... .. ..... .... .... .. . 29
2.2 Modèles modifiés .... .. ..... ..... .. .... .. .......... .... ...... .... .. ... ... .... ....... ... .. .. ...................... ........ 30
CHAPITRE III
RÉSULTATS ..... ...... ...... .. ... ...... .... .. ........ ... .. .... .... ............ ........... .. .. ..... ....... .. .. .. .. .. ... ..... ......... 31
3.1 Résultats modèles de base .. .. . .. .. .. .. .. .. . .. .. ... . .. ... .. ....... .. .... .. .... ... .. .. .. ... ..... .. ... .. .. .. .. ... ... .. . 31
3 .1.1 Résultats : Modèle à effets aléatoires ............. .. ... .. .. ... .......... .... ........ .. ...... ........ . 31
3.1.2 Résultats : Modèle à effets fixes ........... ...... .... ... ... ....... .... .. ...... .. .. .... ...... ..... ....... 36
3.1.3 Résultats : Test Hausman .. .. ... ...... ... ...... ... ........ ... ..... .... ........ .... .. ... .. ... ........ ..... .. 41
3.1.4 Résultats : Modèle de régression linéaire .. .... .. .... .......... .... ...... ... .. ....... ....... .... ... 42
v
3.2 Résu ltats : Modèles modifiés .... ........ ... ...... .. .... ... .... ............ .. ... ....... .. ........ ..... ... ..... ...... 44
3.2. 1 Résultats : Modèle à effets aléatoires .... ...... ... .... ....................... .. ... ..... .............. 44
3 .2 .2 R ésu ltats : Modè le à effets fixes ............ .. ... ... .................. ...................... .. ... ..... .. 46
3.2.3 Résu ltats : Test Hausman ............. .... ... ... ........ .. .... .... ...... ........ ................... ... ..... 49
3.2.4 R ésultats :Modèle de régression li néa ire .... .. .... ........................... ........ ............. 49
CHAPITRE IV
DISCUSSION DES RÉSULTATS ... .... ........ ........ ....... .. ....... .... ...... .. ... .. ... ... ......... .................. 52
CONCLUSION ................ ....... ...... .... ...... ....... ................... ............ ......... ..... .... ...... ....... ... ... .. .. . 58
APPENDICE A .. ........ ........... ........ ...... ... ... ....... ... ... .. .. .. .. .... ... ........... ..... .. .... .......... ..... .... ..... .... 60
Tableau Page
RÉSUMÉ
À l'aide de l'Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) un
échantillon de 1300 étudiants âgés de 7 et 9 ans et observés deux fois du premier au
troisième cycle est construit afin d'estimer des modèles de régression pour des
données de panel.
Trois méthodes d'estimation sont utilisées pour estimer l'impact du sport sur les
performances scolaires : un modèle de régression à effets fixes , un modèle de
régression à effets aléatoires et un modèle de régression simple par moindre carré
ordinaire.
Cette thèse cherche à démontrer si l' activité sportive a un impact sur les résultats
scolaires et si ce lien de causalité est significativement important. Le développement
durable est devenu un sujet populaire au cours des dernières années, mais il faut aussi
tenir compte du développement des humains qui batiront notre société du futur. Il est
donc essentiel pour la société d ' être au courant de l'effet de la pratique sportive sur le
rendement académique d' un étudiant, car elle pourrait utiliser le sport pour contrer le
décrochage scolaire, pour demander un meilleur fmancement du sport à ses élus et
permettre au Québec de mieux se classer au seins des pays de l'OCDE (MELS,
2010a).
L'étude la plus similaire à notre travail de recherche est celle de Shepard et al.,
originalement écrit en 1984. Au total, 546 étudiants d'écoles primaires de Trois-
Rivières ont été retenus. Les établissements qui ont pris part à cette étude ont divisé
leurs étudiants en deux groupes. En retranchant du temps des autres matières, sauf les
cours d'anglais, le groupe expérimental a pu bénéficier de 5 heures d'éducation
physique par semaine. Les autres étudiants recevaient le minimum de 40 minutes
2
requis par le ministère de l'Éducation du Québec. Ces deux groupes ont été suivi de
la première à la sixième année (Shepard, 1997). De plus, ils ont pu compiler des
résultats à l'aide de tests sur l'intelligence et sur le développement psychomoteur. Les
tests utilisés sont le « Goodenough » test et le WISC test (W echsler Intelligence sc ale
for Children). À première vue, les résutlats du WISC test démontrent que les
étudiants du groupe expérimental ont obtenu des résultats supérieurs à ceux des
étudiants des autres groupes. Les auteurs ont voulu vérifier l'impact d 'une
augmentation du nombres d'heures allouées à l'éducation physique sur les résultats
en français, en mathématiques, en science de la nature et sur le comportement. Ces
résultats ont été compilés à chaque année pour chaque étudiant participant. Pour
évaluer l' impact du programme expérimental sur les résultats académiques et pour
présenter une comparaison entre les résultats obtenus par les deux groupes, les
auteurs se sont servis du programme MANO V A, soit une technique d'analyse de
variance avec plusieurs variables dépendantes qui permet ainsi de tester la différence
entre plusieurs vecteurs de moyennes. En première année, les résultats semblent
démontrer que les étudiants du groupe non-expérimental ont obtenu, en moyenne, de
meilleurs résultats que le groupe expérimental. Cependant, cette tendance est
renversée pour toutes les autres années, surtout en deuxième, troisième, cinquième et
sixième année. En mathématiques, les groupes expérimentaux ont obtenu de
meilleurs scores dans quatre comparaisons et des résultats égaux aux autres groupes
dans huit comparaisons. Le groupe expérimental n'a pas obtenu de résultats plus
faibles et ce, pour toutes les comparaisons. Cette étude longitudinale présente des
résultats qui corroborent les hypothèses de ce mémoire. Ici aussi , des facteurs socio-
économiques et démographiques, l'âge et le sexe ont été inclus dans l'analyse.
Cependant, plusieurs points importants différencient les travaux. D ' abord, la
méthodologie utilisée est une régression longitudinale alors que l'expérience de
Shephard et al. utilise une méthode de comparaison. De plus, 1'étude de Trois-
Rivières a été mené dans cette ville, soit une ville majoritairement francophone.
L ' ELNEJ offre un échantillon plus vaste et diversifié.
3
Le texte de Carlson et al. (Carlson, 2007) s'appuie sur l'enquête longitudinale « The
Early Chidhood Longitudinal Study, Kindergarten Class of 1998 to 1999 » qui est un
échantillon représentant des enfants entrant la prématernelle (Kindergarten) en 1998
jusqu'à leur cinquième année de primaire en 2004. Cette analyse examine l'influence
de l'activité physique sur les résultats en mathématique et en lecture à l'aide d'un
échantillon de 5316 étudiants représentant une étude longitudinale menée de 1998 à
2004 dans des écoles primaires américaines. En tenant compte du revenu familial, de
l'ethnie, de l'éducation de la mère, du sexe de l'enfant ainsi que de plusieurs variables
démographiques, les auteurs ont effectué une régression linéaire multivariée
longitudinale à l'aide du programme SUDAAN pour tester la relation entre l'activité
physique et les scores en mathématiques et en lecture. À chaque année, les résultats
dans ces deux domaines ont été compilés en contrôlant pour le niveau de scolarité de
1' enfant. De façon générale, les résultats réfutent leur hypothèse initiale. Chez les
filles, seuls les résultats en lecture des étudiantes de cinquième année étaient
significatifs et positivement reliés à la pratique d 'activités physiques. Chez les
garçons, aucune différence n'a été notée dans les résultats en mathématiques et en
lecture. Les résultats négatifs obtenus dans cette enquête peuvent être liés à la façon
dont les données ont été manipulées afin de produire un échantillon représentatif de la
population américaine.
qui leur a été envoyé aftn de recueillir les informations concernant le sexe, l'âge, la
structure familiale et le statut socio-économique des familles. Quatre questions ont
été utilisées pour différencier les niveaux d'activité physique, soit: combien de fois
dans la dernière semaine l'enfant a-t-il pratiqué un sport où le niveau d'intensité
cardiorespiratoire était élevé, combien de fois dans la dernière semaine l'enfant a-t-il
fait du vélo ou de la marche durant au moins 20 minutes, combien de fois dans la
dernière semaine l'enfant a-t-il fait des exercices d'étirement et combien de fois dans
la dernière semaine l'enfant a-t-il fait des exercices du musculation (Tremblay, 2000).
En régressant le résultat au test de mathématiques sur la variables d'activité physique,
soit un aggrégrat pondéré des résultats aux quatres questions mentionnées plus haut,
le sexe, le statut socio-économique, la structure familiale, le nombre de frères et
sœurs et l'estime de soi, les auteurs ont trouvé une relation négative significative entre
les résultats en mathématiques et l'activité physique. Ces résultats peuvent être
expliqués par le fait que la population est représentative du Nouveaux-Brunswick
seulement. On ne peut donc pas extrapoler au Canada. De plus, la courte période sur
laquelle les données ont été collectées et le peu de variables explicatives peuvent être
responsables de biais dû à la présence d'hétérogénéité ou de corrélation entre les
variables explicatives. Si l'hypothèse d'homogénéité n'est pas respectée, les estimés
de la régression seront biaisés et ne pourront être utilisés pour des ftns d'inférences .
Ces types de problèmes ne risquent pas d'apparaître dans ce mémoire étant donnée le
plus grand nombre de variables explicatives et que le panel s'étend sur plusieurs
périodes. De plus, comme ils le soulignent dans leur conclusion, les questions posées
aux enfants pour mesurer le niveau d'activité physique manquent de précision. Celles
de l'ELNEJ permettent de séparer en cinq niveaux la fréquence à laquelle 1'enfant
pratique le sport. Finalement, la variable utilisée pour mesurer la performance
scolaire dans ce mémoire est un test standardisé à l'échelle nationale et administré à
tous les étudiants durant les huit cycles de l'ELNEJ tandis que dans le texte de
Tremblay et al., le test n'est administré qu'aux étudiants de sixième année au
Nouveau-Brunswick.
5
Le texte de Mulholland se base, entre autre, sur un article souvent cité dans la
littérature, soit celui de Richard Bailey dans Journal of School Health « Physical
Education and Sport in Schools : A Review of Benefits and Outcomes » (Bailey,
2006). Dans son texte, l'auteur fait une revue des essais scientifiques qui ont analysés
les effets du sport sur les résultats scolaires. Il se base sur plusieurs points de son
inspection des articles pour finalement porter une conclusion qui appuie la prémisse
présentée au début de ce travail. Ainsi Bai ley conclue que :
Dans un autre ordre d' idée, le livre de Francine Lauzon, L 'éducation psychomotrice:
Source d 'autonomie et de dy namisme (Lauzon, 1990) présente les éléments essentiels
au développement d'un enfant en regroupant des aspects cognitifs, socio-affectifs et
psychomoteurs. Elle consacre un chapitre à l'importance et l'impact de l'activité
physique sur le évolution des jeunes enfants. Ses conclusions sont claires quant au
développement de l'autonomie, la confiance en soi et de l'estime de soi . L'atteinte de
ces objectifs passe par la conquête d' habiletés motrices et sensorielles qui
s'amplifient avec la pratique d'activité physique. L'auteure affirme aussi que les
activités sensorielles et motrices sont nécessaires au développement de l'intelligence
et du rapport socio-affectif de l'enfant.
7
Finalement, il existe des études qui se sont lancé sur les mêmes pistes que celles
présentées plus haut, mais avec des résultats différents. Dans celle de James F. Sallis
et al. « Effects of Health-Related Physical Education on Academie Achivement :
Project SPARK » (Sallis, 1999), les auteurs présentent une étude qu ' ils ont menée
pendant deux ans auprès de 7 écoles primaires dans une banlieu du sud de la
Californie. Les variables utilisées pour mesurer les résultats scolaires sont les tests du
Metropolian Achivement Test, MA T6 et MAT7, soit un test de mathématique et un
test de psychologie. Ils cherchaient à démontrer si une augmentation des heures
dédiées aux cours d 'éducation physique serait reliée à une augmentation des
performances académiques. Leur constat fut que ce n ' était pas le cas. Il faut tenir
compte du fait que l'échantillon utilisé pour leur étude ainsi que la durée du panel
sont de taille faible et assez court, ce qui cause un problème de non-stationnarité des
données, comme mentionnés dans la section Méthodologie. L ' enquête utilisée pour la
présente étude ne fait pas face à ce genre de problème.
8
La problématique qui entoure l'étude de l'effet du sport sur les résultats scolaires
repose sur plusieurs aspects : le sport, bien entendu, mais aussi le développement
humain, le financement et l'importance que les Québécois accordent au sport. Il
faudra s' intéresser à plusieurs domaines afin de bien saisir l'amplitude des bienfaits
du sport sur les rendements académiques.
DONNÉES
L' objectif de ce travail est d'établir un lien empirique entre l' activité sportive et la
performance à 1' école avec 1' Enquête longitudinale nationale sur les enfants et les
jeunes (ELNEJ) de Statistique Canada, qui est biennale et qui couvre les années
1994-1995 à 2008-2009. Le site web de Statistique Canada la décrit ainsi:
La variable utilisée pour mesurer la performance scolaire est le score d'un test en
mathématiques, le CAT/2, dont la difficulté augmente avec le niveau de l'année
scolaire. Ce test est produit à tous les cycles (8) de l'ELNEJ pour les enfants à l'école
et qui ont de 7 à 15 ans. Ce test mesure les capacités de l' élève à effectuer des
opérations d' addition, de soustraction, de multiplication, de division et à résoudre des
problèmes comportant des pourcentages. Seul le score gradué est retenu pour ce
mémoire (ELNEJ, 2010).
Deux variables indépendantes vont être utilisées pour calculer l' impact de l' activité
physique sur les résultats en mathématiques. Plusieurs questions relatives au sport
sont disponibles dans I'ELNEJ, mais pour une grande majorité, elles ne sont pas
récurrentes à travers les cycles . La variable actif représente les étudiants qui
pratiquent une activité parascolaire quelconque, alors que la variable sportif
représente les étudiants qui pratiquent une activité sportive. Pour la variable sportif,
on demande au répondant : « Dans les 12 derniers mois, en dehors des heures de
classe, à quelle fréquence a-t-il/elle participé à des activités physiques ou à des sports
libres? ». Les réponses retenues sont : presque tous les jours, quelques fois par
semaine, environ une fois par semaine, environ une fois par mois et presque jamais.
L'étudiant pour qui le parent a répondu une des trois premières réponses est considéré
sportif. Celui dont le répondant a choisi une des deux dernières réponses est classé
parmi les non-sportifs. En ce qui à trait à la variable actif, la question posée est:
«Dans les 12 derniers mois, en dehors des heures de classe, à quelle fréquence a-t-
il/elle suivi des leçons ou des cours de musique, de danse ou d'art ou participé à
d'autres activités non sportives? ». Le choix de réponses et le processus de
catégorisation est le même que pour la variable relative au sport.
estimations de l'effet de l'activité physique sur les scores de mathématiques avec des
techniques de régression pour données longitudinales. Plusieurs milliers d'enfants ont
participé à cette enquête ce qui la rend très attrayante.
L' échantillon initial est constitué d'enfants répartis à travers le Canada âgés entre 0 et
11 ans. La distribution des étudiants à travers les cycles est décrite dans le diagramme
suivant où les longues flèches représentent la cohorte initiale alors que les petites
représentent les cohortes du Développement de la petite enfance.
0 ~ Cyde 1 : 1994-1995
y ·
~ Cycle~ : l99'-l99
1
01>_ ~Cy-rte3 · 1999-1999
10 l) _;~~ Cyde4 : _000-_001
~. l.a; ._ _ _ _~-,~> Cyde 5 : 2002-200.3
L....:.:::.__ _ _ _ _ ~ Cyde 6 : 2004-2005
~
1:):......_ _ _ __, "J._
c_:.- -> C)·cLe 7 . _Q()6-200ï
De plus, les cycles 4 à 8 ne sont pas retenus sutout dû au problème des données
manquantes quant à la question par rapport au sport. En effet, une modification dans
la formulation et le codage de la question font qu ' aucune observation est notée après
le cycle 3 pour cette question. Étant donné le nombre de répondants trop faible pour
certains groupes d'âge et une distribution plutôt hétérogène pour certains cycles, seuls
les enfants de 7 et 9 ans seront observés et ce, deux fois du premier au troisième cycle
inclusivement.
L ' échantillon final est constitué de 1300 étudiants âgés de 7 et 9 ans observés au
cours des trois premiers cycles, plus précisement, 650 enfants observés deux fois dans
la régression. La décomposition du panel par cycle est présentée dans le Tableau 1.1
ci-dessous.
Deux constats sont tirés de la distribution des jeunes qui ont répondu à la question sur
le sport. D ' abord, le nombre de sportifs est plus important que le nombre de non-
sportifs et ce, qu'ils soient observés à 7 ans ou à 9 ans. Ensuite, lorsque ces jeunes
sont observés pour la deuxième fois, on note que 24 étudiants passent du statut de
non-sportif à sportif. Ces constats sont présentés dans le Tableau 1.2 ci-dessous.
Lorsque la distribution des enfants qui ont répondu à la question sur le sport est
observée par sexe, elle montre que les parents des garçons sont moins nombreux que
ceux des filles à répondre. Pour ce même groupe, les sportifs représentent plus du
double de garçons non-sportifs alors que chez les filles, les deux groupes ont un
nombre plutôt égal d'étudiantes. Ces variables sont présentées dans le Tableau 1.3
suivant.
14
Moye nne au
Moyenne- Écart-
Écart-type Moyenne-Filles scoreMath
Garçons type
(com binées)
Cyclel 367.9 66.90 363 .9 66.58
Cycle2 364.7 66.66 367.6 67.51 363.8
Cycle3 340.4 60.30 344.4 63.09
Source : ELNEJ et calculs de l'auteure.
15
Évidemment, beaucoup de facteurs autres que les activités sportives peuvent avoir un
impact sur les résultats au test de maths. L ' ELNEJ offre une vaste diversité de
variables de contrôles qui pourraient être potentiellement incluses dans une régression
cherchant à estimer l' effet de l' activité sportive sur les résultats en mathématiques.
Le revenu des parents et leur niveau d'éducation jouent un rôle important dans
l'éducation de l' enfant. En effet, une famille plus riche, de manière générale, peut
. acheter plus de ressources utilisables pour l' éducation des enfants et elle peut aussi
leurs offrir plus facilement un parcours scolaire en milieu privé. Dans l' étude de
Finnie et Muller (Finnie, 2008), les auteurs ont trouvé comme résultats que pour les
hommes, un revenu parental de 100 000 $ et plus est associé à une augmentation de
19,1 points de pourcentage de la possibilité de poursuivre des études universitaires
par rapport au groupe de revenu de 50 000 $ à 75 000 $. Pour les femmes , cette
statistique grimpe à 19,8 points de pourcentage.
En ce qui à trait à l' effet du revenu famillial indexé de l'indice des pnx à la
consommation, il a été représenté par quatre variables dichotomiques représentant
différents paliers. La distribution des classes de revenu s' avère être plutôt
représentative d ' une distribution des paliers de revenu d ' une population-type.
Environ 9 % des répondants ont un revenu élevé, 25 %un revenu moyen-élevé, 47 %
un revenu moyen, laissant ainsi 19 % avec un bas revenu, soit sous 30 000 $.
Dans ce même article, les auteurs divulguent aussi que les garçons ayant des parents
avec un diplôme de premier cycle universitaire ont 31 ,2 points de pourcentage plus de
chance de s'inscrire à l'tmiversité que ceux ayant des parents qui n' ont pas complétés
d ' études post-secondaires. Dans ce mémoire, la mère peut avoir obtenu un diplôme
d ' études secondaires, post-secondaire, collégiales ou universitaires. Sinon, elle est
non-répondante. Ces pourcentages sont respectivement 20 %, 31 %, 22 % , 13 % et
14 %. Pour les hommes, seuls les niveaux d'études supérieures sont observés. Dans
16
De même, la structure familiale est un facteur important dans la réussite scolaire. Par
exemple, il sera difficile pour une famille monoparentale de trouver du temps qui
permet à l'enfant de participer à des activités sportives structurées. La variable
dichotomique monoparental prend la valeur de 1 pour un foyer où il n'y a qu'un seul
parent et 0 autrement. Un peu moins de 12 % des étudiants observés sont issus de
familles monoparentales. Qui plus est, dans l' étude de Deslandes et Cloutier
(Deslandes, 2005), les auteurs mentionnent que les enfants vivant dans une famille
non traditonnelle ont des résultats académiques plus faibles et présentent plus de
problèmes de comportement. La variable parentsbio saisi l'effet d'avoir deux parents
biologiques dans le foyer, ce qui est le cas pour plus de 82 % des jeunes. Si un des
deux n'est pas le parent biologique, cette variable dichotomique prend la valeur de O.
De plus, l' âge de la mère est aussi une caractéristique qui permet d'évaluer le foyer
de l'étudiant. Pour 50,07% des jeunes, la mêre est âgée de 25 ans ou moins alors que
45,15% des enfants ont une mère d'âge moyen, c'est-à-dire entre 26 et 44 ans. Seuls
4,78% des enfants de l'échantillon ont une mère de 45 ans et plus. Finalement, pour
permettre de bien capter l'effet de la structure familiale, trois variables binaires
contrôlent le nombre de frêres et ou sœurs dans le foyer du jeune étudié. Les enfants
ayant seulement un frère ou une soeur sont majoritaires à 51 % dans ce mémoire, à
peine 30% en ont deux alors que 7 %d'entre eux sont dans des familles avec quatre
enfants ou plus. Il s' en suit que 12% des étudiants sont enfants uniques.
17
Il sera aussi intéressant de retenir le type d ' établissement que les élèves fréquentent.
Selon le classement 2007-2008 des écoles secondaires au Québec de l' Institut Fraser
pour les résultats aux examens provinciaux en quatrième et cinquième secondaire, les
dix premières écoles sont des établissements privés. Ainsi, un étudiant qui fréquente
une école du secteur privé est susceptible d ' obtenir de meilleurs résultats qu 'un
étudiant du secteur public si ce classement représente bien le niveau académique des
étudiants de ces écoles secondaires. Bien que les jeunes observés sont au niveau
primaire, cette caractéristique sera tout de même retenue. Quatres variables
dichotomiques sont générées. Ainsi, 2,46 % des jeunes fréquentent un établissement
privé, 15,38 % une école catholique, 0,38 % tous autres types d 'école, laissant
81,78 % des répondants au public. Il sera interessant de comparer le lien entre les
différents types d'établissements scolaires par rapport à l'éducation publique sur les
résultats académiques.
Un autre élément qui peut influencer les résultats scolaires d ' un enfant est le pays de
naissance de ses parents. Cette caractéristique sera captée par la variable binaire,
immigrantfemme, qui saisi l'effet d ' une mère née au Canada ou non. Basé sur les
résultats du PISA 2009, l' article de l' OCDE sur l' intégration des immigrants (OCDE,
2013) note, en moyenne, 36 points de moins dans les résultats des tests de
compréhension de l'écrit chez les jeunes âgés de 15 ans qui sont nés dans le pays de
résidence de parents immigrants en comparaison avec les enfants dont au moins un
parent est né dans le pays de résidence. Cette différence s'amplifie au Canada, en
Australie, en Israël et aux États-Unis si on contrôle le statut socio-économique
familial. Dans cette épreuvre, il sera possible, grâce au grand répertoire de variables
dans I' ELNEJ, d'estimer l'effet de la province, mais aussi celle de la taille de la
région dans laquelle l' élève réside. Pour l'échantillon de la régression, 42 % des
étudiants habitent en Ontario, 22 % dans les Prairies, 10 % dans les provinces de
l'Atlantique, 13% pour la Colombie-Britannique et donc 11% au Québec . En ce qui
18
à trait aux regions, elles ont été catégorisées en rurale, petite, moyenne et grande, soit
toutes des variables dichotomiques . Étant donné la distribution décrite plus haut des
jeunes à travers les provinces canadiennes, il est sans surprise que 23 ,76 % d'entre
eux résident dans de petites régions, 11 ,23 % dans des régions moyennes, 38,92 %
dans de grandes régions et 26,09 % dans des régions rurales. Qui plus est, l'étude de
l'OCDE offre aussi t.m classement des résultats en mathématiques par province et
classe le Québec, l'Alberta, l'Ontario et la Colombie-Britannique parmi les quatre
premiers. Une autre raison pour laquelle la province de résidence constitue une
variable importante est relié à l'accès au sport et son financement. Les provinces qui
offrent plus de soutien fmancier, plus de ligues et d'équipes facilitent la pratique du
sport. Prenons par exemple le cas de l'athlétisme, en Colombie-Britannique, le
soutient financier se fait sous la base de remboursement de dépenses (BC Athletics,
2011). En Ontario (Athletics Ontario, 2013) et au Québec (MELS, 2011), le support
est offert sous forme de crédit d' impôt selon des critères de sélection qui sont basés
sur les performances de l'athlète.
Dans un même ordre d' idées, la langue aussi est une caractéristique importante
lorsqu'il est question de la performance académique d'un enfant. Les enfants se
retrouvant dans un milieu académique où l'environnement linguistique est différent
de celui à la maison peuvent être désavantagés. D'abord, par le fait qu 'avant même de
commencer à comprendre la matière enseignée, ils doivent comprendre le language
dans laquelle celle-ci est présentée et ensuite, car il est plus difficile pour des parents
qui ne parlent pas la langue d' enseignement d'aider leurs enfants à faire leurs devoirs.
Dans la publication de l'OCDE présentée plus haut, on compte en moyenne un écart
de 27 points dans les résultats des élèves nés dans le pays de résidence de parents
immigrants par rapport aux élèves autochtones lorsque la langue d' enseignement
n' est pas celle couramment utilisée à la maison. Pour 1' échantillon de la régression,
78,38 % des répondants sont anglophones, 1,8 % bilingue et 19,78 % sont
19
Certaines caractéristiques ne sont malheuresement pas incluses dans l' ELNEJ. Les
caractéristiques telles que la confiance en soi, la persévérence, la volonté et l' esprit de
compétition ne sont pas quantifiables bien que toutes ces singularités chez 1'enfant
ont des impacts importants autant sur la réussite scolaire que sportive. Le support
parental, le type et le nombre d 'amis ainsi que les habiletés naturelles sont aussi des
variables qui ne pourront être incluses dans la régression. La section suivante cherche
à qualifier la nature de ces particularités inobservables chez 1' enfant et de leurs
impacts sur la méthode d'analyse à employer.
Finalement, le taux de réponse à l'ELNEJ est plus faible que celui qui était espéré.
Ces pourcentages sont présentés dans le Tableau 1.6 suivant Dans le guide qui
accompagne le questionnaire de l'ELNEJ, il est expliqué que le taux de réponse est
calculé est divisant le nombre d' examens complétés par le nombre d' enfants éligibles.
Un faible taux de réponse diminue l'information disponible pour les chercheurs.
Aussi, si les caractéristiques des enfants non-répondants ne sont pas captées dans la
régressions, elles pourraient influencer le terme d'erreur et causer un biais dans les
estimations.
22
~L Y RE P ~ E R .\T E BY PR \l~ E
PR \ '1. .-
MÉTHODOLOGIE
Quelques difficultés se posent pour 1'estimation d'un effet non-biaisé des activités
sportives sur les résultats en mathématiques. Un premier problème pourrait apparaître
dans un contexte de régression, lorsque la participation à de telles activités est
corrélée avec des facteurs inobservables qui influent simultanément sur les résultats et
l'activité physique. En second, le cas d'un biais endogénéité, soit un problème qui
survient lorsque le sens du lien de causalité qui tmit le sport et les résultats scolaires
est mal défini, provoque aussi des biais dans l'estimation des effets du sport. Il faut
donc minimiser l' impact de tels facteurs dans l' analyse de régression de panel.
C'est pour ces raisons que la technique longitudinale qui sera privilégiée pour
l'analyse économétrique sera celle qui permet l'inclusion d ' effets fixes individuels
dans la régression de l' impact des activités sportives sur les résultats en
mathématiques. Cette méthode permet d ' inclure une constante qui capte tous les
effets des autres variables explicatives qui ne varient pas dans le temps comme par
exemple, le lieu de naissance de la mère et le type de parent. L ' hypothèse de base de
cette technique d ' analyse est que les entités, dans notre cas, les enfants, sont tmiques.
Ainsi, on pose comme hypothèse l' exogénéité stricte des variables explicatives
conditionelle à cette constante pour toutes les périodes. Elle permet donc de prévenir
les biais duent à une corrélation entre la variable à expliquer et une des variables
explicatives inobservées, mais constante dans le temps de manière à interpréter l' effet
de l' activité sportive toutes choses étant égales par ailleurs. Un des bémols de cette
approche est qu ' elle est plus efficace pour calculer des variations intrinsèques que
pour calculer l'effet causal des variables explicatives sur la variable à expliquer. La
régression à effets fixes n'estimera que les effets pour les variables qui varient,
préférablement beaucoup dans le temps. C'est pour cela que la technique d ' analyse à
effets aléatoires sera aussi utilisée.
24
Il sera possible de procéder avec la méthode à effets aléatoires pour étudier l'impact
des activités sportives, car elle offre des estimateurs consistants et est donc plus
efficace que celle à effets fixes (Cameron, 2012). Cette approche permet aux effets
non-observés d'être distribués aléatoirement et de spécifier les autres variables qui
pourraient potentiellement influencer la variable dépendante. Ainsi, il sera possible de
contrôler par exemple le sexe, le revenu, la scolarisation des parents, la taille de la
région et la fratrie pour capter l'effet net du sport sur les résultats en mathématique.
Ceci donne donc un pouvoir explicatif aux variables, ce qui n'est pas tout à fait le cas
avec la méthode à effets fixes. Cette technique d'estimation est basée sur une
hypothèse supplémentaire qui nécéssite 1'absence de corrélation entre l' activité
sportive et les effets inobservés. Néanmoins, étant donné l'éventail de variables que
l'on retrouve dans l'ELNEJ, il est possible de contrôler assez de facteurs pour
probablement éliminer le problème de variables omises. D 'ailleurs, l'analyse à effets
aléatoires est plus efficace pour faire de l'inférence étant donné que la variance des
estimateurs générés est plus petite que celle obtenue pour les coefficients estimés par
la méthode à effets fixes (Merrigan, 2014).
Une dernière technique, celle de la méthode de régression linéaire, sera utilisée pour
des fms de comparaison avec les méthodes présentées plus haut. Il est possible de
prouver avec les variances estimées pour l'erreur et les effets non-observés que le
modèle de régression à effets fixes et celui par moindre carré ordinaire sont des cas
limites du modèle à effets aléatoires (Merrigan, 2014).
CHAPITRE II
MODÈLES
où Yit est le score au test de mathématique, Z~t est la variable représentant 1'activité
physique, Xit sont les variables explicatives, Ci est une variable non-observée qui ne
varie pas dans le temps, soit l'effet fixe ou aléatoire, Uit est un terme d'erreur, i est
l'identifiant de l'étudiant et test 1'indice de temps.
Pour chaque méthode d'estimation choisie pour calculer d'impact du sport sur les
résultats académiques, une version de 1' équation (1) modifiée sera utilisée ainsi que
les raisons motivant 1'utilisation de la technique en question. La variable dépendante
est le score au test CAT/2 de mathématique, soit scoreMath. Deux variables
indépendantes vont être utilisées pour calculer l'impact de 1'activité physique sur les
résultats en mathématiques. La variable actif représente les étudiants qui pratiquent
27
une activité parascolaire quelconque, alors que la variable sportif représente les
étudiants qui pratiquent une activité sportive.
Le premier modèle est estimé à partir d' une régression avec estimateurs à effets
aléatoires .
où Yit est le score au test de mathématique, Zlt est la variable sportif, Xit sont les toutes
variables explicatives retenues jusqu'à présent, Ci est l'effet aléatoire, Uit est le terme
d' erreur, i est l'identifiant de l'étudiant et test l' indice de temps .
Deux hypothèses sont requises pour qu ' elle soit estimée par la méthode à effets
aléatoires. D'abord, on impose l'exogénéité stricte des variables explicatives
conditionelle à la présence de Ci , c'est-à-dire qu 'étant donné la présence de l'effet
aléatoire, il y a absence de corrélation entre le terme d'erreur et les variables
explicatives et ce, peu importe la période. Ensuite, on impose l'absence de corrélation
entre les effets aléatoires inobservés et les autres variables explicatives du modèle.
Ces deux hypothèses assurent la convergence des estimés. Il sera cependant plus juste
d' utiliser l 'option « cluster » sur les individus disponible sur Stata pour contrôler
l'hétéroscédasticité lors des régressions. Cette méthode d'estimation est appropriée
pour ce modèle, car étant donné que le panel est composé de plusieurs périodes et de
plusieurs individus, il est possible d' observer les jeunes deux fois et de contrôler
plusieurs variables explicatives. De plus, elle permet aux effets inobservés d'être
28
distribués aléatoirement. Dans le modèle estimé avec Stata, on impose une correction
pour l' hétéroscédasticité. L ' option« cluster » permet à la régression de panel d'être
«robuste» à l'hétéroscédasticité. Seule la puissance des tests sera affectée si ce
problème est en fait absent, mais ces mêmes tests restent valident (Merrigan, 2014).
Toujours avec ce même logiciel, il est possible de tester si la variance de l'effet
aléatoire est nulle grâce au test de Breush-Pagan de type multiplicateur de Lagrange.
Le second modèle est estimé avec la méthode d'estimation avec estimateurs à effets
fixes.
où Yit est le score au test de mathématique, Z, 1 est la variable sportif, Xit sont les
variables explicatives, Ci est une variable non-observée qui ne varie pas dans le temps,
soit l'effet fixe , Di est une des variables dichotomiques qui prend la valeure de 1 ou 0,
Uit est un terme d'erreur, i est l'identifiant de l'étudiant et finalement, test l' indice de
temps.
29
La statistique F calculée lors d'une régression à effet fixe vérifie que tous les effets
fixes, Ci , sont égaux à zéro. Il est à noter que le modèle à effets fixes ne peut
qu'estimer l'impact des variables qui varient beaucoup dans le temps. Cette faiblesse
est notable pour cette étude étant donné que plusieurs variables comme, la province,
le type d' école, la scolarité des parents ainsi que la classe de revenu ne varient pas
dans le temps, mais peuvent avoir un impact significatif sur les résultats académiques.
Le troisième modèle est celui estimé par une régression linéaire par moindre carré
ordinaire (MCO).
qui consiste en l' équation (1), mais sans indice de temps. Cette régression est générée
pour des fms de comparaison avec les modèles présentés plus haut comme mentionné
auparavant. La nature du lien entre ces modèles réside dans la comparaison entre la
30
variance de l'effet inobservé et celle du terme d ' erreur. Cette comparaison est
représentée par l'équation (2) dans la section Discussion des résultats.
Il est possible d'effectuer un test d ' autocorrélation à l'aide du résidu généré par la
méthode de régression linéaire. Ainsi, une régression du terme d' erreur estimé sur ce
même terme d'erreur retardé d'une période permettrera de confirmer ou d ' infirmer la
présence d'autocorrélation dans le modèle.
Les modèles modifiés sont les mêmes que ceux estimés dans la section 2.1 avec
comme seule différence majeure que la variable explicative, Zu, est représentée par la
variable actif. Les trois modèles, soient le modèle à effets aléatoires, le modèle à
effets fixes et le modèle de régression linéaire simple sont estimés et contraints aux
mêmes tests. Les équations (lA ' ), (1 B ') et ( 1C') représentent les modèles avec la
variable actif.
Le but de cette modification est de vérifier si c' est le sport qui influence les résultats
ou SI le fait de pratiquer une activité parascolaire, peu importe son genre, pourrait
aussi avoir un impact sur les tests de mathématique. Comme mentionné dans le
chapitre précédent, la corrélation entre ces deux variables est de 0, 1977.
CHAPITRE III
RÉSULTATS
33
Dans le cas des variables de revenu, lorsqu'on considère le palier de revenu élevé,
l'effet sur la note de mathématique est de 2,27 points par rapport à un enfant vivant
dans un foyer à bas revenu. Un impact d'amplitude similaire est estimé pour le revenu
moyen-élevé, soit de 2,78 points. Par contre, pour un enfant dont le revenu de la
famille est considéré moyen-bas, on note une baisse du résultat au test de math par
rapport à un étudiant pour qui le revenu familial est bas. Ce point en particulier sera
exploré plus en détail dans les sections qui suivent. Le niveau d'études que les parents
espèrent voir leur enfant atteindre aussi influence positivement le résultat
académique. L'estimateur qui représente des études collégiales complétées est
significatif à 3 % et augmente la note de 12,51 points par rapport à un jeune dont les
parents croient qu'il completera des études primaires ou secondaires. Pour des études
universitares, le coefficient est moins important et n'est pas significatif, soit avec un
effet positif de 7,2 5 points sur le score.
Une autre variable qui permet de décrire le foyer de l'enfant est la variable
dichotomique qui représente le statut d'immigrant de la mère, c'est-à-dire, si elle est
née au Canada ou non. Cet estimateur est significatif à 1 % et propose une
augmentation de 13,74 points de la note au test de mathématique lorsque la mère de
34
l'enfant n ' est pas née au Canada. Ce constat est contraire à ceux présentés dans la
revue de la littérature, mais il peut être le résultat d'une meilleure adaptation des
enfants des femmes immigrantes au Canada. Toujours au sujet de cette dernière, la
variable dichotomique jeuneMere correspond aux mères âgées de moins de 25 ans, la
variable avgMere représente celles entre 25 et 34 ans. Ces deux variables ne sont pas
significatives, mais tout de même, pour l' échantillon de la régression, le score
diminue de 4 , 16 points pour un enfant ayant une jeune mère par rapport à la note d ' un
enfant ayant une mère âgée de 45 ans ou plus. Pour les mères d'âge moyen, la note
chute de 7,34 points par rapport à celle d'Lm étudiant dont la mère est considérée
âgée.
L' estimateur de la variable dichotomique représentant les étudiants anglophones n' est
pas significatif, néanmoins, il estime une baisse du score au test de mathématique de
4,77 points par rapport à celle d'un enfant francophone ou allophone. Dans le cas où
1'étudiant est bilingue, cette variation positive est estimée à 18,51 points. Cet
échantillon exprime bien la situation d'un pays comme le Canada où les langues
officielles sont le Français et l' Anglais. Il est donc attendu qu'un étudiant qui maitrise
les deux performe mieux.
Parmi les coefficients des variables dichotomiques qui captent la taille de la région
dans laquelle l'enfant réside, seul celui pour les grandes régions est significattif.
Aussi, seul le coefficient pour les petites régions est positif. De plus, la note
augmente de 1,27 points pour un étudiant localisé dans une région de moins de 30
000 habitants par rapport à une région rurale. Le score diminue de 6,63 points pour
ceux vivant dans des régions de taille moyenne et de 9,54 points pour ceux habitant
une région de 100 000 habitants ou plus. Dans un même ordre d'idée, les estimateurs
des variables dichotomiques représentant la province où réside l'enfant sont tous
négatifs et significatifs. Par rapport au résultat d' un étudiant qui habite au Québec, on
note une diminution de 13,57 points pour les étudiants de la Colombie-Britannique,
35
24,35 points pour ceux de l'Ontario, 25 points pour ceux des provmces de
1'Atlantique et 27,30 points pour les jeunes des provinces des Prairies. Déjà, il est
possible de conclure que, dans l' échantillon de cette régression, les étudiants
québécois ont de meilleurs résultats au test de mathématique. Cette conclusion
s'enligne avec celle tirée au sujet de la langue que parle l'enfant étant donné que le
Québec est la province où les deux langues sont le plus courrament utilisées.
Dans un autre ordre d'idées, la variable privé qui décrit le type d'établissement que
l'enfant fréquente estime une augmentation de la note de 23 ,70 points par rapport à
celle d'un étudiant du secteur public. Cette variation positive est de 7,27 points pour
ceux qui fréquentent une école catholique et de 1,09 points pour les autres types
d' établisssements scolaires.
Finalement, pour ce qui est question de la composition du foyer, les estimateurs des
variables dichotomiques générées pour capter l'effet de la taille de la fratrie ne sont
pas significatifs. Néanmoins, le score augmente de 5,10 points si l'enfant à un frère
ou une sœur versus un enfant unique. Cette variation est de 8,20 points s'il y a 3
- - -- - -- - - - - ----
36
enfants au total dans la famille et 4,50 points s'ils sont 4 enfants ou plus. Pour un
enfant dans un foyer avec un seul parent, le coefficient de cette variable dichotomique
estime une baisse de la note de 4,53 points par rapport à un enfant dans un foyer avec
deux parents. Même si ce coefficient n'est pas significatif, le signe de la variation est
cohérent. Finalement, le score augmente de 2,05 points pour un enfant dont les deux
parents sont ses parents biologiques à comparer un étudiant dont un des deux parents
n'est pas son parent biologique.
Les résultats de la régression de 1'équation (lB) estimée par Stata sont présentés dans
le Tableau 3.2 ci-après. Pour ce modèle, les coefficients des variables explicatives qui
sont significatifs sont l'âge de l'enfant, un ménage au revenu élevé, l'âge de la mêre et
les femmes ayant un diplôme universitaire. Les autres variables de la régression,
entre-autre la variable de sport, ne sont pas significatives. Pour la régression à effets
fixes, les estimateurs pour les variables relatives au sexe de l'enfant et si la mère est
née au Canada ou non sont omises pour des raisons de collinéarité. En effet, ces
variables ne changent pas dans le temps et la méthode avec estimateurs à effets fixes
n'est pas en mesure de générer leur coefficient. L'écart-type estimée de l' effet fixe est
de 39,78 et celui du terme d'erreur est de 44,80. Ces statistiques seront abordées plus
en détail lors de la comparaison entre le modèle de régression linéaire et celui à effets
37
38
L' estimateur de l' impact du sport sur les résultats en math, soit la variable sportif, a
un impact négatif de 0,87 point sur le score et n'est pas significatif. L' âge de l'enfant
a un impact significatif positif de 46,09 points. Ce résultat est cohérent avec celui
généré par le modèle à effets aléatoires. Pour les variables de revenu, les résultats
sont incohérents avec la littérature. Pour toutes les variables dichotomiques du revenu
familial, 1' impact sur le score est négatif par rapport à un étudiant dans un foyer à bas
revenu. Le niveau d'étude que les parents espèrent voir leur enfant atteindre n'est pas
significatif pour toutes les variables dichotomiques de ce modèle. Tout de même,
l'estimateur qui représente des études collégiales complétées augmente la note de 7,38
points par rapport à un qui complèterait des études primaires ou secondaires. Pour des
études universitares, le coefficient est négatif et diminue la note de 5,22 points. Les
coefficients des variables dichotomiques relatives à l'âge de la mère de l'étudiant
telles que j euneMere et avgMere sont négatifs aussi. Pour l' échantillon de la
régression, le score diminue de 29,25 points et 27,18 points respectivement par
rapport à un élève dont la mère est âgée de 45 ans ou plus. Ces estimateurs sont
significatifs à 2 % respectivement. L'estimateur de la variable dichotomique
représentant les étudiants anglophones n' est pas significatif et ce constat tient pour
celui de la variable représentant les enfants bilingues. Sommes toutes, la note d'un
étudiant anglophone accuse 6,74 points de retard sur celle d'un étudiant francophone
ou allophone, alors que le coefficent de la variable biling estime une augmentation de
la note de 3,55 points. Ces résultats sont semblables à ceux obtenus avec le modèle
précédent.
En ce qui à trait aux estimateurs des variables dichotomiques qui captent la taille de la
région dans laquelle l'enfant réside, ceux qui habitent une zone rurale ont de
meilleures notes au test de mathématique que les autres jeunes et ce, que ces dernjers
habitent une petite région, une moyenne ou une grande. En effet, la note diminue de
0,06 points pour les en fans en petite région et de 11,07 et 7,32 points respectivement
40
pour ceux qui vivent dans des régions moyennes et grandes. Dans cette régression à
effets fixes, l'impact d'habiter dans une province autre que le Québec n'est pas aussi
important que dans le modèle à effets aléatoires. Par rapport au score des étudiants
québécois, ce dernier diminue de 6,82 points pour les étudiants ontariens et des
provinces de l'Atlantique, mais il augmente de 2,63 points pour ceux des Prairies et
13,24 points pour les étudiants qui résident dans la province la plus à l' ouest. Tous
ces derniers coefficients ne sont pas significatifs.
modèle que dans celui de la section précédente. La note augmente de 12,18 points si
l' enfant à un frère ou une sœur à comparer l'enfant unique, 16,02 points s' il y a 3
enfants au total dans le foyer et 34,12 points s ' il y a 4 enfants ou plus dans le ménage.
Pour un enfant avec un seul parent, le coefficient de cette variable dichotomique
propose une baisse de 12,22 points par rapport à un enfant qui a deux parents. Dans
cette régression, ce coefficient n' est pas significatif, mais le sens de la variation reste
cohérent. Pour terminer, le résultat au test de math augmente de 1,60 points pour un
enfant vivant avec ses parents biologiques versus un jeune dont un des deux parents
dans son foyer ne l' est pas.
donné que la méthode à effets aléatoires estime une variance plus faible pour les
estimateurs, cette dernière est donc favorisée pour ce mémoire.
Un autre test, supérieur au test de Hausman, qui aurait pu servir à la validation des
modèles est le test de Wald conjoint proposé par Wooldridge à l'aide des moyennes
temporelles des variables explicatives (Wooldridge, 2002). Cependant, ce test n'a pas
été retenu en raison des limites de temps.
44
Lorsque 1'équation ( 1A) est régressée, mais en imposant actif comme variable
explicative principale, on obtient l'équation (lA').
(lA')
où Yit est le score au test de mathématique, Z 11 est la variable actif, Xi 1 sont les toutes
variables explicatives retenues jusqu'à présent, Ci est l'effet aléatoire, Uit est le terme
d 'erreur, i est l'identifiant de l'enfant et test l' indice de temps.
Les coefficients des variables de contrôle estimés par ces régressions sont très
semblables, c'est-à-dire que l'ampleur et le sens des variations sont pratiquement les
mêmes. Dans les cas les plus extrêmes, les coefficients des deux modèles diffèrent au
maximum par 0,2 points. Par contre, la constante et l'estimateur de la variable actif
propose un impact plus important, soit de 3,15 points pour la variable explicative
principale. Pourtant, la corrélation entre la variable scoreMath et sportif et plus
grande que celle entre scoreMath et actif. Il est à noter que les estimateurs qui
n'étaient pas significatifs dans le modèle pour les étudiants sportifs ne le sont pas
dans ce modèle-ci aussi. Le R-Carré et les écart-type estimés sont aussi semblables,
d'où des résultats similaires lorsque le test de Breush-Pagan est conduit sur les deux
modèles. Le résultat du test, présenté dans le Tableau A.2 en appendice, permet de
rejetter l' hypothese nulle. Les résultats de la régression de l'équation (lA') eux sont
présentés dans le Tableau 3.4 ci-dessous.
45
Homme {
Diplôme collégia 1 8.59 3.6 0.02
Diplôme universitaire 3.02 5.2 0.56
1 frê re/sœ ur 5. 16 5.4 0.34
2 frêres/sœurs 8.24 5 .6 0.14
3 frêre s/sœurs 4 .54 7 .6 0.55
école privée 23.64 9 .5 0.01
éco le ca tholique 7.27 4.1 0.08
autres types d'écoles 1.03 6.6 0.88
fa011lle monoparentale -4.32 7.8 0.58
2 parents biologiques 2.19 6.9 0.75
constante estimée -27.27 17.3 0. 12
Si l'équation (lB) est régressée avec actif comme variable explicative principale, elle
devient l' équation (lB').
Yit = ~0 + ~1 zlt + ~ 2 Xzt + ... + ~n Xnt + DtCt + D zCz+ ... + DnCn + Uit , (lB ')
où Yit est le score au test de mathématique, Ztt est la variable actif, Xit sont les
variables explicatives, c; est une variable non-observée qui ne varie pas dans le temps,
soit 1'effet fixe , D; est une des variables dichotomiques qui prend la val eure de 1 ou 0,
u; 1 est un terme d'erreur, i est l'identifiant de l'enfant et test l' indice de temps.
Les coefficients des variables de contrôle estimés par cette régression modifiée, mise
à part celui de la constante et celui de la variable actif, sont d'ampleur similaire à
ceux de l'équation (lB) et le sens des variations sont les mêmes pour la majorité des
variables explicatives pour le deux modèles. Ces résultats sont présentés dans le
Tableau 3.5 ci-dessous. Parmi les valeurs qui sont différentes dans ce modèle, l'effet
du fait d' habiter une petite région au lieu d'une région rurale est postif alors qu'il était
négatif pour le modèle de régression estimé à l'aide de l'équation (lB). Un constat
similaire s'applique à la constante qui passse de -2,21 points dans le modèle de base à
7,66 points pour 1'équation modifiée. Aussi, le coeficient de la variable explicative
pricipale passe de -0,87 point avec sportif à -6,65 points avec actif. Ici, 1'impact
d'être inscrit à une activité scolaire quelconque fait varier la note de façon négative
par rapport à ceux qui ne le sont pas, et cette variation est plus importante que dans le
modèle pour les sportifs. Finalement, le coefficient de la variable FemmeDiplSec, soit
une mère ayant obtenu un diplôme d'études secondaires, est significatifs à 9 % tandis
que ce pourcentage était de 11 % dans le modèle de base. Encore une fois , les
variables dichotomiques ageEnfant et immigrantFemme ont été omises pour éviter le
problème de collinéarité. La statistique F générée après la régression pour tester
47
l'hypothèse nulle que tous les effets fixes sont égaux à zéro nous permet de rejeter
cette dernière hypothèse nulle. Lorsqu'on teste comme hypothèse nulle si le
coefficient de la variable explicative principale est nul, soit actif les résultats du test,
présentés dans le Tableau A.3b de l'appendice, démontrent qu'on ne rejette pas
l'hypothèse nulle à un niveau de significativité de 5 %, mais il faut noter qu'à 11 %,
on la rejette.
48
Comme pour les régressions avec Z;1 = sportif le même test de Hausman est utilisé
pour sélectionner le modèle le plus adéquat pour les données disponibles.
L'hypothèse nulle du test de Hausman préconise le modèle à effet aléatoire, tandis
que l'hypothèse alternative favorise le modèle à effet fixe. Les résultats du test de
Hausman sont présentés dans le Tableau A. 5 en appendice. Les régressions sont
effectuées sans correction pour l ' hétéroscédasticité pour les fins du test. Les
coefficients des estimateurs pour le modèle à effet aléatoire sont donc légèrement
différents que ceux générés avec la correction. Pour cette régression et pour un niveau
de significativité de 5 %, l' hypothèse nulle n 'est pas rejettée. Ceci implique que les
modèles sont potentiellement sans biais, mais pour ce mémoire, le modèle à effets
aléatoires est préféré pour la variance estimée de ses estimateurs plus faible.
Quand l'équation (lC) est régressée avec actif comme variable explicative principale,
elle devient l'équation (lC').
Soit 1'équation (1 C) :
qui consiste en l'équation (1), mais sans l' indice de temps et où y;1 est le score au test
de mathématique, Z 11 est la variable actif, x; 1 sont les variables explicatives, et U it est
un terme d 'erreur.
Les résultats du modèle de l'équation (lC') sont comparables, pour la majorité des
coefficients, à ceux obtenus pour les modèles de régression des équations (lA), (lA')
50
et (lC). Le R-Carré aussi est équivalent pour ces modèles. La variation positive
estimée de la note, pour un jeune qui pratique une activité parascolaire quelconque,
est de 2,59 points par rapport à un étudiant inscrit à aucune activité. Les résultats de
cette régression sont présentés dans le Tableau 3.6 ci-après.
Dans cet essai qui tente d'estimer 1'impact du sport sur les résultats au test de
mathématique, « 1'étudiant-type » pour cet échantillon, c'est-à-dire lorsque toutes les
variables dichotomiques sont égales à zéro, est un garçon dans un ménage où le
revenu familial est bas, soit sous les 30 000 $, pour lequel les parents croient qu ' il
complètera ses études secondaires et qui a une mère âgée de 45 ans ou plus qui est
née au Canada. Le garçon est francophone ou allophone, mais pas anglophone ni
bilingue. Il habite dans une région rurale du Québec et est enfant unique. Le père a
complété des études secondaires ou moins alors que le niveau maximum d'études
atteint par la mère n'a pas été déclaré. D'ailleurs, il grandit dans un foyer avec deux
parents, mais seul un des deux est son parent biologique. Les tableaux B.l et B.2 de
l'appendice présentent les statistiques descriptives des variables utilisées dans les
régressions pour les étudiants sportifs et actifs respectivement.
Dans le modèle de régression avec estimateurs à effets aléatoires, parmi les variables
explicatives incluses dans l'équation (lA), celles qui influencent le plus le score,
toutes choses étant égales par ailleurs, sont si la mère est née au Canada ou non, le
niveau d'éducation de cette dernière et le type d 'établissement que fréquente l'enfant.
Pour cette méthode, le résultat moyen d'un étudiant qui va à l'école privé augmente
de 6,51 % à comparer un enfant qui fréquente une école publique. Ce constat est
cohérent avec la littérature. Pour ce qui à trait à la variable relative au statut
d'immigrant de la mère, le coefficient estime une augmentation de 3,77 % de la note
moyenne pour un étudiant dont la mère n 'est pas née au Canada par rapport à un
jeune pour qui la mère 1'est. Toujours au sujet de la mère, il a été estimé que celles
53
qui ont obtenu leur diplôme universitaire font augmenter la note de l'enfant de
10,47 % versus une mère non-répondante. Pour cet échantillon, les caractéristiques
relatives à la mère influencent beaucoup la note de l' enfant lorsque les effets
inobservés sont considérés aléatoires .
54
Dans ce mémoire, l'impact de la pratique d ' tme activité physique sur le résultat au
test de mathématique, par rapport à la note moyenne obtenue pour les étudiants de
l'échantillon est négligeable dans la régression à effets aléatoires, soit une
augmentation de 0,25 % du score. Le R-Carré « overall » qui est une mesure de la
capacité du modèle à expliquer les variations dans les notes au test est de 0,5471.
Ainsi, le modèle de l'équation (lA) permet d'expliquer partiellement la diversité des
résultats. Plusieurs explications sont possibles. D'abord, pour les enfants de moins de
10 ans, ce sont les parents qui répondent aux questions de l'ELNEJ pour eux. Ensuite,
les individus observés sont peut-être encore trop jeunes pour pratiquer un sport à un
niveau assez élevé qui leur permettrait de bénéficier de ces bienfaits possibles.
Finalement, dans l'étude de Trois-Rivière (Shepard, 1997), les auteurs mentionnent
qu'en première année, les jetmes dans le groupe avec le nombre minimum d'heures
d'éducation physique obtenaient de meilleurs résultats que ceux dans le groupe avec
une heure supplémentaire. Cependant, cette tendance était renversée en fin d'études
pnma1res.
Dans le modèle de régression avec estimateurs à effets fixes estimé avec l'équation
(1 B), plusieurs coefficients estiment des variations incohérentes avec la littérature.
D ' abord , tous les estimateurs des variables de revenu sont négatifs et celui pour la
variable sportif aussi. De plus, le coefficient de cette dernière variable estime une
diminution de la note de 0,239 %. Le R-Carré « within » pour cette régression est de
0,7637, ce qui à première vue porte à croire que cette modélisation permet de bien
expliquer les variation du score de l'étudiant. Néanmoins, le test de Hausman ne
permet pas de rejetter l' hypothèse nulle, mais il favorise tout de même le modèle à
effets aléatoires. Plusieurs raisons justifient cette conclusion, mais la plus importante
est que les variables incluses dans l'équation (lB) ne varient pas assez dans le temps
pour que leur impact sur la note soit bien capté par le modèle à effets fixes dans le
test de Hausman (Merrigan, 20 14). D 'ailleurs, les variables sexeEnfant et
immigrantFemme sont omises dans l'estimation de cette équation.
ss
Lorsque la variable explicative principale est remplacée par actif dans le modèle de
régression à effets aléatoires, on remarque que les estimateurs de plusieurs variables
de l' équation (lA') sont, au dixième près, identiques à ceux de l'équation (lA) sauf
pour le coefficient de la variable actif Ce dernier estime une variation positive de
0,86 % du score pour un étudiant actif par rapport à un qui ne l'est pas. Malgré Lme
corrélation faible entre les deux variables explicatives principales, leur impact
respectif sur la note est de moins de 1 % dans les deux cas. Quand même, la catégorie
pour les enfants actifs est beaucoup plus vaste que pour les sportifs, ce qui fait qu'une
variation un peu plus importante de la note est attendue et ce, même si la corrélation
entre le score et le sport est plus importante que celle entre la note et une activité
quelconque. Le R-Carré « overall » est le même dans l'équation (lA) et (lA'), mais
les écart-types pour le terme d'erreur et l'effet aléatoire sont plus petites dans le
modèle modifié. Quand même, le test de Breush-Pagan effectué sur le modèle de
l'équation (lA') génère les mêmes conclusions, c'est-à-dire qu'on rejette une variance
nulle pour l'effet aléatoire.
Les comparaisons sont similaires entre l'équation (1 B) et (1 B') qui sont estimées
avec une régression à effets fixes. Dans le modèle avec la variable actif, le coefficient
de cette dernière variable estime une variation négative de 1,82 % de la note pour un
enfant qui pratique une activité parascolaire quelconque par rapport à un pour qui ce
n'est pas le cas. Le R-Carré pour le modèle modifié est de 0,7647, ce qui est
semblable au modèle de base. Les écart-type estimés par l'équation (lB') sont plus
faibles que ceux générés par la méthode initiale. Ainsi, lorsque Stata teste l'hypothèse
nulle que tous les effets fixes sont égaux à zéro, la statistique F générée est
sensiblement différente, mais on rejette tout de même l'hypothèse nulle pour
l'équation (lB'). Le test sur le coefficient de la variable explicative principale
démontre qu'on ne rejette pas l'hypothèse nulle que cet estimateur est nul. Cependant,
dans le cas de la variable actif, à 11 %, on rejette l'hypothèse nulle.
56
D'ailleurs, parmi les modèles présentés précédemment, seuls ceux avec des
estimateurs à effets fixes calculent que 1' impact sur la note au test de mathématique
de pratiquer une activité, sportive ou non, hors de l'établisement scolaire est négatif.
Cette méthode calcule aussi, en terme absolu, des variations plus importantes du
score. Ces observations sont cohérentes avec la littérature, dont l'étude de Sallis et al.
(Sallis, 1997) présenté dans la section Introduction. Au cours d ' une journée, le temps
accordé à la pratique d 'activités parascolaires diminue celui destiné aux études et aux
devoirs, toutes choses étant égales par ailleurs. Ainsi, il est possible, surtout en bas
âge, qu 'une mauvaise gestion des heures attribuées à chaque tâche pénalise l'enfant
dans son apprentissage, d 'où une variation négative dans la note pour les étudiants
sportifs ou actifs.
Pour comparer les trois modèles présentés jusqu'ici dans cette recherche, il est
possible de calculer un ratio qui les unit dans les cas limites, comme mentionné dans
la présentation des modèles.
(2)
résultats pour le modèle de régression à effets aléatoires pour les sportifs sont
présentés dans le Tableau 4.1 suivant.
RE, Sportif
Teta= 0,3080
sigma (c) = 26,54
sigma (u)= 39,78
Le cas limite du modèle de régression à effets aléatoires lorsque e est égal à zéro, est
le modèle de régression linéaire estimé par l'équation (lC). À l' opposé, sie est égal à
un, on obtient le modèle de régression à effets fixes (Merrigan, 2014). Pour le modèle
retenu, e= 0,2726 et teta = 0,3080. Le modèle de régression avec estimateurs à effets
aléatoires est donc adéquat. Ceci explique sans doute pourquoi les coefficients de
l'équation (IC) sont généralement plus élevés que ceux de l'équation (lA). En effet,
si la méthode par moindre carré ordinaire ne tient pas compte de la corrélation
intertemporelle entre les variab les explicatives et les effets inobservés, elle génére des
estimateurs biaisés.
CONCLUSION
Le but de cette recherche était de déterminer s'il y avait un lien de causalité entre
l'activité physique et les résultats académiques et si ce lien était significatif. Cet
objectif a été partiellement atteint. Avec un panel tiré de l'Enquête longitudinale
nationale sur les enfants et les jetmes qui couvre les années 1994-1995 à 2008-2009,
pour tous les étudiants canadiens, il a été possible d'extraire un échantillon de 1300
étudiants âgés de 7 et 9 ans pour les trois premiers cycles de cette enquête. Malgré les
problèmes d'hétéroscédasticité et d'autocorrélation qui sont faibles, mais qui
perdurent, une relation positive mais non significative a été estimée par le modèle de
régression à effets aléatoires.
La conclusion est que l'impact de l'activité physique sur les résultats scolaires, plus
précisément, sur la note de mathématiques moye1me, est de 0,25 %. Plusieurs raisons
expliquent cet impact faible, mais notable. D'abord, les hypothèses strictes du modèle
à effets aléatoires amènent avec elles leurs lots de complications comme
l'hétéroscédasticité ou l'autocorréraltion du terme d'erreur. Ainsi, la nature de l'effet
inobservé et sa modélisation, qui sont eux-mêmes des sujets de recherches
importants, influencent la qualité des résultats qui peuvent être tirés de ce genre de
régression. Ensuite, les variables relatives au temps dédié aux sports au lieu des
devoirs, les heures de sommeil et le passé sportif des parents sont des variables qui
sont absentes du modèle, car elles ne fesaient pas parties de l'enquête, mais qui
pourtant ont sans doutes un impact sur les performances autant sportives que
académiques. Puis, la littérature démontre que les jeunes sportifs qui perfonnent
mieux académiquement sont plus âgés que ceux retenus dans ce mémoire. De plus, le
fait que la même question ne soit pas répétée pour les adolescents limite la taille de
l'échantillon. Finalement, comme mentionné au Chapitre 1, le faible taux de réponse
59
à l'ELNEJ diminue l' information disponible pour les chercheurs par le fait que les
caractéristiques des enfants non-répondants ne sont pas captées dans la régressions et
cela pourrait causer un biais dans les estimations.
APPENDICE A
Estimated re su1ts ·
Var sd = sqrt {Var )
Tes t: Va r ( u ) = 0
54.29
Frob > chibar 2 0.0000
~d = sqr t (Var !
53.41
= 0 .00 00
sportif = 0 actif = 0
F{ 1, 6 4 7) 0.04 F ( 1, 6 47 ) = 2.67
o. 9416 Prob > F = O.l027
Prob > F
..
l' H tl'ü! r n.k o~ ~l:v.! ai~ .. ~~ru::;;d Vin ' .ull='!! l!Ut i x 3 rt d~1: net i!qc.\l th~ nl.!.::llèr ":J:f
oe .:::;c!~no;a l;;s..e:i na ~;~~tQ:;:;~d t3'2: ), b~ .c<u:~ ~- ·i = vb;n. >:0~ -e-~,ç., ~ ~'h~r~ y
t !i'l.~ i:J . 11a mpu ·li'Ii t:t" eg~:. . t,c:;:;n;i:;r ;r P'U pu t . ou·:; ~o · illLXon f oc-
.à:Ly!:h. ... n9 tJ.n~.xpoect:.o~eà o.ttd pO~ib ~ Y eo.r.::::~d~:r c.c~:ir.q _ycur ,...,.riab:l t: ~ at) !t' ...t.~ l!h::.
~Ef:!ci nt :: on a; ::~~nu..l.x.::
- - •c-t _ !.Ci~t.a --
rbl <• t l l>•ll ) • (th:!g~V_l:l·V~B ll
!1ff~r~nc...:: .. . ..: .
,:;p=-t.L ;; • • 11705~ ~ ~ ,!i~H : · l. 776JH l . 0120l5
SCot::~A.")'t.. 4.ti.OB~O -iii.• 1.90H • 2 . L00769 .H7BH
R~~n~osloe·t~ · 4·t.~~l 4 ~ . -.~u~ -2 ~. 52~17
'· iU)~
l:t~V ~!'l:..:.!.,iQ:"'..>•e:"l2 - 10.719>& l.77UOt · 13. &•!1657 L96'H9J
ae"-r~nv. y~. l -10 . 1!i~5fi -:l . 9HH - 9 .la7ilS 1 .i1i~1
;;: ;,oÇ. ÇQl l 7.JS!HH :..Z.SlC!6t · 5 .ll0215<1 ). 09J.SO'
ê: 'tt;.d!!!'L~ i · !i .22 1'7l11 :r.2S1 n:~ .12.nlu >. s.·s.nos
) t!!ut.eMê!"~ -H .:<S00-4, -4.1110074 -25.011997 ~ 1.. GSoa~
· F -!7 ll9~ ~ -i!~~9.ti • t , ll<~ n ~. ~14 ~11<~
.& . 740H4 -4 . ïHl1 -l.9Eî!>79l ~6 . !l<J,9l2
J , $'17~7 -ï,:i; . ~~~' 2?,Q?.;)H . J' ;}.:)7$';)
pe · ic • . 0561!1H:t l -:l~S~ ~ . ~ .JnJzs 9 - :tb'H'
- u.o?o ~ & _,' 6307!1: - 4 .0!hi7S : ::l. . :J;J70j
•7 .32l'5U ~ ,. Si U6$ 2.22Z71SS H.47 G5
. ;; • S22055 - H . 3S H5 1.7.53109 {9 .1:5!191
pr l.:t>l l.;;~ua -:l. .JOO·G• 2 .un+ '17.10~9;l
:;l ~<pe: .,,n:aa •!4. "5<4~ u.n:z6 ~o.unt
Cl!! 13.236Sl - 1J.Se50S .2&. 90l5B lo& . 2-f~':l!.
'l'<!. . o:pls~e l.l.?r.sa l'J. l.H·U 6 .?-0953·6 :..• . !>'5!>0~
Ç'e~:::'% - t,:;,~C' 19 . 70791 H .36-4.01. . o;; .0:56lii9 l3.65.U
F<c>~m!eO l plc . l ll. !N ,SS 1~.roa - 3.Ult3:2.3. ::. s . •~~~'
F~--Oipl .i U .0 3S Sa l t .l.OS·i'~ ;)0 . 92977 il.JUtt
H.cimme~nl.,e. l &.~S7~TZ ll . !i0:2: ~ · L>H~29 ~1.:!l:962 J
H ~ plU:. i. lli.U,l-4 :L~7SS' :::s. 4·611.5 J O. ·UH7
f:r ~1 12 .U2 25, ~- >OQ79i 7. \)7 )<152
1
:,'· -7<'~-t2'
t "'.rèl. 11> .o::n. >t> t . 1:9625, 7.1:Z!>40'i .:.6. '100~!
! r~rè "l H.ll9H ~ .4 :$'37>62 29.62405 ~~ .;oG~1
~i·, 27 . HJH ~) . 7020' J. 4.31511 'Z1.l.)$7•t
!1. hOli 'flè - 1. ]9Bll·~ i . :I:Ï04.Zi -9 . 059286 LB9'nltt
.l -rtii oJ. · l l ..·\'712 '-.. 09ol'l:U - :14. Sli555 :$- '10903
= ~~ l ~;;.. 1. ·U- 2165~ · "- Sl2Jt - 7. ~lill!i79 ~ O· . l.~D$ 1.
ptt~eéSt..o l.,OO'f81 • 0-49-22~ - . Hll74l4 S.O.SIH~
a.
~t a ru o1 tfi Ottl u .cta '•U:J :u u (J.l) ill l'lO:. ~.l. ~ -::r ::.:.
Gl:! f!.(d<f!:'.t!; :oe'!Vj ti!~tetj t·~2 l ,: "-~ !IL:!e ttr\t: .:..Q ' ~ "'r"t''U ~$ 'Ot:" t.:"'~ - -1! ~rt
lie Iolill eœ cœ _t iOI; :tl! te.~~. lb:a:; ne ttl! cutpl~ c! ;r.:c:r !!Ct:Dl.lt::lr';; . or-
~rth!.u.l u:~c '.!!if. ~c pc!.!. lN"!' .cc:sid!!r t:C.:Shn.;J •= · · b.!.!!t. 1:::1 tc"lll: ttl!
cocj:f,:çl r :-. s ::-e on ' ~ tn: :: s ~ .
•H ''.~rtu --
(~) U::·H
r..iH!!:.~!!let!
APPENDICE B
Tablea u B.l Statistiques descriptives des variables utilisées dans les régressions
pour les étudiants sportifs
Ta blea u B.2 Statistiques descriptives pour les variables utilisées dans les
régressions pour les étudiants actifs
BIBLIOGRAPHIE
Finnie, Ross et Richarld Muller. 2008. The effect of family incarne, parental
education and other background factors on access to post-secondary education
in Canada. En ligne. 38p.
<bttp://higheredstrategy .corn/mesa/pub/pdfïMESA_ Finnie_ Mueller. pdf>.
Consulté le 5 juillet 2013 .
67
Institut Fraiser. 201 O. (22 octobre). « Bulletin des écoles secondaires du Québec
2010 ». En ligne. <http://www.fraserinstitute.org/fr/research-
news/news/display.aspx?id=16729>. Consulté le 9 juillet 2013 .
OCDE. 2012 . «Éducation des personnes nées dans le pays de résidence de parents
immigrés». In OCDE, Trouver ses marques : Les indicateurs de l'OCDE sur
l'intégration des immigrés 2012. Éditions OCDE. En ligne. 14 p.
<http:l/dx.doi .org/10.1787/9789264073432-9-fr>. Consulté le 6 juillet 2013.
68
Torres-Reyna, Oscar. 2007. Panel Data Analysis: Fixed and Random Effects (using
Stata JO.x). Diaporama en ligne. Princeton University. p.9-29.
<http ://www. princeton.edul- otorres/Panell 0 l.pdf>. Consulté le 15 juillet 2013.
Wooldridge. Jeffrey. «Econometrie Analysis of Cross Section and Panel Data» . 737
p. London, England: The MIT Press. 2002 .