Développement Et Validation Du Questionnaire de Connaissances Sur L'asthme Destiné Aux Patients Adultes (QCA-PA)
Développement Et Validation Du Questionnaire de Connaissances Sur L'asthme Destiné Aux Patients Adultes (QCA-PA)
Développement Et Validation Du Questionnaire de Connaissances Sur L'asthme Destiné Aux Patients Adultes (QCA-PA)
Mémoire
Daniel Beaurivage
Québec, Canada
iii
iv
Table des matières
v
2. Génération d’items ........................................................................................ 28
3. Détermination d’un format de mesure .......................................................... 29
4. Vérification de la clarté des items ................................................................. 29
5. Prétest ............................................................................................................ 30
Échantillon pour la phase de validation .................................................................... 31
Déroulement .............................................................................................................. 33
Phase de validation ................................................................................................... 34
6. Analyse d’items (Preuves de validité de la structure interne) ....................... 34
7. Preuves de validité (relation avec d’autres variables, conséquences)........... 35
Analyses statistiques ..................................................................................................... 36
Résultats ........................................................................................................................ 38
Indice de discrimination ............................................................................................ 38
Cohérence interne ..................................................................................................... 40
Modèle de Rasch ....................................................................................................... 40
Analyse de la structure factorielle............................................................................. 41
Validité concomitante ............................................................................................... 43
Reproductibilité et réponse aux changements........................................................... 43
Discussion ..................................................................................................................... 45
Conclusions ................................................................................................................... 48
Remerciements .............................................................................................................. 49
Conclusion ........................................................................................................................ 51
Bilan .............................................................................................................................. 51
Forces et limites de l’étude ........................................................................................... 52
Perspectives de recherches futures................................................................................ 54
Annexe 1 ........................................................................................................................... 55
Annexe 2 ........................................................................................................................... 59
Bibliographie..................................................................................................................... 63
vi
Liste des tableaux
Tableau 1 : Caractéristiques des participants (n=101) à la validation du QCA-PA ......... 32
Tableau 2 : Résultats de l'analyse d'items au T0 pour chacun des items du QCA-PA ..... 39
vii
viii
Liste des figures
ix
x
Abréviations
xi
xii
Remerciements
xiii
xiv
Avant-propos
Ce mémoire est présenté sous forme de publication. Vu sa forme, il est possible qu’une
certaine redondance soit présente au fil des pages. L’article inclus dans ce texte a été
soumis à la Revue des maladies respiratoires et est présentement en cours d’évaluation.
L’auteur principal de l’article est l’auteur de ce mémoire.
xv
Introduction
Le domaine médical fait souvent appel à des instruments de mesure traitant des
connaissances des patients, que ce soit dans un but diagnostique ou de suivi
thérapeutique, à plus forte raison dans le cas de maladies chroniques qui engendrent un
poids considérable sur le système de santé et des enjeux plus élevés. L’asthme, qui se
caractérise par une inflammation et un resserrement des bronches, est l’une des maladies
chroniques les plus répandues dans le monde, affectant entre 1 % et 18 % de la
population (FitzGerald, Reddel et Boulet, 2014). Avec un taux de prévalence de 14 %, le
Canada est l’un des pays les plus touchés par cette maladie (Masoli, Fabian, Holt,
Beasley et Global Initiative for Asthma, 2004).
Des études ont montré que l’asthme est souvent mal contrôlé (Bateman, Bousquet et
Braunstein, 2001; Boulet et al., 2006). L’une des raisons expliquant cette situation est le
manque de connaissances des patients envers la maladie et son contrôle, aussi appelé
maîtrise (Boulet, Boulet et Milot, 2002; Soriano, Rabe et Vermeire, 2003). Par exemple,
alors que la principale cause de l’asthme est l’inflammation des voies respiratoires,
Soriano et al. (2003) ont montré que seulement 7,8 % des personnes asthmatiques
l’identifiaient correctement.
1
2003). L’importance d’évaluer les connaissances des patients dans le but d’augmenter
l’efficacité des interventions éducatives des professionnels de la santé est donc réelle.
Le but de la présente étude consiste à développer et obtenir des preuves de validité pour
le Questionnaire de connaissances sur l’asthme destiné aux patients adultes (QCA-PA),
eu égard au processus proposé par Dussault, Valois et Frenette (2007), inspiré de
DeVellis (2003). Cet instrument en français vise une évaluation diagnostique à
interprétation critériée des connaissances des patients sur leur maladie. Contrairement
aux questionnaires existants, il est basé sur les derniers rapports internationaux du Global
Initiative for Asthma (GINA), un organisme réunissant certains des plus grands
spécialistes en asthme au monde et publiant périodiquement ce que tout professionnel de
la santé et tout patient devraient savoir sur cette maladie (FitzGerald et al., 2014).
Les sections suivantes ont pour but d’établir le cadre de référence ayant servi à
développer et à valider le QCA-PA. Elles expliquent les étapes à suivre et les analyses à
2
effectuer. Par la suite, un article scientifique est présenté, reprenant l’ensemble des étapes
énoncées de même que les résultats des analyses. Une conclusion, faisant le bilan du
projet de recherche et donnant des pistes de recherches futures termine ce mémoire.
3
4
Cadre de référence
Au début du XXe siècle, les travaux statistiques de Pearson et Spearman ont donné de la
crédibilité aux assises de la mesure (DeVellis, 2003). À partir de corrélations, ils ont
permis d’examiner de façon systématique les relations entre les variables. Par la suite, les
travaux de Stevens (1951), portant sur les différentes échelles de mesure en
psychophysique, appliqués ensuite aux sciences humaines par Thurstone et Byrne (1951),
5
ont fourni la légitimité scientifique dont la mesure en sciences humaines avait besoin,
s’appliquant d’abord aux tests mentaux, puis aux autres types d’instruments comme les
questionnaires et les examens (DeVellis, 2003). La mesure était alors perçue comme
l’assignation de nombres à des objets ou des phénomènes selon des règles (Bertrand et
Blais, 2004). De tels instruments de mesure sont désormais grandement utilisés dans le
domaine des sciences de la santé, de la psychologie et des sciences sociales.
6
l’attribution d’un diplôme certifiant l’acquisition de connaissances dans un domaine
donné (Laurier et al., 2005). Finalement, la fonction pilotage vise l’évaluation des
éducateurs, des moyens d’enseignement, des programmes et des établissements dans le
but d’en améliorer l’efficacité (Laurier et al., 2005).
Ces fonctions d’évaluation peuvent être abordées à travers trois types d’interprétation.
L’interprétation normative s’appuie, comme son nom l’indique, sur la comparaison à une
norme. Celle-ci est fixée en fonction du comportement ou du rendement normal du reste
du groupe d’où est tiré le répondant (Laurier et al., 2005). Elle vise à classer les
répondants les uns par rapport aux autres selon leur degré d’habileté. L’interprétation
critériée porte sur l’atteinte, par le répondant, d’un ou des objectifs d’apprentissage fixés
à l’avance. Le répondant n’est donc plus comparé au reste du groupe, mais est plutôt jugé
par rapport à l’atteinte d’un seuil de réussite identique d’une personne à l’autre (Laurier
et al., 2005). L’interprétation dynamique compare les résultats du répondant entre eux à
divers moments du processus d’évaluation-apprentissage (Laurier et al., 2005). Le but est
d’en apprécier l’évolution. Le choix d’une fonction d’évaluation et d’un type
d’interprétation peut avoir une incidence plus ou moins grande sur le répondant. L’enjeu
peut être élevé, comme dans le cas de la fonction certificative, ou bas, comme dans le cas
de la fonction pronostique. Plus l’enjeu d’un instrument de mesure est élevé, plus les
inférences qui en sont tirées doivent s’appuyer sur des preuves fiables et valides, et donc
nécessite un processus rigoureux d’élaboration (AERA et al., 2014).
7
Dans la prochaine section, seront présentées les étapes de développement et de validation
de questionnaires telles que proposées par Dussault et al. (2007), inspirées de DeVellis
(2003), qui sont appliquées au QCA-PA. Les cinq premières étapes correspondent à la
phase d’élaboration, alors que les deux dernières composent la phase de validation (1-
détermination de l’objet de mesure à la lumière d’une revue de littérature, 2- génération
d’items, 3- détermination d’un format de mesure, 4- vérification de la clarté des items, 5-
prétest, 6- analyse d’items, 7- preuves de validité de construit). Suivant les avancées sur
l’obtention de preuves de validité, les étapes 6 et 7 seront combinées. Comparativement à
d’autres méthodes, celle-ci comprend un nombre limité d’étapes suivant un ordre logique
et permettant des allers-retours pour en modifier le contenu en cours d’élaboration. Elle
comporte comme avantage de considérer les preuves de validité de construit, souvent
négligées par d’autres auteurs.
4. Phase d’élaboration
Dussault et al. (2007) et DeVellis (2003) s’accordent avec une majorité d’experts en
mesure et évaluation pour faire de la détermination de l’objet de mesure la première étape
à la base de l’élaboration d’un questionnaire. Des auteurs mentionnent le manque de
précision sur les concepts abordés par un instrument de mesure comme un problème
fréquent (DeVellis, 2003; Furr, 2011; Marquis, 2003; Shum et al. 2006, Urbina 2004). La
consultation d’experts du domaine étudié, de même qu’une revue de littérature portant
sur le ou les concept(s) à évaluer, sont recommandées. Brancato et al. (2006) ajoutent
l’utilisation de groupes de discussion choisis parmi la population cible. Ces actions
permettent de bien circonscrire l’objet d’évaluation en différenciant le concept à l’étude
de concepts similaires. Pour ce faire, Downing (2003) et Osterlind (2010) suggèrent
l’emploi d’un tableau de spécifications qui identifie les dimensions du concept et les
sous-dimensions s’y rattachant, de même que l’importance relative de chacune pour sa
compréhension. Finalement, cette étape mène également à déterminer les caractéristiques
de la population cible et à confirmer les objectifs de l’évaluation, tels que les concepts
8
abordés ainsi que la fonction et le type d’interprétation de la mesure, que certains auteurs
définissent comme des étapes distinctes (AERA et al., 2014; Brancato et al., 2006; Furr,
2011; Marquis, 2003; Urbina, 2004).
9
partie de l’item tout en rejetant l’autre. Le niveau de langage et le vocabulaire utilisés
doivent être adaptés à la population cible et il convient d’éviter les questions négatives, et
les doubles négations (pour plus de détails, consulter Lakhal et Frenette, sous presse).
Des items peuvent aborder la même notion, mais avec une formulation différente. Une
redondance bien effectuée, c’est-à-dire qui reformule les mêmes idées avec suffisamment
de différences, permet de constater la permanence d’une idée chez le répondant par la
répétition des mêmes réponses malgré des formulations différentes (DeVellis, 2003).
Dans la présente recherche, des discussions entre plusieurs spécialistes du domaine donc
le pneumologue chercheur, d’autres pneumologues québécois et des pneumologues
anglophones ont mené à la génération d’une banque de 52 items basée sur les
recommandations de GINA concernant ce que tout patient asthmatique devrait savoir sur
sa maladie et respectant ces règles. De plus, les items ont été regroupés en cinq catégories
comme le propose GINA, soit cinq items portant sur l’aspect biomédical, 16 sur les
facteurs déclenchants, 18 sur le diagnostic et le contrôle, 10 sur les traitements et trois sur
les connaissances générales liées à l’asthme, en fonction de l’importance accordée à
chacune dans ce consensus international.
La génération d’items doit être suivie par l’étape de la sélection d’un format de mesure,
soit la forme que prendra l’échelle de réponse (DeVellis, 2003). Plusieurs choix s’offrent
au développeur de questionnaires comme les questions de type « vrai ou faux », les
questions à choix multiples et les questions à réponses construites courtes ou élaborées
dans le cas des questionnaires de connaissances et les échelles de type Likert, Thurstone
ou Guttman pour les questionnaires d’attitudes (DeVellis, 2003). Cette étape et la
précédente doivent toujours refléter les objectifs de l’évaluation quant à l’objet de
mesure, la fonction et le type d’interprétation, mais se présentent différemment d’un
auteur à l’autre. Les Standards for Educational and Psychological Testing (AERA et al.,
2014) et Urbina (2004) suggèrent l’ordre inverse, soit de choisir l’échelle de mesure
avant de générer les items, alors que Furr (2011), Marquis (2003) et Shum et al. (2006)
ne voient là qu’une seule étape. De leur côté, Brancato et al. (2006) intègrent à cette
10
étape la détermination du mode de collecte de données, qui semble toutefois implicite
chez les autres auteurs.
Dans le cas du QCA-PA, il a été convenu d’opter pour des items de type « vrai ou faux »
puisque ce genre d’items s’avère souvent plus rapide à répondre pour le participant
(Tousignant et Morissette, 1989) et plus facile à analyser pour le professionnel de la santé
en situation clinique. L’option « Ne sais pas » a été ajoutée aux choix de réponse afin
d’éviter les données manquantes. Toutefois, au moment de l’analyse, les réponses ont été
transformées selon une dichotomie bonne réponse/mauvaise réponse où l’option « Ne
sais pas » a été considérée comme une mauvaise réponse puisqu’elle ne démontrait pas
une connaissance acquise par le patient.
Pour Dussault et al. (2007) et DeVellis (2003), la vérification de la clarté des items
constitue une étape à part entière. Brancato et al. (2006) et Urbina (2004) abondent en ce
sens, contrairement aux Standards for Educational and Psychological Testing (AERA et
al., 2014), Furr (2011) et Shum et al. (2006) qui l’associent à l’étape précédente. Elle
consiste en l’accumulation des premières preuves de validité soit la validité apparente et
la validité de contenu, bien que des auteurs n’incluent généralement qu’une seule des
deux formes de validité (Marquis, 2003; Urbina, 2004). La validité apparente concerne la
vérification par un échantillon de la population cible de sa compréhension des items et de
leur lien avec les concepts (Laveault et Grégoire, 1997). La validité de contenu vise la
vérification des mêmes éléments par des experts du domaine et ajoute la vérification de la
couverture de l’ensemble du concept par les items (Laveault et Grégoire, 1997). Quelle
que soit la façon d’aborder cette étape, elle nécessite un retour vers les étapes précédentes
à la suite des commentaires des répondants de la population cible et des experts du
domaine.
11
pneumologues, trois éducatrices en asthme, un psychologue, un pharmacien et deux
médecins généralistes. Ils étaient questionnés à l’effet que selon eux, l’ensemble des
connaissances qu’un patient asthmatique devrait avoir de sa maladie étaient présentes.
Leurs commentaires concernant exclusivement la formulation des items ont permis
d’arriver à une version préliminaire de 52 items du QCA-PA qui a été soumise à un
prétest.
4.5. Prétest
La dernière étape de la phase d’élaboration d’un questionnaire est celle du prétest. Elle
consiste à soumettre le questionnaire dans sa version préliminaire à un échantillon de la
population cible différent de celui de l’étape précédente afin de procéder à l’analyse des
caractéristiques psychométriques de l’instrument de mesure. Plusieurs théories sont
avancées quant au nombre de participants idéal que devrait compter un échantillon, mais
un élément leur est commun : plus l’échantillon est grand, moins les résultats sont soumis
à des erreurs de mesure (DeVellis, 2003). Le nombre de répondants requis dépend
beaucoup du nombre d’items que comporte l’instrument de mesure ainsi que du nombre
de dimensions du concept évalué (Nunnally et Berstein, 1994). Il faut aussi tenir compte
des réalités de la recherche et de la faisabilité, par exemple la taille de la population visée
et l’accès à cette population. Shum et al. (2006) estiment qu’un échantillon comportant
une centaine de personnes environ est adéquat. Kline (2000), pour sa part mentionne que,
lorsque des analyses factorielles sont effectuées, un ratio répondants/items de 2 pour 1
peut être toléré si les facteurs sont bien définis. Plusieurs approches pour estimer la taille
d’un échantillon font référence au nombre de paramètres à estimer. Pour les analyses
factorielles confirmatoires, un ratio de 10 : 1 est privilégié (Tabachnick et Fidell, 2007).
Au-delà de la taille de l’échantillon, c’est sa représentativité de la population cible qui
doit être visée (DeVellis, 2003; Kline, 2000).
Les analyses proposées pour cette étape sont celles liées aux preuves de validité de la
structure interne du questionnaire, notamment l’indice de difficulté, l’indice de
discrimination, les corrélations inter-items, les analyses de fiabilité et les analyses
factorielles exploratoires (AFE) ou confirmatoires (AFC) (Downing, 2003). Si, pour
12
plusieurs auteurs, l’étape du prétest est essentielle et permet l’ajustement du questionnaire
(AERA et al., 2014; DeVellis, 2003; Urbina, 2004), d’autres passent outre cette étape et
vont directement à la phase de validation (Brancato et al., 2006; Furr, 2011; Marquis,
2003; Shum et al., 2006). Pour sa part, Urbina (2004) suggère de répéter le prétest
jusqu’à l’obtention d’une version acceptable. Le remodelage de l’instrument de mesure à
la suite de ces analyses permet d’obtenir une version finale du questionnaire pour laquelle
des preuves supplémentaires quant à la validité seront recherchées auprès de la
population cible ou, si elle s’avère trop grande et donc impossible à tester dans son
entièreté, par un nouvel échantillon représentatif différent de celui du prétest.
Le QCA-PA a fait l’objet d’un prétest où une version préliminaire comportant 52 items
divisés en cinq catégories, a été complétée par un échantillon composé de 84 adultes
asthmatiques. Ces répondants ont rempli le QCA-PA une première fois, à la suite de quoi
ils ont tous reçu une session d’éducation personnalisée sur l’asthme. Entre quatre et six
semaines plus tard, 76 de ces personnes étaient disponibles pour remplir à nouveau le
QCA-PA. Ces deux administrations ont permis non seulement des analyses de la
structure interne qui s’est avérée bonne et la vérification de la structure factorielle (telles
que proposées aux sections 5.1.1 et 5.1.2), mais ont également procuré une preuve de la
fiabilité du test par la réponse au changement à la suite de l’enseignement, où une
augmentation significative des scores pouvant être mesurée. Ces analyses ont amené les
chercheurs à identifier les items problématiques de l’instrument de mesure. La version
finale du QCA-PA comporte désormais 54 items, à la suite de la suppression d’items
redondants et l’ajout d’un ensemble d’items portant sur les conséquences d’un asthme
mal contrôlé. La division en catégories n’est conservée qu’à titre visuel, les AFC ayant
montré que les données du prétest s’ajustaient mieux à un modèle unidimensionnel où
tous les items sont liés au concept unique des connaissances sur l’asthme.
5. Phase de validation
Tant pour Dussault et al. (2007) et DeVellis (2003) que pour la majorité des chercheurs,
la validité est considérée comme une qualité psychométrique cruciale (Furr, 2011;
Laveault et Grégoire, 1997; Shum et al., 2006). Elle constitue le degré avec lequel le
13
questionnaire mesure bien ce qu’il prétend mesurer (Messick, 1994). La validité est
aujourd’hui abordée comme un concept unifié regroupant cinq types de preuves :
contenu, processus de réponse, structure interne, relation avec d’autres variables et
conséquences (Downing, 2003; Messick, 1994). Plutôt qu’une dichotomie valide/non-
valide, la validité est plutôt perçue comme un processus continu d’accumulation de
preuves visant à déterminer le degré de validité des inférences qu’il est possible de tirer
des données recueillies par l’instrument (Laveault et Grégoire, 1997).
Pour l’ensemble des auteurs consultés, la phase de validation d’un questionnaire passe
d’abord par l’étape de l’analyse d’items qui consiste en l’accumulation de preuves de la
validité de la structure interne. À cette fin, la théorie classique des tests (TCT) et la
théorie de réponse aux items (TRI) proposent un ensemble de procédures statistiques
permettant d’accumuler des preuves de validité quant à la structure interne d’un
instrument de mesure. La première permet d’établir la fiabilité des items d’un
questionnaire. Le caractère différent de chaque concept à l’étude est fourni par le
coefficient de cohérence interne. Mesuré par le coefficient alpha de Cronbach (ou le KR-
20 dans le cas de données dichotomiques, comme dans la présente recherche), le
coefficient de cohérence interne est considéré comme satisfaisant s’il se situe entre 0,7 et
14
0,9 (Juniper, Svensson, Mork et Stahl, 2005). Une deuxième forme de fiabilité consiste à
évaluer la stabilité dans le temps. Elle est souvent appelée reproductibilité et se mesure en
comparant les résultats des répondants au même questionnaire, à deux temps de mesure,
sans qu’il n’y ait d’intervention entre les deux. Une analyse des corrélations entre les
résultats des différents temps de mesure de même qu’une analyse de variance (ANOVA)
à mesures répétées permet de vérifier cette forme de fiabilité. L’indice de discrimination,
aussi appelé corrélation item-total, peut également servir à indiquer le degré de
pertinence de chaque item à l’intérieur de sa dimension. Diverses valeurs pouvant être
acceptables dépendamment des objectifs poursuivis par le questionnaire et de l’enjeu de
celui-ci (Crocker et Algina, 1986; Laveault et Grégoire, 1997). Nunally et Bernstein
(1994) indiquent qu’un item présentant un bon indice de discrimination (r > 0,3) ajoute à
la cohérence interne d’un instrument de mesure et qu’un item avec un indice modéré (r >
0,2) peut quand même y contribuer positivement. Pour sa part, l’indice de difficulté
indique le taux de réussite de chaque item. Il permet, d’identifier les items qui risquent
d’être plus ou moins réussis. Plus l’indice de difficulté est élevé, plus l’item risque d’être
échoué par un plus grand nombre de répondants. Le coefficient de corrélation intra-classe
peut également être utilisé pour attester de la fiabilité test-retest d’un instrument de
mesure en se basant sur l’analyse de variance. Il est surtout utilisé pour vérifier la fiabilité
inter-juges. Le biais de mesure différentiel (Differential Item Functionning DIF) identifie
les items d’un test qui peuvent réagir différemment d’un groupe de répondants à l’autre,
en contrôlant pour le niveau d’habileté, lorsque ceux-ci présentent un trait latent
commun. La TRI, pour sa part, amène une analyse plus approfondie des items. En plus de
comparer les items entre eux, elle inclut dans l’analyse les répondants au questionnaire.
Elle se base sur le postulat que la performance d’un sujet est attribuable à un trait latent
plutôt qu’aux caractéristiques de l’échantillon dont il fait partie (Laveault et Grégoire,
1997). Différents modèles de mesure de la TRI peuvent être utilisés en fonction de la
qualité de l’information que l’on cherche à retirer de chaque item. Le plus simple et le
plus couramment utilisé du fait de sa simplicité étant le modèle à un paramètre (Bertrand
et Blais, 2004). Un cas spécial de ce modèle à un paramètre, le modèle de Rasch, postule
qu’un seul trait latent est responsable de la variance des items et que tous les items
possèdent le même degré de discrimination (Bertrand et Blais, 2004; Laveault et
15
Grégoire, 1997). La mesure est alors considérée invariante dans les échantillons de
répondants et peut être analysée de façon plus spécifique. Les statistiques d’ajustement
produites sont une indication de l’adéquation entre le modèle unidimensionnel de Rasch
et les données.
Un autre moyen d’attester de la validité de la structure interne est par des analyses
factorielles. Elles permettent de vérifier la validité de construit, considéré comme le type
de validité le plus important par plusieurs spécialistes de la psychométrie (DeVellis,
2003; Furr, 2011; Osterlind, 2010). Elles peuvent être de nature exploratoire (AFE),
cherchant à découvrir des traits latents qui émergent de regroupements se basant sur les
données recueillies, ou alors de nature confirmatoire (AFC). Les analyses factorielles de
nature exploratoire se basent soit sur les covariances entre les variables, soit sur l’analyse
en composantes principales qui s’appuie davantage sur l’analyse de la variance des
variable indépendantes afin d’en réduire le nombre et ainsi rendre l’information d’un
instrument de mesure moins redondante. Les AFC, quant à elles, permettent d’établir
dans quelle mesure les données recueillies s’ajustent au modèle théorique sur lequel
s’appuie l’élaboration du questionnaire (Laveault et Grégoire, 1997). Elles s’effectuent à
l’aide de logiciels permettant d’effectuer des analyses par équations structurelles, tel EQS
(Bentler, 1995), utilisé dans le cas du QCA-PA, mais également LISREL (Jöreskog et
Sörbom, 1996-2001) et Mplus (Muthén et Muthén, 1998-2010), entre autres.
16
instruments, car une corrélation élevée aurait montré une trop grande similarité entre le
QCA-PA et la mesure étalon et donc le manque de pertinence du nouvel instrument.
Enfin, une analyse de variance multivariée des scores obtenus permet d’apporter une
preuve supplémentaire de réponse aux changements de l’instrument de mesure. À long
terme, l’augmentation des connaissances des participants constitue une conséquence
positive de l’usage du questionnaire sur les répondants (Messick, 1994). Il peut en être
autrement si la complétion du questionnaire entraîne chez le répondant un niveau de
stress trop élevé ou quelque autre complication. Dans ce cas, les conséquences négatives
du test surpasseraient les conséquences positives. Une ANOVA à mesure répétées
comparant les temps de mesure permet de déterminer si une différence significative des
résultats est présente d’un temps à l’autre, avant et/ou après l’intervention éducative.
Pour le QCA-PA, les analyses suivantes ont été retenues puisqu’elles sont celles qui sont
les plus présentes dans la littérature pour ce genre de recherche. L’analyse du coefficient
de cohérence interne, l’indice de discrimination des items, l’indice de difficulté, la
reproductibilité, l’analyse par le modèle de Rasch et les AFC ont été retenus comme
preuves de validité de la structure interne. L’analyse de la validité concomitante du QCA-
PA a constitué quant à elle une preuve de la relation avec d’autres variables. Le
Questionnaire de connaissances sur l’asthme en langue française (QCALF) (Nguyen et
al., 2003), le seul autre questionnaire en français évaluant le même concept et ayant déjà
recueilli certaines preuves de validité, a été utilisé comme mesure étalon. Cependant,
comme le QCA-PA se veut une amélioration par rapport aux instruments de mesure déjà
existants, un coefficient entre 0,4 et 0,8 a été jugé acceptable pour démontrer une bonne
validité concomitante (Streiner et Norman, 1995). Une analyse de variance (ANOVA) à
mesures répétées a finalement été effectuée sur les scores du QCA-PA à chacun des
quatre temps de mesure. Elle avait pour but d’établir la fiabilité du QCA-PA, mais
également sa validité de conséquences.
17
18
Présentation de l’article
Les pages qui suivent présentent un article soumis à la Revue des maladies respiratoires,
revue officielle de la Société de pneumologie de langue française (SPLF). Depuis 1887,
cette revue publie des articles originaux, des éditoriaux, des recommandations d’experts
et des fiches techniques en lien avec les pathologies pulmonaires sous forme de 10
fascicules réguliers par année et en ligne. L’article qui suit présente la méthode de
développement et de validation utilisée pour l’élaboration du QCA-PA. Il poursuit deux
objectifs. Premièrement, offrir aux professionnels de la santé un nouvel instrument de
mesure des connaissances de leurs patients asthmatiques sur leur maladie afin
d’augmenter l’efficacité de leurs interventions éducatives. Deuxièmement, proposer une
méthode simple et rigoureuse de développement d’instruments de mesure applicable à
plusieurs autres domaines de la santé.
19
20
Article scientifique
Eric Frenette
Université Laval,
Département des fondements et pratiques en éducation
2320, des Bibliothèques, TSE 454
Université Laval
Québec, Canada, G1V 0A6
Courriel : [email protected]
Tél. : 418-656-2131 #3759
Louis-Philippe Boulet
Institut de cardiologie et de pneumologie de Québec (IUCPQ)
2725, chemin Sainte-Foy
Québec, Canada, G1V 4G5
Courriel : [email protected]
Tél : 418 656-4747
Marie-Ève Boulay
Institut de cardiologie et de pneumologie de Québec (IUCPQ)
2725, chemin Sainte-Foy
Québec, Canada, G1V 4G5
Courriel : [email protected]
Tél : 418 656-8711 #2617
21
Résumé
Méthodes : Le QCA-PA a été développé et validé selon sept étapes proposées par
Dussault, Valois et Frenette (2007) et comporte 54 items « vrai/faux/ne sais pas ». Un
total de 101 adultes asthmatiques a répondu au questionnaire à quatre reprises lors de
trois visites en milieu hospitalier sur une période d’environ un mois. À la deuxième
visite, il était complété avant et après une session d’enseignement individualisée sur
l’asthme.
Mots-clés :
22
Abstract
Methods: The QCA-PA was developed according to Dussault, Valois and Frenette
(2007) seven steps. It includes 54 “true/false/don’t know” items. A total of 101 asthmatic
adults completed the questionnaire four times during three visits over a period of about
one month. It was answered twice on the second visit, before and after an individualized
education session on asthma.
Results: QCA-PA shows different proofs of validity: face and content, response process,
internal structure, relationship to other variables and consequences of testing. It is
represented by a unidimensional factor structure and its internal consistency appears to be
satisfying.
Key words:
23
Introduction
L’asthme est une des maladies chroniques les plus répandues dans le monde et les coûts
qui y sont associés sont élevés (FitzGerald et al., 2014; Masoli et al., 2004). Les
conséquences de l’asthme peuvent être minimisées par un bon contrôle de la maladie et
l’éducation du patient est considérée comme un des éléments les plus importants pour
optimiser le contrôle. Malheureusement, l’asthme est souvent mal contrôlé (Bateman et
al., 2001; Boulet et al., 2006). Parmi les raisons expliquant cette situation, on retrouve le
manque de connaissances du patient sur sa maladie et les critères de contrôle de celle-ci
(Boulet, Phillips, O’Byrne et Becker, 2002; Soriano et al. 2003). Par exemple, Soriano et
al. (2003) ont montré que lorsqu’ils étaient questionnés sur les causes et le traitement de
l’asthme, seuls 7,8 % des patients asthmatiques mentionnaient l’inflammation des voies
respiratoires et seulement 17,6 % savaient que les corticostéroïdes inhalés étaient la
médication la plus efficace pour réduire l’inflammation bronchique.
Les bénéfices de l’éducation sur l’asthme ont été démontrés, mais trop peu de patients
asthmatiques profitent d’interventions éducatives adéquates (Cowie, Cicutto et Boulet,
2001; Gibson et al., 2003). Dans le but d’améliorer l’efficacité des interventions des
professionnels de la santé, il convient d’abord d’évaluer les connaissances du patient sur
sa maladie, afin de lui fournir l’information la plus appropriée sur laquelle les bases des
suggestions sur les changements de comportement seront établies.
24
Pour être de qualité, un instrument de mesure de connaissances des patients, tel un
questionnaire, doit présenter diverses preuves de validité de contenu, du processus de
réponse, de la structure interne, des relations avec d’autres variables et de conséquences
(Downing, 2003; Messick, 1994). Ces preuves sont accumulées tout au long du processus
d’élaboration et de validation et elles permettent de juger du niveau de validité des
inférences pouvant être tirées des réponses au questionnaire (Messick, 1990).
25
1. Détermination de l’objet
de mesure
- Validité de contenu
2. Génération d’items
- Validité de contenu
3. Détermination du
format de mesure
Phase de développement - Validité du processus de
réponse
4. Vérification de la clarté
des items
- Validité du processus de
réponse (apparente)
- Validité de contenu
5. Prétest
- Validité de la structure
interne
- Validité du processus de
réponse
6. Analyse d’items
- Validité de la structure
interne
26
Méthodologie
Phase de développement
Dans le cas du QCA-PA, un spécialiste du domaine étudié était responsable du projet. Ses
connaissances sur l’asthme et son expérience clinique ont fourni les bases théoriques du
questionnaire. De plus, la consultation des documents de l’organisme GINA sur les
connaissances que tout patient asthmatique devrait posséder a fortement inspiré
l’élaboration du QCA-PA (FitzGerald et al., 2014). Les auteurs se sont donc attardés aux
recommandations émises pour les asthmatiques adultes et ont ciblé les cinq dimensions
proposées par GINA, soit biomédical, facteurs déclenchants, diagnostic et contrôle,
traitements ainsi que connaissances générales.
27
instruments de mesure déjà existants. Aucun questionnaire ne respecte l’ensemble des
preuves de validité à accumuler. Un seul questionnaire en français existant et répondant à
certaines preuves de validité, soit le Questionnaire de connaissances sur l’asthme en
langue française (QCALF) (Nguyen et al., 2003) sera utilisé comme mesure étalon dans
le cadre de l’analyse de validité concomitante de l’étape 7. Il comporte 38 items à
l’origine, mais l’un de ces items s’adressant à une population française a été retiré.
Comme le QCA-PA, il se présente sous la forme de questions « vrai ou faux » et l’option
« Ne sais pas » est également présente. Ce questionnaire se veut une synthèse des
connaissances sur l’asthme, mais certains éléments semblent manquant par rapport au
consensus international.
2. Génération d’items
Une fois que les concepts abordés dans le questionnaire sont bien établis, la création
d’items est possible, mais doit suivre plusieurs règles de base. Tout d’abord, tous les
items doivent être en lien avec les objectifs de l’évaluation (DeVellis, 2003). Ils doivent
également être concis, présenter un niveau de langage adapté à la population cible et ne
comporter qu’une seule idée. Il convient aussi d’éviter les multiples négations et les
pronoms ambigus (Lakhal et Frenette, sous presse). Par exemple, l’item de type « vrai ou
faux » suivant comporte plusieurs erreurs : « Le patient asthmatique devrait toujours
suivre les conseils de son médecin puisqu’il est la personne la mieux placée pour
connaître les actions les plus efficientes à poser ». En effet, cet item est trop long et
utilise un niveau de langage trop élevé pour l’ensemble de la population. Il comporte
également deux affirmations séparées par « puisqu’il » et ce dernier pronom peut être
compris comme faisant référence aussi bien au patient asthmatique qu’au médecin.
En respectant les différentes règles de base, une banque de 52 items inspirés du rapport
GINA a été construite pour le QCA-PA. Elle regroupait des questions se rattachant aux
cinq regroupements théoriques proposées par GINA, soit : biomédical, facteurs
déclenchants, diagnostic et contrôle, traitements ainsi que connaissances générales.
28
3. Détermination d’un format de mesure
La détermination de la forme que prendront les réponses doit faire l’objet d’une réflexion
par rapport aux buts d’évaluation poursuivis dans le questionnaire. Un questionnaire de
connaissances et un questionnaire d’attitudes ne comportent pas le même type de
questions. Il convient, à cette étape, de choisir le format de mesure le plus approprié au
questionnaire souhaité, telles les questions de type « vrai ou faux », les questions à choix
multiples, les échelles de type Thurstone ou Likert (DeVellis, 2003; Tousignant et
Morissette, 1989).
La vérification de la clarté des items comporte deux éléments qui s’ajoutent aux preuves
de validité d’un instrument de mesure. La validité apparente et de contenu constituent un
premier test pour les items créés. La validité apparente consiste à présenter les items à un
échantillon représentatif de la population ciblée par l’évaluation. Elle vise à recueillir les
commentaires quant à l’adéquation entre les concepts abordés, la formulation des items
par rapport aux buts poursuivis par le questionnaire et la compréhension du vocabulaire
et du niveau de langage utilisés (DeVellis, 2003). La validité de contenu diffère de la
validité apparente par la composition du groupe auquel sont présentés les items. Dans ce
cas-ci, le questionnaire est présenté à un groupe d’experts du domaine abordé par le
questionnaire. L’objectif de la validité de contenu est de s’assurer qu’aucun aspect des
concepts abordés n’a été négligé en fonction des bases théoriques propres à ce domaine.
Les commentaires obtenus auprès de l’échantillon de la population cible et du groupe
29
d’experts permettent au chercheur de modifier ou de supprimer les items problématiques
et d’en ajouter d’autres au besoin (DeVellis, 2003).
5. Prétest
30
l’asthme couvrant l’ensemble des concepts abordés dans le QCA-PA leur a été donnée
par une thérapeute respiratoire (inhalothérapeute). Entre quatre et six semaines plus tard,
29 de ces hommes et 47 de ces femmes ont complété le questionnaire une seconde fois
afin de mesurer la réponse aux changements, qui s’est avérée satisfaisante puisqu’une
augmentation significative au résultat total au questionnaire était perçue entre les deux
temps de mesure. Des analyses d’items (indice de discrimination et ajustement au modèle
de Rasch) (Bond et Fox, 2007) ont permis d’identifier des items à modifier ou à retirer
pour éviter la redondance. Les analyses factorielles confirmatoires suggéraient un
meilleur ajustement à un modèle unidimensionnel plutôt que les cinq catégories de
GINA.
Pour la phase de validation, 101 nouveaux adultes asthmatiques n’ayant pas participé aux
phases précédentes de l’élaboration du QCA-PA ont été recrutés à la clinique spécialisée
de pneumologie de l’IUCPQ et au Centre de recherche de l’IUCPQ (Tableau 1).
31
Tableau 1 : Caractéristiques des participants (n=101) à la validation du QCA-PA
n
Sexe
Homme 38
Femme 63
Âge (années)a 45 ± 15
Groupe ethnique
Caucasien 101
Durée de l’asthme (années)b 20
(< 1 à 68)
Sévérité de l’asthme
Léger 45
Modéré 34
Sévère 22
Statut tabagique
Non-fumeur 66
Ex-fumeur 30
Fumeur 4
Tabagisme secondaire 1
Scolarité
Aucun diplôme d’études secondaires 3
Diplôme d’études secondaires ou cours classique 12
Certificat ou diplôme d’une école de métier 5
Certificat ou diplôme collégial 23
Certificat ou diplôme universitaire 58
Occupation
Travailleur temps plein 53
Travailleur temps partiel 10
Sans emploi 3
Étudiant(e) 14
Retraité(e) 21
a
moyenne ± écart-type; b moyenne (étendue).
L’échantillon comptait des adultes caucasiens asthmatiques présentant une sévérité et une
durée d’asthme variables. Les critères d’inclusion étaient les suivants : 1) asthme
diagnostiqué par un pneumologue, 2) réversibilité significative aux bronchodilatateurs
(augmentation d’au moins 12 % et/ou 200 ml du volume expiratoire maximal en une
seconde (VEMS) après la prise d’un bronchodilatateur) ou 3) présenter des symptômes
d’asthme et avoir un test de provocation à la métacholine positif (concentration de
métacholine provoquant une chute de 20 % ou plus du VEMS (CP20) ≤ 16 mg/ml). Les
critères d’exclusion étaient la présence d’une MPOC, la participation aux étapes
d’élaboration du questionnaire et l’incapacité à lire.
32
Déroulement
Comme cette étude visait à mesurer les connaissances sur l’asthme des participants et
l’acquisition de nouvelles connaissances, le score des participants était attribué selon une
dichotomie bonne réponse/mauvaise réponse. Ainsi, pour chaque item, une note de 1 était
attribuée à la bonne réponse et de 0 à la mauvaise réponse ou à « ne sais pas ». Le score
des participants aux deux questionnaires équivalait au nombre de bonnes réponses. Les
scores pour le QCA-PA pouvaient varier de 0 à 54 et pour le QCALF de 0 à 37, puisque
ce dernier comporte 38 items, mais que l’un d’eux a été retiré parce qu’il ne s’appliquait
pas à la population cible.
33
Phase de validation
Trois procédures ont été privilégiées pour l’analyse d’items du QCA-PA, soit l’indice de
discrimination, l’analyse de la cohérence interne et l’analyse de l’ajustement des items au
modèle de Rasch. L’indice de discrimination est déterminé par le coefficient de
corrélation item-total. Il indique dans quelle mesure un item parvient à discriminer les
répondants ayant un score élevé de ceux ayant un score faible. Plus le coefficient est
élevé, plus l’item est discriminant. L’analyse de la cohérence interne consiste à s’assurer
que les items liés à un même concept réagissent de façon constante pour tous les
répondants. Ces deux procédures appartiennent à la théorie classique des tests qui
englobe de nombreux autres tests statistiques possibles (Crocker et Algina, 1989;
Laveault et Grégoire, 1997). La théorie de réponse aux items, pour sa part, permet une
analyse plus poussée des items puisqu’elle place sur une même échelle le degré de
difficulté des items et le niveau d’habileté des répondants (Bertrand et Blais, 2004).
Plusieurs modèles sont tirés de cette théorie, mais le plus simple, et le plus utilisé, est
certainement le modèle de Rasch qui postule qu’un seul trait latent est responsable de la
variance des items et que tous les items possèdent la même discrimination (Bond et Fox,
2007).
34
7. Preuves de validité (relation avec d’autres variables,
conséquences)
Ici seront vues les preuves de la validité de structure interne (validité de construit et
reproductibilité), de relation avec d’autres variables (validité concomitante) de même que
des preuves de la validité de conséquences (réponse aux changements).
35
Analyses statistiques
L’indice de discrimination est considéré problématique s’il se situe sous 0,2 (Crocker et
Algina, 1986; Nunnaly et Bernstein, 1994) (Voir Annexe 2). Comme des données
dichotomiques ont été utilisées, la corrélation point-bisériale item-total a servi aux
analyses. La cohérence interne est attestée par la valeur du coefficient de la formule 20 de
Kuder-Richardson (KR-20). Cette formule est privilégiée à l’alpha de Cronbach dans le
cas de données dichotomiques. Des valeurs entre 0,7 et 0,9 sont reconnues comme
présentant un bon niveau de cohérence interne (Crocker et Algina, 1986). Les analyses
ont été réalisées au moyen du logiciel TESTFAC 4.0 (Bock et al., 2003).
Les analyses avec le modèle de Rasch ont été réalisées avec l’aide du logiciel
WINSTEPS (version 3.32) (Linacre et Wright, 1999). Les statistiques d’ajustement sont
une indication de l’adéquation entre le modèle unidimensionnel de Rasch et les données
recueillies. Le logiciel WINSTEPS fournit deux statistiques d’ajustement pour les items :
infit et outfit (Linacre, 2002; Wright et Master, 1982). L’infit présente l’information
pondérée de la moyenne des carrés des résidus standardisés entre les réponses observées
et attendues en fonction de la variance de l’item et de la variance totale. L’outfit, utilisée
comme référence additionnelle, fournit la moyenne des carrés des résidus standardisés,
élevant les résidus au carré avant d’en faire la moyenne pour éviter que les résidus
négatifs ne compensent pour les résidus positifs. Une valeur de 1 à l’une et l’autre de ces
statistiques dénote un bon ajustement de l’item au modèle et une valeur allant de 0,5 à 1,5
est considérée satisfaisante (Linacre, 2002). Une valeur ≥ 1,5 indique un manque
d’homogénéité entre les items alors qu’une valeur ≤ 0,5 représente de la redondance entre
les items (Bain, Pini, Scallon et Bertrand, 1996).
Des analyses factorielles confirmatoires à partir des modèles d’équations structurelles ont
été exécutées en utilisant le logiciel EQS 6.2 (Bentler, 1995) afin d’obtenir une preuve de
la validité de construit du QCA-PA. Divers indices d’ajustement ont servi à comparer la
matrice théorique aux données empiriques : le chi-carré de Satorra-Bentler (la statistique
chi-carrée utilisée pour les données non normales) et son ratio sur les degrés de liberté
(SBχ2/dl), l’indice d’adéquation comparatif (Comparative Fit Index, CFI), l’indice
36
d’adéquation non normé (Non Normed Fit Index, NNFI) proposé par Tucker et Lewis
(1973) et la racine du carré moyen de l’erreur d’estimation (Root Mean Square Error of
Estimation, RMSEA) recommandée par Steiger (Steiger, 1990). La version modifiée de
l’Akaike Information Criterion (Consistent version of the AIC, CAIC), proposée par
Bozdogan (Bozdogan, 1987) a également été utilisée afin de comparer les modèles entre
eux.
Une valeur du SBχ2/dl s’approchant de 2,0 représente un bon ajustement du modèle aux
données empiriques, alors qu’une valeur de 5,0 indique un ajustement acceptable. Les
modèles indiquant un CFI et un NNFI au-dessus de 0,9 sont généralement considérés
comme adéquats (Schumacker et Lomax, 1996), alors que ceux présentant des valeurs de
0,95 sont qualifiés d’appréciables (Marsch, Ellis, Parada, Richards et Heubeck, 2005).
Une valeur du RMSEA en-dessous de 0,08 est acceptable, alors qu’une valeur en-dessous
de 0,05 est appréciable (Browne et Cudeck, 1993). Quant au CAIC, le modèle le plus
approprié devrait être celui qui présente la valeur la plus faible (Bentler, 1995). Enfin,
considérant que les données analysées ne respectaient pas la loi normale, la méthode
d’estimation du maximum de vraisemblance (Maximum Likelihood, ML) et son option
robust ont été utilisées. Étant donné le nombre de participants et le nombre de paramètres
à estimer, l’utilisation d’indicateurs était requise pour chacun des facteurs. Deux
indicateurs ont été construits pour chacun des facteurs. Marsch, Hau, Balla et Greyson
(1998) ont montré que leur utilisation était aussi efficace que l’utilisation de tous les
items pour évaluer l’adéquation des modèles théoriques aux données. Pour chacun des
facteurs, les indicateurs ont été conçus de façon aléatoire. L’indicateur 1 était obtenu par
la moyenne des items impairs et l’indicateur 2 par la moyenne des items pairs. Dans le
but d’optimiser la structure factorielle des modèles testés, le test multiplicatif de
Lagrange (LMTEST), qui propose l’ajout de paramètres, a aussi été employé (Bentler &
Dijkstra, 1985).
37
un modèle à quatre facteurs corrélés (caractéristiques de l’asthme, facteurs déclenchants,
diagnostic et contrôle ainsi que traitement de l’asthme). Le deuxième modèle (M2)
ajoutait à la structure suggérée par la littérature un facteur de second ordre, les
connaissances sur l’asthme étant le facteur principal qui influence les quatre autres. Le
troisième et dernier modèle testé (M3) s’appuyait sur l’analyse de la cohérence interne
ainsi que sur les résultats obtenus au prétest et éprouvait une structure unidimensionnelle.
Afin d’obtenir une preuve de validité concomitante, des corrélations de Spearman ont été
réalisées entre les scores totaux du QCA-PA et du QCALF à chacun des temps de
mesure. Puisqu’un coefficient trop élevé démontrerait une trop grande similarité entre les
deux questionnaires, un coefficient entre 0,4 et 0,8 est jugé acceptable pour démontrer
une bonne preuve de validité concomitante (Streiner et Norman, 1995).
Résultats
Indice de discrimination
Le tableau 2 présente les résultats des analyses d’items obtenus pour chacun des items du
QCA-PA au premier temps de mesure (T0). Par souci de concision, les résultats
similaires ayant été obtenus aux autres temps de mesure ne sont pas présentés. Les items
12a, 12c, 16a et 16b avaient une variance nulle, tous les participants ayant obtenu la
bonne réponse, leur indice de discrimination était donc nul. Ces items ont été retirés des
analyses subséquentes. Ils ont tout de même été conservés à l’intérieur du QCA-PA
puisque, selon l’expert du domaine, il s’agit de connaissances primordiales que les
patients asthmatiques doivent posséder. Il est donc normal que tous les maîtrisent.
D’autres items, 13 au total, présentaient des indices de discrimination insatisfaisants au
T0 selon les critères fixés. Ils étaient répartis également dans le questionnaire et rien ne
semblait les lier à priori. Pour les mêmes raisons, ils ont été conservés. Une attention
particulière leur a été accordée pour la suite des analyses.
38
Tableau 2 : Résultats de l'analyse d'items au T0 pour chacun des items du QCA-PA
39
19e elle a besoin de prendre sa médication de secours (ex. VentolinMD, BricanylMD, 0,66 0,48 0,35
AiromirMD, SymbicortMD) avant tout exercice physique
19f ses tests respiratoires (ex : débit expiratoire) sont à 70 % de leur meilleure 0,42 0,50 0,36
valeur
20 Le but du traitement de l’asthme est d’obtenir le contrôle de la maladie. 0,99 0,10 0,14 X
21 Les médicaments de secours (ex : VentolinMD, BricanylMD, AiromirMD et 0,62 0,49 0,47
SymbicortMD) sont les meilleurs types de médicaments pour le contrôle de l’asthme à
long terme.
22 Tous les patients asthmatiques nécessitent un plan d’action écrit (un document sur 0,57 0,50 0,23
lequel il est indiqué quoi faire si l’asthme se détériore).
Les médicaments suivants sont des médicaments de maintien, qui doivent donc être
pris régulièrement, à tous les jours :
23a Bronchodilatateurs à courte action (ex : VentolinMD, BricanylMD, AiromirMD) 0,81 0,39 0,37
23b Corticostéroïdes inhalés (ex : FloventMD, PulmicortMD, QVARMD, AlvescoMD, 0,67 0,47 0,45
AsmanexMD)
23c Combinés (AdvairMD, SymbicortMD, ZenhaleMD) 0,62 0,49 0,40
23d Antagonistes du récepteur des leucotriènes (SingulairMD) 0,37 0,48 0,46
Cohérence interne
Les coefficients de cohérence interne pour chacune des quatre catégories proposées par
les assises théoriques et à chacun des temps de mesure du QCA-PA, en plus de ceux du
QCALF, sont présentés au tableau 3. Pour le QCA-PA, les coefficients se situaient entre
0,71 et 0,82 à chacun des temps de mesure lorsque calculés pour l’ensemble du
questionnaire. Les coefficients n’étaient pas satisfaisants lorsque les catégories étaient
considérées séparément, indiquant qu’elles sont plutôt de nature descriptive. Les
coefficients du QCALF étaient également satisfaisants et justifiaient son utilisation
comme mesure étalon.
T0 T1 T2 T3
Facteurs
Caractéristiques de l’asthme 0,56 0,64 0,41 0,35
Facteurs déclenchants 0,40 0,55 0,34 0,23
Diagnostic et contrôle 0,54 0,61 0,63 0,60
Traitements de l’asthme 0,49 0,56 0,09 0,19
Total QCA-PA 0,78 0,82 0,71 0,71
Modèle de Rasch
Le tableau 2 indique les items qui obtiennent des statistiques non satisfaisantes (marqués
d’un « x ») à la suite des analyses selon le modèle de Rasch à T0. Encore une fois, les
40
résultats similaires aux autres temps de mesure ne sont pas présentés par souci de
concision. Parmi les 13 items identifiés comme ayant un indice de discrimination
insatisfaisant, trois ressortaient à nouveau comme étant problématiques selon une des
deux statistiques rapportées. Il s’agit des items 12d, 16c et 20, liés respectivement aux
causes, aux symptômes et au traitement de la maladie. Une fois de plus, l’avis de l’expert
du domaine a fait foi de la décision de conserver ces items à l’intérieur du QCA-PA. Il
s’agit d’éléments incontournables des connaissances sur l’asthme et il est nécessaire que
les professionnels de la santé sachent si les patients les maîtrisent. Il en a été de même
pour les trois items problématiques selon l’outfit, mais adéquats selon l’indice de
discrimination qui ne reflétaient donc pas un problème récurrent d’une analyse à l’autre.
Le tableau 4 présente les indices d’ajustement des données du QCA-PA pour les modèles
testés à T0. Des valeurs similaires ont été obtenues aux autres temps, mais ne sont pas
présentés, toujours par souci de concision.
Le M1, à quatre facteurs corrélés, présentait un bon ajustement du modèle aux données,
un CFI appréciable de même qu’un NNFI et un RMSEA acceptables. Cependant, c’est ce
modèle qui comportait l’indice CAIC le plus élevé. Le M2, comprenant un facteur de
deuxième ordre, présentait des statistiques d’ajustement légèrement moins élevées, soit
un bon SBχ2/dl, un CFI et un RMSEA acceptables, mais un NNFI sous le seuil
d’acceptabilité fixé. Son CAIC était plus faible que celui de M1. Pour ce qui est du M3,
bien que le CAIC indiquait qu’il s’agit du modèle s’ajustant le mieux aux données, le
CFI, le NNFI et le RMSEA n’étaient pas acceptables. Pour ce modèle, l’analyse du
LMTEST suggérait d’ajouter une corrélation entre les termes d’erreurs des indicateurs 5 et
6. Comme ils correspondaient au même domaine suggéré par la littérature, ce lien a été
ajouté. Le M4, soit le M3 optimisé à la lumière du LMTEST, présentait alors le CAIC le
plus faible, un RMSEA répondant au seuil appréciable ainsi que des valeurs de CFI et de
NNFI respectivement appréciables et adéquates. La figure 2 présente la solution
standardisée de l’analyse factorielle confirmatoire.
41
Tableau 4 : Indices d'ajustement des modèles testés à T0
Indices d’ajustement M1 M2 M3 M4
Indicateur 1 0,24
0,49
Indicateur 2
0,31
0,55
Indicateur 3
0,34
0,58
0,41 Indicateur 4
0,17
Connaissances sur
l’asthme 0,61
Indicateur 5
0,38
0,64
Indicateur 6
0,41
0,53
Indicateur 7
0,28
0,55
Indicateur 8
0,31
42
Validité concomitante
Le tableau 5 présente les corrélations entre les scores obtenus par les participants aux
deux questionnaires à chacun des temps de mesure. Les coefficients obtenus permettent
de constater que les corrélations étaient plus élevées à chacun des temps de mesure pour
un même questionnaire que d’un questionnaire à l’autre. Tel qu’attendu, les coefficients
de corrélation entre le QCA-PA et le QCALF pour chacun des temps de mesure respectifs
se situaient tous entre 0,479 et 0,665 et étaient significatifs (p = 0,01). Cela apporte une
preuve de la validité concomitante du QCA-PA envers un autre instrument de mesure
respectant certaines preuves de validité concernant le même concept, soit les
connaissances sur l’asthme.
Le tableau 5 montrant une corrélation plus élevé entre les scores du QCA-PA à T0 et T1,
43
Le tableau 6 présente les scores moyens obtenus au QCA-PA et au QCALF à chacun des
temps de mesure. Il montre que l’évolution des scores était comparable pour les deux
questionnaires. La figure 3 montre la comparaison du score moyen au QCA-PA à chacun
des temps de mesures. L’ANOVA à mesures répétées du QCA-PA, par le test de
sphéricité de Mauchly, montre une différence de la variance dans le temps (W(5) = 0,433 p
< 0,05), les analyses intra-sujets (Greenhouse-Geisser) attestant d’une différence
significative du score moyen pour chaque temps de mesure (F(2,009) = 115,311 p < 0,05,
ηp2 = 0,541). Spécifiquement, les analyses de contraste indiquaient une différence
significative de faible amplitude entre T0 et T1 (F(1) = 5,381 p < 0,05, ηp2 = 0,052) et une
différence significative de plus forte amplitude entre T1 et T2 (F(1) = 159,070 p < 0,05,
ηp2 = 0,619), ainsi qu’entre T2 et T3 (F(1) = 139,223 p < 0,05, ηp2 = 0,587). Les scores
moyens très similaires obtenus aux T0 et T1 démontrent la reproductibilité du
questionnaire. L’augmentation modérée significative des scores après la session
d’enseignement avère quant à elle la réponse aux changements du QCA-PA.
L’accroissement des scores entre T2 et T3 est probablement dû à la maturation des
concepts chez les répondants, un effet d’apprentissage se faisant sentir après avoir
répondu plusieurs fois aux mêmes questions. Comme les scores étaient très similaires,
cela démontre surtout la reproductibilité postenseignement.
Scores T0 T1 T2 T3
QCA-PA 40,6 (5,5) 41,32 (5,8) 45,65 (4,0) 45,79 (3,9)
QCALF 29,1 (4,5) 30,6 (4,4) 32,7 (2,9) 32,9 (2,8)
44
Score (/54)
T0 T1 T2 T3
Temps de mesure
Discussion
45
D’autres preuves de validité ont été obtenues durant la phase de validation. Concernant la
structure interne, un niveau acceptable de cohérence interne a montré que les items du
QCA-PA étaient liés entre eux. L’indice de discrimination de chaque item et l’analyse
d’items selon le modèle de Rasch ont permis d’identifier des items problématiques.
Cependant, ces résultats ne dénotaient pas un problème persistant d’une analyse à l’autre
et d’un temps de mesure à l’autre. Se basant sur la réalité clinique, l’expert du domaine a
jugé qu’il fallait conserver tous les items puisqu’ils constituent des connaissances
importantes qu’un patient asthmatique doit posséder. Le présent questionnaire servant à
orienter la session d’enseignement sur les éléments à traiter, il revêt un enjeu important
par rapport au répondant puisqu’il est associé au contrôle de sa maladie, mais du point de
vue de la session d’enseignement, cet enjeu pronostique est de plus faible importance.
Ainsi, le fait de conserver des items problématiques n’a que peu d’incidences sur la
session d’enseignement.
Deux types d’analyses ont permis d’obtenir d’autres preuves de validité. Les preuves de
validité de construit sont attestées par les analyses factorielles confirmatoires qui
suggéraient un meilleur ajustement des données du QCA-PA à un modèle possédant un
seul facteur. Cette analyse allait dans le sens suggéré par le coefficient de cohérence
interne, les connaissances sur l’asthme ne pouvant pas être catégorisées, comme le
suggère le rapport GINA (FitzGerald et al., 2014). De plus, les coefficients de corrélation
acceptables entre le QCA-PA et le QCALF constituent une preuve de validité
concomitante du QCA-PA. L’obtention de corrélations modérées entre les deux
questionnaires a permis de démontrer le caractère distinctif du nouveau questionnaire. La
corrélation étant modérée, cela montre que le QCA-PA n’est pas une simple répétition du
QCALF, mais se veut une bonification par rapport à cet outil de mesure déjà existant,
notamment puisqu’il se base sur les recommandations internationales GINA et qu’il a
accumulé davantage de preuves de validité que tout autre questionnaire.
46
la validité de conséquences de l’usage du questionnaire. De fait, les participants à l’étude
présentaient un niveau de connaissances plus élevé et durable sur leur maladie.
Diverses limites de la présente étude sont à mettre en lumière. Tout d’abord le nombre
limité de participants à la phase de validation peut s’expliquer par la période de temps
restreinte pour le recrutement et l’implication que demandait l’étude, soit trois
déplacements dont un d’une durée d’environ deux heures pour suivre la session
d’enseignement. Cependant, il s’avère appréciable d’avoir pu recruter une centaine de
patients sur une période d’environ six mois et de les avoir ainsi aidés à mieux connaître
leur maladie. De plus, la majorité des participants ayant été recrutés parmi les patients
fréquentant un centre de soins tertiaire, les scores moyens élevés dès le premier temps de
mesure, et donc l’amélioration modérée à la suite de l’enseignement, se comprennent
davantage. Une telle étude en soins de première ligne sur des patients récemment
diagnostiqués pourrait accentuer ces différences, sans toutefois changer les conclusions
de l’étude.
Des recherches futures pourraient s’attarder à différencier les connaissances des patients
en fonction des données sociodémographiques recueillies. De plus, une validation du
QCA-PA pour d’autres populations avec des caractéristiques différentes comme les
enfants, les personnes âgées ou les athlètes pourrait être envisagée. Enfin, une validation
transculturelle serait à prévoir pour renforcer le caractère généralisable du QCA-PA.
47
Conclusions
Le but de cette étude était de présenter une méthode rigoureuse de validation d’outils de
mesure des connaissances par l’exemple du Questionnaire de connaissances sur l’asthme
destiné aux patients adultes (QCA-PA). Cette méthode peut être reproduite pour d’autres
instruments de mesure des connaissances dans plusieurs domaines, les étapes demeurant
les mêmes. Les diverses preuves de validité permettent de supporter l’interprétation
proposée des résultats.
48
Remerciements
Nous remercions Juliet Foster, Martyn Partridge, Mark FitzGerald et Helen Reddel pour
leurs conseils sur les étapes initiales de développement de ce questionnaire. Nous
remercions également, sous la direction de Patricia Côté, les inhalothérapeutes du Réseau
québécois de l’asthme et de la MPOC (RQAM) Guylaine Gauthier, Livia Battisti et
Valérie Chabot, de même que Lyne Ringuette et Christiane Balizet de l’IUCPQ pour leur
enseignement aux participants, respectivement aux étapes du prétest et de la validation du
QCA-PA.
49
50
Conclusion
Cette section fait état des conclusions pouvant être tirées des résultats obtenus dans le
cadre de l’élaboration et de la validation de l’instrument de mesure développé. Elle
permettra tout d’abord de faire un bilan de l’étude menée pour le développement et la
validation du QCA-PA. Puis, les forces et les limites de l’étude seront présentées avant
d’ouvrir sur des possibilités de recherches futures en lien avec le développement de cet
instrument de mesure.
Bilan
Cette étude avait pour but le développement et l’obtention de preuves de validité d’un
instrument de mesure de nature diagnostique à interprétation critériée des connaissances
des patients asthmatiques sur leur maladie. Boulet et al.(2002) et Soriano et al. (2003)
ayant montré qu’une augmentation des connaissances peut mener à un meilleur contrôle
de la maladie, une bonne évaluation permet une meilleure intervention éducative, ce dont
bénéficient rarement les patients souffrant de maladies chroniques comme l’asthme
(Gibson et al., 2003). De plus, pour répondre à la défaillance d’instruments validés de
façon rigoureuse (Pink et al., 2009), les chercheurs ont ici décidé d’adapter une méthode
développée par DeVellis (2003) et éprouvée par Dussault et al. (2007). À noter que les
avancées sur le plan de la validité ont permis de fusionner les étapes 6 (analyse d’items)
et 7 (preuves de validité) en une seule étape (figure 4). Cette méthode a permis
l’accumulation d’un nombre appréciable de preuves de validité, tel que recommandé par
les spécialistes en mesure et évaluation (Downing, 2003; Laveault et Grégoire, 1997;
Messick, 1994; Waldmann, Gulich et Zeitler, 2008), ce qui lui confère une crédibilité
certaine.
51
1. Détermination de l’objet
de mesure
- Validité de contenu
2. Génération d’items
- Validité de contenu
3. Détermination du
format de mesure
Phase de développement
- Validité du processus de
réponse
4. Vérification de la clarté
des items
- Validité du processus de
réponse (apparente)
- Validité de contenu
5. Prétest
- Validité de la structure
interne
- Validité du processus de
réponse
6. Preuves de validité
52
De plus, s’appuyant sur les recommandations de l’organisme GINA (FitzGerald et al.,
2014), le QCA-PA s’avère applicable à grande échelle, les items concernant l’ensemble
des adultes asthmatiques.
Une des limites de cette étude est que malgré l’accumulation de plusieurs preuves de
validité, certaines n’ont pas pu être vérifiées, principalement à cause du contexte de la
recherche. Ainsi, le nombre restreint de participants (n=101) à la phase de validation
aurait pu affecter l’analyse de la structure factorielle. L’exigence de se déplacer à trois
reprises et le temps alloué pour effectuer le recrutement ayant limité les possibilités de
recrutement. Une étude de généralisabilité aurait pu être réalisée afin de confirmer la
valeur universelle attribuée au QCA-PA puisqu’il se base sur des lignes directrices
internationales et que la reproductibilité de la mesure aux deux premiers temps de mesure
va en ce sens.
53
mesure à plus long terme afin d’évaluer l’impact de la complétion du questionnaire et de
la session d’enseignement sur les participants.
L’évaluation des connaissances des patients à long terme suivant la session d’éducation
sur l’asthme constitue une perspective future de recherche. En outre, il s’avérerait
intéressant d’évaluer le nouveau niveau de contrôle de l’asthme acquis chez les patients
ayant participé à l’étude de validation du QCA-PA, des données sur le contrôle initial de
l’asthme ayant été recueillies au T0. Ce type d’étude permettrait en effet d’éprouver la
théorie selon laquelle une augmentation des connaissances du patient conduirait à un
meilleur autocontrôle. De plus, un point de coupure du questionnaire pourrait être
déterminé, montrant quel score au questionnaire est associé à un bon contrôle de la
maladie.
54
Annexe 1
55
Vrai Faux Ne sais pas
B) FACTEURS DÉCLENCHANTS
(ce qui peut causer des symptômes d’asthme)
10.Chez les personnes allergiques aux chats, aux pollens, aux acariens, etc., le
contact avec ceux-ci peut causer des symptômes d’asthme.
56
Vrai Faux Ne sais pas
b) Sillements
c) Oppression au thorax (sensation de serrement à la poitrine)
d) Crachats (sécrétions bronchiques)
e) Toux
f) Brûlements d’estomac
17. Lorsqu’elles n’ont pas de symptômes d’asthme, les personnes
asthmatiques peuvent arrêter de prendre leur médication de maintien
(ex : FloventMD, PulmicortMD, QVARMD, AlvescoMD, AsmanexMD, AdvairMD,
SymbicortMD, ZenhaleMD, SingulairMD).
18.Il existe de petits appareils pour mesurer l’obstruction des bronches par
soi-même (ces appareils sont appelés débitmètres de pointe).
b) elle s’éveille la nuit à cause de l’asthme pas plus de 2 fois par mois
c) elle peut faire des activités quotidiennes normales, incluant l’exercice
d) elle a des symptômes d’asthme 5 à 7 jours par semaine
e) elle a besoin de prendre sa médication de secours (ex. VentolinMD,
BricanylMD, AiromirMD, SymbicortMD) avant tout exercice physique
D) TRAITEMENT DE L’ASTHME
20. Le but du traitement de l’asthme est d’obtenir le contrôle de la maladie.
MD MD
21. Les médicaments de secours (ex : Ventolin , Bricanyl , Airomir et MD
SymbicortMD) sont les meilleurs types de médicaments pour le contrôle
de l’asthme à long terme.
22. Tous les patients asthmatiques nécessitent un plan d’action écrit (un
document sur lequel il est indiqué quoi faire si l’asthme se détériore).
57
Vrai Faux Ne sais pas
c) Combinés (AdvairMD, SymbicortMD, ZenhaleMD)
d) Antagonistes du récepteur des leucotriènes (SingulairMD)
MERCI D’AVOIR COMPLÉTÉ CE QUESTIONNAIRE
©Tout droit réservé. Ce questionnaire ne peut être reproduit sans la permission de
l’auteur.
Contact : [email protected]
58
Annexe 2
59
est élevé, meilleur est l’ajustement du Statistique utilisée dans le cadre
modèle. d’analyse par équations structurelles.
Elle estime l’adéquation d’un modèle
Indice d’ajustement non normé (Non
théorique à des données empiriques dans
Normed Fit Indexe, NNFI)
le cas de données qui ne respectent pas
Statistique d’ajustement utilisée en la loi normale.
équations structurelles. Elle prend en
-M-
compte l’ampleur des corrélations et le
nombre de paramètres estimés. Plus Maximum de vraisemblance
l’indice est élevé, meilleur est (Maximum Likelihood, ML)
l’ajustement du modèle.
Méthode statistique utilisée pour estimer
Indice de discrimination les paramètres dans un modèle, entre
autres en équations structurelles. Elle
Représenté par la corrélation item-total.
maximise la probabilité que la matrice
Indice statistique défini comme la
de corrélations reflète la distribution
différence entre la proportion de
réelle dans la population.
réussites à l'item parmi les individus
dont les résultats sont les plus élevés sur Modèle de Rasch
l'ensemble de l'épreuve et la proportion
Issu de la Théorie de Réponse aux Items
de réussites chez les individus dont les
(TRI), le modèle de Rasch est une
résultats globaux sont les plus faibles.
méthode d’analyse de données
Plus l’indice de discrimination est élevé
statistiques servant à mesurer les
pour un item, plus sa réussite est
capacités, les attitudes ou les traits de
représentative d’un score total plus élevé
personnalité des répondants à un
à l’épreuve ou, à l’inverse, plus son
questionnaire. Il est le modèle le plus
faible résultat est représentatif d’un score
simple et le plus utilisé de la TRI,
total plus faible à l’épreuve.
stipulant qu’un seul trait latent est
-K- responsable de la variance des items et
que tous les items possèdent le même
Khi carré de Satorra-Bentler (SBχ2)
niveau de discrimination.
60
Son analyse peut se faire à l’aide de l’indice est faible, meilleur est
logiciels tels WINSTEPS ou RUM2020. l’ajustement du modèle.
WINSTEPS présente deux statistiques
-T-
d’ajustement pour les items : infit et
outfit . L’infit présente l’information Test de sphéricité de Mauchly
pondérée de la moyenne des carrés des
Test statistique utilisé dans le cas
résidus standardisés entre les réponses
d’ANOVA à mesures répétées. Il a pour
observées et attendues en fonction de la
but de vérifier le postulat selon lequel la
variance de l’item et de la variance
variance des différences entre chaque
totale. L’outfit, utilisée comme référence
paire de variable indépendante est égale
additionnelle, fournit la moyenne des
(postulat d’homogénéité des variances).
carrés des résidus standardisés, élevant
les résidus au carré avant d’en faire la Test multiplicatif de Lagrange
moyenne pour éviter que les résidus (LMTEST)
négatifs ne compensent pour les résidus
Test statistique permettant, dans le cadre
positifs. Les valeurs considérées comme
d’analyses par équations structurelles, de
satisfaisantes pour chacune des
proposer l’ajout de paramètres au
statistiques devraient se situer entre 0,5
modèle théorique testé.
et 1,5.
-V-
-R-
Version modifiée de l’Akaike
Racine du carré moyen de l’erreur
Information criterion (Consistent
d’estimation (Root Mean Square Error
version of the Akaike Information
of Estimation, RMSEA)
Criterion, CAIC)
Statistique d’ajustement utilisée en
Statistique d’ajustement utilisée en
équations structurelles. Elle permet
équations structurelles. Elle permet de
d’éviter les erreurs dues à la taille de
comparer différents modèles théoriques
l’échantillon en comparant la différence
entre eux. Le modèle présentant l’indice
entre le modèle théorique et la matrice
CAIC le plus faible devrait être celui qui
de covariance de la population. Plus
s’ajuste le mieux aux données.
61
62
Bibliographie
63
Browne, M. W. et Cudeck, R. (1993). Alternative Ways of Assessing Model Fit. Dans K. A. Bollen
et J. S. Long (dir.), Testing Structural Equation Models (p. 136-162). Beverly Hills, CA:
Sage.
Cowie, R. L., Cicutto, L. et Boulet, L. P. (2001). Asthma Education and Management Programs in
Canada. Canadian Respiratory Journal, 8, 416-420.
Crocker, L. M. et Algina, J. (1986). Introduction to Classical and Modern Test Theory. New York,
NY : Holt, Rinehart, and Winston.
DeVellis, R. F. (2003). Scale Development : Theory and Applications (2e éd.). Thousand Oaks, CA :
SAGE.
Downing, S. M. (2003). Validity: On Meaningful Interpretation of Assessment Data. Medical
Education, 37(9), 830-837.
Dussault, M., Valois, P. et Frenette, E. (2007). Validation de l'échelle de Leadership Transformatif
du directeur d'école. Psychologie du travail et des organisations, 13(2), 37-52.
FitzGerald, J. M., Reddel, H. et Boulet, L. P. (2014). Pocket Guide for Asthma Management and
Prevention (for Adults and Children Older than 5 Years). Récupéré [le 15 mars 2015] de
http://www.ginasthma.org/local/uploads/files/GINA_Pocket_2014_Jun11.pdf
Foster, G., Taylor, S. J. et Elridge, S. E. (2007). Self-Management Education Programmes by Lay
Leaders for People with Chronic Conditions. Cochrane Database of Systematic Reviews,
4(CD005108).
Furr, R. M. (2011). Scale Construction and Psychometrics for Social and Personality Psychology.
Los Angeles, CA ; London, UK : SAGE.
Gibson, P. G., Ram, F. S. et Powell, H. (2003). Asthma Education. Respiratory Medicine, 97(9),
1036-1044.
Jöreskog, K. G. et Sörbom, D. (1996-2001). LISREL 8 [logiciel informatique]. Lincolnwood, IL :
Scientific Software International.
Juniper, E. F., Svensson, K., Mork, A. C. et Stahl, E. (2005). Measurement Properties and
Interpretation of Three Shortened Versions of the Asthma Control Questionnaire.
Respiratory Medicine, 99(5), 553-558.
Kline, P. (2000). The Handbook of Psychological Testing (2e éd.). London, UK ; New York, NY :
Routledge.
Lakhal, S. et Frenette, E. (sous presse). La rédaction des questions pour évaluer les
apprentissages. Dans J. Leroux (dir.), Évaluer les compétences au collégial et à
l'université : Guide pratique à l'intention des enseignants. Sherbrooke, Canada :
Performa.
Laurier, M., Tousignant, R. et Morissette, D. (2005). Les principes de la mesure et de l'évaluation
des apprentissages (3e éd.). Montréal, Canada : Gaëtan Morin.
Laveault, D. et Grégoire, J. (1997). Introduction aux théories des tests en sciences humaines.
Paris, France ; Bruxelles, Belgique : De Boeck Université.
Linacre, J. M. (2002). What do Infit and Outfit, Mean-Squared and Standardized Mean? Rasch
Measurement Transaction, 16, 878.
Linacre, J. M. et Wright, B. D. (1999). Winsteps Rasch-Model Computer Program (version 2.88)
[logiciel informatique]. Chicago, IL : MESA Press.
Marquis, P. (2003). Développement et validation d'un questionnaire : état de l'art et niveau
d'évidence requis. Dans O. Chassany et C. Caulin (dir.), Qualité de vie liée à l'état de
santé (p. 37-45). Paris, France : Springer-Verlag.
Marsch, H. W., Ellis, L., Parada, L., Richards, G. et Heubeck, B. G. (2005). A Short Version of the
Self-Description Questionnaire ii : Operationalising Criteria for Sort Form Evaluation with
64
New Applications of Confirmatory Factor Analysis. Psychological Assessment, 17, 81-
102.
Marsch, H. W., Hau, K. T., Balla, J. et Grayson, D. (1998). Is More Ever Too Much: The Number of
Indicators per Factor in Confirmatory Factor Analysis. Multivariate Behavioral Research,
33, 181-220.
Masoli, M., Fabian, D., Holt, S., Beasley, R. et Global Initiative for Asthma Program. (2004). The
Global Burden of Asthma: Executive Summary of the GINA Dissemination Committee
Report. Allergy, 59(5), 469-478.
Messick, S. (1990). Validity of Test Interpretation ans Use. Dans M. C. Alcin (dir.), Encyclopedia of
Educational Research (6e éd.). New York, NY : Macmillan.
Messick, S. (1994). Validity of Psychological Assessment: Validation of Inferences from Persons'
Responses and Performances as Scientific Inquiry into Score Meaning. American
Psychologist, 50(9), 741-749.
Muthén, L. K., et Muthén, B. O. (1998-2010). Mplus Statistical Software [logiciel informatique].
Los Angeles, CA: auteur.
Nguyen, L., Raherison, C., Bozonnat, M. C., Lheureux, M., Nocent, C., Tunon-de-Lara, J. M. et
Taytard, A. (2003). Validation of an Asthma Knowledge Questionnaire. Revue des
Maladies Respiratoires, 20(6 Pt 1), 871-880.
Nunnally, J. C., et Bernstein, I. H. (1994). Psychometric Theory (3e éd.). New York, NY : McGraw-
Hill inc.
Osterlind, S. J. (2010). Modern Measurement. Theory, Principles and Applications of Mental
Appraisal (2e éd.). London, UK : Pearson.
Pink, J., Pink, K. et Elwyn, G. (2009). Measuring Patient Knowledge of Asthma: A Systematic
Review of Outcome Measures. Journal of Asthma, 46(10), 980-987.
Rattray, J., Jones, M. C. (2005). Essential, Elements of Questionnaire Design and Development.
Journal of Clinical Nursing, 16, 234-243.
Schumacker, R. E. et Lomax, R. G. (1996). A Beginner's Guide tu Structural Equation Modeling.
Mahwah, NJ : Lawrence Erlbaum Associates.
Shum, D., O'Gorman, J. et Myors, B. (2006). Psychological Testing and Assessment. South
Melbourne, Australia ; New York, NY: Oxford University Press.
Soriano, J. B., Rabe, K. F. et Vermeire, P. A. (2003). Predictors of Poor Asthma Control in
European Adults. Journal of Asthma, 40(7), 803-813.
Steiger, J. H. (1990). Structural Model Evaluation and Modification : An Interval Estimation
Approach. Multivariate Behavioral Research, 25, 173-180.
Stevens, S. S. (1951). Handbook of Experimental Psychology. New York, NY : Wiley.
Streiner, D. L., et Norman, G. R. (1995). Health Measurement Scales: A Practical Guide to their
Development and Use (2e éd.). Oxford, UK ; New York, NY : Oxford University Press.
Tabachnick, Barbara G., et Fidell, Linda S. (2007). Using multivariate statistics (5th ed.). Boston ;
Toronto: Pearson/Allyn et Bacon.
Tardif, J. (1999). Le transfert des apprentissages. Montréal, Canada : Éditions Logiques.
Thurstone, T. G., et Byrne, K. M. (1951). Mental abilities of children. Chicago, IL : Science
Research Associates.
Tousignant, R. et Morissette, D. (1989). Les Principes de la mesure et de l'évaluation des
apprentissages (2e éd. rev. et augm.). Boucherville, Canada : Gaëtan Morin.
Tucker, L. R. et Lewis, C. M. (1973). A Reliability Coefficient for Maximum Likelihood Factor
Analysis. Psychometrika, 38, 1-10.
Urbina, Susana. (2004). Essentials of Psychological Testing. Hoboken, NJ: John Wiley & Sons.
65
Waldman, U. M., Gulich, M. S., et Zeitler, H. P. (2008). Virtual Patients fos Assessing Medical
Students: Important Aspects when Considering the Introduction of a New Assessment
Format. Medical Teacher, 30(1), 17-24.
Wright, B. D. et Master, G. N. (1982). Rating Scale Analysis: Rasch Measurement. Chicago, IL :
MESA Press.
66