ChapI Introduction À L'analyse Multivariée
ChapI Introduction À L'analyse Multivariée
ChapI Introduction À L'analyse Multivariée
Introduction générale.
L’analyse des données est effectuée pour répondre à l’objectif d’une recherche,
elle est précédée par des préliminaires de contrôle des informations et de
sélection de la ou des méthodes d’analyse les plus appropriées. L’analyse
préliminaire est une préparation à l’analyse principale pour localiser ou corriger
les problèmes que contiennent les données d’une étude (Fidell, L. S., &
Tabachnick, B. G. 2003)1. Nous traitons aussi dans ce chapitre la question des
variables (types, nature et échelles de mesure), le type des données et des
tableaux de données et enfin le choix de la méthode d’analyse appropriée à une
recherche donnée.
2
Chapitre I. Introduction à l’analyse des données.
Variable
Variable
Modératrice
Indépendant
(MOD_V)
e (IV)
H3
H1
H4 H5 Variable
dépendante
H2 (DV)
Variable
Médiatrice
(MED_V)
Variable de
Contrôle (CV)
Variable dépendante.
Le premier statut qu’on accorde à une variable dans un modèle est le statut
dépendant endogène, à expliquer, critère ou réponse. Une variable est dite
dépendante quand elle est déterminée ou causée par des facteurs ou des
variables dans le modèle. Elle est pure endogène quand seules les variables du
modèle qui la déterminent. Elle partiellement endogène quand elle est
déterminée aussi par des variables autres que celles qui la déterminent dans le
modèle. (D. Little 2010)
Une variable endogène est aussi appelée variable à expliquer ou variable critère.
Une variable endogène est une variable qui apparaît comme variable
dépendante dans au moins une des équations d’un modèle structurel donné.
Dans un diagramme de causalité, les variables endogènes peuvent se reconnaître
au fait qu’elles ont au moins une flèche pointée vers elles. (Statistica)
Variable indépendante.
La variable indépendante est une variable manipulée (ou contrôlée)
expérimentalement ou statistiquement par le chercheur dans le but d’étudier ses
effets sur la variable dépendante. Il peut s’agir également d’une variable dans
une étude descriptive considérée comme précédant un résultat ou effet (variable
dépendante). Une attention particulière est accordée à cette étape, en effet
l’omission d’une variable indépendante normalement corrélée avec une ou
3
Chapitre I. Introduction à l’analyse des données.
Dans une relation causale (y i=β0 + β1xi+µi) xi est dite exogène c’est-à-dire
E(xi/µi)=0, on parle d’hypothèse d’exogénéité.
Une variable est dite exogène par rapport au phénomène à étudier au sens où
elle considérée comme étant en dehors du dit phénomène. Une variable
exogène peut être explicative du phénomène est appelée variable explicative ou
prédicteur comme elle peut être juste une variable de contrôle. Elle est
considérée comme variable de contrôle quand elle figure pour « purifier » l’effet
de variable explicative sur les variables à expliquer. Les variables de contrôle ne
font pas l’objet d’hypothèse de recherche.
Une variable est exogène quand elle déterminée par des variables non retenues
dans le modèle. Elle l’est aussi quand elle est considérée comme étant
indépendante des variables retenues dans le modèle. (D. Little 2010) 5
La variable exogène peut être modératrice tant qu’elle n’entre pas dans la
définition du phénomène endogène.
Dans la recherche de G. Wang et R. G. Netemeyer (2002) 6, le modèle comprend
trois variables endogènes : « learning effort », « self efficacy » et « sales
performance ». Le chercheur assigne à certaines variables endogènes un rôle
médiateur. Cette phase concerne également l’intégration éventuelle d’une ou
plusieurs variables modératrices. La phase de la conception consiste à assigner à
la variable le statut de modératrice pure ou de quasi modératrice.
Une attention particulière est accordée à cette étape, en effet l’omission d’une
variable indépendante normalement corrélée avec une ou plusieurs variables
indépendantes incluses dans le modèle peut conduire à des estimations biaisées
et inconsistantes. D’un autre côté l’omission d’une variable indépendante non
4
Chapitre I. Introduction à l’analyse des données.
corrélée avec une variable indépendante retenue ne conduit pas à une sur-
estimation de leurs variances. D’une manière générale l’omission d’une variable
importante est l’une des causes principales de l’erreur de spécification puisque le
modèle est censé reproduire la réalité (Bagozzi 1980 p 97 cité par Diamontopolos
A.1994 p 108).
Variable médiatrice.
Dans certains modèles de relations entre deux variables V1 et V2, on peut se
rendre compte de la nécessité d’interposer une troisième variable V3 dite
variable médiatrice et considérer que l’effet de V1 sur V2 n’est pas forcément
direct.
Une variable a le statut de variable médiatrice quand les conditions suivantes
sont réunies (Baron, R. M., & Kenny, D. A. 1986)7 :
Les niveaux de variation de la variable indépendante déterminent d’une
manière significative la variable présumée médiatrice (chemin a).
La variable présumée médiatrice détermine d’une manière significative la
variable dépendante (chemin b).
Quand les chemins a et b sont contrôlés, l’effet de la variable
indépendante sur la variable dépendante est moins significatif ou nul.
o Si le chemin c est nul, la variable médiatrice est unique et
dominatrice.
o Si le chemin c n’est pas nul, ceci indique l’existence éventuelle de
plusieurs facteurs médiateurs.
Figure N° 4 : Schéma de modèle avec variable médiatrice.
5
Chapitre I. Introduction à l’analyse des données.
1
Fernández-Gago, R., Cabeza-García, L., & Nieto, M. (2016). Corporate social responsibility, board
of directors, and firm performance: an analysis of their relationships. Review of Managerial
Science, 10(1), 85-104.
2
Ahmed, P. K., Rafiq, M., & Saad, N. M. (2003). Internal marketing and the mediating role of
organisational competencies. European Journal of Marketing, 37(9), 1221-1241.
6
Chapitre I. Introduction à l’analyse des données.
3
Chan, S. H., & Song, Q. (2020). Insight into the process of responsibility judgment of an audit
failure. International Journal of Accounting & Information Management.
7
Chapitre I. Introduction à l’analyse des données.
8
Chapitre I. Introduction à l’analyse des données.
Les quatre règles ne sont pas respectées, la variable FMK ne joue pas le rôle de
variable médiatrice.
Tableau N° 2 : Résultats de l’estimation des quatre équations.
R R² R² F p Ct Coef Sig. Coef Sig. Vérificatio
(ajust 1 2 n règle
é)
Equation 1 : ,25 ,251 79,28 0 0,48 ,00 Règle 1 :
FMK=Ct+b1*PROAC 2 4 1 0 oui
Equation 2 : ,32 ,10 ,100 6,30 PROAC FMK Règle 3:
BGC=Ct+b3*PROAC+b4*F 0 2 4 Non
MK -,42 ,00 -,200 ,OO Règle 4
5 0 5 NON
9
Chapitre I. Introduction à l’analyse des données.
Variable modératrice
Dans certaines recherches, l’effet d’une variable X sur une autre Y n’est pas
absolu mais dépend à son tour d’une autre variable M qui intervient pour
modérer l’effet de la première sur la deuxième. Contrairement à une variable de
contrôle, une variable modératrice fait l’objet d’une hypothèse de recherche.
Figure N° 10 : Schématisation de la place de la variable modératrice.
(Variable
modératrice)
M
Variable Variable
indépendante dépendante
X Y
10
Chapitre I. Introduction à l’analyse des données.
En général, une variable modératrice est une variable qualitative (sexe, race,
classe) ou quantitative (niveau de récompense) qui affecte la direction et/ou la
force de la relation entre une variable indépendante ou prédictive et une
variable dépendante ou critère. (R.M. Baron & D.A. Kenny 1986)13
11
Chapitre I. Introduction à l’analyse des données.
Source : Ko de Ruyter, Marcel van Birgelen, Martin Wetzel (1985), Consumer ethnocentrism in international
services marketing ; International Business Review; 7 185–202
Ces variables agissent sur l’effet des tendances ethnocentriques sur l’attitude des
consommateurs envers les produits importés.
En marketing International, Erramelli et Roa (1998)16 souhaitent mesurer l’effet
de la spécificité de l’actif sur la proportion de partage de contrôle en faisant
intervenir plusieurs variables modératrices dont l’intensité du capital,
l’inséparabilité du service etc.
Figure N° 13 : Modèle de la spécificité de l’actif sur la propension de contrôle.
12
Chapitre I. Introduction à l’analyse des données.
13
Chapitre I. Introduction à l’analyse des données.
4
Fernández-Gago, R., Cabeza-García, L., & Nieto, M. (2016). Corporate social responsibility, board
of directors, and firm performance: an analysis of their relationships. Review of Managerial
Science, 10(1), 85-104.
14
Chapitre I. Introduction à l’analyse des données.
X Y
Ce type de variable est continu. Soit les variables y et x est la relation y=a+b*x. La
forme de la relation entre x et y est également fonction d’une autre variable z.
La relation prend la forme : y=a+ (b1+b2*z)*x ce qui peut s’écrire autrement
y=a+b1*x+b2*z*x.
Dans ce type de modèle, on peut constater que la variable modératrice
n’interagit pas avec la variable critère (y), il s’agit de variable pure modératrice.
La variable quasi modératrice.
Une variable est quasi modératrice quand on prévoit une interaction avec la
variable critère et le modèle prend la forme suivante : y=a+b1x+b3z+b2z*x.
Figure N° 18 : Cas de modèle avec une variable quasi modératrice
Z
X Y
15
Chapitre I. Introduction à l’analyse des données.
Source : Nasution, M. D. T. P., & Rossanty, Y. (2018). Country of origin as a moderator of halal
label and purchase behaviour. Journal of Business and Retail Management Research, 12(2).
16
Chapitre I. Introduction à l’analyse des données.
Source: Subhash Sharma; Richard M Durand; Oded Gur-Arie (1981) Identification and analysis of
moderator variables JMR, Journal of Marketing Research (pre-1986); Aug 1981; 18, 3
La variable Modératrice homogénéisante.
La variable de ce type correspond à celle qui influence la force de la relation
entre une variable critère et une variable prédictive sans qu’elle n’interagisse
avec cette dernière et n’est pas significativement liée avec les deux variables.
Dans ce cas particulier, la variable modératrice est qualitative, elle est retenue
dans une recherche pour tenir compte des différences entre les observations
classées en groupes homogènes.
Figure N° 21 : Exemple de modèle avec variable modératrice de type
« homologizer »
17
Chapitre I. Introduction à l’analyse des données.
18
Chapitre I. Introduction à l’analyse des données.
19
Chapitre I. Introduction à l’analyse des données.
A.
20
Chapitre I. Introduction à l’analyse des données.
Variable de Contrôle.
Dans certaines recherches et notamment expérimentales, on fait intervenir dans
l’analyse des variables dont on souhaite tout simplement éliminer ou atténuer
l’effet sans vouloir forcément mesurer leur effet sur la variable dépendante. Ce
type de variables est appelé variables de contrôle. « Une variable de contrôle est
la quantité que les scientifiques gardent constante mais l’observe aussi
attentionnée que la variable dépendante ». Elle est celle qui intervient dans
l’estimation d’une relation sans qu’elle fasse l’objet d’une hypothèse de
recherche. Ce qui différencie donc une variable explicative X d’une variable de
contrôle C c’est l’absence d’hypothèse de recherche.
Figure N° 24 : Variable de contrôle.
X (indépendante, H1 Y (dépendante, à
explicative) expliquer)
C (Contrôle)
5
Huang, T. C., Lawler, J., & Lei, C. Y. (2007). The effects of quality of work life on commitment and
turnover intention. Social Behavior and Personality: an international journal, 35(6), 735-750.
21
Chapitre I. Introduction à l’analyse des données.
22
Chapitre I. Introduction à l’analyse des données.
23
Chapitre I. Introduction à l’analyse des données.
Kim, T., & Chang, K. (2014)28 ont étudié les effets de l'engagement
organisationnel et de l'engagement des employés dans les entreprises coréennes
sur leurs intentions de quitter et leurs comportements de citoyenneté
organisationnelle. En outre, en utilisant l'analyse des effets interactionnels, cette
étude a examiné les effets d'interaction des deux types de prise en compte des
intentions du roulement et des comportements de citoyenneté
organisationnelle. Au total, 209 employés dans neuf entreprises différentes ont
participé à cette étude. Les résultats ont révélé que l'engagement
organisationnel avait un effet négatif sur les intentions du chiffre d'affaires, alors
que les engagements professionnels avaient un effet positif. En outre,
l'engagement organisationnel a eu un effet positif sur les comportements de
citoyenneté organisationnelle, alors que l'engagement professionnel n'a pas eu
d'effet notable sur celui-ci. L'engagement organisationnel et l'engagement
professionnel ont montré certains effets d'interaction globaux concernant les
comportements de citoyenneté organisationnelle ainsi que les intentions de
roulement
Tableau N° 7 : Résultats de la régression avec variable de contrôle.
Unstandardized Standardized R²
Coefficients Coefficients R²ajust F ∆R²
B Std. Error Beta t Sig.
Mode (Constant) 4,244 ,497 8,545 ,000 0,064 0,048 2,970
l1 Age -,460 ,179 -,242 -2,562 ,011
Gender -,026 ,266 -,007 -,099 ,921
Education -,054 ,118 -,033 -,460 ,646
Organization ,051 ,207 ,017 ,244 ,808
24
Chapitre I. Introduction à l’analyse des données.
Working_year -,007 ,027 -,022 -,246 ,806
Mode (Constant) 5,180 ,515 10,049 ,000
l2 Age -,204 ,148 -,107 -1,375 ,171
Gender ,059 ,219 ,017 ,271 ,786
Education -,129 ,097 -,077 -1,328 ,186 18,26
0,389 0,368 0,325
Organization -,130 ,170 -,043 -,764 ,446 6
Working_year -,015 ,022 -,052 -,704 ,482
Org_commit -,657 ,069 -,566 -9,531 ,000
Occup_commit ,438 ,065 ,402 6,718 ,000
a. Dependent Variable : Turnover
25
Chapitre I. Introduction à l’analyse des données.
Dans une recherche en marketing, J.E. McGee et al. (1995)33 deux variables ont
été retenues comme étant deux variables de contrôles : l’année de la création de
la société et le total de l’actif, la première servirait pour contrôler l’année
d’entrée dans l’industrie et la deuxième pour contrôler la taille de la firme.
L’estimation de l’effet des variables de contrôle a été faite avec les variables
objets d’hypothèses.
26
Chapitre I. Introduction à l’analyse des données.
Les résultats sont résumés dans le Tableau N° 8. La variable SIZE n’a pas d’effet
significatif sur la variable dépendante (t de student <1,96) et le fait de la
contrôler ou non la variable SIZE ne modifie en rien les coefficients de régression
des différentes variables explicatives.
Tableau N° 8 : estimation des paramètres de régression pour le modèle avec et
sans la variable de contrôle.
Avec la variable de contrôle Sans la variable de contrôle
Coefficients
Coefficients non Coefficients non Coefficients
standardisés standardisés standardisés standardisés
Ecart Sig. Ecart
Modèle B standard Bêta t B standard Bêta Bêta t Sig.
27
Chapitre I. Introduction à l’analyse des données.
(Constante) ,149 ,208 ,714 ,480 ,311 ,165 1,886 ,066
PRCL -,001 ,008 -,013 -,108 ,915 ,000 ,008 ,002 ,013 ,989
MUSPOP ,365 ,159 ,285 2,296 ,027 ,363 ,160 ,284 2,267 ,029
IGSCORE ,046 ,013 ,488 3,619 ,001 ,054 ,011 ,575 4,941 ,000
IAH ,003 ,002 ,258 1,926 ,061 ,004 ,001 ,329 2,691 ,010
SIZE ,023 ,019 ,182 1,255 ,216
R² Ajusté ,392 ,384
F 6,932 8,163
Sig. 0,000 0,000
Approche des résidus.
L’approche des résidus consiste à estimer le modèle avec les variables de
contrôle uniquement et calculer le résidu qui devient une nouvelle variable
dépendante. Puis estimer le modèle en expliquant le résidu par les variables
explicatives (sans les variables de contrôle).
Cette manière d’intégrer les variables de contrôle est observée en marketing
dans la recherche de R. L Hess Jr et al. (2003 p135) 36. Ces auteurs estiment le
modèle de régression uniquement avec les variables de contrôle, puis retiennent
le résidu comme variable dépendante et font intervenir les variables objets
d’hypothèse.
i. Application de la méthode des résidus en économie
Pour illustrer cette approche, nous utilisons les données de l’ Article de Goldsmith, A.
A. (1995)37. Dans cet article, nous disposons d’une matrice des données initiales
sur 59 pays en sous-développement et en transition. Cet article explore la
relation entre les facteurs institutionnels (PIBGROW est le taux de croissance
moyen du PIB pour les six années 1988 à 1993, GDINV est l'investissement
intérieur brut en pourcentage du PIB en 1990, EXPORT est les exportations en
pourcentage du PIB en 1990, EXSOC est une variable artificielle désignant les
pays de l’ex bloc socialiste, POLRGTS est l’indice des droits politiques de Freedom
House pour 1992-1993 et PROPINDX est l’indice des droits de propriété et de
l’héritage) et la croissance dans les années 80 et le début des années 90. En
introduisant la variable de contrôle, l’auteur remarque que de toute évidence,
les facteurs institutionnels n’ont qu’une influence sur la croissance économique.
Il existe une diversité de modèles théoriques pour expliquer les changements de
revenus nationaux, et la plupart des modèles contiennent des variables
économiques plus conventionnelles. Un problème d'endogénéité existe
probablement, car des facteurs économiques peuvent également être corrélés
avec les droits politiques et économiques et ainsi colorer leurs effets. Pour isoler
le rôle des institutions, davantage de variables explicatives sont nécessaires pour
pouvoir identifier leur relation avec la variable dépendante (taux de croissance
annuel du produit national brut de 1980 à 1990). La part des dépenses dans le
28
Chapitre I. Introduction à l’analyse des données.
produit intérieur brut a été introduite en tant que variable de contrôle. Seules
les variables présentées dans le Tableau N° 9 sont retenues dans la présente
analyse en raison du manque d’information sur les autres variables.
Tableau N° 9: Statut des variables dans le modèle estimé
Variable dépendante Variables indépendantes Variable de contrôle
GDPGROW : Average annual GDINV EXPORT
growth rate of GDP (1988-93 POLRGTS
or available years). PROPINDX
En faisant cette régression, nous obtenons une nouvelle colonne dans la matrice
initiale qui contient la variable dépendante après avoir neutraliser la variable de
contrôle.
Tableau N° 10: Chemin à suivre sur SPSS pour effectuer une régression sur la
variable de contrôle et enregistrer le résidu non standardisé.
29
Chapitre I. Introduction à l’analyse des données.
30
Chapitre I. Introduction à l’analyse des données.
Total 57,792 58
a. Variable dépendante : Unstandardized Predicted Value
b. Prédicteurs : (Constante), GDINV is gross domestic investment as a percent of the GDP in
1990, POLRGTS is the Freedom House political rights index for 1992-93, PROPINDX is the
Heritage Foundation index of property rights
31
Chapitre I. Introduction à l’analyse des données.
GDINV is gross
domestic
investment as a ,046 ,055 ,104 ,838 ,406 ,909 1,100
percent of the
GDP in 1990
a. Variable dépendante : GDPGROW is the average growth rate of the GDP for the six years
1988 to 1993: dependant variable
Intégration de la variable de contrôle par la corrélation
partielle.
Dans le calcul de la corrélation linéaire on peut être amené à contrôler une
variable d’où la nécessité de faire appel à la corrélation partielle.
Figure N° 28 : Corrélation partielle entre Ventes et Prix sous contrôle MTB
Variables de contrôle Prix Ventes
mtb Prix Corrélation 1,000 -,141
Signification (bilatérale) . ,404
ddl 0 35
Ventes Corrélation -,141 1,000
Signification (bilatérale) ,404 .
ddl 35 0
Intégration de la variable de contrôle dans le test de Chi2.
Quand il s’agit de deux variables nominales et quand il s’agit de contrôler
l’association par la prise en compte d’une troisième variables on utilise le test de
chi2 avec variable de contrôle. Pour illustrer ce cas, nous faisons appel à une
matrice initiale disponible sur SPSS « Satisf.sav”. Cette matrice est le résultat
d’une enquête38 menée par une chaîne de magasins. Afin de déterminer le taux
de satisfaction de la clientèle, une entreprise de vente au détail mène des
enquêtes sur 582 clients en 4 endroits différents (magasins). Une enquête auprès
d’un échantillon de clients est faite dans quatre points de vente pris au hasard
D'après les résultats de l'enquête, on a constaté que la qualité du service client
était le facteur le plus important de la satisfaction globale du client. Compte tenu
de ces informations, la direction souhaite tester si chacun des magasins offre un
niveau de service similaire des autres.
32
Chapitre I. Introduction à l’analyse des données.
Figure N° 29 : Chemin sur SPSS pour une analyse de satisfaction client.
33
Chapitre I. Introduction à l’analyse des données.
34
Chapitre I. Introduction à l’analyse des données.
ait ou non des contacts avec le représentant du service. D’où l’idée de contrôler
une variable traduisant les différences.
Le test du chi-carré est effectuée séparément pour les clients qui ont fait et pour
ceux qui n'ont pas eu contact avec un représentant du magasin. Bien que n'étant
pas directement liée à la qualité du service rendu par vos employés, on peut
considérer une analyse séparée de ces clients afin de déterminer s'il ya un autre
facteur qui explique cette relation.
Figure N° 32 : Test de Chi2 avec intégration d’une variable de contrôle.
35
Chapitre I. Introduction à l’analyse des données.
Effectif
3 9,4 10,1 15,5 9,6 11,5 56,0
théorique
Effectif 10 21 25 12 24 92
Magasin
Effectif
4 15,4 16,6 25,4 15,7 18,8 92,0
théorique
Effectif 49 53 81 50 60 293
Total Effectif
49,0 53,0 81,0 50,0 60,0 293,0
théorique
Effectif 25 20 38 30 33 146
Magasin
Effectif
1 23,3 26,3 39,4 28,1 28,8 146,0
théorique
Effectif 26 30 34 27 19 136
Magasin
Effectif
2 21,7 24,5 36,7 26,2 26,9 136,0
théorique
Magasin
Effectif 15 20 41 33 29 138
Magasin
Total Effectif
3 22,1 24,9 37,2 26,6 27,3 138,0
théorique
Effectif 27 35 44 22 34 162
Magasin
Effectif
4 25,9 29,2 43,7 31,2 32,0 162,0
théorique
Effectif 93 105 157 112 115 582
Total Effectif
93,0 105,0 157,0 112,0 115,0 582,0
théorique
Source: Edwards J.R. and R.P. Bagozzi (2000), On the Nature and Direction of relationships
Between Constructs and Measures; Psychological Methods, Vol 5 N°2 pp 115-174.
« Une échelle est constituée d’indicateurs réflexifs, dont les valeurs sont causées
par un construit sous-jacent. C’est la température qui cause la variation du
thermomètre et non le contraire. C’est l’attitude bonne ou mauvaise qui cause la
réponse pas du tout d’accord/ tout à fait d’accord à un item et non le contraire »
Darpy (1999-2003)44
Dans une échelle de mesure de l’ethnocentrisme (CETSCALE) de Shimp et Sharma
1987)45, c’est le niveau d’ethnocentrisme chez l’individu qui cause la réponse
37
Chapitre I. Introduction à l’analyse des données.
Tout à fait d’accord à pas du tout d’accord à chacun des 17 items de mesure et
non le contraire.
Dans le modèle réflexif, le construit exerce un effet de causalité sur la variable
observable.
La mesure est formée de deux composantes : la composante réelle « true score
t » et la composante de l’erreur « random score e » (Lord and Novick 196846 cités
par D/ W GERBING ; J.C ANDERSON 1984)47. La mesure peut donc s’écrire : x=t+e
sachant que Cov(t,e)=0 et E(x)=t
La valeur réelle étant définie comme la valeur espérée de la mesure. L’erreur e
représente des inconsistances liées à des mesures parallèles. L’erreur est
aléatoire. Ce raisonnement fait pour une seule mesure est valable pour des
mesures multiples.
La relation de causalité prend la forme suivante : xi=lix+di où xi désigne la
variable observable, x : la variable latente ou le construit ; li la contribution
factorielle représentant l’effet de x sur xi et di l’erreur de mesure aléatoire.
Le modèle de mesure Formatif.
Depuis une dizaine d’années, la mesure formative gagne du terrain au dépend de
la mesure réflexive. Les chercheurs en sociologie sont ceux qui ont en fait le plus
grand usage (Curtis and Jakson 1962), Blalock 1964, 1971 et Land 1970). Les
chercheurs en Marketing adoptant la mesure formative sont plutôt rares (Fornell
et Bookstein 1982) et Diamantopolos 48 cite à ce propos Diamantopoulos and
Winklhofer (2001) et plus récemment Rossiter (2002) and Jarvis et al. (2003).
La mesure formative est décrite par Blalock (1971) 49 cité par Jeffrey R. Edwards
and Richard P. Bagozzi 2000)50 pour désigner la variable latente mesurée par une
ou plusieurs de ses causes. De même MacCallum et Brown (1993, p 533) et
Bedeian, Day et Kelloway (1997 p 788) précisent que les mesures formatives
peuvent être considérées comme des causes de la variable latente.
L’idée commune des modèles de mesures formatives part du principe qu’il est
possible de constater que des indicateurs (variables observables) peuvent causer
la variable latente et non le contraire (MacCallum, R.C.and M.W.Browne (1993 51)
cité par A.Diamantopoulos ; Heidi M Winklhofer 52. On confond souvent entre
indicateur formatif et indicateur causal53.
Bagozzi (1994)54 remarque quand une variable latente est définie comme une
somme linéaire d’un ensemble de mesures ou quand un ensemble de mesures
d’une variable dépendante est déterminé par une combinaison linéaire des
mesures de variables indépendantes, les mesures sont appelées indicateurs
formatifs. Le construit formatif est confondu avec la notion d’indice différent à
son tour de la notion d’échelle.
38
Chapitre I. Introduction à l’analyse des données.
L’exemple typique de la variable latente cité dans ce sens est celui du statut
socioéconomique (Hausser et Goldbeger 1971 et Haisser1973) 55, celui de la
réussite dans la carrière professionnelle (Judge et Bretz 1994 56) et celui de la
qualité de la vie (Bollen and Ting 2000 57, Fayers, hand, Bjordal and Groenvold
199758).
En ce qui concerne le statut socio-économique qui n’est autre qu’une
combinaison de variables observables comme l’éducation, le revenu, la
profession et le lieu de résidence Ces variables forment donc le concept latent.
La dimension formative est manifestée par le principe que si une composante du
statut socioéconomique, le revenu par exemple augmente, ledit statut augmente
sans pour autant qu’un changement soit constaté dans les autres composantes.
A l’inverse le statut socioéconomique d’un individu peut augmenter sans qu’il ne
soit accompagné par une augmentation systématique des quatre composantes
(A. Diamantopoulos ; H. M Winklhofer (2001))59.
Tableau N° 20: Modèle formatif
Modèle formatif sans erreur Modèle formatif avec erreur
d’estimation (ξ) d’estimation (ξ)
ζ
x1 γ1
x1 γ1 1
η
η x2
x2 γ2
γ2
γ3
x3
γ3
x3
Eta=γ1*x1+ γ2*x2+ γ3*x3 Eta=γ1*x1+ γ2*x2+ γ3*x3+ζ
39
Chapitre I. Introduction à l’analyse des données.
40
Chapitre I. Introduction à l’analyse des données.
X7
X8
Pour illustrer ce modèle, nous nous empruntons à Winklhofer et al. (2002) leur
application. Les auteurs s’intéressent à la variable latente efficacité de la
prévision, elle est mesurée d’une manière réflexive par trois items (y1, y2 et y3)
et d’une manière formative par huit autres items (x1 à x8).
Tableau N° 21 : Les items réflexifs et les items formatifs
Items formatifs Items réflexifs
x1 = % moyen d’erreur absolue à court terme y1 = Meilleure compétence
x2 = % moyen d’erreur absolue à moyen terme des prévisions à l’export
x3 = Fréquence des fois où les ventes dans l’industrie.
prévisionnelles ont tendance à sous-estimer les y2 = Confiance des preneurs
ventes réalisées à l’export. de décision dans les
x4 =tendance de surestimation des ventes à prévisions effectuées.
l’export. y3 = comparées aux
x5 = préparation à l’avance des prévisions et des concurrents les aptitudes de
décisions relatives à l’export. prévision des ventes sont
x6 = retard dans la réception des informations meilleures.
par le preneur de décision.
x7 = Le coût de l’information pour les opérations
à l’export sont toujours souvent prohibitive.
Environnemental turbulence
x8 = Turbulence de l’environnement
Dans la formulation des hypothèses, les auteurs font allusion à la nature du lien
entre chaque item et la variable latente.
Comparaison entre construit réflexif et construit formatif.
Après avoir présenté les caractéristiques de chacun des deux modèles de
mesure, nous procédons à présent à une comparaison dans l’espoir de lever
toute équivoque entre les deux modèles.
41
Chapitre I. Introduction à l’analyse des données.
variable catégorique ne peut être intégrée dans le modèle que si elle est
convertie en variable (s) artificielles (s) codée 0 ou 1.
Dans une étude on peut observer des sous-groupes dans un échantillon, par
exemple il s’agit d’expliquer la performance des commerciaux par la taille de leur
territoire et leur expérience. L’expérience étant une variable nominale
permettant d’observer deux sous-groupes : les commerciaux ayant plus de 5 ans
d’expérience et ceux qui ont moins de cinq ans d’expérience.
Pour traiter ce cas, il est possible d’emprunter l’une des deux voies suivantes :
La première : Procéder par une analyse statistique (régression par
exemple) en considérant les groupes de l’échantillon séparément et de
faire autant d’analyse statistique que de sous-groupes. Cette solution
n’est possible que si la taille de l’échantillon est importante et le nombre
de modalités de la variable catégorique désignant les sous-groupes est
faible.
Quand ce n’est pas le cas, il est possible d’estimer un seul modèle (de
régression par exemple) en considérant des groupes multiples dans une
même étude. Les variables artificielles constituent la solution pour ce cas
particulier.
43
Chapitre I. Introduction à l’analyse des données.
Figure N° 35 : Manière sur SPSS pour créer des variables artificielles.
Tableau N° 23 : Matrice des données de vente après création des variables
artificielles.
Aptitude
vendeur
Vente Revenu (communi, Nombre Potentiel
moyenne annuel compet d'années du Région Région=G
réalisée moyen etc..) d'expérience territoire commerciale Genre Genre=Femme Genre=Homme Région=Tunis D Régions Région=autres
1 40128 713 1,27 4,08 179,50 GD Femme OUI Non Non OUI Non
Régions
2 35700 823 1,05 3,65 144,00 GD Femme OUI Non Non OUI Non
Régions
3 62639 1031 1,09 6,37 179,00 autres Homme Non OUI Non Non OUI
4 28274 1121 1,41 2,94 182,00 Tunis Femme OUI Non OUI Non Non
5 49306 1420 1,14 5,07 171,10 GD Femme OUI Non Non OUI Non
Régions
6 62080 1811 1,25 6,39 205,00 autres Homme Non OUI Non Non OUI
7 35343 1934 1,17 3,73 160,00 GD Femme OUI Non Non OUI Non
Régions
8 59660 2000 ,62 6,17 38,50 autres Femme OUI Non Non Non OUI
9 63596 2182 1,26 6,58 208,50 autres Femme OUI Non Non Non OUI
10 30542 2462 1,28 3,30 169,90 GD Femme OUI Non Non OUI Non
Régions
11 4140 2500 ,84 ,66 5,60 Tunis Homme Non OUI OUI Non Non
12 5216 2500 ,75 ,77 5,80 Tunis Homme Non OUI OUI Non Non
13 6454 2500 ,67 ,90 6,00 Tunis Homme Non OUI OUI Non Non
14 31677 2747 1,03 3,44 138,00 GD Femme OUI Non Non OUI Non
Régions
15 26512 2793 1,22 2,93 158,00 Tunis Femme OUI Non OUI Non Non
16 19152 2811 1,13 2,20 137,50 Tunis Femme OUI Non OUI Non Non
17 62291 2857 1,05 6,51 173,00 autres Femme OUI Non Non Non OUI
18 58375 2895 1,04 6,13 167,00 autres Femme OUI Non Non Non OUI
19 10986 3000 1,03 1,40 14,40 Tunis Homme Non OUI OUI Non Non
20 48000 3289 1,16 5,13 175,00 GD Femme OUI Non Non OUI Non
Régions
21 47751 3351 1,12 5,11 169,00 GD Femme OUI Non Non OUI Non
Régions
22 8131 3416 1,39 1,15 16,00 Tunis Homme Non OUI OUI Non Non
23 29100 3616 1,33 3,27 177,00 GD Femme OUI Non Non OUI Non
Régions
24 68270 4022 1,14 7,23 196,00 autres Femme OUI Non Non Non OUI
25 27017 4312 1,27 3,13 167,00 GD Femme OUI Non Non OUI Non
Régions
26 36036 4448 1,18 4,05 165,30 GD Femme OUI Non Non OUI Non
Régions
27 40656 4673 1,18 4,53 172,00 GD Femme OUI Non Non OUI Non
Régions
44
Chapitre I. Introduction à l’analyse des données.
28 53878 4768 1,10 5,86 174,90 GD Femme OUI Non Non OUI Non
Régions
29 20617 4797 1,34 2,54 167,90 Tunis Femme OUI Non OUI Non Non
30 40946 4824 1,14 4,58 166,00 GD Femme OUI Non Non OUI Non
Régions
Total N 30 30 30 30 30 30 30 30 30 30 30 30
a. Limité aux 30 premières observations.
45
Chapitre I. Introduction à l’analyse des données.
à-dire que l’instrument doit être décorrélé de la variable de choix choisie (par
exemple, la participation des marchés émergents) » H. Lu (2008 p27).
Pour illustrer la variable instrumentale, nous nous référons à l’exemple suivant :
il s’agit d’une « société de vente par correspondance a un club de lecture et un
club de CD. Chaque mois, ils proposent des offres spéciales aux membres du
club. L'entreprise souhaite créer un modèle pour le total des achats d'offres
spéciales du mois en fonction du total des achats de livres, des achats de CD et
du type d'offre accordée aux membres du club ».
La régression des moindres carrés en deux étapes est utile lorsqu'il existe des
boucles de rétroaction dans votre modèle. Par exemple, un club de lecture peut
vouloir modéliser le montant des ventes croisées aux membres, en utilisant le
montant que les membres dépensent en livres en tant que prédicteur.
Cependant, l'argent dépensé pour d'autres articles est de l'argent non dépensé
en livres, de sorte qu'une augmentation des ventes croisées correspond à une
diminution des ventes de livres. Il y a une boucle de rétroaction entre la réponse
et le prédicteur, ainsi l'erreur dans la réponse est corrélée au prédicteur.
La régression des moindres carrés en deux étapes convient à cette situation, car
l'argent dépensé pour des offres spéciales n'est pas de l'argent dépensé en livres
ou en CD; il y a donc une boucle de rétroaction entre la réponse et ces deux
prédicteurs.
La matrice des données est disponible sur SPSS, elle comprend quatre-vingt-dix-
neuf mois d'informations sur les ventes sont collectées dans « cross_sell.sav ». Le
fichier comprend également une variable, Offre spéciale, affichant l'offre spéciale
de chaque mois, qui a également été recodée en deux variables indicatrices,
l'offre articles et l'offre Chèques, pouvant être utilisées comme prédicteurs dans
les procédures de régression. Enfin, les remises mensuelles offertes aux
membres du club sont également répertoriées » SPSS.
46
Chapitre I. Introduction à l’analyse des données.
Equation 1 Multiple R
,383
R Square
,147
Adjusted R Square
,110
ANOVA
Sum of Squares df Mean Square F Sig.
Equation 1 Regression 1,851 4 ,463 3,994 ,005
Residual 10,772 93 ,116
Total 12,623 97
Coefficients
47
Chapitre I. Introduction à l’analyse des données.
Unstandardized Coefficients
B Std. Error Beta t Sig.
Equation 1 (Constant) -1,511 1,317 -1,147 ,254
buycd ,353 ,106 1,090 3,336 ,001
buybk ,189 ,116 ,542 1,626 ,107
offer_type2 ,303 ,105 ,300 2,899 ,005
offer_type1 ,130 ,091 ,117 1,425 ,158
Coefficient Correlations
buycd buybk offer_type2 offer_type1
Equation 1 Correlations buycd 1,000 ,410 ,371 -,082
buybk ,410 1,000 ,636 ,203
offer_type2 ,371 ,636 1,000 ,427
offer_type1 -,082 ,203 ,427 1,000
Ces résultats (Tableau N° 24) indiquent que le chiffre d’affaires prévu de l’offre
spéciale est égal à -1.511 + 0.353 * buycd + 0.189 * buybk + 0.130 * offer_type1
+ 0.303 * offer_type2. La valeur de signification pour offer_type1 est supérieure
à 0,05, ce qui indique que l’effet des petits appareils en tant qu’offre spéciale ne
se distingue pas de celui des jeux d’échecs commémoratifs. La valeur de
signification pour buybk est également supérieure à 0,05, mais il semble
probable que cela soit davantage dû à l’inadéquation des variables d’instrument
actuelles aux valeurs estimées de buybk générées qu’à l’adéquation de buybk en
tant que prédicteur des rachats. (SPSS)
48
Chapitre I. Introduction à l’analyse des données.
49
Chapitre I. Introduction à l’analyse des données.
Échelle nominale
L’échelle nominale appelée aussi catégorique non ordinale par opposition à
l’échelle catégorique ordinale63. « La variable statut social est par exemple un
exemple de variable catégorielle non ordinale où il n’est pas admis un
classement entre les personnes célibataires, mariées, divorcées ou veuves ».
Les variables catégoriques non ordinales sont confondues avec les variables
nominales où le classement des différentes modalités de réponse ne répond pas
à un ordre particulier.
La plus ancienne des 4 échelles. Dans cette échelle « les nombres utilisés sont
des codes qui ont un rôle d’identificateur de situations possibles » C. J. Huberty
et al. (1986)64. Les chiffres appelés codes n’impliquent pas des comparaisons
entre les objets ou les sujets dont on codifie le comportement ou la nature. Cette
échelle nécessite que l’on utilise le même code pour la même classe.
a. Échelle Binaire ou dichotomique
L’échelle binaire ou dichotomique est un cas particulier de l’échelle nominale.
Une différence est à faire entre une vraie dichotomie d’une dichotomie
artificielle. La première est une dichotomie réelle qui lui correspond deux
catégories distinctes comme par exemple être un homme ou une femme. Une
vraie dichotomie est à distinguer d’une dichotomie artificielle par le fait qu’on ne
peut pas « imaginer un continuum quelconque sous-jacent à l’une ou à l’autre de
ces catégories » Jacques Baillargeon 65.
Une échelle dichotomique artificielle correspond à « des dimensions continues
que l'on présume être distribuées normalement dans la population, mais qui,
pour diverses raisons, ont dû être mesurées grossièrement en seulement deux
niveaux ». Nous pouvons citer par exemple « être client de l’entreprise ou client
de la concurrence » Jacques Baillargeon.
Échelle Ordinale.
Elle s’ajoute à l’échelle nominale pour éventuellement procéder à des
comparaisons entre objets par rapport à la même variable nominale.
« Les variables catégorielles ordinales sont celles qui retiennent un certain ordre
dans les modalités. La variable CSP est pour certain assimilée à une variable
catégorielle ordinale puisque on admet un classement économique et social des
différentes catégories ».
Échelle Intervalle.
Elle s’ajoute à l’échelle ordinale pour permettre de déterminer de combien, en
plus ou en moins une caractéristique est présente dans un élément. L’unité de
50
Chapitre I. Introduction à l’analyse des données.
mesure et le point zéro sont fixés arbitrairement. Elle possède des unités de
mesures constantes
« On cite l’exemple classique des échelles de Fahrenheit et Celsius pour mesurer
des températures. On peut faire « des inférences quant aux différences entre les
entités que l’on mesure » (1) On ne peut pas dire qu’une valeur est un multiple
de l’autre. Les différences entre les valeurs d’une échelle peuvent être exprimées
comme des multiples les unes des autres. On peut utiliser la plupart des mesures
statistiques : La moyenne, L’écart type, La corrélation.
Echelle Proportionnelle ou ratio.
Elle « constitue l’élite des échelles », elle autorise le calcul de toutes les
opérations arithmétiques et elle possède un point zéro unique. On les trouve
dans les sciences physiques pour mesurer la longueur, le poids etc. Cette échelle
permet la comparaison des rapports.
Comparaison entre les échelles.
Il est possible de comparer les quatre échelles par rapport à l’existence ou non
d’un ordre, de l’égalité ou non des intervalles et l’existence ou non d’un point
zéro.
Figure N° 40 : Types des échelles de mesure.
51
Chapitre I. Introduction à l’analyse des données.
Une proposition d’Evrard et al. (2002)66 permet de lever certaines difficultés dans
la qualification d’une échelle à allouer à une variable donnée.
52
Chapitre I. Introduction à l’analyse des données.
Source : Evrard, Pras et Roux (2002), Market, Fondements et Méthodes des recherches en Marketing ;
DUNOD P 303
une enquête refuse de donner une information précise et donc métrique sur une
donnée particulière (ex chiffre d’affaires). Une autre raison réside dans la
disponibilité d’une information métrique mais celle-ci ne respecte pas une
condition d’application d’une méthode choisie comme par exemple la normalité.
La solution de convertir l’échelle métrique en échelle ordinale ou nominale.
La transformation de l’échelle n’est pas possible dans tous les sens, elle n’est
possible que d’une échelle métrique à une échelle ordinale ou nominale.
Figure N° 42 : Transformation de l’échelle.
54
Chapitre I. Introduction à l’analyse des données.
différentielle. Sa forme est unipolaire allant par exemple d’une réponse négative
à une autre positive (D. Menezes et al.1979)68.
Échelle différentielle de Thurstone
« L’échelle différentielle de Thurstone (à ne pas confondre avec la loi du
jugement comparatif que nous avons vue plus haut) pour but d’aboutir à des
mesures d’intervalles, et elle utilise la méthode des intervalles apparemment
égaux. Bien que l’on puisse être tenté de considérer cette technique comme
relevant de la méthode « jugement » plutôt que de la méthode « réponse »,
nous choisirons pour notre part de la considérer comme une méthode de «
réponse », en raison de la sévérité des hypothèses qui lui sont sous-jacentes »
Green et Thill (1972).
D’un point de vue pratique, la mise en œuvre de cette technique passe par les
étapes suivantes:
Le chercheur rédige un grand nombre (100 à 150) de propositions qui sont en
relation avec l’attitude qu’il étudie. Ces propositions peuvent être obtenues
grâce aux réponses d’un grand nombre de personnes interrogées de manière
non- directive, ou elles peuvent être conçues par les chercheurs eux-mêmes.
On demande à plusieurs « juges » de classer les propositions en onze groupes
« égaux » qui vont du « plus favorable » au « moins favorable » pour un
attribut particulier. Le sixième groupe constitue le point « neutre».
On détermine pour chaque item (proposition) une valeur de mesure, en
pondérant la moyenne ou la médiane par les fréquences observées chez les
juges.
On choisit enfin 20 à 25 propositions, en utilisant seulement les propositions
dont la variance, pour l’ensemble des juges, est « relativement faible ».
Dans le questionnaire final, qui se compose des 20 à 25 items, les
propositions sont présentées en ordre aléatoire, et l’on demande au sujet
d’indiquer seulement celles avec lesquelles il est en accord.
La moyenne (ou la médiane) des valeurs d’échelles du sujet correspond alors
à son « score » total pour l’attribut qui est mesuré. Donc, en définitive, on
échelonne ainsi les sujets et les stimuli.
Échelle sémantique différentielle
L’échelle sémantique différentielle a été conçue par Osgood et ses collaborateurs
(Osgood CE. Et al. (1957)69. Elle permet d’analyser à la fois l’intensité et le
contenu des attitudes des répondants à l’égard d’entités telles que l’image.
La démarche consiste à demander aux répondants de décrire un phénomène
(objet de l’étude), au moyen d’un ensemble de couples d’adjectifs opposés, du
55
Chapitre I. Introduction à l’analyse des données.
Source: Green, Paul E., and Tull, Donald S., Research for Marketing Decisions, Prentice Hall, Englewood Cliffs,
N.J., 1978.
La technique Q-Sort.
La technique Q-sort a pour objectif de comparer les individus, et non d’obtenir
des valeurs d’échelle en tant que telles. Les phases de sa mise en œuvre sont les
suivantes (F.N. Kerlinger 196470 cité par Green et Tull 1972). On fournit au sujet
un grand nombre d’items (75 à 150) et on lui demande de les disposer en onze
groupes, allant du « plus favorable » au « moins favorable ».
Contrairement à ce qui est fait dans la technique de Thurstone, qui a pour but de
déterminer des valeurs d’échelle (en supposant que des « juges » puissent
classer les propositions en divers groupes, de caractère plus ou moins favorable),
dans la technique Q-sort on demande au sujet d’indiquer son degré d’accord ou
de désaccord avec l’item considéré. Donc, si le sujet approuve énergiquement
l’item, il le place dans un groupe extrême, etc...
D’autre part, le sujet doit placer dans chaque groupe un nombre d’items
prédéterminé, qui est fixé de manière à obtenir pour l’ensemble une distribution
finale approximativement normale.
On attribue un « score » à chaque groupe. Dans cette technique, on ne
s’intéresse non pas aux scores totaux des sujets, mais au degré de similitude
entre divers sujets pour chacun des items. On peut obtenir cette similitude par
une analyse de corrélation classique.
On peut adresser à la technique Q-sort un certain nombre de critiques qui ont
déjà été faites à propos des techniques de Likert, de Thurstone et de
scalogramme. On utilise en général la technique Q-sort pour classer les sujets en
fonction de leur « similitude » relativement à l’attitude qui est mesurée. Dans ce
cas, cette technique peut en outre être critiquée du point de vue statistique (F.N.
Kerlinger 1964 cité par Green et Tull 1972) 71. La principale difficulté inhérente à
ces trois types « d’échelles » est peut-être due au fait que nous avons affaire
56
Chapitre I. Introduction à l’analyse des données.
aussi bien à des différences entre stimuli qu’à des différences entre sujets, et au
fait que certaines attitudes peuvent ne pas être échelonnables.
Types d’hypothèses
Selon la nature de la problématique et de l’objectif de recherche, on distingue
entre plusieurs formes d’hypothèses. Avant de présenter les différentes formes
d’hypothèses de recherche, nous mettons le point sur la différence entre
hypothèse de recherche et hypothèse statistique.
A. Hypothèse statistique et Hypothèse de recherche.
Une hypothèse de recherche est à la base de la conceptualisation d’une relation
entre deux concepts ou de variables latentes. Une hypothèse statistique est une
traduction technique de la relation suivant une norme utilisée par les outils
statistiques.
57
Chapitre I. Introduction à l’analyse des données.
Indépendance des
observations
**Homogénéité des
répondants :
**Test paramétrique
si H0 de
normalité>0,05
**Test de V de
59
Chapitre I. Introduction à l’analyse des données.
Cramer
**Test non
paramétrique si H0
de normalité<0,05 de
kruskal-Wallis
***Test Test non
paramétrique si H0
de normalité<0,05 de
U de Mann-Whitney
Variance commune
attribuée à la
méthode « biais
CVM »
analyse factorielle H0 : La structure
exploratoire de F1 est
constituée d’un
seul construit
Indice de KMO et
Test de Bartlett
Hypothèse de recherche.
Les hypothèses de recherche et statistiques peuvent être classées en différentes
catégories (Figure N° 45). L’hypothèse de recherche est un énoncé formel qui
prédit la ou les relations attendues entre deux ou plusieurs variables. C'est une
solution plausible au problème de recherche. L’hypothèse de recherche émane
de la littérature. Elle est pertinente quand elle fait l’objet de manque de
recherches ou de controverse entre les auteurs.
60
Chapitre I. Introduction à l’analyse des données.
Unidirectionnelle
Directionnelle
Bidirectionnelle
Non
directionnelle
Statistique
Variable C
H2
Variable B
H3
61
Chapitre I. Introduction à l’analyse des données.
établir une relation de causalité d’une variable endogène sur une autre
endogène. C’est le cas de H4 dans la Figure N° 47.
Figure N° 47 : Modèle avec hypothèse de double causalité
Quel que soit le cas on est dans une relation dite de cause à effet. L’effort de
conceptualisation à ce propos consiste à trouver dans une relation les
symptômes de la causalité. J. R. Edwards et R. P. Bagozzi (2000 p23) 76 retiennent
un consensus sur les propriétés d’une relation de causalité (Asher, 1983; Bagozzi,
1980; Bollen, 1989; Cook & Campbell, 1979; Heise, 1975; James, Mulaik, & Brett,
1982) :
La causalité nécessite que la cause et l’effet soit deux entités distinctes. Quand
deux variables ne sont pas distinctes leur relation est tautologique et ne peut
être vue comme une relation de causalité.
La causalité nécessite une association c'est-à-dire que la cause et l’effet
covarient. L’association est vue sous l’optique de probabilité en admettant que la
cause accroît la vraisemblance de l’effet.
62
Chapitre I. Introduction à l’analyse des données.
63
Chapitre I. Introduction à l’analyse des données.
A B
64
Chapitre I. Introduction à l’analyse des données.
65
Chapitre I. Introduction à l’analyse des données.
Types de données.
Les données qu’on peut analyser dans une recherche peuvent prendre
différentes formes.
Différents types de données font l’objet de manipulations statistiques :
Les données de type sections-croisées « cross-section » ou transversales.
Les données de type séries chronologiques « time series »
Les données de type longitudinales.
Les données de type Panel “panel”
Chacun de ces trois types de données peut comporter :
Des données nichées ‘nested” ou non.
Des données censurées “censured” ou complètes.
Des données multiniveaux « multilevel » ou un seul niveau.
66
Chapitre I. Introduction à l’analyse des données.
Ce qui nous intéresse dans une analyse de type ce sont les différences entre les
sections (les observations). En comptabilité, nous citons Hans B. C. al. (2007)81
qui ont retenu un échantillon d’entreprises britanniques et allemandes pour
expliquer les différences en adopteurs et non adopteurs des IFRS. En marketing
nous citons à titre d’exemple la recherche de O. Kitapci et al. (2009)82 qui ont
retenu un échantillon de clients des banques pour expliquer les différences de
plainte entre clients fidèles et nouveaux arrivants.
xij correspond à la valeur prise par une entité observée (ou un individu) pendant
la période i par rapport à la variable j. x ij peut correspondre à une moyenne
67
Chapitre I. Introduction à l’analyse des données.
Données de Panel
A. Présentation des données de panel.
Il est possible de combiner dans une même recherche des données de type
sections-croisée et des données du type chronologique. Ce type de données est
appelé données de panel. On relève dans ce type de données une pertinence
informationnelle entre individus (cross-section) et à travers le temps (série
chronologique). L’idéal est que les données de panel soient mesurées à des
intervalles de temps réguliers (par exemple, année, trimestre et mois). Sinon, les
données du panel doivent être analysées avec prudence (Park, H. M. 2015) 84.
Tableau N° 30 : Données de type Panel (sections croisées x Séries chronologiques)
Observations Périodes V1 V2 …. …… Vp
O1 P1
O1 P2
…
O2 P1
O2 P2
O2 P.. xijm
..
68
Chapitre I. Introduction à l’analyse des données.
O3 P1
O3 P2
..
…..
ON P1
ON P2
…. …
ON Pl
6
Yu, L. (2018). Research on the Comprehensive Financial Competitiveness of Beijing, Tianjin and
Hebei Region Based on Principal Component Analysis. DEStech Transactions on Engineering and
Technology Research, (eeec).
69
Chapitre I. Introduction à l’analyse des données.
Données Nichées
Dans certaines recherches, les éléments de la population cible sont nichés, c'est-
à-dire rassemblés au sein de groupes (niches) et les individus à l’intérieur d’une
niche ont une certaine similarité qui se manifeste dans l’information collectée.
Les groupes ou les niches les plus représentés peuvent influencer les résultats. Si
le phénomène de niche est réel, la section devient la niche et non l’individu.
Par exemple, quand la population d’une recherche est composée de vendeurs
dans les grandes surfaces ou de commerciaux appartenant à des entreprises, il
est possible que des unités d’échantillonnage (le vendeur, le commercial)
puissent avoir une certaine similarité dans les réponses ou dans les informations
relevées. (S J Bell et al. 2004)93
L’analyse des informations provenant des individus appartenant à des entités
(niches) peuvent contenir des biais de redondance. Quand certaines entités sont
plus représentées que d’autres, la valeur du paramètre statistique ne reflète pas
l’état ou le comportement des individus. (J. Lawrence R. 1982) 94 (Osborne, J. W.
7
Xiong, S., Yang, D., & Xiong, X. (2020, September). Measurement and Evaluation of Regional
Financial Integration in Guangdong, Hong Kong and Macao: Based on the Panel Data from 2000
to 2018. In The 3rd International Conference on Economy, Management and Entrepreneurship
(ICOEME 2020) (pp. 85-90). Atlantis Press.
70
Chapitre I. Introduction à l’analyse des données.
(2000)95.
Différents tests ont été utilisés pour vérifier l’effet de niche (nested data) :
Le premier est le test d’Eta-carré (η²) permet de tester si deux
observations (employés par exemple) appartenant à une même unité
agrégée (un magasin par exemple) sont plus similaires que deux
employés appartenant à deux unités différentes. Une valeur de ce
paramètre dépassant le seuil 0,20 (Georgopilos 1986) 96 indique que la
présence d’effet de niche dans les données et que l’agrégation des
données est appropriée.
Le second test est suggéré par ICC (intra class correlation) de James et al.
(1984)97, il permet de mesurer le degré d’accord au sein d’une unité. Le
paramètre statistique, connu par rwg, doit excéder 0,70 pour constater
l’existence d’effet de niche et se prononcer pour un niveau élevé
d’agreement entre les répondants au sein d’une même unité.
Baruch, Y. et al. (2014 p p522) 98 ont mené une enquête auprès de 545 chefs de
projet dans 21 entreprises pour étudier la réussite dans la carrière. Avant de
mener les analyses nécessaires à la réalisation des objectifs de cette recherche,
les auteurs ont voulu vérifier la présence d’effet de niche c’est-à-dire la similarité
des réponses au sein des 21 entreprises des 545 chefs de projets. Une analyse de
la variance est menée et retient l’entreprise comme variable indépendante à 21
modalités (groupes) et les variables de l’étude comme variables dépendantes. Le
recours au rwg (ICC : intra-class correlation) pour décider de retenir le chef de
projet comme section (observation) et non l’entreprise et écarter l’effet de
niche.
Dans leur article S. J. Bell et al. (2004)99 utilisent la statistique d’Eta² et le test r wg
pour procéder à l’identification des données nichées. Les auteurs ont voulu
tester si un phénomène de niche existe dans les données d’une enquête auprès
d’un échantillon de 115 commerciaux appartenant à différents points de vente.
13 variables de l’étude ont fait l’objet des deux tests précédents. Les résultats
prônent la présence d’effet de niche et donc la possibilité d’exploiter les
informations par niche. En effet, les valeurs de Eta² sont supérieures à 0.20 et les
valeurs de rwg sont supérieures à 0,7.
Données censurées
La donnée de survie d’un sujet ou d’un objet pour lequel l’évènement n’est pas
survenu pendant la période d’observation est appelée « donnée censurée ». Une
donnée censurée est codée 1.
72
Chapitre I. Introduction à l’analyse des données.
P1 P2 P3 P4 P5 P6 P7 P8
Période d'observation
Fin de la
période
d'observati
on
73
Chapitre I. Introduction à l’analyse des données.
74
Chapitre I. Introduction à l’analyse des données.
" For individual-level measures, n = 220, for group-level measures, n = 34. * p < .05 * * p < .01
Il est très utile dans ce sens d’établir un tableau récapitulatif des éléments de la
méthodologie adoptée pour une recherche avant d’entamer le volet empirique.
Il est possible de trouver des tableaux de synthèse méthodologiques dans la
plupart des thèses réalisées sous notre direction ou en collaboration avec des
75
Chapitre I. Introduction à l’analyse des données.
76
Tableau N° 32 : Exemple de tableau récapitulatif de la méthodologie d’une enquête basée sur un questionnaire.
Concept de Tests et Tests et Tests de
base / Nature Nombre Question méthodes Concepts liés Echelles Nombre Question méthode Hypothèses Tests et Robustesse
variables de d’items N° d’analyse de mesure d’items N° s méthode
contrôle préliminaires d’analyse d’analyse
préliminaires
Source : Yangui Wasfi (2015) ; EFFET DE L’ASYMÉTRIE DU POUVOIR PERÇUE SUR LA RÉUSSITE DE LA NÉGOCIATION DU RÉFÉRENCEMENT DANS LA
GRANDE DISTRIBUTION : ÉTUDE ORIENTÉE FOURNISSEUR, Thèse de Doctorat pour l’obtention du titre de docteur en Sciences de
Gestion ; Université de Sfax ; Faculté des Sciences Économiques et de Gestion Laboratoire de Recherche en Marketing (LRM)
I. Critères de Choix de la méthode d’analyse.
Plusieurs critères interviennent pour choisir la ou les méthodes appropriées.
La nature de l’objectif (descriptif, explicatif et prédictif).
Le nombre de variables présentes dans une même hypothèse.
L’échelle de mesure des variables (nominale, ordinale, intervalle et ratio
ou proportionnelle).
SPSS par exemple fournit une assistance pour aider à choisir la méthode la plus
appropriée au besoin du chercheur après avoir répondu d’une manière
séquentielle à un ensemble de questions. Aideàassistant statistique…
1. Le choix de la méthode bivariée.
Si l’analyse ne porte que si deux variables simultanément, le choix de la méthode
à adopter dépend de la réponse apportée aux deux questions suivantes :
o Quel est l’objectif de l’analyse (associer ou comparer des groupes) ?
o Quelle est la nature de l’échelle des deux variables ?
Plusieurs propositions de tableaux ou de diagrammes ont été faites pour aider à
choisir la méthode bivariée appropriée. Nous notons la proposition de Evrard Y,
et al. (2000)103 qui proposent une double entrée pour sélectionner la méthode en
considérant l’échelle de mesure de deux variables et l’objectif (de comparaison
ou d’association) (Tableau N° 33).
Tableau N° 33: Choix de la méthode d’analyse bivariée
Objectifsà Association Comparaison
Echelles des 2 2 groupes Plusieurs groupes
variables ▼ Indépenda Apparié Indépend Appari
nts s ants és
Métrique / Corrélation linéaire de
Métrique Pearson
Coefficient de Régression
Ordinale/ Spearman ; Kendall ; Kappa de
Ordinale Gamma ; Somer Cohen
Nominale/ d.l=1 d.l >1
Nominale
Chi2 avec Chi2
correction Coefficient
Yates de
Coefficien contingenc
t Phi e ;
Risque V Cramer
relatif
Odds
ratio
Chapitre I. Introduction à l’analyse des données.
79
Chapitre I. Introduction à l’analyse des données.
80
Chapitre I. Introduction à l’analyse des données.
Source (adaptée) SUNER, A., & ÇELİKOĞLU, C. C. (2007). Application of a Population Based Study of
Correspondence Analysis in Choosing A Health Institution.
81
Chapitre I. Introduction à l’analyse des données.
Tableau N° 34: Les possibilités d’utilisation des méthodes d’analyses sur SPSS en
fonction des différents types de données.
Type de données Matrice Matrice de synthèse
initiale (Recours au syntax)
Méthodes X(n,p) Matrice de Matrice Matrice des Matrice de Matrice
d’analyse contingence de corrélations variances des
similarité covariance scores
factoriels
Chi2 x x
ANOVA x
Gamma x x
V Cramer x x
Analyse factorielle x x
des
correspondances
Modèle log- x x
linéaire
MDS x x
Classification x x
(typologie)
Régression linéaire x + Taille de + Taille de
l’échantillon l’échantillon
et écarts-
types)
Analyse x x
Discriminante
MANOVA x
Analyse factorielle x x x x
Régression x
Logistique
CHAID x
82
Chapitre I. Introduction à l’analyse des données.
84
Chapitre I. Introduction à l’analyse des données.
Pour effectuer par exemple une analyse typologique avec cette matrice on fait
recours à la fonction SYNTAX dans le logiciel SPSS.
CLUSTER
/MATRIX=IN(*)
/PLOT=DENDROGRAM.
87
Chapitre I. Introduction à l’analyse des données.
(1967) via
CFA
Source : Ezekiel, A. O., Olaleke, O., Omotayo, A., Lawal, F., & Femi, O. (2018). Data on empirical
investigation of direct and indirect effect of personality traits on entrepreneurs’ commitment of
SMEs. Data in brief, 19, 1171.
1. Conformité de l’échantillon à la population : Exemple en
logistique
Une application en logistique est empruntée à Fynes, B. et al. (2005) 120 où les
auteurs souhaitent savoir si la structure de leur échantillon de 200 firmes
représente bien la population. Les tests de Chi2 utilisés ne permettent pas de
rejeter l’hypothèse H0 : Indépendance entre d’une part les modalités de la
caractéristique et la source (population ou échantillon). Il y a donc une
indépendance. Ceci suggère que le profil de réponse de l'échantillon n’est pas
significativement différent du profil de la population, et que l'échantillon est
largement représentatif des variables clés.
91
Chapitre I. Introduction à l’analyse des données.
Nous montrons dans ce qui suit les calculs qui ont mené à ces résultats et ce
pour me premier critère. La matrice de contingence croisant la source
(population et l’échantillon) avec la taille de l’entreprise (nombre d’employés) a
été utilisée en guide d’application. Le recours au test de Chi2 d’association
permet les résultats suivants :
Tableau N° 41 : Matrice de contingence.
Critère
100 but 20 but 50 but
less less 200 or less Less
than 20 than 50 more than 100 than 20 Total
Source Population Effectif 90 338 85 128 180 821
Effectif
90,9 336,1 86,8 135,9 171,3 821,0
théorique
Sample Effectif 23 80 23 41 33 200
92
Chapitre I. Introduction à l’analyse des données.
Effectif
22,1 81,9 21,2 33,1 41,7 200,0
théorique
Total Effectif 113 418 108 169 213 1021
Effectif
113,0 418,0 108,0 169,0 213,0 1021,0
théorique
Figure N° 64 : Manière sur SPSS pour saisir une matrice des fréquences dans la
population et celles dans l’échantillon.
Figure N° 65 Manière sur SPSS pour saisir une matrice des fréquences dans la
population et celles dans l’échantillon (Suite).
La valeur de Chi2 est égale 4,906 avec p égale à 0,297, l’hypothèse nulle (H0 :
indépendance entre la source d’information et le critère) est acceptée. La
structure de l’échantillon est conforme à celle de la popuation et la
représentativité est retenue.
Tableau N° 42: Résultats du Test de Chi2
Signification asymptotique
Valeur ddl (bilatérale)
93
Chapitre I. Introduction à l’analyse des données.
94
Chapitre I. Introduction à l’analyse des données.
10
Akinci, S., Aksoy, Ş., & Atilgan, E. (2004). Adoption of internet banking among sophisticated
consumer segments in an advanced developing country. International journal of bank
marketing, 22(3), 212-232.
95
Chapitre I. Introduction à l’analyse des données.
<1000 19.2
Household 1000–2000 47.4
income (€ €2001–3000 € 21.9
3000þ € 11.5
Some time Yes 24.7
living in rural
areas
21.9
11.5
11
Salazar-Ordóñez, M., Rodríguez-Entrena, M., Cabrera, E. R., & Henseler, J. (2018). Survey data
on consumer behaviour in olive oil markets: The role of product knowledge and brand
credence. Data in brief, 18, 1750-1757.
97
Chapitre I. Introduction à l’analyse des données.
98
Chapitre I. Introduction à l’analyse des données.
99
1. La méthode subjective : La méthode de Armstrong, J. &
Overton, T. (1977)
La méthode de Armstrong, J. & Overton, T. (1977) 140 consiste à dater et
numéroter les questionnaires lors de l’envoi et surtout de leur réception. D’après
cette méthode, les derniers répondants sont supposés être similaires aux non-
répondants Flower F.J. (1993)141. En conséquence, les premières réponses reçues,
ont été comparés aux dernières. Si les différences sont non significatives, on
retient la conclusion que le biais de non réponse n’altère pas les résultats. Cette
méthode est dite subjective (Hult, G. T. M. et al. 2004) 142.
a. Exemple en marketing : Biais de non réponse méthode
subjective.
Dans leur étude de Ashraf, M. et al. (2017)12 constatent que le taux de réponse
dans leur enquête en ligne est de 17,8%. Ils vérifient le biais de non réponse et
présentent les résultats suivants (Tableau N° 49) :
Tableau N° 49: Analyse du biais de non réponse.
Variables N Mean Std. t- Sig.
Deviation Statistics (2-tailed)
Perceived Confirmation Early 100 3.3370 0.92126 0.023 0.982
Late 100 3.3400 0.91008
Competence Trust Early 100 4.0133 0.83943 1.172 0.244
Late 100 3.8610 0.83408
Benevolence Trust Early 100 3.3267 1.00502 -1.146 0.255
Late 100 3.4933 0.97957
Integrity Trust Early 100 3.1358 1.15013 -1.339 0.184
Late 100 3.3500 1.02309
Satisfaction Early 100 3.5762 0.95471 -0.950 0.345
Late 100 3.4440 1.07788
Source : Ashraf, M., Jaafar, N. I., & Sulaiman, A. (2017). The Mediation Effect of Trusting Beliefs on The
Relationship between Expectation-Confirmation and Satisfaction with The Usage of Online Product
Recommendation. The South East Asian Journal of Management.
Pour vérifier le biais de non-réponse, une comparaison des moyennes sur toutes
les constructions d'étude a été réalisée en utilisant des tests t appariés. Les
résultats ont révélé que la valeur de signification pour tous les construits d'étude
est supérieure à 0,05. Ainsi, on conclut qu'il n'y a pas de différences
statistiquement significatives dans les moyennes pour ces deux groupes et que,
12
Ashraf, M., Jaafar, N. I., & Sulaiman, A. (2017). The Mediation Effect of Trusting Beliefs on The
Relationship between Expectation-Confirmation and Satisfaction with The Usage of Online
Product Recommendation. The South East Asian Journal of Management.
Chapitre I. Introduction à l’analyse des données.
par conséquent, les répondants qui n'ont pas répondu au sondage auront
probablement les mêmes perceptions des concepts que ceux qui ont répondu.
Exemple en comptabilité : Biais de non réponse méthode
subjective.
Une application en comptabilité est observée dans l’article de J. L. Pruijssers et
al. (2013)143. Sur les 281 experts comptables interrogés, 40 sont considérés
comme des répondants précoces et 40 comme des retardataires. Un test-t de
différence des moyennes sur les variables sociodémographiques montrent que
l’hypothèse d’égalité des moyennes est acceptée. Il n’y a pas de différence entre
les profils des répondants et des non répondants.
Tableau N° 50 : Test du biais de non-réponse
Variable Early respondents (n=40) Late respondents (n=40)
Demographic variables (p-values)
Gender 0.572
Level (partner/senior/junior) 0.579
Years worked for current employer 0.761
Type of firm (B4/mid-tier/small) 0.539
Constructs of interest
Client commitment 3.97 4.10
Economic dependency 2.34 2.16
Profit orientation 4.42 4.40
Client retention 5.29 5.31
Transparency 5.22 5.19
Audit quality reducing behaviors 2.59 2.21
Deliberate distortions 2.30 1.93
Overcharging clients 2.06 1.90
Professional commitment 5.15 5.47
Level of education (BA/Msc/PhD/ hogeschool), Type of education (accounting vs no
accounting) *means significantly different at p <.05
Source: Jorien L. Pruijssers and J. (Hans) van Oosterhout ORGANIZATIONAL ANTECEDENTS OF
DYSFUNCTIONAL AUDITOR BEHAVIORS: THE MITIGATING ROLE OF AUDIT FIRM GOVERNANCE,
Electronic copy available at: http://ssrn.com/abstract=2251828.
Exemple en finance islamique : Biais de non réponse méthode
subjective.
Une application de cette méthode en finance islamique est constatée dans
l’article de Abu Hussain, H., & Al-Ajmi, J. (2012 144. Ces auteurs concluent qu’il n’y
a pas de différence entre les 30 premiers répondants et les 30 derniers et
excluent le biais de non réponse.
Exemple en management : Biais de non réponse méthode
subjective.
101
Chapitre I. Introduction à l’analyse des données.
En management, Ahmed, I., & Manab, N. A. (2016)145 ont utilisé le test de Levene
pour constater qu’il n’existe pas de différence significative entre les premiers
répondants et les répondants retardataires (Tableau N° 51).
Tableau N° 51 : Résultats du test T d'échantillons indépendants pour le biais de
non-réponse Le test de Levene pour l'égalité des variances.
Group N Mean SD F Sig.
Variables
Early Response 111 4.1391 .44883 .034 .853
RMF Late Response 52 3.9509 .40357
Early Response 111 3.9022 .75075 1.101 .296
BEO Late Response 52 3.5247 .80933
Early Response 111 3.2723 1.23787 3.238 .074
COP Late Response 52 3.2655 1.12999
Early Response 111 4.3784 .50437 .306 .581
RMI Late Response 52 4.0962 .46218
Early Response 111 4.2027 .36543 .002 .968
RMC Late Response 52 4.1563 .34556
Early Response 111 3.9640 .51040 .100 .752
RKS Late Response 52 3.9115 .50938
Early Response 111 4.0060 .63799 1.709 .193
SCP Late Response 52 4.1506 .57381
Early Response 111 2.9225 .72968 1.790 .183
OIN Late Response 52 4.2038 .52914
Early Response 111 3.3333 .80173 .439 .509
LFS Late Response 52 3.4207 .82472
Early Response 111 4.2117 .41920 .005 .945
FFP Late Response 52 4.3013 .39197
Early Response 111 4.1967 .42176 .232 .631
NFP Late Response 52 4.1154 .45678
Note: RMF=Risk Management Framework, BEO= Board Equity Ownership, C O P =Compliance,
RMI=Risk Management Information, RMC=Risk Management Culture, RKS=Risk Knowledge
Sharing, SCP=Staff Competence, OIN=Organisational innovativeness, LFS=Leadership Factors,
FFP=Financial Firm Performance, NFP= Non-financial Firm Performance
La méthode objective de Lambert et Harrington (1990).
La méthode objective revient à Lambert, D.M., and Harrington, T.C. (1990) 146, elle
nécessite que l’on dispose des données sur les caractéristiques de toutes les
observations touchées par l’instrument de l’enquête et il s’agit de comparer la
structure du groupe des répondants à celle des non répondants. Si la différence
est non significative, le bais de non réponse n’altère pas les résultats.
a. Exemple en Management : Biais de non réponse méthode
objective.
102
Chapitre I. Introduction à l’analyse des données.
103
Chapitre I. Introduction à l’analyse des données.
104
Chapitre I. Introduction à l’analyse des données.
105
Chapitre I. Introduction à l’analyse des données.
million) million) ratio
Respondents 37 42 42 42 42
Non-respondents 394 458 458 454 458
Mean
Respondents 2,115.6 260,991.6 128,520.2 2.185 1.717
Non-respondents 2,198.6 244,191.9 111,073.3 2.816 1.848
SD
Respondents 4,285.3 659,829.9 211,060.8 1.430 1.300
Non-respondents 6,980.5 854,794.1 292,602.3 3.483 3.545
Levene’s test for equality of variances 0.096 0.001 0.009 5.218* 0.415
t-test for equality of means (equality of 0.071 −0.124 −0.377 1.163 0.239
variances assumed)
t-test for equality of means (equality of 0.105 −0.154 −0.494 2.295* 0.506
variance not assumed)
Wilcoxon test −1.470 −0.806 −1.519 −1.207 −1.075
Notes : This table shows five characteristics for the survey respondents and non-respondents and
the tests for non-response bias. *Significant at the 0.05 level
Source : Baker, H. K., & Kapoor, S. (2015). Why Indian firms issue stock distributions. Managerial
Finance, 41(7), 658-672.
Les résultats montrent qu'une seule des cinq caractéristiques - le ratio prix /
valeur comptable diffère significativement au niveau de 0,05 pour le test de
Levene pour l'égalité des variances et le test t pour l'égalité des moyennes
(égalité de variance non assumée). Cependant, le test de Wilcoxon n'est pas
statistiquement significatif pour ce ratio. Par conséquent, malgré le taux de
réponse relativement faible, les auteurs retiennent la conclusion que les
répondants et les non-répondants ne diffèrent pas statistiquement sur quatre
des cinq caractéristiques.
Attitudes à prendre en cas de biais de non réponses.
En cas de biais de non constaté dans une recherche, il y a lieu de le signaler.
Différentes attitudes peuvent être prises par les auteurs :
a. Afficher le biais de non réponse dans les limites de la
recherche. Nous pouvons citer l’article de Lichtenthaler, U.
(2009) 13
Corriger l’enquête en procédant au suivi des non répondants ou
augmenter la taille de l’échantillon en s’assurant des mêmes
conditions de l’enquête.
13
Lichtenthaler, U. (2009). RETRACTED: The role of corporate technology strategy and patent
portfolios in low-, medium-and high-technology firms.
106
Chapitre I. Introduction à l’analyse des données.
107
Chapitre I. Introduction à l’analyse des données.
Pour avoir ce graphique sur SPSS, on peut procéder par la voie statistique
numérique (analyseà statistiques descriptives à explorer) soit directement par
le menu : graphe.
Pour calculer cette expression sur SPSS, nous considérons l’exemple d’application
de Matsumura, H. et al. (2019)14. Les auteurs proposent une matrice initiale
présentant 5 variables : Brand Sector, Brand value US dollar, Oversea sales ratio,
Global Domestica et MarketcapJPY.
Statistiques
Brand value (US dollar)
N Valide 79
Manquant 0
Moyenne 1337892,29114
Médiane 789000,00000
Ecart type 1572839,605634
Plage 8310282,000
Minimum 4718,000
Maximum 8315000,000
14
Matsumura, H., Ueda, T., & Sagane, Y. (2019). Data on the correlations among brand value,
market capitalization, and consolidated overseas sales ratios of Japanese companies. Data in
Brief, 23, 103808.
108
Chapitre I. Introduction à l’analyse des données.
Figure N° 67 : Chemin sur SPSS pour explorer les données et les observations
déviantes.
109
Chapitre I. Introduction à l’analyse des données.
110
Chapitre I. Introduction à l’analyse des données.
111
Chapitre I. Introduction à l’analyse des données.
112
Chapitre I. Introduction à l’analyse des données.
Figure N° 73 : Recherche des observations déviantes des 125 états financiers par
rapport deux variables CAHT et Indconv.
113
Chapitre I. Introduction à l’analyse des données.
Pour illustrer cette méthode, nous faisons recours aux données de l’enquête de
O. Akrout (2016)159 sur la profession d’expertise-comptable. Il s’agit de mener
une analyse de régression multiple en considérant comme variable dépendante
n’importe qu’elle variable métrique (nous avons retenu le numéro des
répondants) et les variables à tester comme variables indépendantes (18 items
sur l’engagement professionnel).
Dans le sous-menu « enregistrer » (Figure N° 74), nous cochons la case
« Distance de Mahalanobis », nous obtenons ainsi dans la matrice une nouvelle
variable désignant la distance de chaque observation par rapport au barycentre
(Figure N° 75).
Figure N° 74 : Calcul de la distance de Mahalanobis
115
Chapitre I. Introduction à l’analyse des données.
116
Chapitre I. Introduction à l’analyse des données.
117
Chapitre I. Introduction à l’analyse des données.
Figure N° 80 : Procédure sur SPSS pour un bilan des observations déviantes.
118
Chapitre I. Introduction à l’analyse des données.
11 ,942 5740,65 5455,4351 285,21493
12 -,179 5094,10 5148,2280 -54,12796
13 ,038 5383,20 5371,6347 11,56526
14 1,187 4888,17 4528,7859 359,38413
15 -,719 4033,13 4250,8304 -217,70043
16 -,702 4941,96 5154,4702 -212,51016
17 ,292 5312,80 5224,3752 88,42483
18 -2,480 4139,87 4890,8153 -750,94530
19 1,438 5397,36 4961,7947 435,56530
20 -,822 5149,47 5398,4950 -249,02496
21 1,195 5150,83 4789,1241 361,70586
22 -1,241 4989,02 5364,7796 -375,75963
23 ,088 5926,86 5900,1721 26,68787
24 ,339 4703,88 4601,1908 102,68920
25 ,902 5365,59 5092,4083 273,18168
26 -,169 4630,09 4681,4107 -51,32068
27 ,396 5711,86 5591,9116 119,94839
28 -,821 5095,48 5344,0691 -248,58914
29 1,236 6124,37 5750,2154 374,15458
30 -,108 4787,34 4820,0950 -32,75499
31 -,977 5035,62 5331,4779 -295,85792
32 ,340 5288,01 5185,0356 102,97442
33 -,225 4647,01 4715,2497 -68,23967
34 -,600 5315,63 5497,2827 -181,65268
35 ,615 6180,06 5993,6976 186,36241
36 -,107 4800,97 4833,3366 -32,36664
37 ,548 5512,13 5346,1821 165,94789
38 -,481 5272,21 5417,9816 -145,77165
a. Variable dépendante : ventes
Évaluation des observations aberrantes.
Les observations aberrantes peuvent faire l’objet d’élimination si leur pertinence
n’est pas démontrée. L’idée d’évaluer l’importance des observations déviantes
conduit certains chercheurs comme M. Trimarchi et al. (2001 p9)165 à effectuer
une analyse discriminante avec et sans observations aberrantes. Ces auteurs
notent que l'analyse a utilisé cent cinquante-cinq réponses, obtenues auprès des
cadres d'achat à Hong Kong. Le dépistage des données indiquait qu'il n'y avait
aucune violation des hypothèses requises pour une analyse discriminante fiable.
L'évaluation de l'asymétrie et de la kurtosis indiquait que les données
satisfaisaient à la normalité. La distance de Mahalanobis a été calculée pour
détecter les valeurs aberrantes multivariées : pour le critère p <.001 (c2 (7) =
24,32), sept observations aberrantes ont été trouvées. L'étude de ces cas
indiquait que les réponses étaient généralement caractérisées soit par une note
élevée, soit par une note faible pour la plupart des questions. Pour examiner
l'effet des valeurs aberrantes, une analyse discriminante a été effectuée à la fois
incluant et excluant les cas aberrants. L'effet de la suppression des valeurs
119
Chapitre I. Introduction à l’analyse des données.
aberrantes sur les résultats de l'analyse était marginal, donc les cas aberrants ont
été retenus dans l'échantillon final.
Traitement des observations aberrantes.
Après avoir repéré les observations déviantes, le chercheur est en mesure de
procéder à leur élimination quand leur nombre ne dépassent pas les 2% du
nombre total des observations (A. J. Kunnan 1998 p 299) ou à les traiter
séparément moyennant une justification théorique à de telles mesures.
121
Chapitre I. Introduction à l’analyse des données.
122
Chapitre I. Introduction à l’analyse des données.
Figure N° 82 : Manière sur SPSS pour vérifier le caractère complètement aléatoire
des données manquantes.
Les données manquantes ne représentent pas plus de 1,4% des données. Ceci
montrent leur caractère peu pertinent.
Tableau N° 59 : Les données manquantes.
Manquant Nombre d'extrêmesa
N Moyenne Ecart type Effectif Pourcentage Faible Elevée
effor1 357 3,10 ,758 3 ,8 16 0
effor2 356 2,39 ,944 4 1,1 0 0
effor3 356 2,99 ,754 4 1,1 . .
effor4 360 2,44 ,862 0 ,0 0 0
effor5 358 3,32 ,717 2 ,6 5 0
effor6 355 3,39 ,668 5 1,4 3 0
effor7 359 2,47 ,968 1 ,3 0 0
effor8 359 2,16 ,941 1 ,3 0 0
effor9 359 2,92 ,817 1 ,3 . .
a. Nombre d'observations en dehors de la plage autorisée (Q1 - 1,5*IQR, Q3 + 1,5*IQR).
Le test de Little permet d’accepter l'hypothèse nulle selon laquelle les données
manquantes sont complètement aléatoires (Test MCAR de Little : Khi-deux =
76,566 DF = 61, Sig. = ,086). Le risque de rejet de H0 est de 8,6% ce risque est
supérieur au seuil classique (5%), on ne pas assumer ce risque et on ne peut pas
dans ce cas rejeter H0. L’hypothèse nulle est acceptée, les données manquantes
sont complètement aléatoires.
Tableau N° 1 Moyennes EMa
effor1 effor2 effor3 effor4 effor5 effor6 effor7 effor8 effor9
3,10 2,39 2,99 2,44 3,32 3,38 2,47 2,16 2,92
Test MCAR de Little : Khi-deux = 76,566, DF = 61, Sig. = ,086
a. Applications de la méthode MCAR de Little.
123
Chapitre I. Introduction à l’analyse des données.
i. Application en Finance.
Liberatore, J., & Miller, T. (2016 p3) 172 développent dans leur article une
taxonomie des entreprises manufacturières et de services, en mettant l'accent
sur différents paramètres de performance clés pour surveiller et gérer la partie
logistique de la chaîne d'approvisionnement. En outre, cette étude détermine si
l'utilisation de mesures clés spécifiques par les entreprises dans ces différentes
classifications varie selon l'industrie, et quel effet, le cas échéant, l'accent mis sur
différents paramètres de performance clés dans les classifications ont sur la
performance financière. Les données originales de cette étude ont été obtenues
à partir du programme d'analyse comparative des SAP pour la planification de la
chaîne d'approvisionnement et utilisent les données de mesure du rendement de
247 entreprises de fabrication et de services. L'ensemble de données comprend
2 223 éléments de données (9 variables * 247 cas), où 330 (14,84%) sont
manquants. La quantité et la configuration des données manquantes devraient
affecter la technique utilisée pour remplacer les valeurs de données manquantes
(Tsikritsis N. 2005). Les modèles possibles sont non manquants au hasard
(NMAR), manquant au hasard (MAR) et manquant complètement au hasard
(MCAR). Ce dernier cas est le meilleur et signifie que la présence de données
manquantes sur une variable n'est pas liée aux valeurs des autres variables de
l'ensemble de données. Le test de Little est la norme pour déterminer si
l'ensemble de données est MCAR ou non. En appliquant le test de Little, les
auteurs ont trouvé que leur ensemble de données est MCAR (test statistique du
chi carré = 356.491, d, f 324, p = 0.103).
Application en ressources humaines.
Un exemple en ressources humaines et sciences comptables montrant une
conclusion différente est effectué sur les données de Salau, O. et al. (2018) 15.
L’examen de la matrice des données montre la présence des valeurs manquantes
sur toutes les variables avec un maximum de 4,3% des observations. La valeur de
Little's MCAR test: Chi-Square = 6403,963, DF = 3595, Sig. = ,000. L’hypothèse
nulle (H0 : les valeurs manquantes sont complètement aléatoires) est rejetée
pour ces données.
Tableau N° 60: Etats des valeurs manquantes.
Missing No. of Extremesa
N Mean Std. Deviation Count Percent Low High
ORA1 564 3,39 ,799 12 2,1 19 0
15
Salau, O., Osibanjo, A., Adeniji, A., & Igbinoba, E. (2018). An integrated dataset on
organisational retention attributes and commitment of selected ICT and accounting firms. Data in
brief, 18, 1930-1936.
124
Chapitre I. Introduction à l’analyse des données.
ORA2 574 3,73 ,556 2 ,3 . .
ORA3 569 3,56 ,729 7 1,2 13 0
ORA4 561 3,35 ,831 15 2,6 15 0
ORA5 551 3,11 1,071 25 4,3 0 0
ORA6 567 3,54 ,746 9 1,6 10 1
ORA7 569 3,55 ,708 7 1,2 9 0
ORA8 553 2,86 1,320 23 4,0 0 0
ORA9 555 2,92 1,272 21 3,6 0 0
ORA10 573 2,88 ,952 3 ,5 0 0
ORA11 568 3,12 ,920 8 1,4 25 0
ORA12 553 3,03 ,972 23 4,0 0 0
ORA13 562 2,73 1,077 14 2,4 0 0
ORA14 574 3,52 ,723 2 ,3 9 0
ORA15 563 3,47 ,877 13 2,3 24 0
ORA16 565 3,17 ,946 11 1,9 40 0
ORA17 560 2,88 1,139 16 2,8 0 0
ORA18 558 2,89 ,948 18 3,1 0 0
ORA19 569 3,05 ,983 7 1,2 47 0
ORA20 567 3,14 ,942 9 1,6 30 0
ORA21 570 2,60 ,961 6 1,0 10 0
ORA22 568 2,52 1,051 8 1,4 23 0
ORA23 569 2,62 1,115 7 1,2 0 0
ORA24 566 ,89 1,191 10 1,7 0 0
ORA25 560 2,41 1,119 16 2,8 33 0
AC1 562 1,90 1,161 14 2,4 0 0
AC2 560 1,56 1,294 16 2,8 0 0
AC3 569 2,28 1,219 7 1,2 49 2
AC4 572 2,62 1,111 4 ,7 0 0
AC5 557 2,52 1,212 19 3,3 48 0
NC1 551 2,51 1,233 25 4,3 50 0
NC2 569 3,26 ,950 7 1,2 40 0
NC3 568 3,22 ,984 8 1,4 40 0
NC4 555 2,51 1,390 21 3,6 0 0
NC5 568 2,74 1,177 8 1,4 0 0
CC1 567 2,55 1,316 9 1,6 0 0
CC2 565 2,43 1,323 11 1,9 0 0
CC3 556 2,44 1,160 20 3,5 42 0
CC4 566 2,69 1,293 10 1,7 0 0
CC5 558 2,79 1,050 18 3,1 0 0
a. Number of cases outside the range (Q1 - 1.5*IQR, Q3 + 1.5*IQR).
125
Chapitre I. Introduction à l’analyse des données.
une variable, on suit les étapes suivantes avancées par par Schlomer, G. L. et al.
(2010) :
Créer une variable muette avec deux valeurs : manquante et non
manquante.
Utiliser des procédures statistiques standard pour tester la relation entre
cette variable et les autres variables d'intérêt de l'ensemble de données.
o Si la variable muette n'est liée à aucune autre variable, les
données sont soit MCAR, soit ne manquent pas au hasard
(NMAR).
o Si la variable fictive est associée à d'autres variables, les données
sont MAR ou NMAR
Traitement des données manquantes.
Le traitement des valeurs manquantes s’impose même si leur proportion est
faible étant donné que certains logiciels statistiques les éliminent pas défaut
(SPSS par exemple) et d’autres ne poursuivent pas l’analyse quand ils les
rencontrent (AMOS par exemple). Il existe plusieurs méthodes pour traiter les
informations manquantes, et les chercheurs en proposent plusieurs typologies.
Certains (par exemple L. Ben Othmane (2012), classent les méthodes de
traitement en méthodes palliatives, en méthodes statistiques et en méthodes
supervisées.
D’autres comme Kline (1989)174 les classent en méthodes d’élimination,
méthodes de remplacement (ou imputation) et méthodes d’estimation à travers
une modélisation. Une excellente synthèse basée sur cette classification est faite
par N. Tsikriktsis (2005)175 qui effectue une comparaison des différentes
méthodes en insistant sur les occasions de recours, les avantages et les
inconvénients.
126
Chapitre I. Introduction à l’analyse des données.
Méthodes Méthodes
Méthodes palliatives
statistiques supervisées
Moyenne
Médiane
Mode
Source : Schéma composé à partir des informations tirées de Laila Ben Othmane (2012),
Prévalence et facteurs associés aux données manquantes des registres de consultations
médicales des médecins des centres de santé communautaires de … BA Ly - - theses.ulaval.ca
a. La méthode de « Listwise » ou élimination de l’observation.
C’est la méthode de traitement des valeurs manquantes la plus courante. Elle
consiste à éliminer toutes les observations du moment où l’observation contient
une valeur manquante.
Si les données ne correspondent pas à l'hypothèse de MCAR, la suppression par
liste « listwise » peut produire des estimations biaisées (Acock, A. C. 2005)176.
La méthode de pairwise
Cette méthode n’élimine pas l’observation que pour la variable qui enregistre un
manquement d’information.
La méthode de substitution par la moyenne.
Cette méthode consiste à remplacer les informations manquantes par la
moyenne de la variable.
vérifier s’il n’y en a pas une ayant une variance faible qui ne différencie que
d’une manière faible les répondants. Ces variables doivent être éliminés
(Thomas, R., & Wood, E. 2015 p91)177. Une variable ayant une variance faible
(<0,25) (Son, C. G. et al. 2005 p445)178 ou un écart-type inférieur à 0,50 (Francis-
Smythe, J. 2013 p232)179 reflète une faible variabilité des réponses autour de la
moyenne. Une telle anomalie au niveau des données pourrait donner des
résultats non significatifs non attendus (Sandvik, C., et al. 2009)180.
Ce préliminaire est observée en comptabilité dans l’article de Caldwell, D. F. et al.
(1990 p250)181 qui ont éliminé 5 items sur 16 suite à une faible variance. Dans le
travail de Lundin, J. (2015 p29)182, une faible variance dans les données a eu pour
conséquence l’absence de significativité des effets attendus.
Pour illustrer la question de la variance faible, nous faisons appel aux données de
l’enquête et plus précisément une échelle de mesure relative à l’indépendance
de l’expert-comptable. Comme on peut le remarquer (Tableau N° 61), trois items
ont des variances inférieures à 0,25 que nous proposons d’éliminer.
Tableau N° 61 : Statistiques descriptives des items de l’échelle d’indépendance.
Moyenne Ecart Variance Asymétrie Erreur Kurtosis Erreur Plage
type standard standard
d'asymétrie de Kurtosis
IND1 1,18 0,534 0,285 3,445 0,201 12,523 0,399 3
128
Chapitre I. Introduction à l’analyse des données.
16
https://www.ncbi.nlm.nih.gov/mesh?term=social%20desirability
129
Chapitre I. Introduction à l’analyse des données.
130
Chapitre I. Introduction à l’analyse des données.
131
Chapitre I. Introduction à l’analyse des données.
d. 01nterpolated 10-point categorical scale: bottom category "negative," coded -5%; top category "50%
or more," coded 55%. Only
e. one firm is in this top category and 17 are in the bottom.
f. *Significant at p < .05.
Source : Dwyer, F. R., & Oh, S. (1988). A transaction cost perspective on vertical contractual
structure and interchannel competitive strategies. The Journal of Marketing, 21-34.
Age de l’entreprise.
- Moins de 5 ans 93 72 14 c2= 26.76
- de 5 à 10 ans 73 73 36 d.l=12
- de 10 à 15 ans 37 25 5 r=0.008
- de 15 à 20 ans 13 15 3
- de 20 à 25 ans 18 7 2
- de 25 à 30 ans 11 8 6
- 30 ans et plus 12 14 1
Age du propriétaire
-Moins de 30 ans 78 93 25 c2= 9.48
- de 30 à 40 ans 78 54 19 d.l = 6
- de 40 à 50 ans 52 30 11 r=0.148
- 50 ans et plus 6 33 12
133
Chapitre I. Introduction à l’analyse des données.
Dans une recherche en marketing, Jones, M. A., et al. (2000 p265)191 s’assurent
de l’homogénéité de la population étudiée. Le test consiste à vérifier l’existence
de différence significative entre les modèles de régression à travers les types
d’industries. La valeur de Fisher calculée est de 0,008 avec un p<0.10.
L’hypothèse d’homogénéité est acceptée, il n’y a donc pas de raison de séparer
les industries dans les analyses.
Dans une recherche en finance islamique, Yusoff, R., & Wilson, R. (2005)192
utilisent le test de Chow pour vérifier l’homogénéité de la population des
dépositaires des banques islamiques (participation aux bénéfices) par rapport
aux dépositaires classiques (basés sur les intérêts). Le test permet de retenir
l’hypothèse d’homogénéité au risque de se tromper de 10%.
Dans une recherche en finance, Ayadi, I. (2014)193 étudient l’efficience des
banques tunisiennes et utilise dans un premier temps le test de Chow pour
134
Chapitre I. Introduction à l’analyse des données.
135
Chapitre I. Introduction à l’analyse des données.
nichées, c’est dire une similarité entre des groupes de répondants non pas suite
à une variable choisie mais au fait que des observations ont été prises au sein
des mêmes entités. Les données nichées peuvent être désirées par le chercheur
ou au contraire non désirées. Elles sont désirées quand le chercheur souhaite
pour une raison ou une autre agréger les observations. Elles sont non désirées
quand l’agrégation n’est pas voulue mais des similarités au sein des entités
peuvent conduire à une agrégation forcée.
Dans cet article, il s’agit de vérifier si des différences peuvent exister entre les
vendeurs d’un même magasin au niveau des réponses à un ensemble de
variables (dépendantes). Si des différences sont significatives, l’agrégation
s’impose pour éviter l’effet de redondance des réponses.
Par exemple, la valeur de Eta² correspondante à la variable dépendante
« promotion opportunity » est égale à 0,38 ce qui signifie que 38% de la variance
de cette variable est expliquée par le fait que le vendeur appartienne au même
magasin (Tableau N° 67).
Tableau N° 67 : Lien entre les variables dépendantes et avec l’appartenance ou
non à un même magasin.
Variable 1 2 3 4 5 6 7 8 9 10 Il 12 13 14 15
1. Store s ize
2. Promotion opportu nity .1
3
3. Job autonomy .24 .08
4. Job sec urity .09 .3 1 .33
5. Distributive ju stice . .52 .40 .39
14
6. Team orientation .09 .46 .27 . 14 .44
7. Coworker s upport -.03 .44 .32 .26 .48 .66
8. Job routinization -.09 -. 1 7 -.23 -.31 -.23 -.44 -.20
9. Role ambiguity .01 -.27 -.37 -.40 -.35 -.36 -.40 . 12
1 O. Resource aclequacy .23 .35 .04 .07 .2 1 .33 .43 -.1 5 -.22
1 1 . Organizational support .01 .29 . 1 8 .25 .50 .46 .42 -.36 -.2 1 .39
1 2. Supervisory support .1 1 .47 .27 . 17 .45 .39 .35 -.20 -.35 . 14 .37
1 3. Custome r complaints .07 . 1 7 -.01 .26 .04 -.05 .09 -.2 1 -.27 -.22 -.04 .20
1 4. Commitment to customer -.28 . 1 5 .14 .35 .23 .36 .46 -.38 -.26 -.06 -.32 .25 .03
serv ice
1 5. J ob motivation .05 .20 .07 .46 .36 .39 .23 -.37 -.37 . 16 .37 . 10 .17 .33
Mean 7.22 3.34 3.49 4.03 3.03 3.50 3.79 2.1 2 2.02 3.6 1 2.93 3.79 6.03 3.8 1 2.99
Standard dev iation 3.78 .49 .47 .39 .65 .5 1 .52 .44 .42 .43 .50 .63 3.97 .40 .52
Cronbach's a lpha .73 .83 .79 .89 .84 .70 .70 .64 .5 1 .72 .9 1 .89 .8 1
Compos ite reliabi lity .75 .86 .74 .93 . 89 .82
137
Chapitre I. Introduction à l’analyse des données.
Source : Simon J. Bell Bülent Mengüç Sara L. Stefani (2004); When Customers Disappoint: A
Model of Relational Internal Marketing and Customer Complaints; Journal of the Academy of
Marketing Science. Volume 32, No. 2, pages 118.
Une application est faite pour vérifier l’implication des enquêteurs dans la
réalisation d’une enquête par questionnaire. Nous disposons des résultats d’une
enquête faites auprès des responsables de points de vente. 24 enquêteurs ont
été recrutés pour mener une enquête sur le rapport entre les acteurs des circuits
de distribution. On souhaite vérifier s’il n’y a pas des signes de fraude de la part
des enquêteurs et quiconque ingérence des enquêteurs dans les réponses. Pour
calculer Eta sur SPSS on suit le chemin présenté dans la Figure N° 86.
Figure N° 86 : Manière de calcul de Eta
Pour ces trois variables, la valeur de Eta² est inférieur à 0,20, ce qui permet de
noter que les réponses par groupes d’enquêteurs sont bien différentes (Tableau
N° 68), les observations sont indépendantes.
138
Chapitre I. Introduction à l’analyse des données.
141
Chapitre I. Introduction à l’analyse des données.
142
Chapitre I. Introduction à l’analyse des données.
143
Chapitre I. Introduction à l’analyse des données.
COMP5 ,652
COMP4 ,604
Méthode d'extraction : Analyse en composantes principales.
Application du CVM vis EFA en système d’information.
Une application de la méthode de Harman en système d’information est
empruntée à Newkirk H. E. et al (2006 p487)234. Les auteurs constatent l’absence
d’une variance commune significative des mesures puisque 15 facteurs avec des
valeurs propres supérieures à 1 et aucun facteur n’explique une variance
remarquable (les variances varient de 1,2% à 27%). Cette conclusion est aussi
retenue par Parolia N. et al.(2007)235 dans leur article en système d’information.
Les auteurs constatent plus d’un facteur émerge de l’analyse pour atteindre une
variance totale de 68% sachant que le premier facteur ne récupère que 35%. Il
n’y a donc pas un seul facteur qui représente tous les items et la variance
commune attribuée à la méthode n’est pas évidente.
Application du CVM vis EFA en entrepreneuriat.
Une application en entrepreneuriat revient à Barringer Bruce R. et al. (1999) 236.
Les auteurs mènent une analyse factorielle exploratoire sans rotation en suivant
le principe de base que s’il y a un substantiel biais de CMV dans les données un
facteur unique est censé émergé. L’utilisation de la proposition de Harman
montre que 13 facteurs ayant des valeurs propres supérieures à 1 apparaissent
et aucun facteur n’est dominant. Le biais de CMV n’est pas un problème pour les
données de l’étude.
Application du CVM vis EFA en comptabilité.
Pour illustrer cette méthode en comptabilité nous faisons appel à l’article de Xu,
Y., & Tuttle, B. M. (2005) 237, dans cet article nous disposons des contributions
factorielles « loading » et il est possible de recalculer les résultats à partir de ces
données moyennant la fonction SYNTAX sur SPSS (Figure N° 89).
145
Chapitre I. Introduction à l’analyse des données.
146
Chapitre I. Introduction à l’analyse des données.
147
Chapitre I. Introduction à l’analyse des données.
qu’il n’y a pas de facteur dominant, ce qui écarte le biais de CMV par la méthode
de Harman via EFA.
Application du CVM vis EFA en science des organisations
Une application en science des organisations à partir de la matrice des
corrélations est empruntée à la recherche de W. L. J., & Anderson, S. E. (1994)241.
Figure N° 92 : Matrice des corrélations et syntax
149
Chapitre I. Introduction à l’analyse des données.
150
Chapitre I. Introduction à l’analyse des données.
Le modèle à un seul facteur donne un CHI2 (170) = 923,64, contre CHI2 (149) =
174.61 pour le modèle de mesure qui comprenait sept facteurs ; l'ajustement
était pire dans le modèle unidimensionnel à ce qu'elle était dans le modèle de
mesure. Un ajustement pire pour le modèle à un seul facteur suggère qu'un
facteur général n'est pas tenu compte pour la majorité de la covariance entre les
mesures de cette étude.
Nous avons appliqué l’analyse factorielle confirmatoire par la méthode de
Harman sur l’exemple des difficultés d’analyse stratégique. Comme on peut le
constater le modèle à un seul facteur (qui occulte la CVM) n’est pas significatif à
comparer au modèle de mesure à trois facteurs.
Tableau N° 78 : Vérification du CVM par une CFA sur les difficultés d’analyse
stratégique.
Modèle NPAR CMIN DF P CMIN/DF
Modèle à un seul facteur 22 117,160 44 ,000 2,663
151
Chapitre I. Introduction à l’analyse des données.
La normalité et la multinormalité.
Le respect de la normalité ou plutôt de la multinormalité est une condition
traditionnelle dans l’usage des méthodes dites paramétriques.
A. La normalité : À quoi ça consiste ?
Une variable suit une distribution normale quand elle prend la forme d’une
cloche : symétrique et non aplatie de façon à ce que 64% des observations soient
situées des deux côtés de la moyenne plus ou moins une fois l’écart-type, 98% la
moyenne +/- 2 fois l’écart-type et 100 la moyenne +/- 3 fois l’écart type. Une
variable suit une loi normale centrée réduite quand sa moyenne nulle et son
écart type égal à 1.
154
Chapitre I. Introduction à l’analyse des données.
155
Chapitre I. Introduction à l’analyse des données.
4
Fréquence
2
Sigma = 70,44
Moyenne = 406,1
0 N = 38,00
27
30 ,0
32 ,0
35 0
37 ,0
40 ,0
42 ,0
45 ,0
47 0
50 ,0
52 ,0
55 ,0
5
0
5,
0
5
0
5
0,
5
0
5
0,
0
MTB
156
Chapitre I. Introduction à l’analyse des données.
Pour calculer le test de Lilliefors sur SPSS on suit les consignes suivantes que
nous résumons dans la Figure N° 98.
157
Chapitre I. Introduction à l’analyse des données.
158
Chapitre I. Introduction à l’analyse des données.
Le Test de Shapiro-Wilk
Le Test de Shapiro-Wilk est utilisé pour vérifier l’hypothèse nulle : les données de
l’échantillon suivent la loi normale.
Comme nous pouvons le constater dans l’application suivante, la statistique de
Shapiro-Wilk est de 0,981 avec un risque de 0,344 ce qui permet d’accepter
l’hypothèse nulle et de constater le respect de la loi normale (Tableau N° 84).
Tableau N° 84 : Test de Normalité avec Shapiro_Wilk
Kolmogorov-Smirnova Shapiro-Wilk
Statistique ddl Signification Statistique ddl Signification
Indconvmoy ,053 72 ,200* ,981 72 ,344
a. Correction de signification de Lilliefors
*. Il s'agit d'une borne inférieure de la signification réelle.
159
Chapitre I. Introduction à l’analyse des données.
(x
i 1
i x) 3
NS 3 Avec S variance de x
A chaque valeur de Skewness correspond son erreur standard.
Formule N° 6: Calcul du S.E
6 6
s.e 0,129
n 357
La distribution est symétrique quand cette expression (l’asymétrie) est égale à
zéro. Une distribution qui a une asymétrie positive à une longue queue vers la
droite. Une distribution est asymétrique négative quand elle possède une longue
queue vers la gauche.
Approximativement une valeur d’asymétrie supérieure à deux fois son erreur
standard (l’écart type divisé par la racine carrée de N) correspond à une
distribution asymétrique (Chou, C.-P., & Bentler, P. M. (1990) 255. Chou et Bentler
(1995256 cités par R.Weston and Paul A. Gore, Jr. 2006 257 p735) considèrent qu’un
indice d’asymétrie (Skewness) supérieur à trois est le maximum.
Soit trois variables observables AR1, AR2 et AR3. Le test d’asymétrie est présenté
dans le Tableau N° 85.
Tableau N° 85 : Statistiques descriptives
N Moyenne Ecart type Skewness e.s c.r
AR1 357 4,14 ,957 -1,296 ,129 -10,04
AR2 357 3,74 ,965 -,604 ,129 -4,682
AR3 357 4,24 ,789 -1,323 ,129 -10,25
Pour les trois items, la valeur de Skewness est plus que 3 fois supérieure à
l’erreur standard ce qui permet de rejeter la symétrie. L’asymétrie est
importante, elle est à gauche ce qui correspond à un nombre important
d’observations du côté gauche plus qu’autorisé par la loi normale comme
montré dans la Figure N° 100.
160
Chapitre I. Introduction à l’analyse des données.
L’aplatissement ou le Kurtosis.
Une distribution normale ne doit pas être aussi aplatie. L’aplatissement ou le
Kurtosis est une mesure du degré de concentration des observations dans les
queues. Pour calculer l’aplatissement on se base sur la Formule N° 8.
Formule N° 7 : Formule de Kurtosis.
N
(x
i 1
i x) 4
3
NS 4
Avec S variance de x
Formule N° 8: calcul de l’erreur standard
24 24
s.e 0,259
n 357 Un Kurtosis qui dépasse +/- 3 quand il est divisé par
son erreur standard est un signe d’aplatissement (donc de déviation à la loi
normale) (Lynn, M. L., et al. 2009 p239)258.
Dans la pratique, la valeur d’aplatissement est rarement égale à zéro. On parle
plutôt de déviation par rapport au niveau d’aplatissement requis par la
normalité. Un Kurtosis compris entre -2 et +2 est acceptable et ne considère pas
l’aplatissement comme engendrant une déviation importante par rapport à la loi
normale. Un Kurtosis supérieur à 10 annonce un problème et une valeur
supérieure à 20 est extrême (Kline, 2005259 cité par Rebecca Weston and Paul A.
Gore, Jr. 2006 p735)260.
Un Kurtosis négatif indique que les queues comptent moins d’observations que
dans une distribution normale. Un Kurtosis positif indique les queues comptent
plus d’observations que dans une distribution normale.
Dans l’exemple ci-dessus, la valeur de Kurtosis est dans les normes pour le
deuxième item et non pour les autres.
Tableau N° 86 : Statistiques descriptives de l’aplatissement (Kurtosis)
N Moyenne Ecart type Kurtosis e.s c.r
AR1 357 4,14 ,957 1,624 ,257 6,32
161
Chapitre I. Introduction à l’analyse des données.
Pour calculer la valeur du Kurtosis sur SPSS on suit le chemin indiqué dans la
Figure N° 101 et Figure N° 102.
Figure N° 101 : Manière de Procéder sur SPSS pour calculer les paramètres de
test de la normalité.
Figure N° 102 : Manière de Procéder sur SPSS pour calculer les paramètres de
test de la normalité (Suite)
Le test de Jarque-Bera
Le test de Jacque-Bera est utilisé pour tester la normalité. Il permet de vérifier
l’hypothèse nulle H0 : La distribution de la variable est normale contre
l’hypothèse H1 : la distribution n’est pas normale. « Le test de Jarque-Bera ne
teste pas à proprement parler si les données suivent une loi normale, mais plutôt
si le kurtosis et le coefficient d'asymétrie des données sont les mêmes que ceux
d'une loi normale de même espérance et variance » Wikepedia.
162
Chapitre I. Introduction à l’analyse des données.
163
Chapitre I. Introduction à l’analyse des données.
164
Chapitre I. Introduction à l’analyse des données.
Le critère MARDIA
Le test le plus largement utilisé pour vérifier la multinormalité est le test de
Mardia (1970)261 qui n’est autre qu’une généralisation multivariée du test de
Kurtosis (Ga´ Bor J. Sze´ kelya, & M. L. Rizzob 2005 p59262, Ke-Hai Yuan et al.
(2004 p413)263.
La formule de calcul est :
Formule N° 9 : Mardia.
N
1 2 p( p+2 )( N −1)
∑
N i=1 [( ]
x i −x )' S−1 ( x i−x ) −
N +1
Avec p : nombre de variables observables et N la taille de l’échantillon.
La statistique de Mardia, sous l’hypothèse de la normalité, a une moyenne nulle
et une erreur standard égale à (8p(p+2)/N) 1/2, avec p le nombre de variables et N
la taille de l’échantillon.
Le test de Mardia permet de tester l’hypothèse nulle suivante :
H0 : La valeur du coefficient de Mardia =0 ce qui se traduit par une présence de
multi-normalité.
« Quand la valeur de c.r. (critical ratio dépasse 1,96 et la probabilité de rejet de
H0 est faible moins de 5%), le risque de rejet de H0 est faible, l’hypothèse est
rejetée et la multi normalité n’est pas assurée. Quand, au contraire, la valeur de
c.r. est bien inférieure à 1,96 (et donc une probabilité dépassant 5%), le risque de
rejet de H0 étant élevé, l’hypothèse ne peut qu’être acceptée et la multi
normalité est assurée ». Bryman et Cramer (2001)264 indiquent que si la valeur du
ratio critique (c.r.) dépasse 5, la distribution est considérée non normale.
En général, « l’hypothèse de la multi normalité est satisfaite lorsque les
coefficients Mardia ont une valeur inférieure à 3 (Romeu et Ozturk 1993 265 cités
par Roussel et al. 2002 p 83266). Bollen & Stine (1992)267 avancent la règle
suivante : si la valeur de Mardia est inférieure à la valeur p(p+2), les données
suivent la loi multinormale.
À titre d’exemple, nous pouvons faire allusion à la recherche en sociologie de D.
R McCreary et al. (2002 p172) 268. Dans cette application, il s’agit d’une échelle de
36 indicateurs pour lesquels les statistiques de Kurtosis et de Skewness sont dans
les normes, seulement la multinormalité ne l’est pas, la valeur de Mardia
(Mardia’s normalized estimate) est de 24,98. Pour réduire cette déviation les
auteurs éliminent 7 observations identifiées multivariées déviantes, ce qui
permet de réduire Mardia à 18,98 qui demeure importante.
Pour illustrer cette méthode, nous proposons l’exemple du modèle de mesure de
l’effort.
165
Chapitre I. Introduction à l’analyse des données.
Le test c.r. (équivalent au test t) indique une valeur égale à 13,23 ce qui veut dire
que la valeur de Mardia est 13 fois supérieure à son erreur type, cette valeur est
166
Chapitre I. Introduction à l’analyse des données.
bien différente de zéro. En termes de rapport, celui-ci est bien supérieure à 1,96
et donc un risque de rejet de H0 inférieur à 5%, l’hypothèse nulle est rejetée ce
qui entraîne le rejet de la multi normalité.
Le Problème de multicolinéarité.
A. La Multicolinéarité : A quoi cela consiste ?
Plusieurs méthodes nécessitent l’absence de la multicolinérité. Il s’agit de
l’utilisation des variables explicatives effectivement indépendantes les unes des
autres. On parle d’abord de colinéarité qui est définie comme étant la
redondance qui peut exister entre une variable et une autre supposées
indépendantes dans un modèle explicatif d’une troisième variable.
La multicolinéarité est une généralisation de la colinéarité à plusieurs variables
dites exogènes dans un modèle causal. Il y a multicolinéarité quand une variable
exogène est une combinaison linéaire des autres variables exogènes.
Les symptômes de multicolinéarité.
Différents signes et méthodes sont proposés pour détecter la présence de
multicolinéarité. Nous présentons un résumé de ces signes ou méthodes dans le
Tableau N° 88 : Résumé des outils de mesure de la multicolinéarité
Outil Formule Signe de multicolinéarité
Des coefficients de
régression illogiques
(Lafi, S. Q., & Kaneene, J.
B. 1992)17
Corrélation >0.8
VIF Variance inflation 1/(1-R²) >10
factor
Tolérance 1-R² <0,20
Nombre de Valeur propre >15
conditionnement MAX/Valeur propre MIN
Il n'y a pas de règles pour déterminer à partir de quelles valeurs précises il existe
des preuves de problèmes de multicolinéarité (Suàrez Àlvarez, L. et al. 2007) 269.
Schmidt, P., & Muller, E. N. (1978) 270 et Kaplan D. (1994)271 (cités par R. Grewal et
al. (2004 p521)272 recommandent d’inspecter :
17
Lafi, S. Q., & Kaneene, J. B. (1992). An explanation of the use of principal-components analysis
to detect and correct for multicollinearity. Preventive Veterinary Medicine, 13(4), 261-275.
167
Chapitre I. Introduction à l’analyse des données.
168
Chapitre I. Introduction à l’analyse des données.
170
Chapitre I. Introduction à l’analyse des données.
Hughes, J. N. et al. (2004)284 ont trouvé dans leur étude sur l’échelle SCAP
(Social–Cognitive Assessment Profile) une valeur du nombre de conditionnement
de 5,04 permettant de dépasser le problème de multicolinéarité. Dans leur
recherche sur la gestion des chaînes logistiques, Wiengarten, F. et al. (2010)285
notent que leurs résultats indiquent que les indices de conditionnement sont
également dans la fourchette souhaitable et ils concluent que la multicolinéarité
n'impose aucune menace sérieuse à l’analyse.
Les Conséquences de la Multicolinéarité
Wang, G. C. (1996)286 reproduit quatre conséquences de la multicolinéarité :
Dans un modèle à deux variables, lorsque la multicolinéarité, qui est souvent
appelée colinéarité pour le cas à deux variables, est présente, l'erreur-type
estimée pour les coefficients sera grande. En effet, dans la formule de la
variance des coefficients, il existe un facteur multiplicateur sous la forme de 1
/ (1-r²), où r est le coefficient de corrélation entre deux variables et sa valeur
est comprise entre -1 et + 1. Ce facteur est souvent Appelé facteur d'inflation
de variance. Lorsque r = 0, il n'y a pas de multicolinéarité et le facteur
d'inflation est égal à 1. Alors quand r augmente en valeur absolue, les
variances des coefficients estimés augmentent aussi. Lorsque r approche ± 1,
le facteur d'inflation approche l'infini. Dans le cas de plus de deux variables
indépendantes, le coefficient de détermination (R²) remplacera r² dans le
facteur d'inflation de variance.
Lorsque les coefficients estimés ont de grandes erreurs-types et sont
instables, il sera difficile pour le chercheur d'évaluer correctement
l'importance relative des variables indépendantes. Surtout lorsque les
coefficients estimés ont des signes erronés.
Les coefficients estimés peuvent devenir négligeables ou présenter des signes
erronés et, par conséquent, être sensibles aux changements dans les
données d'échantillonnage. Cela est dû au fait que lorsque les variables
indépendantes sont corrélées, les erreurs-types estimées pour les
coefficients seront importantes et, par conséquent, les statistiques t seront
faibles. Les coefficients estimés avec de grandes erreurs-types seront
instables. Une addition de quelques observations supplémentaires à
l'échantillon entraînera un changement important dans la taille des
coefficients et parfois dans les signes des coefficients. Lorsque l'un des
coefficients change de signe de positif à négatif ou de négatif à positif à la
mise à jour du modèle, le modèle ne produira pas une bonne prévision.
La présence de multicolinéarité peut amener le chercheur à supprimer une
172
Chapitre I. Introduction à l’analyse des données.
173
Chapitre I. Introduction à l’analyse des données.
174
Chapitre I. Introduction à l’analyse des données.
Figure N° 110 : Analyse factorielle sur les variables explicatives des ventes.
175
Chapitre I. Introduction à l’analyse des données.
Le Biais d’endogénéité.
L'endogénéité est considérée comme un des principaux problèmes quand il s’agit
d’étudier la relation de causalité entre une variable « cause » et une autre
« effet ». En termes statistique, ce problème survient quand l’hypothèse de non
corrélation entre la variable cause (X) et l’erreur d’estimation (µ) n’est pas
vérifiée. Cette situation implique une estimation biaisée du coefficient censé
mettre en valeur l’effet de X sur Y. Les problèmes d'endogénéité sont
particulièrement frustrants pour les chercheurs, car la direction et la taille du
biais sont difficiles à prédire ex ante (Hamilton, B. H., & Nickerson, J. A. (2003
P52).
Les symptômes et les outils de détection du biais
d’endogénéité.
A. Corrélation variable exogène et erreur d’estimation.
La méthode consiste à s’assurer que la corrélation entre la variable supposée
176
Chapitre I. Introduction à l’analyse des données.
influencée par h.
L’omission d’une variable ou L’hétérogénéité inobservée.
L’omission des variables serait le problème le plus fréquemment rencontré en
sciences sociales et comportementales (Vella, 1998). Il existe un biais de
variables omis lorsqu'une variable, qui affecte la variable dépendante et est
corrélée à une ou plusieurs variables explicatives, est omise. Le fait que le
chercheur choisisse seul et d’une manière délibérée les variables sans faire appel
à la littérature augmente le risque d’omission (Wooldridge, J. M. 2002 cité par
Bascle, G. (2008).
L’erreur de mesure
Des mesures qui manquent de précision affectent l’estimation des effets.
Effet retardé.
Dans le cas d’une estimation de la causalité sur des données temporelles, les
chercheurs ajoutent souvent une variable indépendante qui traduit l’effet
retardé. Une telle démarché peut conduire à un biais d’endogénéité si les résidus
sont autocorrélés.
Les solutions aux biais d’endogénéité.
La solution de la variable instrumentale.
Pour surmonter le biais d'endogénéité dans l'estimation des MCO, Coffé, H., &
Geys, B. (2005) traitent la variable « capital social » comme une variable
endogène et utilisons la méthode de la régression des doubles moindres carrés
(2SLS).
I. Effet de taille.
« La taille de l’effet désigne à quel degré un phénomène donné est présent dans
la population » (Cohen 1988, p. 9 selon Bourque, J. et al. (2009)18 ). « Il désigne
désormais généralement tout indice de relation entre variables… » Il « décrit le
degré auquel l'hypothèse nulle d'absence de relation entre variables est fausse »
Witell, L. et al. (2014)19.
18
Bourque, J., Blais, J. G., & Larose, F. (2009). L’interprétation des tests d’hypothèses: p, la taille
de l’effet et la puissance. Revue des sciences de l'éducation, 35(1), 211-226.
19
Witell, L., Gustafsson, A., & D. Johnson, M. (2014). The effect of customer information during
new product development on profits from goods and services. European Journal of
Marketing, 48(9/10), 1709-1730.
178
Chapitre I. Introduction à l’analyse des données.
180
Chapitre I. Introduction à l’analyse des données.
182
1
Fidell, L. S., & Tabachnick, B. G. (2003). Preparatory data analysis. Handbook of psychology.
2
Carlson, K. D., & Wu, J. (2011). The illusion of statistical control : Control variable practice in management
research. Organizational Research Methods.
3
Bagozzi, R.P. (1980), Causal Models in Marketing, New York, Wiley
4
Diamantopolos A. (1994), Modelling With LISREL : A Guide for the Uninitiated, Journal of Marketing
Management, 10, 105-136.
5
Little, D. (2010). New contributions to the philosophy of history (Vol. 6). Springer Science & Business Media.
6
Wang, G., & Netemyer, R. G. (2002). The effects of job autonomy, customer demandingness, and trait
competitiveness on salesperson learning, self-efficacy, and performance. Journal of the Academy of Marketing
Science, 30(3), 217-228.
7
Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research:
Conceptual, strategic and statistical considerations. Journal of Personality and Social Psychology, 51, 1173– 1182
8
Jong-min Choe (2004) ; The relationships among management accounting information, organizational learning
and production performance; Journal of Strategic Information Systems 13 pp 61–85
9
Judd, C.M. & Kenny, D. A. (1981), Process analysis estimating mediation in evaluation research, Evaluation
research, 5, 602-619.
10
Baron, R. M., & Kenny, D. A. (1986); The moderator–mediator variable distinction in social psychological
research: Conceptual, strategic and statistical considerations; Journal of Personality and Social Psychology, 51, p
1177
11
Baron, R. M., & Kenny, D. A. (1986); The moderator–mediator variable distinction in social psychological
research: Conceptual, strategic and statistical considerations; Journal of Personality and Social Psychology, 51, p
1177
12
Zhou, L. (2007). The effects of entrepreneurial proclivity and foreign market knowledge on early
internationalization. Journal of World Business, 42(3), 281-293.
13
Reuben M. Baron and David A. Kenny (1986) ; The Moderator-Mediator Variable Distinction in Social
Psychological Research: Conceptual, Strategic, and Statistical Considerations; Journal of Personality and Social
Psychology, 1, 51, No. 6, 1173-1182
14
Jong-min Choe (2004) ; The relationships among management accounting information, organizational learning
and production performance; Journal of Strategic Information Systems 13 pp 61–85
15
Ko de Ruyter, Marcel van Birgelen, Martin Wetzel (1985), Consumer ethnocentrism in international services
marketing ; International Business Review ; 7 185–202
16
Erramilli M.K.and C.P.Rao (1993); Service Firms' International Entry Mode Choice: A Modified Transaction-Cost
Analysis Approach, Journal of Marketing V 57 July pp 19-38.
17
Lumpkin, G T; Dess, Gregory G (1996); Clarifying the entrepreneurial orientation construct and linking it to
performance; Academy of Management. The Academy of Management Review; Jan ; 21, 1; pg. 135
18
Hong K.K.and Y.G.Kim (2002); The critical success factors for ERP implementation an organizational fit
perspective; Information and Management; 40 pp 25-40
19
Subhash Sharma; Richard M Durand; Oded Gur-Arie (1981), Identification and analysis of moderator variables;
Journal of Marketing Research ; Aug; 18, pg. 291
20
Nasution, M. D. T. P., & Rossanty, Y. (2018). Country of origin as a moderator of halal label and purchase
behaviour. Journal of Business and Retail Management Research, 12(2).
21
Subhash Sharma; Richard M Durand; Oded Gur-Arie (1981), "Identification and analysis of moderator variables";
Journal of Marketing Research ; Aug; 18, pg. 291
22
Gilbert A Churchill Jr; Neil M Ford; Steven W Hartley; Orville C Walker Jr (1985) ; The determinants of salesperson
performance : A meta-analysis, Journal of Marketing Research; May; 22, pg. 103-129
23
Hunter, Jon E., Frank L. Schmidht and Gregg B. Jackson (1982), Meta-analysis: Cumulative research Findings
Across Studies, Beverly Hills, Ca. ; Sage Publications.
24
Artur Baldauf; David W Cravens (2002) ; The effect of moderators on the salesperson behavior performance and
salesperson...European Journal of Marketing;; 36, 11/12; pg. 1380
25
Baron Reuben M. and David A. Kenny (1986); The Moderator-Mediator Variable Distinction in Social
Psychological Research: Conceptual, Strategic, and Statistical Considerations; Journal of Personality and Social
Psychology; No. 6, 1173-1182
26
Dawne Lamminmakia (2008); Accounting and the management of outsourcing: An empirical study in the hotel
industry, Management Accounting Research 19) 163–181
27
Green, K. M., Covin, J. G., & Slevin, D. P. (2008). Exploring the relationship between strategic reactiveness and
entrepreneurial orientation: The role of structure–style fit. Journal of Business Venturing, 23(3), 356-383.
28
Kim, T., & Chang, K. (2014). Turnover intentions and organizational citizenship behaviours in Korean firms: the
interactional effects of organizational and occupational commitment. Asia Pacific Business Review, 20(1), 59-77.
29
Barringer, B. R., & Bluedorn, A. C. (1999). The relationship between corporate entrepreneurship and strategic
management. Strategic Management Journal, 20(5), 421-444.
30
Simon J Bell; Bulent Menguc; Sara L Stefani (2004); When Customers Disappoint: A Model of Relational Internal
Marketing and Customer; Academy of Marketing Science. Journal; Spring; 32, 2
31
Kimberly M. Green, Jeffrey G. Covin, Dennis P. Slevin (2008) Exploring the relationship between strategic
reactiveness and entrepreneurial orientation: The role of structure–style fit, Journal of Business Venturing, 23
356–383
32
Ulrich Lichtenthaler (2009), The role of corporate technology strategy and patent portfolios in low-, medium- and
high-technology firms, Research Policy,
33
McGee J.E; M.J.Dowling and W.L.Megginson (1995) ; Cooperative Strategy and New Venture Performance : The
Role of Business Strategy and Management Experience; Strategic Management Journal, Vol 16 N° 7 Oct pp 565-
580
34
Grant Richardson (2006), Determinants of tax evasion: A cross-country investigation, Journal of International
Accounting, Auditing and Taxation, 15 150–169
35
Roberts, R. W. (1992). Determinants of corporate social responsibility disclosure: an application of stakeholder
theory. Accounting, Organizations and Society, 17(6), 595-612.
36
Hess Ronald L Jr; Shankar Ganesan; Noreen M Klein (2003), Service failure and recovery: The impact of
relationship factors on customer, Academy of Marketing Science. Journal; Spring; 31, 2; pg. 127
37
Goldsmith, A. A. (1995). Democracy, property rights and economic growth. The Journal of Development
Studies, 32(2), 157-174.
38
Kertoasri Jl. Analysis of Cross-Classifications Using Crosstabs; Brawijaya Professional Statistical Analysis; BPSA
MALANG66 Malang
39
Green, P. E., F. J. Carmone and D. P. Wachpress (1976), Consumer Segmentation via Latent Class Analysis, Journal
of Consumer Research, 3, 170-174.
40
DeVellis, R. F. 1991. Scale development: Theory and applications. Newbury Park, CA: Sage.
41
Coltman, T., Devinney, T. M., Midgley, D. F., & Venaik, S. (2008). Formative versus reflective measurement
models: Two applications of formative measurement. Journal of Business Research, 61(12), 1250-1262.
42
Fornell. C and Bookstein, F.L. (1982), Two Structural Equation Models : LISREL and PLS applied to Consumer Exit-
Voice, Journal of Marketing, 19, 440-452.
43
Kenneth Law and Shim Sum Wrong (1999), Multidimensional Constructs in Structural Equation Analysis : An
Illustration Using the Job Perception a,d Job Satisfaction Construct, Journal of management, Vol 25, N°2 pp 143-
160
44
Darpy (1999-2003); Développement d’une échelle de mesure : La notion de variable latent ; pagesperso-
orange.fr/denis.darpy/…/variablelatente.pdf
45
Shimp, Terence A.; Sharma, Subhash (1987); Consumer Ethnocentrism: Construction and Validation of the
CETSCALE; JMR, Journal of Marketing Research; Aug; 24, 3 pp. 280-290
46
Lord, Frederic M. and Melvin R. Novick (1968), Statistical Theories of mental Test Scores, reading, MA: Addison-
Wesley
47
David W Gerbing and James C Anderson (1984); On the Meaning of Within-Factor Correlated Measurement
Errors; Journal of Consumer Research; Jun; 11, 1; pg. 572
48
Adamantios Diamantopoulos (2006); the error term in formative measurement models: interpretation and
modeling implications interpretation and modelling implications, Journal of Modelling in Management Vol. 1 No.
1, pp. 7-17
49
Blalock, H.M. (1971). Causal models involving unobserved variables in stimulus-response situations. In H.
M.Blalock (Ed.), Causal models in the social sciences (pp. 335-347). Chicago: Aldine
50
Jeffrey R. Edwards and Richard P. Bagozzi (2000): On the Nature and Direction of Relationships between
Constructs and Measures; Psychological Methods Vol. 5, No. 2~ p 157.
51
MacCallum, R.C.and M.W.Browne (1993), The Use of Causal Indicators In Covariance Structure Models: Some
Pratical Issues, Psychological Bulletin, 114 (3), 533-41
52
Diamantopoulos, A., & Winklhofer, H. M. (2001). Index construction with formative indicators: An alternative
to scale development. Journal of marketing research, 38(2), 269-277.
53
Adamantios Diamantopoulos; Heidi M Winklhofer (2001); Index construction with formative indicators: An
alternative to scale development; Journal of Marketing Research; May; 38, 2; p 270.
54
Bagozzi Richard (1994), Structural Equation Models in Marketing Research Basic: Principles; in Principles of
Marketing Research, R. Bagozzi ed. Oxford Blackwell, 317-85.
55
Hauser, R.M. (1971), Socioeconomic Nackground and Education Performance, Rose Monographe Series,
Washington DC: American Sociological Association. Hauser R.M. (1973), Disggregating a Social-Psychological
Model of Educational Attainment”, In Structural Equation Models in the Social sciences, Arthur S. Goldberger and
Otis Dudkey Duncan eds. New York: Seminar Press, 255-84.
56
Judge TA, Bretz RD. Person-organization fit and the theory of work adjustment: implications for satisfaction,
tenure, and career success. J Vocat Behav 1994; 44(1):32–54.
57
Bollen K, Ting K. (2000); A tetrad test for causal indicators. Psychol Methods; 5(1): 3–22.
58
Fayers PM, Hand DJ, Bjordal K, Groenvold M. Causal indicators in quality of life research. Qual Life Res 1997;
6:393–406.
59
Adamantios Diamantopoulos; Heidi M Winklhofer (2001), Index construction with formative indicators: An
alternative to scale develo..., Journal of Marketing Research; May; 38, 2; pg. 269
60
BOLLEN (1989), Structural Equations With Latent Variables, New York John Wiley & Sons
61
Coltman, T, Devinney, TM, Midgley, DF & Veniak, S, (2008); Formative versus reflective measurement
Models : Two applications of formative measurement, Journal of Business Research, 61(12), , 1250-1262.
62
Statnotes
63
Carl J.Huberty, Janet M.Wisenbaker, Jerry D.Smith and Janet C.Smith (1986) ; Using Categoriel Variables in
Discriminant Analysis ; Multivariate Behavioral Research, 21,479-496
64
Huberty, C. J., Wisenbaker, J. M., Smith, J. D., & Smith, J. C. (1986). Using categorical variables in discriminant
analysis. Multivariate behavioral research, 21(4), 479-496.
65
Jacques Baillargeon Application et interprétation des techniques statistiques avancées ;
http://www.uqtr.ca/cours/srp-6018/s4/panoplie.htm
66
Evrard, Pras et Roux (2002), Market, Fondements et Méthodes des recherches en Marketing ; DUNOD
67
Artur Baldauf; David W Cravens ( 2002) ; The effect of moderators on the salesperson behavior performance and
salesper...European Journal of Marketing; 36, 11/12; pg. 1380
68
Dennis Menezes; Norbert F Elbert (1979), Alternate semantic scaling formats for measuring store image: An
evaluation Journal of Marketing Research Feb; 16 pg. 80
69
Osgood CE., G.J. Suci et PH. Tannenbaum (1957), The Measurement of Meaning (University of Illinois Press,
Urbana, Illinois,).
70
F.N. Kerlinger (1964), Foundations of Behavioral Research (Holt, Rinehart and Winston, Inc., New York, , pp. 581-
598
71
Green, P. E., Tull, D. S., & Lleu, J. (1974). Recherche et décisions en marketing. Presses universitaires de Grenoble.
72
P.E.Green et D.S.Tull (traduit par J.LLeu) (1974) : Recherche et Décisions en Marketing ; PUF.
73
Baillargeon G. et Rainville J. (1978), Statistique appliquée, tome 2, Trois-Rivières, Les éditions SMG, 6e édition.
74
Thiétart R.A. et coll (1999), Méthodes de Recherche en Management, Dunod
75
Dodge Y.(1993), Statistique : Dictionnaire encyclopédique, Paris, Dunod..
76
Jeffrey R. Edwards and Richard P. Bagozzi (2000), On the Nature and Direction of Relationships Between Constructs and
Measures; Psychological Methods, Vol. 5, No. 2 pp 155-174
77
Cook, T., & Campbell, D. (1979). Quasi-experimentation: Design and analysis issues for field settings. Boston: Houghton
Mifflin
78
Michel TREMBLAY et Pascale-Édith LANDREVILLE, L’influence du partage de l’information sur l’engagement
organisationnel: Influence directe ou indirecte? www.reims- ms.fr/agrh/.../2008landreville-trembley.pdf
79
Roth, Martin S (1995); The effects of culture and socioeconomics on the performance; Journal of Marketing
Research; May; 32, 2; pg. 163-176
80
Yin Xu and Brad M. Tuttle (2005); The Role of Social Influences in Using Accounting Performance Information to Evaluate
Subordinates: A Causal Attribution Approach; Behavioral research in Accounting, Volume 17, pp.191.210
81
Hans B. Christensen, Edward Lee, Martin Walker (2007); Cross-sectional variation in the economic consequences
of international accounting harmonization: The case of mandatory IFRS adoption in the UK, The International
Journal of Accounting 42 341–379
82
Olgun Kitapci and Ibrahim Taylan Dortyol (2009), The differences in customer complaint behaviour between
loyal customers and first comers in the retail banking industry The case of Turkish customers, Management
Research News; Vol. 32; No. 10, pp. 932-941
83
Klösgen, W. (2002). Types and forms of data. Handbook of Data Mining and Knowledge Discovery, Oxford
University Press, New York, USA, 33-44.
84
Park, H. M. (2015). Linear regression models for panel data using SAS, Stata, LIMDEP, and SPSS.
85
Fallan, E., & Fallan, L. (2009). Voluntarism versus regulation: Lessons from public disclosure of environmental
performance information in Norwegian companies. Journal of Accounting & Organizational Change, 5(4), 472-
489.
86
Zaman, M., & Chayasombat, J. (2014). Audit pricing and product differentiation in small private firms: evidence
from Thailand. Journal of Accounting in Emerging Economies, 4(2), 240-256.
87
Yamamura, E. (2011). The effects of the social norm on cigarette consumption: evidence from Japan using panel
data. Japan and the World Economy, 23(1), 6-12.
88
Hitt, M. A., Bierman, L., Shimizu, K., & Kochhar, R. (2001). Direct and moderating effects of human capital on
strategy and performance in professional service firms: A resource-based perspective. Academy of Management
journal, 44(1), 13-28.
89
Hitt, M. A., Bierman, L., Shimizu, K., & Kochhar, R. (2001). Direct and moderating effects of human capital on
strategy and performance in professional service firms: A resource-based perspective. Academy of Management
journal, 44(1), 13-28.
90
Hsiao, C. (1986). Analysis of Panel Data, Econometric Society Monograph No. 11.
91
Sayrs, L. W. (1989). Pooled time series analysis. Newbury Park, CA: Sage
92
Bergh, D. D. (1993). Don't “waste” your time! The effects of time series errors in management research: The case
of ownership concentration and research and development spending. Journal of Management, 19(4), 897-914.
93
When Customers Disappoint: A Model of Relational Internal Marketing and Customer , Academy of Marketing
Science Journal; Spring; 32, 2; pg. 112
94
James, Lawrence R. (1982), Aggregation Biais in Estimates of perceptual Agreement, Journal of Applied
Psychology , 67 (April): 219-229
95
Osborne, J. W. (2000). Advantages of hierarchical linear modeling. Practical Assessment, Research &
Evaluation, 7(1), 1-3.
96
Georgopoulos, B. S. (1986). Organizational Structure, Problem-Solving, and Effectiveness. San Francisco: Jossey-
Bass. Cite par Simon J. Bell Bülent Mengüç Sara L. Stefani (2004); When Customers Disappoint: A Model of
Relational Internal Marketing and Customer Complaint; Journal of the Academy of Marketing Science. Volume 32,
No. 2, pages 118.
97
James, Lawrence R., Robert G. Demaree, and GerritWolf. (1984); Estimating Within-Group Interrater Reliability With and
Without Response Bias; Journal of Applied Psychology 69 (February): 85-98. James, Lawrence R.
98
Baruch, Y., Grimland, S., & Vigoda-Gadot, E. (2014). Professional vitality and career success: Mediation, age and
outcomes. European Management Journal, 32(3), 518-527.
99
Simon J. Bell Bülent Mengüç Sara L. Stefani (2004); When Customers Disappoint: A Model of Relational Internal
Marketing and Customer Complaints; Journal of the Academy of Marketing Science. Volume 32, No. 2, pages 118.
100
Philippe SAINT PIERRE (2012) ; Introduction à l'analyse des durées de survie 1 Avril
101
Dansereau, F., Jr., & Alutto, J. A. 1990. Level-of-analysis issues in climate and culture research. In B. Schneider
(Ed.), Organizational climate and culture: 193-236. San Francisco: Jossey-Bass.
102
Stefanie E. Naumann; Nathan Bennett (2000), A Case for Procedural Justice Climate: Development and Test of a
Multilevel Model, The Academy of Management Journal, Vol. 43, No. 5. (Oct., pp. 881-889.
103
Evrard Y., B. Pras, R. Roux (2000) : Market, Etudes et recherches en Marketing, DUNOD p 339
104
Dubois, P.-L. et Jolibert, A., (1992), Le Marketing – Fondements et Pratique, Economica.
105
Armstrong, J., & Overton, T. (1977) . Estimating nonresponse bias in mail surveys. Journal of Marketing Research,
14 (August), 396-402.
106
Hair, J., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate data analysis (7th ed.). Upper saddle River, New
Jersey: Pearson Education International.
107
Little, R. J. (1988). A test of missing completely at random for multivariate data with missing values. Journal of the
American Statistical Association 83(404): 1198-1202.
108
Naomi G. Dyera, Paul J. Hangesa, Rosalie J. Hallb (2005); Applying multilevel confirmatory factor analysis techniques to
the study of leadership; The Leadership Quarterly; 16 149–167
109
Zaman, M., & Chayasombat, J. (2014). Audit pricing and product differentiation in small private firms: evidence
from Thailand. Journal of Accounting in Emerging Economies, 4(2), 240-256.
110
Dewar Robert D. and Jane E. Dutton (1986), The Adoption of Radical and Incremental Innovations : An Empirical
Analysis ; Management Science, Vol. 32, No. 11 (Nov., , pp. 1422-1433.
111
Alan G Sawyer; A Dwayne Ball (1981); Statistical power and effect size in marketing research, Journal of
Marketing Research: Aug; 18
112
Maxwell, S. E. (2000), Sample size and multiple regression analysis, Psychological Methods, 5, 434–458.
113
Robert C. MacCallum Keith F. Widaman Kristopher J. Preacher (2001); Sample Size in Factor Analysis: The Role of
Model Error; Multivariate Behavioral Research, 36 (4), 611-637
114
Chéron, E. J., & Zins, M. (1983). Recherche en marketing: méthodes et décisions. Chicoutimi, Québec: G. Morin.
115
Jöreskog, K. G., & Sörbom, D. (1982). Recent developments in structural equation modeling. Journal of marketing
research, 404-416.
116
Stevens, J. (1996). Applied multivariate statistics for the social sciences (3rd ed.). Mahwah, New Jersey: Erlbaum.
117
Loehlin, J. C. (1992). Latent Variable Models: An Introduction to Factor. Path, and Structural Analysis Lawrence
Erlbaum Ass., Publishers, Hillsdale, New Jersey.
118
Westland, J. C. (2010). Lower bounds on sample size in structural equation modeling. Electronic Commerce
Research and Applications, 9(6), 476-487.
119
Ryu, J. S., Decosta, J. P. L. E., & Andéhn, M. (2016). From branded exports to traveler imports: Building destination
image on the factory floor in South Korea. Tourism Management, 52, 298-309.
120
Fynes, B., Voss, C., & de Búrca, S. (2005). The impact of supply chain relationship dynamics on manufacturing
performance. International Journal of Operations & Production Management, 25(1), 6-19.
121
Byrne, M., Chughtai, A., Flood, B., Murphy, E., & Willis, P. (2013). Burnout among accounting and finance
academics in Ireland. International Journal of Educational Management, 27(2), 127-142.
122
Kyriaki Kaplanidou and Christine Vogt (2006), A Structural Analysis of Destination Travel Intentions as a Function
of Web Site Features, Journal of Travel Research; 45; 204
123
Raimondo, M. A., " Nino" Miceli, G., & Costabile, M. (2008). How relationship age moderates loyalty formation:
The increasing effect of relational equity on customer loyalty. Journal of Service Research, 11(2), 142-160.
124
Aaker, D.A., Kumar, V. and Day, G.S. (2001), Marketing Research, John Wiley and Sons, New York.
125
Baruch, Y. 1999. Response rate in academic studies-A comparative analysis. Human relations 52(4), pp. 421-438.
126
Singleton, R. A., Straits, B. C., & Straits, M. M. (2005). Approaches to Social Sciences.
127
Nandedkar, A., & Brown, R. S. (2017). Should I Leave or Not? The Role of LMX and Organizational Climate in
Organizational Citizenship Behavior and Turnover Relationship. Journal of Organizational Psychology, 17(4), 51-
66.
128
Olsen, R. A., & Cox, C. M. (2001). The influence of gender on the perception and response to investment risk: The
case of professional investors. The journal of psychology and financial markets, 2(1), 29-36.
129
Nuhu, N. A., Baird, K., & Appuhami, R. (2016). The Association between the Use of Management Accounting
Practices with Organizational Change and Organizational Performance. In Advances in Management Accounting
(pp. 67-98). Emerald Group Publishing Limited.
130
Kemper, J., Schilke, O., & Brettel, M. (2013). Social capital a eu microlevel origin of organizational
capabilities. Journal of Product Innovation Management,30(3), 589-603.
131
Abu Hussain, H., & Al-Ajmi, J. (2012). Risk management practices of conventional and Islamic banks in
Bahrain. The Journal of Risk Finance, 13(3), 215-239.
132
Malhotra, N. K., Hall, J., Shaw, M., & Oppenheim, P. (2006). Marketing research : An applied orientation (3rd ed.).
French Forest: Prentice Hall
133
Shun Yin Lam Venkatesh Shankar M. Krishna Erramilli Bvsan Murthy (2004); Customer Value, Satisfaction, Loyalty, and
Switching Costs: An Illustration From a Business-to-Business Service Context, Journal of the Academy of Marketing Science.
Volume 32, No. 3, pages 293-311.
134
Saldanha, J. P., Shane Hunt, C., & Mello, J. E. (2013). Driver management that drives carrier performance. Journal
of Business Logistics, 34(1), 15-32.
135
Wouters, M., Anderson, J. C., & Wynstra, F. (2005). The adoption of total cost of ownership for sourcing
decisions––a structural equations analysis. Accounting, Organizations and Society, 30(2), 167-191.
136
Michael J., Dorsch Scott R. Swanson and Scott W. Kelley (1998); the Role of Relationship Quality in the
Stratification of Vendors as Perceived by Customers; Journal of the Academy of Marketing Science. Volume 26,
No. 2, pages 128-142
137
Viator, R. E. (2001). An examination of African Americans' access to public accounting mentors: perceived
barriers and intentions to leave. Accounting, Organizations and Society, 26(6), 541-561.
138
Hult, G. T. M., Hurley, R. F., & Knight, G. A. (2004). Innovativeness: Its antecedents and impact on business
performance. Industrial marketing management, 33(5), 429-438.
139
Gonzalez-Zapatero, C., Gonzalez-Benito, J., & Lannelongue, G. (2017). Understanding how the functional
integration of purchasing and marketing accelerates new product development. International Journal of
Production Economics, 193, 770-780.
140
Armstrong, J., & Overton, T. (1977). Estimating nonresponse bias in mail surveys. Journal of Marketing Research,
14 (August), 396-402.
141
Fowler, F. J. (1993). Survey research methods. Applied research methods series 1. Newbury Park, CA: Sage.
142
Hult, G. T. M., Hurley, R. F., & Knight, G. A. (2004). Innovativeness : Its antecedents and impact on business
performance. Industrial marketing management, 33(5), 429-438.
143
Pruijssers, J and van Oosterhout, J. and Heugens, Pursey P.M.A.R., (2013), Organizational Antecedents of
Dysfunctional Auditor Behaviors: The Mitigating Role of Audit Firm Governance (April 16, 2013). Available at
SSRN: https://ssrn.com/abstract=2251828 or http://dx.doi.org/10.2139/ssrn.2251828
144
Abu Hussain, H., & Al-Ajmi, J. (2012). Risk management practices of conventional and Islamic banks in
Bahrain. The Journal of Risk Finance, 13(3), 215-239.
145
Ahmed, I., & Manab, N. A. (2016). Moderating Effects of Board Equity Ownership on the Relationship between
Enterprise Risk Management and Firms Performance: Data Screening and Measurement Model. benefits, 7(6).
146
Lambert, D.M., and Harrington, T.C. (1990). Measuring Nonresponse Bias in Customer Service Mail Surveys., Journal of
Business Logistics 11(2):5–25.
147
Hult, G. T. M., Hurley, R. F., & Knight, G. A. (2004). Innovativeness : Its antecedents and impact on business
performance. Industrial marketing management, 33(5), 429-438.
148
Saldanha, J. P., Shane Hunt, C., & Mello, J. E. (2013). Driver management that drives carrier performance. Journal
of Business Logistics, 34(1), 15-32.
149
Collier, P., & Gregory, A. (1996). Audit committee effectiveness and the audit fee. European Accounting
Review, 5(2), 177-198.
150
Shun Yin Lam Venkatesh Shankar M. Krishna Erramilli Bvsan Murthy (2004); , Loyalty, and Switching Costs:
An Illustration From a Business-to-Business Service Context, Journal of the Academy of Marketing Science.
Volume 32, No. 3, pages 293-311.
151
Baker, H. K., & Kapoor, S. (2015). Why Indian firms issue stock distributions. Managerial Finance, 41(7), 658-672.
152
Rebecca Weston and Paul A. Gore, Jr. (2006) A Brief Guide to Structural Equation Modeling; The Counseling
Psychologist; 34; 719-751.
153
St-Pierre, Line (1999); En pensant à demain: un modèle de prédiction des comportements déviants chez les
adolescents Line St-Pierre Ecole de Psychologie ; Thèse École des Etudes Supérieures et de la Recherche de
l'université d'Ottawa.
154
Kenneth Bollen (1987), Outliers and Improper Solutions: A Confirmatory Factor Analysis; Example 375
Sociological Methods Research 1987; 15; 375
155
Tabachnick, B. G., h Pidell, L. S. (1996). Using multivariate S t a t i s t i c s (3rd ed.). California : Harper & Collins
College Publishers cités par. « En pensant à demain*: un modèle de prédiction des comportements déviants chez
les adolescents Line St-Pierre Ecole de Psychologie Thèse déposée à l’Éco1e des Etudes Supérieures et de la
Recherche de l'université d'Ottawa dans le cadre des exigences du programme de doctorat
156
www.utexas.edu/courses/.../DetectingOutliers.ppt
157
Hair J., Black W., Babin B. et Anderson R. (2009), Multivariate data analysis: A global perspective, 7th Edition, NJ:
Pearson.
158
Fox J. (1984): Regression diagnostics, Series Quantitatives in the Social Sciences, S a Sage University paper 79
159
Akrout Onsa (2016) ; Intention de quitter la profession d’expertise comptable : Acuité, Déterminants et Profils.
Thèse de Doctorat en Sciences de Gestion, Université de Carthage, IHEC de Cathage.
160
Kline, R. B. (2011). Principles and practice of structural equation modeling. 2011. New York: Guilford Press Google
Scholar.
161
Smith, R. E., & Wright, W. F. (2004). Determinants of customer loyalty and financial performance. Journal of
management accounting research, 16(1), 183-205.
162
Lam, S. Y., Shankar, V., Erramilli, M. K., & Murthy, B. (2004). Customer value, satisfaction, loyalty, and switching
costs : an illustration from a business-to-business service context. Journal of the academy of marketing science,
32(3), 293-311.
163
Tabachnick, Barbara G. and Linda S. Fidell. 1996. Using Multivariate Statistics. 3d ed. New York : HarperCollins
164
Lam, S. Y., Shankar, V., Erramilli, M. K., & Murthy, B. (2004). Customer value, satisfaction, loyalty, and switching
costs: an illustration from a business-to-business service context. Journal of the academy of marketing science,
32(3), 293-311.
165
Michael Trimarchi and James Routledge (2001), An Exploratory Study of Interfirm +Between Hong Kong Buyers,
and Sellers from the West, Working Paper 01/2 December, UNIVERSITY OF THE SUNSHINE COAST FACULTY OF
BUSINESS WORKING PAPER SERIES
166
Tabachnick, G. B., & Fidell, S. L. (2007). Using Multivariate Statistics (5th ed.). New York: Pearson Educational Inc.
167
Hair, J., Black, W. C., Babin, B. J., & Anderson, R. E. (2010). Multivariate data analysis (7th ed.). Upper saddle River, New
Jersey: Pearson Education International.
168
Kabiru Jinjiri Ringim , Mohd Rizal Razalli and Norlena Hasnan (2012); A Framework of Business Process Re-
engineering Factors and Organizational Performance of Nigerian Banks, Asian Social Science Vol. 8, No. 4; April
169
Gerard, J. M., Krishnakumar, A., & Buehler, C. (2006). Marital conflict, parent-child relations, and youth
maladjustment: A longitudinal investigation of spillover effects. Journal of Family Issues, 27(7), 951-975.
170
Rubin, D. B. (1976). Inference and missing data. Biometrika, 61, 581-592.
171
Weston, R., & Gore, P. A. (2006). A brief guide to structural equation modeling. The Counseling Psychologist,
34(5), 719-751.
172
Liberatore, J., & Miller, T. (2016). Outbound Logistics Performance and Profitability: Taxonomy of Manufacturing
and Service Organizations. Bus Eco J, 7(221), 2
173
Schlomer, G. L., Bauman, S., & Card, N. A. (2010). Best practices for missing data management in counseling
psychology. Journal of Counseling psychology, 57(1), 1.
174
Kline, R.B., 1998. Principles and Practice of Structural Equation Modelling. Guilford Press, New York.
175
Nikos Tsikriktsis (2005) A review of techniques for treating missing data in OM survey research, Journal of
Operations Management, 24 53–62
176
Acock, A. C. (2005). Working with missing values. Journal of Marriage and family, 67(4), 1012-1028.
177
Thomas, R., & Wood, E. (2015). The absorptive capacity of tourism organisations. Annals of Tourism Research, 54,
84-99.
178
Son, C. G., Bilke, S., Davis, S., Greer, B. T., Wei, J. S., Whiteford, C. C., ... & Khan, J. (2005). Database of mRNA gene
expression profiles of multiple human organs. Genome research, 15(3), 443-450.
179
Francis-Smythe, J., Haase, S., Thomas, E., & Steele, C. (2013). Development and validation of the career
competencies indicator (CCI). Journal of Career Assessment, 21(2), 227-248.
180
Sandvik, C., Gjestad, R., Samdal, O., Brug, J., & Klepp, K. I. (2009). Does socio-economic status moderate the
associations between psychosocial predictors and fruit intake in school The unit of analysis: Group children? The
Pro Children study. Health education research, cyp055.
181
Caldwell, D. F., Chatman, J. A., & O'Reilly, C. A. (1990). Building organizational commitment: A multifirm
study. Journal of occupational Psychology, 63(3), 245-261.
182
Lundin, J. (2015). Entrepreneurship and Economic Growth: Evidence from GEM Data.
183
Paulhus, D. L. (1991). Measurement and control of response bias.Measurement and control of response
bias.
184
Dorsch, M. J., Swanson, S. R., & Kelley, S. W. (1998). The role of relationship quality in the stratification of
vendors as perceived by customers. Journal of the Academy of marketing Science, 26(2), 128.
185
Jayanti, R. K., McManamon, M. K., & Whipple, T. W. (2004). The effects of aging on brand attitude
measurement. Journal of Consumer Marketing, 21(4), 264-273.
186
Shulman, A. (1973). A comparison of two scales on extremity response bias. The Public Opinion Quarterly, 37(3),
407-412.
187
Dwyer, F. R., & Oh, S. (1988). A transaction cost perspective on vertical contractual structure and
interchannel competitive strategies. The Journal of Marketing, 21-34.
188
Akrout, F. (1996). Analyse macromarketing de la dynamique des circuits de distribution : construction et test d'un
modèle intégré (Doctoral dissertation). Université de Sfax Faculté des Sciences Economiques et de Gestion de
Sfax.
189
Zhao, X. (2005). Modeling market entry mode choice: the case of German firms in China. university of Bielefeld.
Retrieved May, 12, 2006.
190
Chow, G.C., 1960. Tests of equality between sets of coefcients in two linear regressions. Econometrica 28,
3.
191
Jones, M. A., Mothersbaugh, D. L., & Beatty, S. E. (2000). Switching barriers and repurchase intentions in services.
Journal of retailing, 76(2), 259-274.
192
Yusoff, R., & Wilson, R. (2005). An econometric analysis of conventional and Islamic bank deposits in
Malaysia. Review of Islamic Economics, 9(1), 31.
193
Ayadi, I. (2014). Technical efficiency of Tunisian banks. International Business Research, 7(4), 170.
194
Burki, U., & Kadić-Maglajlić, S. (2013). An Islamic marketing perspective on salesperson’s intentions to behave
ethically. International Journal of Social Entrepreneurship and Innovation, 2(5), 391-403.
195
Hutcheson, Graeme and Nick Sofroniou (1999); The multivariate social scientist: Introductory statistics using
generalized linear models. Thousand Oaks, CA: Sage Publications. ISBN 0761952012.
196
Simon J. Bell Bülent Mengüç Sara L. Stefani (2004); When Customers Disappoint: A Model of Relational Internal
Marketing and Customer Complaints; Journal of the Academy of Marketing Science. Volume 32, No. 2, pages 118.
197
Georgopoulos, B. S. (1986), Organizational Structure, Problem-Solving, and Effectiveness. San Francisco: Jossey-Bass.
198
Simon J. Bell Bülent Mengüç Sara L. Stefani (2004); When Customers Disappoint: A Model of Relational Internal
Marketing and Customer Complaints; Journal of the Academy of Marketing Science. Volume 32, No. 2, pages 118.
199
Davis, L. R., Ricchiute, D. N., & Trompeter, G. (1993). Audit effort, audit fees, and the provision of nonaudit
services to audit clients. Accounting Review, 135-150.
200
Cote Joseph A.; M. Ronald Buckley (1987), Estimating Trait, Method, and Error Variance: Generalizing across
70 Construct Validation Studies, Journal of Marketing Research, Vol. 24, No. 3. (Aug), pp. 315-318.
201
Lord, Frederic M. and Melvin R. Novick (1968), Statistical Theories of Mental Test Scores, Reading, MA: Addison-
Wesley (1984), Factor Correlated Measurement Error, Journal of Consumer Research; Jun; 11, 1; pg. 572.
202
Edwards J, Bagozzi R. (2000), on the nature and direction of relationships between constructs and measures.
Psychological Methods; 5(2):155–174.
203
Bagozzi, R. P., & Yi, Y. (1991). Multitrait–multimethod matrices in consumer research. Journal of Consumer
Research, 17, 426–439.
204
Philip M. Podsakoff, Scott B. MacKenzie, and Jeong-Yeon Lee Nathan P. Podsakoff (2003), Common Method
Biases in Behavioral Research: A Critical Review of the Literature and Recommended Remedies, Journal of Applied
Psychology, Vol. 88, No. 5, 879–903
205
Bagozzi, Richard P.; Yi, Youjae; Phillips, Lynn W. (1991), Assessing Construct Validity in Organizational Research,
Administrative Science Quarterly; Sep; 36, 3; pg. 421
206
Philip M. Podsakoff, Scott B. MacKenzie, and Jeong-Yeon Lee Nathan P. Podsakoff (2003), Common Method
Biases in Behavioral Research: A Critical Review of the Literature and Recommended Remedies, Journal of Applied
Psychology, Vol. 88, No. 5, 879–903
207
Markovits Yannis (2011), Normative commitment and loyal boosterism: Does job satisfaction mediate this
relationship? MIBES Transactions, Vol 5, Issue 1, Spring
208
Bagozzi, R. P., Yi, Y., & Phillips, L. W. (1991). Assessing construct validity in organizational
research. Administrative science quarterly, 421-458.
209
Markovits Yannis (2011), Normative commitment and loyal boosterism: Does job satisfaction mediate this
relationship? MIBES Transactions, Vol 5, Issue 1, Spring
210
Cote, J. A., R. Buckley. (1987). Estimating trait, method, and error variance: Generalizing across 70 construct
validation studies. Journal of. Marketing Research. 24(3) 315–318.
211
Burney, L. L., Henle, C. A., & Widener, S. K. (2009). A path model examining the relations among strategic
performance measurement system characteristics, organizational justice, and extra-and in-role performance.
Accounting, Organizations and Society, 34(3), 305-321.
212
Chen, J., Reilly, R. R., & Lynn, G. S. (2005). The impacts of speed-to-market on new product success: the
moderating effects of uncertainty. Engineering Management, IEEE Transactions on, 52(2), 199-212.
213
Nicolaou, A. I. (2000). A contingency model of perceived effectiveness in accounting information systems:
Organizational coordination and control effects. International Journal of Accounting Information Systems, 1(2),
91-105.
214
Poznanski, P. J. (1991). The effects of organizational commitment, professional commitment, life-span career
development, and self-monitoring on job satisfaction and job performance among staff accountants (Doctoral
dissertation, Texas Tech University).
215
Aranya, N., & Ferris, K. R. (1984). A reexamination of accountants' organizational-professional conflict.
Accounting Review, 1-15.
216
Bline, D. M., Meixner, W. F., & Duchon, D. (1991). The measurement of organizational and professional
commitment: An examination of the psychometric properties of two commonly used instruments. Behavioral
Research in Accounting.
217
Cohen, A., & Sayag, G. (2010). The effectiveness of internal auditing: an empirical examination of its determinants
in Israeli organisations. Australian Accounting Review, 20(3), 296-307.
218
Nasution, H. N., & Mavondo, F. T. (2008). Organisational capabilities: antecedents and implications for customer
value. European Journal of Marketing, 42(3/4), 477-501.
219
Abrahamson, M. (1983). Social Research Methods. Englewood Cliffs, NJ: Prentice-Hall
220
Caldwell, D. F., Chatman, J. A., & O'Reilly, C. A. (1990). Building organizational commitment: A multifirm study.
Journal of occupational Psychology, 63(3), 245-261.
221
Markovits, Y. (2011). Normative commitment and loyal boosterism: Does job satisfaction mediate this
relationship?. MIBES Transactions, TEI Larissas, 5(1), 73-89.
222
Lui, S. S., Ngo, H. Y., & Tsang, A. W. N. (2001). Interrole conflict as a predictor of job satisfaction and propensity to
leave: A study of professional accountants. Journal of Managerial Psychology, 16(6), 469-484.
223
Lindell, M.K. and Brandt, C.J. (2000), Climate quality and climate consensus as mediators of the relationship between
organizational antecedents and outcomes, Journal of Applied Psychology, Vol. 85 No. 1, pp. 331-348.
224
Green, K. W., Toms, L. C., & Clark, J. (2015). Impact of market orientation on environmental sustainability
strategy. Management Research Review, 38(2), 217-238.
225
Lindell, M. K., & Whitney, D. J. (2001). Accounting for common method variance in cross-sectional research
designs. Journal of applied psychology, 86(1), 114.
226
Harman, D. (1967). A single factor test of common method variance. Journal of Psychology, 35(1967), 359-378.
227
Newkirk Henry E. and Albert L. Lederer (2006), The effectiveness of strategic information systems planning under
environmental uncertainty, Information & Management 43 481–501
228
Igbaria, Magid, et al. "Personal computing acceptance factors in small firms: a structural equation model." MIS
quarterly (1997): 279-305.
229
Podsakoff, P.M., & Organ, D.W. (1986). Self-reports in organizational research: Problems and prospects. Journal of
Management, 12, 69–82.
230
Seibert, S. E., Kraimer, M. L., & Liden, R. C. (2001). A social capital theory of career success. Academy of
Management Journal, 44(2), 219-237.
231
Kandemir, D., Yaprak, A., & Cavusgil, S. T. (2006). Alliance orientation: conceptualization, measurement, and
impact on market performance. Journal of the academy of marketing science, 34(3), 324-340.
232
Golden Timothy D. and John F. Veiga (2008), The impact of superior–subordinate relationships on the
commitment, job satisfaction, and performance of virtual workers, The Leadership Quarterly 19 77–88
233
Sanjay T. Menon (2001), Employee Empowerment: An Integrative Psychological Approach, APPLIED
PSYCHOLOGY: AN INTERNATIONAL REVIEW, , 50 (1), 153±180
234
Newkirk Henry E. And Albert L. Lederer (2006), The effectiveness of strategic information systems planning
under environmental uncertainty, Information & Management 43 481–501
235
Parolia Neeraj, Stephen Goodman, Yuzhu Li et James J. Jiang (2007) Mediators between coordination and IS
project performance, Information & Management 44 635–645
236
BARRINGER BRUCE R. AND ALLEN C. BLUEDORN (1999) THE RELATIONSHIP BETWEEN CORPORATE
ENTREPRENEURSHIP AND STRATEGIC MANAGEMENT, Strategic Management Journal Strat. Mgmt. J., 20: 421–
444
237
Xu, Y., & Tuttle, B. M. (2005). The role of social influences in using accounting performance information to
evaluate subordinates: A causal attribution approach. Behavioral Research in Accounting, 17(1), 191-210.
238
Augustine, O. E., Efayena, O., & Edegware, J. (2014), Behavioural Factors Affecting Accounting Task Performance.
European Journal of Business and Management www.iiste.org ISSN 2222-1905 (Paper) ISSN 2222-2839 (Online)
Vol.6, No.8, 2014
239
Rudd John M., Gordon E. Greenley, Amanda T. Beatson, Ian N. Lings (2008) Strategic planning and performance:
Extending the debate, Journal of Business Research 61 99–108
240
Kandemir, D., Yaprak, A., & Cavusgil, S. T. (2006). Alliance orientation: conceptualization, measurement, and
impact on market performance. Journal of the Academy of Marketing Science, 34(3), 324-340.
241
Williams, L. J., & Anderson, S. E. (1994). An alternative approach to method effects by using latent-variable
models: Applications in organizational behavior research. Journal of Applied Psychology, 79(3), 323.
242
Rahman, S. (2015). Relationship between employee corporate social responsibility (CSR) attitudes, job
satisfaction and organisational commitment in Bangladesh. Macquarie Graduate School of Management
Macquarie University, Macquarie Park, NSW, Australia
243
Destan Kandemir; Attila Yaprak; S Tamer Cavusgil (2006); Alliance Orientation: Conceptualization, Measurement,
and Impact on Market Performance; Academy of Marketing Science Journal; Summer; 34, 3; pg. 324
244
Buchan, H. F. (2005). Ethical decision making in the public accounting profession: An extension of Ajzen’s theory
of planned behavior. Journal of Business Ethics, 61(2), 165-181.
245
Ryan, J. J. (2001). Moral reasoning as a determinant of organizational citizenship behaviors: A study in the public
accounting profession. Journal of business Ethics, 33(3), 233-244.
246
Carbonell, P., & Rodríguez-Escudero, A. I. (2009). Relationships among team's organizational context, innovation
speed, and technological uncertainty: An empirical analysis. Journal of Engineering and Technology Management,
26(1), 28-45.
247
Liu, Y., Luo, Y., & Liu, T. (2009). Governing buyer–supplier relationships through transactional and relational
mechanisms: Evidence from China. Journal of Operations Management, 27(4), 294-309.
248
Lindell, M. K., & Whitney, D. J. (2001). Accounting for common method variance in cross-sectional research
designs. Journal of applied psychology, 86(1), 114.
249
Lachman, R., & Aranya, N. (1986). Evaluation of alternative models of commitments and job attitudes of
professionals. Journal of Organizational Behavior, 7(3), 227-243.
250
Buchan, H. F. (2005). Ethical decision making in the public accounting profession: An extension of Ajzen’s theory
of planned behavior. Journal of Business Ethics, 61(2), 165-181.
251
Campion, M. A., Cheraskin, L., & Stevens, M. J. (1994). Career-related antecedents and outcomes of job rotation.
Academy of Management Journal, 37(6), 1518-1542.
252
Carson, K. D., Carson, P. P., & Bedeian, A. G. (1995). Development and construct validation of a career
entrenchment measure. Journal of Occupational and Organizational Psychology, 68(4), 301-320.
253
Mohamed Abdou Moustafa (2004), Testing the Weak-Form Efficiency of the United Arab Emirates Stock Market,
Al Ain University, International Journal of Business, Vol. 9, No. 3,
254
RF Hurley (1998), Alternative indexes for monitoring customer perceptions of service quality: a comparative
evaluation in a retail context, … - Journal of the Academy of Marketing …,
255
(SPSS11)
256
Chou, C.-P., & Bentler, P. M. (1990). Model modification in covariance structure modeling: A comparison among
the likelihood ratio, Lagrange Multiplier, and Wald tests. Multivariate Behavioral Research, 25, 115-136
257
Rebecca Weston and Paul A. Gore, Jr. (2006) A Brief Guide to Structural Equation Modeling; The Counseling
Psychologist 34; 719-751.
258
Lynn, M. L., Naughton, M. J., & VanderVeen, S. (2009). Faith at work scale (FWS): Justification, development, and
validation of a measure of Judaeo-Christian religion in the workplace. Journal of business ethics, 85(2), 227-243.
259
Kline, R. B. (2005). Principles and practice of structural equation modeling (2nd ed.). New York: Guilford.
260
Rebecca Weston and Paul A. Gore, Jr. (2006); A Brief Guide to Structural Equation Modeling; The Counseling
Psychologist 34; 719-751.
261
Mardia K.V. (1970), Measures of multivariate skewness and kurtosis with applications, Biometrika 57, 519–530.
262
Ga´ bor J. Sze´ kelya, and Maria L. Rizzob (2005); A new test for multivariate normalité ; Journal of Multivariate
Analysis; 93 58–80
263
Ke-Hai Yuan, Paul L. Lambert and Rachel T. Fouladi (2004), Mardia’s Multivariate Kurtosis with Missing Data,
Multivariate Behavioral Research, 39 (3), 413-437
264
Bryman, A. & Cramer, D. (2001). Quantitative Data Analysis with SPSS Release 10 for Windows, London:
Routledge.
265
Romeu, J.L., Ozturk, A., 1993. A comparative study of goodness of fit tests for multivariate normality ; . Journal of
Multivariate Analysis, 46, 309-334.
266
Patrice Roussel, Frédéric Wacheux (2005) ; Management des ressources humaines : Méthodes de recherche en
sciences humaines et sociales ; Publié par De Boeck Université
267
Bootstrapping goodness-of-fit measures in structural equation models
268
Donald R McCreary; Nancy D Rhodes; Deborah M Saucier (2002), A confirmatory factor analysis of the short form
sex role behavior scale, Sex Roles; Aug; 47, 3/4; Academic Research Library pg. 169-177
269
Suàrez Àlvarez, L., Díaz Martín, A. M., & Casielles, R. V. (2007). Relationship marketing and information and
communication technologies: Analysis of retail travel agencies. Journal of travel Research, 45(4), 453-463.
270
Schmidt, P., & Muller, E. N. (1978). The problem of multicollinearity in a multistage causal alienation model: A
comparison of ordinary least squares, maximum-likelihood and ridge estimators. Quality & Quantity, 12(4), 267-
297.
271
Kaplan, D. (1994). Estimator conditioning diagnostics for covariance structure models. Sociological methods &
research, 23(2), 200-229.
272
Grewal, R., Cote, J. A., & Baumgartner, H. (2004). Multicollinearity and measurement error in structural equation
models : Implications for theory testing. Marketing Science, 23(4), 519-529.
273
Bryman, A., & Cramer, D. (1997). Quantitative data analysis with SPSS for windows. London: Routledge.
274
Williams, S. V. (2003). An empirical investigation of turnover intentions of internal auditors (Doctoral dissertation,
Virginia Commonwealth University).
275
Carson, G. D. (2011). StatNotes : Topics in Multivariate Analysis. Retrieved from.
276
Rockwell, R. C. (1975). Assessment of multicollinearity : The Haitovsky test of the determinant. Sociological
Methods & Research, 3(3), 308-320.
277
Siddiqui, T. A., & Siddiqui, K. I. (2017). Exploring Linkages between Telecom and Financial Inclusion : An
Innovative Strategy for Success. Proceedings of International Conference on Strategies in Volatile and Uncertain
Environment for Emerging Markets July 14-15, 2017 Indian Institute of Technology Delhi, New Delhi pp.830-837
278
Greene, W.H., 1993. Econometric Analysis, third ed. Prentice-Hall, Upper Saddle River, NJ.
279
Hong J.S. (1996) SAS and Statistical Data Analysis. Tamjin Publications, Seoul, pp. 335–411.
280
Wiengarten, F., Humphreys, P., Cao, G., Fynes, B., & McKittrick, A. (2010). Collaborative supply chain practices
and performance : exploring the key role of information quality. Supply Chain Management : An International
Journal, 15(6), 463-473.
281
Fuerman, R. D. (2009). Bernard Madoff and the solo auditor red flag.
282
Shin, H., Park, Y. J., & Kim, M. J. (2006). Predictors of maternal sensitivity during the early postpartum
period. Journal of Advanced Nursing, 55(4), 425-434.
283
Islam, M. S., & Dooty, E. N. (2015). Determinants of stock price movements: Evidence from Chittagong stock
exchange, Bangladesh. Journal of Economics and Business Research, 21(2), 117-133.
284
Hughes, J. N., Webster-Stratton, B. T., & Cavell, T. A. (2004). Development and validation of a gender-balanced
measure of aggression-relevant social cognition. Journal of Clinical Child and Adolescent Psychology, 33(2), 292-
302.
285
Wiengarten, F., Humphreys, P., Cao, G., Fynes, B., & McKittrick, A. (2010). Collaborative supply chain practices
and performance : exploring the key role of information quality. Supply Chain Management : An International
Journal, 15(6), 463-473.
286
Wang, G. C. (1996). How to handle multicollinearity in regression modeling. Journal of Business Forecasting
Methods and Systems, 15, 23-27.
287
Aiken, L. S., West, S. G., & Reno, R. R. (1991). Multiple regression : Testing and interpreting interactions. Sage.
288
Soon Ang and Larry L. Cummings 1997), “Stratégic Response to institutional Influences on Informations systems
Outsourcing”, Organisation Science, Vol 8, N°3 (May 1), pp 235-256.
289
Yang, Y., Zhang, M., & Kou, Y. (2016). Self-compassion and life satisfaction : The mediating role of hope.
Personality and Individual Differences, 98, 91-95.
290
Dewar, R. D., & Dutton, J. E. (1986). The adoption of radical and incremental innovations: An empirical analysis.
Management science, 32(11), 1422-1433.
291
Khlif, H., A., Guidara, A., & Hussainey, K. (2016). Sustainability level, corruption and tax evasion: a cross-country
analysis. Journal of Financial Crime, 23(2), 328-348.
292
Coffé, H., & Geys, B. (2005). Institutional performance and social capital: An application to the local
government level. Journal of urban affairs, 27(5), 485-501.
293
Poudel, K. P., Carter, R., & Lonial, S. (2012). The process aspect of entrepreneurial orientation-performance
relationship: Uncovering the mediating roles of technological capabilities, innovation and firm growth. Frontiers
of Entrepreneurship Research, 32(12), 3.