Análisis Factorial Confirmatorio PDF
Análisis Factorial Confirmatorio PDF
Análisis Factorial Confirmatorio PDF
Nota importante
Los presentes apuntes forman parte del borrador del libro de Joaqun
Alds y Ezequiel Uriel Anlisis Multivariante Aplicado que ser
prximamente publicado por la editorial Thomson-Paraninfo. Por lo
tanto, como tal borrador pueden existir erratas, siendo bienvenidos todos
los comentarios que las detecten y sugerencias sobre la mejora del
captulo.
13 ECUACIONES ESTRUCTURALES:
ANLISIS FACTORIAL CONFIRMATORIO
13.1 INTRODUCCIN
L
X1=L
X2=FSF
X3=H
X4=M
X5=FSC
X6=Q
1
0,493
0,401
0,278
0,317
0,284
FSF
1
0,314
0,347
0,318
0,327
1
0,147
0,183
0,179
FSC
1
0,587
0,463
1
0,453
12=21
11
2
61
12
21 31 4151
22 32 42 52
62
x1
x2
x3
x4
x5
x6
Las variables latentes son de dos tipos. Los mencionados factores comunes (), que son
comunes en cuanto que sus efectos son compartidos por ms de una variable observada, y los
factores especficos o errores (). Como se comprueba en la figura 13.1, cada uno de estos
factores afecta solamente a una variable observada, y son errores aleatorios que se pueden
haber producido en la medida de la variable observada. Finalmente, la flecha curva con dos
puntas que une a los factores comunes, indica que estas variables estn correlacionadas con
una intensidad 12.
Planteados los convenios de representacin y los trminos empleados en el AFC que son
comunes a los de los modelos de estructuras de covarianza, que se examinarn en el prximo
tema, nos restara por sealar las diferencias del anlisis factorial confirmatorio con respecto
al anlisis factorial exploratorio, examinado en el tema 12, o con respecto al modelo de
estructuras de covarianza.
Volviendo a nuestro ejemplo, el investigador quiere saber si las notas estn midiendo un
nico componente de la inteligencia o, por el contrario, reflejan el efecto de varios
componentes. Como l no tiene establecida una hiptesis a priori, su anlisis factorial ha de
contemplar como plausibles todas las posibilidades. Un caso extremo consistira en que todas
las variables carguen de forma significativa sobre un solo factor. Un caso intermedio, aunque
puede haber otras muchas combinaciones, consistira en que un grupo de variables cargue
significativamente sobre un factor y el resto de variables lo haga sobre un segundo factor. La
figura 13.1 recoge todas las posibilidades y, en concreto, estos dos casos. En el primer caso,
11, 21, ... , 61 seran significativos, mientras que 12, 22, ... , 62 no lo seran. En el segundo
caso, 11, 21 y 31 tendran un valor significativo y 41, 51, 61 no (las notas en literatura,
filosofa e historia cargan sobre un factor, inteligencia verbal, y no sobre el otro); por otra
parte, 12, 22, 32 tendran un valor no significativo, mientras que 42, 52, 62 s (las notas en
12=21
11
42
21 31
52 62
x1
x2
x3
x4
x5
x6
12=21
32=23
45=54
56=65
46=64
13=31
13
23
1
11
42
21 31
52 62
x1
x2
x3
x4
x5
x6
0
x2 21
2
x
0 1 3
3 = 31
+
x 0
42 2 4
4
x5 0 52
5
x6 0 62
6
o de manera compacta:
x = +
(13-1)
= E ( xx ) = E ( + )( + )
Teniendo en cuenta que la traspuesta de una suma de matrices es la suma de las traspuestas y
que la traspuesta de un producto es el producto de las traspuestas en orden inverso, tenemos
que:
= E [ ( + )( + ) ]
y teniendo en cuenta la propiedad distributiva y calculando la esperanza:
= E [ + + + ]
= E [ ] + E [ ] + E [ ] + E [ ]
Dado que la matriz no contiene variables aleatorias, al ser constantes los parmetros
poblacionales, se tiene que:
= E [ ] + E [ ] + E [ ] + E [ ]
(13-2)
Si hacemos
= E [ ]
= E [ ]
y asumimos que y estn incorrelacionados entre s, la expresin (13-2) puede escribirse
del siguiente modo:
= +
(13-3)
21
0
0
0
21 22 23
0
0
0
31 32 33 0
11 12
31
; =
=
; = 0
0
0
0 44 45 46
12 22
42
0
0
0 54 55 56
0 52
0
0
0 64 65 66
62
donde los subrayados indican que esos elementos de las matrices y son 0 por la
especificacin concreta que tiene el modelo que se quiere contrastar. Lgicamente, si el
investigador asumiera otras hiptesis la configuracin de estas matrices sera distinta. De
hecho, tal como hemos comentado anteriormente, en general, la matriz tiene 6(6+1)/2 = 21
elementos distintos a estimar (el tringulo inferior), mientras que en nuestro caso, dado el
modelo especificado, slo hay 12.
10
12=21=*
2 *
1*
1=42
1=11
21=* 31=*
x1
52=* 62=*
x3
x2
1*
x4
2*
3*
x5
4*
5*
x6
1
0=12=21 0=32=23
0=45=54 0=56=65
0=13=31
0=46=64
6*
En el modelo (13-1), como puede verse, los coeficientes correspondientes al trmino de error () son 1. Sin
embargo, en algunos programas de ordenador para tratamiento del AFC se permite fijar los coeficientes a
valores distintos de 1.
2
11
Es decir, hay 13 parmetros a estimar, con lo que tenemos 8 grados de libertad, dado que el
nmero de datos es 21. Por tanto, el modelo puede someterse a contraste. A continuacin
aprovecharemos el ejemplo para presentar la sintaxis que nos permite estimarlo mediante uno
de los programas que indicbamos al comienzo del captulo, concretamente, el EQS.
El EQS se basa en la notacin de Bentler y Weeks (1980) que se limita a distinguir entre
variables dependientes e independientes en el AFC. Una variable ser independiente cuando
de ella slo salga una flecha causal y ser dependiente si recibe alguna. Este programa denota
como Vi a las variables observadas, como Fi a los factores comunes y como Ei a los factores
12
/TITLE
CFA INTELIGENCIA VERBAL Y CUANTITATIVA
/SPECIFICATIONS
CASE=275; VAR=6; ME=ML; MA=COR; ANAL=COV;
/MATRIX
1.000
0.493
0.401
0.278
0.317
0.284
1.000
0.314
0.347
0.318
0.327
1.000
0.147
0.183
0.179
1.000
0.587
0.463
1.000
0.453
1.000
/STANDARD DEVIATIONS
1.0900 0.5900 0.9800 1.1000 0.4100 1.1100
/LABELS
V1=L; V2=FSF; V3=H; V4=M; V5=FSC; V6=Q;
F1=IV; F2=IQ;
/EQUATIONS
V1= F1+E1;
V2=*F1+E2;
V3=*F1+E3;
V4= F2+E4;
V5=*F2+E5;
V6=*F2+E6;
/VARIANCES
F1 TO F2=*;
E1 TO E6=*;
/PRINT
EFFECT=YES;
FIT=ALL;
/COVARIANCES
F1 TO F2=*;
/LMTEST
/WTEST
/END
13
correlaciones, lo que se hace bajo el apartado /MATRIZ y, en segundo lugar, para que el EQS
realice el anlisis en trminos de matriz de varianzas covarianzas es necesario ofrecerle las
desviaciones tpicas de las variables observadas (/STANDARD DEVIATIONS).
El planteamiento de las ecuaciones se hace en el apartado /EQUATIONS. Puede comprobarse
que las variables observadas son dependientes siendo explicadas por los factores comunes (Fi)
y por los especficos (Ei). As, la primera ecuacin:
V1=F1+E1
La anterior ecuacin recoge la particularidad de que el parmetro de F1 (1, en la notacin
anterior) es 1, porque se ha fijado a este valor tal y como se ve en la figura 13.4 (11=1) y lo
mismo ocurre con el parmetro del trmino de error E1. En cambio, en la segunda ecuacin:
V2=*F1+E2
el coeficiente del trmino de error sigue estando fijado a 1, pero es necesario estimar el
parmetro de F1 (21=*).
Todas las varianzas, tanto de los factores especficos como de los comunes han de estimarse,
tal como indica la instruccin /VARIANCES y lo mismo ocurre con las covarianzas ente los
factores comunes F1 y F2 (as lo indica la instruccin / COVARIANCES). As pues, queda
comprobada la sencillez de la sintaxis del programa cuando seguimos la notacin de Bentler y
Weeks (1980), dado que todo se reduce a distinguir entre variables dependientes e
independientes, lo que permite deducir de manera natural las ecuaciones. Las dos ltimas
instrucciones (/LMTEST y /WTEST) las analizaremos ms adelante. En el epgrafe siguiente,
que dedicamos a la estimacin del modelo, comentaremos las salidas resultantes de la
ejecucin del programa EQS con la sintaxis anterior.
14
Estimar el modelo, supone encontrar valores, a partir de los datos muestrales, para las
matrices anteriores (que denotamos con ^) que cumplan las restricciones impuestas en el
proceso de identificacin y que hagan que la matriz de varianzas y covarianzas estimada
mediante la expresin siguiente, sea lo ms parecida posible a S:
+
(13-4)
Long (1983) ilustra el proceso de estimacin como sigue. Inicialmente existirn infinitas
matrices estimadas de , y que satisfagan la expresin anterior, pero habr que rechazar
todas aquellas soluciones que no cumplan las restricciones que se han impuesto en la
identificacin del modelo. Llamemos genricamente *, * y * a las matrices que s
cumplen las restricciones. Esas matrices permiten obtener una estimacin de la matriz de
varianzas covarianzas poblacional * mediante (13-4). Si esta ltima matriz est prxima a S,
entonces las estimaciones de los parmetros contenidas en *, * y * seran razonables en el
sentido de ser consistentes con los datos de S.
Necesitamos una funcin, a la que denominamos una funcin de ajuste, que nos indique en
qu medida * est prxima a S. Long (1983) denota a estas funciones de ajuste con la
expresin F(S;*) y estn definidas para todas las matrices que cumplen las restricciones
marcadas en la identificacin del modelo. Si entre dos matrices que cumplen esta condicin se
verifica que F(S; 1 ) < F(S; 2 ), entonces concluiremos que 1 est ms prxima a S que
15
(13-5)
donde por tr indicamos la traza de la matriz resultante de la operacin subsiguiente, esto es, la
suma de los elementos de su diagonal. Long (1983) y Ullman (1996) indican que este mtodo
tiene dos limitaciones que hacen que no sea muy utilizado. En primer lugar, no existen
contrastes estadsticos asociados a este tipo de estimacin y, en segundo lugar, los
estimadores dependen de la escala de medida de las variables observadas, esto es, no se
alcanzara el mismo mnimo de (13-5) si las unidades del nivel de renta, por ejemplo,
estuviera medida en pesetas que si lo estuviera en millones.
Este mtodo tiene, sin embargo, algunas ventajas. As, no es necesario asumir ningn tipo de
distribucin terica de las variables observadas, frente a la hiptesis de normalidad
multivariante que asumen otros mtodos de estimacin. Por ello, si la violacin de esta
hiptesis fuera muy evidente, algunos autores recomiendan recurrir a la estimacin por este
mtodo, pero tomando como datos de partida la matriz de varianzas covarianzas estandarizada
o matriz de correlaciones - para corregir el problema de la dependencia de las unidades de
medida.
(13-6)
(13-7)
16
diagonal (o sea, q), el primer trmino de (13-7) se aproximar a q cuando las matrices estn
prximas, compensndose con el trmino q de (13-7). Por otra parte, la diferencia de los
logaritmos de los determinantes de S y * tender a 0, dado que, cuando las matrices estn
prximas, tambin lo estarn sus determinantes. De esta forma, cuando las matrices sean
iguales la funcin de ajuste ser cero.
13.4.4 Estimacin por la teora de la distribucin elptica
La estimacin EDT (Elliptical Distribution Theory) se basa en la distribucin de probabilidad
de este nombre. La distribucin normal multivariante es un caso particular de esta familia con
parmetro de curtosis4 igual a cero. En este caso, la funcin a minimizar adopta la forma:
2
2
1
FEDT ( S; * ) = ( + 1 )1 tr ( S * ) W 1 tr ( S * ) W 1
2
(13-8)
(13-9)
wijkl = ijkl ij kl
siendo ijkl momentos de 4 orden y ij y kl las covarianzas.
13.4.6 Comparacin de los distintos procedimientos de estimacin
Resumimos a continuacin los resultados del trabajo de Hu, Bentler y Kano (1992), que
analizaron mediante simulacin de Monte Carlo cmo se comportaban los distintos
procedimientos de estimacin ante distintos tamaos muestrales, violacin de las hiptesis de
normalidad y de independencia entre los trminos de error y los factores comunes.
Estos autores encontraron que, en caso de que fuera razonable asumir la normalidad, el
mtodo ML funcionaba mejor cuando el tamao muestral era superior a 500, mientras que
4
El coeficiente de curtosis de una distribucin es igual al coeficiente estandarizado de cuarto orden menos 3.
17
para tamaos inferiores a esa cifra tena un mejor comportamiento el mtodo EDT.
Finalmente, el mtodo ADF slo ofreca buenos resultados con muestras superiores a 2500
casos.
Cuando el supuesto de normalidad se violaba, los mtodos de ML y GLS solo daban buenos
resultados con muestras superiores a 2500 casos, aunque el GLS funcionaba algo mejor que el
ML en muestras inferiores. Pese a no adoptar el supuesto de normalidad, el mtodo ADF
tampoco daba buenos resultados con muestras inferiores a 2500 casos.
Cuando se produce una violacin del supuesto de independencia entre los trminos de error y
los factores comunes, los mtodos de ML y GLS funcionan muy mal, y tambin el ADF salvo
que la muestra fuera superior a 2500 casos. En cambio, el EDT funcionaba significativamente
mejor que los dems.
A la luz de lo expuesto, Ullman (1996) recomienda:
Los mtodos de ML y GLS son la mejor opcin con pequeas muestras siempre que
sea plausible la asuncin de normalidad e independencia.
En el caso en que ambos supuestos no parezcan razonables, se recomienda recurrir a la
estimacin ML denominada escalada. Una descripcin de este procedimiento se
encuentra en Bentler (1980) y es una opcin de estimacin del EQS.
V
V
V
V
V
V
1
2
3
4
5
6
1.188
0.317
0.428
0.333
0.142
0.344
FSF
V 2
H
V
0.348
0.182
0.225
0.077
0.214
0.960
0.158
0.074
0.195
M
V
1.210
0.265
0.565
FSC
V 5
Q
V
0.168
0.206
1.232
La matriz , que contiene los coeficientes de regresin entre las variables observadas y los
factores comunes, se obtiene directamente de las ecuaciones que el EQS denomina ecuaciones
de medida y que se recogen en el cuadro 13.4. En estas ecuaciones aparecen tambin los
estadsticos para contrastes de significatividad de cada coeficiente, as como los errores
estndar, cuya interpretacin se ofrecer ms adelante.
18
0,
604
0
1
0
0
0,373
0,817
0
=V1
1.000 F1
+ 1.000 E1
FSF
=V2
.509*F1
.068
7.467
+ 1.000 E2
=V3
.604*F1
.096
6.319
+ 1.000 E3
=V4
1.000 F2
+ 1.000 E4
FSC
=V5
.373*F2
.039
9.467
+ 1.000 E5
=V6
.817*F2
.096
8.552
+ 1.000 E6
0,388 0, 698
Los subrayados indican que ese parmetro se fijo al valor sealado durante la identificacin del modelo.
19
F
--I F1
I
I
I
I F2
I
I
I
IV
IQ
.636*I
.117 I
5.443 I
I
.698*I
.112 I
6.244 I
I
F
--I F2
I F1
I
I
IQ
IV
.388*I
.068 I
5.712 I
I
Finalmente resta por obtener la estimacin de la matriz , que contiene las varianzas y
covarianzas entre los factores especficos o trminos de error. Si se observa la figura 13.4, se
comprueba que, durante la identificacin del modelo, todas las covarianzas se fijaron a 0
(como se indica con un subrayado en la matriz que se muestra a continuacin), por lo que slo
se han estimado las varianzas. El cuadro 13.6 ofrece la informacin que nos permite obtener
la estimacin de la matriz :
0
0
0
0
0
0,552
0
0,183
0
0
0
0
0
0
0,
728
0
0
0
0
0
0,512
0
0
0
0
0
0
0
0, 071
0
0
0
0
0
0, 767
0
Basta operar matricialmente de acuerdo con la expresin (13-4) para obtener la estimacin de
la matriz de varianzas covarianzas poblacional (el EQS no la ofrece):
1,188
0,324
0,384
=
0,388
0,145
0,317
0,348
0,196 0,960
0,197 0, 234
0, 074 0, 087
0,161 0,191
1, 210
0, 260 0,168
20
(13-10)
E2
FSF
E3
E4
E5
FSC
E6
D
--.552*I
.088 I
6.256 I
I
.183*I
.025 I
7.294 I
I
.728*I
.071 I
10.281 I
I
.512*I
.075 I
6.828 I
I
.071*I
.010 I
6.807 I
I
.767*I
.079 I
9.655 I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
L
FSF
H
M
FSC
Q
V
V
V
V
V
V
1
2
3
4
5
6
L
V 1
0.000
-0.007
0.044
-0.055
-0.003
0.027
(S-SIGMA) :
FSF
V 2
0.000
-0.014
0.028
0.003
0.053
H
V
0.000
-0.076
-0.014
0.003
M
V
0.000
0.004
-0.005
FSC
V 5
0.000
-0.006
AVERAGE ABSOLUTE
COVARIANCE
RESIDUALS
COVARIANCE
RESIDUALS
Q
V
0.000
0.0163
0.0228
21
22
Cuadro 13.8 Matriz residual estandarizada de varianzas covarianzas y otra informacin relacionada
STANDARDIZED RESIDUAL MATRIX:
L
FSF
H
M
FSC
Q
V
V
V
V
V
V
1
2
3
4
5
6
L
V 1
0.000
-0.011
0.041
-0.046
-0.007
0.022
FSF
V 2
0.000
-0.024
0.043
0.013
0.081
H
V
M
V
0.000
-0.070
-0.035
0.003
FSC
V 5
0.000
0.010
-0.004
0.000
-0.014
=
=
Q
V
0.000
0.0201
0.0282
6,V 2
0.081
4,V 3
-0.070
4,V 1
-0.046
4,V 2
0.043
3,V 1
0.041
5,V 3
-0.035
3,V 2
-0.024
6,V 1
0.022
6,V 5
-0.014
5,V 2
0.013
2,V 1
-0.011
5,V 4
0.010
5,V 1
-0.007
6,V 4
-0.004
6,V 3
0.003
2,V 2
0.000
3,V 3
0.000
6,V 6
0.000
5,V 5
0.000
4,V 4
0.000
RANGE
FREQ PERCENT
1
-0.5 - -0
0.00%
2
-0.4 - -0.5
0
0.00%
3
-0.3 - -0.4
0
0.00%
4
-0.2 - -0.3
0
0.00%
5
-0.1 - -0.2
0
0.00%
6
0.0 - -0.1
11 52.38%
7
0.1 0.0
10 47.62%
8
0.2 0.1
0
0.00%
9
0.3 0.2
0
0.00%
A
0.4 0.3
0
0.00%
B
0.5 0.4
0
0.00%
C
++ 0.5
0
0.00%
------------------------------TOTAL
21 100.00%
EACH "*" REPRESENTS
1 RESIDUALS
el 100% de los residuos cae dentro del intervalo [0.1; 0.1] de forma prcticamente simtrica
y, como se ha sealado, centrada en cero. En sntesis, el ajuste del modelo, a partir del anlisis
de los residuos es bueno, aunque puede existir un problema debido a la interrelacin entre las
variables V2 y V6.
(13-11)
La hiptesis alternativa postula que la matriz nc es igual a cualquier matriz que sea definida
positiva. Para el contraste de estas hiptesis en Bentler y Bonett (1980) se propone el
siguiente estadsico:
0
N FML
0
es el valor que toma la funcin de ajuste (13-7) al
donde N es el nmero de datos y FML
24
362.81793
-7.15793
392.818 ON
INDEPENDENCE CAIC =
MODEL CAIC =
15 DEGREES OF FREEDOM
293.56637
-44.09210
CHI-SQUARE =
8.842 BASED ON
8 DEGREES OF FREEDOM
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
0.35579
THE NORMAL THEORY RLS CHI-SQUARE FOR THIS ML SOLUTION IS
BENTLER-BONETT NORMED
FIT INDEX=
BENTLER-BONETT NONNORMED FIT INDEX=
COMPARATIVE FIT INDEX (CFI)
=
BOLLEN (IFI)
FIT INDEX=
McDonald (MFI)
FIT INDEX=
LISREL GFI
FIT INDEX=
LISREL AGFI
FIT INDEX=
ROOT MEAN SQUARED RESIDUAL (RMR) =
STANDARDIZED RMR
=
ROOT MEAN SQ. ERROR OF APP.(RMSEA)=
90% CONFIDENCE INTERVAL OF RMSEA (
0.977
0.996
0.998
0.998
0.998
0.989
0.971
0.027
0.044
0.020
0.000,
9.157.
0.075)
El ndice NFI (Normed Fit Index) ha sido propuesto por Bentler y Bonnett (1980) y compara
el valor del estadstico 2 del modelo terico con el del modelo independiente:
NFI =
2
2
indep
teorico
2
indep
25
Para que sea satisfactorio este estadstico, como la mayor parte de los que examinaremos a
continuacin, debe alcanzar valores superiores a 0,90 (Bentler, 1992).
En nuestro ejemplo, como puede comprobarse en el cuadro 13.9, su valor es el siguiente:
392,81 8,84
= 0,977
392,81
NFI =
Algunos trabajos han demostrado que este ndice tiene una tendencia a subestimar el ajuste
del modelo si las muestras son pequeas (Bearden, Sharma y Teel, 1982), llevando a sus
autores a plantear dos modificaciones del mismo, el ndice NNFI y el CFI.
ndice NNFI
El Nonnormed Fit Index (NNFI) incorpora los grados de libertad de los modelos terico e
independiente y aunque se evita as la subestimacin del ajuste, puede provocar en algunos
casos extremos valores fuera del rango 0-1. Otra limitacin es que, en pequeas muestras,
puede indicar un ajuste excesivamente bajo si se compara con otros modelos, tal y como
apuntan Ullman (1996) y Anderson y Gerbing (1984).
NNFI =
glindep 2
glteorico teorico
2
indep
glindep
2
indep
En el ejemplo que nos ocupa, y tomando la informacin del cuadro 13.9, este estadstico
ofrece tambin un buen ajuste:
NNFI =
15
8,84
8
= 0,996
392,81 15
392,81
ndice CFI
Este ndice (Comparative Fit Index), propuesto por Bentler (1988), corrige por el nmero de
grados de libertad del siguiente modo:
CFI =
2
2
glindep ) ( teorico
glteorico )
( indep
2
( indep glindep )
CFI =
( 392,81 15 ) ( 8.84 8 )
= 0,998
( 392,81 15 )
26
ndice IFI
Propuesto por Bollen (1989), pretende corregir la posibilidad de que el NNFI tome valores
por encima del intervalo razonable 0-1. Para ello se formula as:
2
2
indep
teorico
2
indep
glteorico
IFI =
En nuestro ejemplo este ndice tambin alcanza valores de ajuste razonables. A partir de la
informacin del cuadro 13.9, se obtiene el siguiente valor:
IFI =
392,81 8,84
= 0,998
392,81 8
ndice MFI
Propuesto por McDonald y Marsh (1990), el ndice MFI entrara en los denominados ndices
de ajuste absoluto en contraposicin a los anteriores que hemos denominado comparativos,
por basarse en poner en relacin el modelo terico con el independiente. El MFI solo toma en
consideracin la 2 del modelo terico y responde a la expresin siguiente:
MFI =
1 2
glteorico
teorico
2
N
e
donde toda la notacin es conocida salvo N que indica el tamao de la muestra. Con los datos
del cuadro 13.9 se comprueba que:
MFI =
1 8,84 8
e 2 275
= 0,998
ndice GFI
Ullman (1996) denomina a este ndice y al AGFI que, como se ver, es una sencilla
correccin de aquel, ndices de proporcin de varianza. El ndice GFI (Goodness of Fit Index)
es una ratio entre los elementos ponderados de la matriz de covarianzas poblacional estimada
y los elementos ponderados de la matriz de covarianzas muestral. Concretamente, su
expresin es la siguiente:
tr ( W )
tr ( sWs )
donde el vector contiene las varianzas de la matriz de covarianzas estimada y el vector s las
de la matriz muestral. La matriz W es una matriz de ponderacin que vara en funcin del
mtodo de estimacin elegido: la matriz identidad en el ULS, la matriz de covarianzas
muestral en el GLS, la inversa de la matriz de covarianzas estimada en el ML, etctera. Segn
puede verse en el cuadro 13.9, este estadstico toma el valor 0,981.
GFI =
27
ndice AGFI
El Adjusted Goodness of Fit Index (AGFI) es una correccin del anterior que se hace en
funcin del nmero de parmetros que se han de estimar (a los que denominanmos k) y el
nmero de datos disponibles (a los que denominamos d). Esta correccin adopta la forma:
AGFI = 1
1 GFI
k
1
d
En nuestro ejemplo, con la informacin del cuadro 13.9, y recordando que se dispona de 21
datos y 13 parmetros a estimar, el valor del estadstico es el siguiente:
AGFI = 1
1 0,989
= 0,971
13
1
21
ndice AIC
Este ndice, denominado Akaike Information Criterion (Akaike, 1987) forma parte de un
nuevo grupo que Ullman (1996) denomina ndices de grado de parsimonia, por cuanto tienen
en cuenta no solamente la bondad de ajuste estadstico sino tambin el nmero de parmetros
a estimar. Su expresin adopta la forma:
2
AIC = teorico
2 glteorico
Para nuestro ejemplo, con la informacin del cuadro 4.9 se obtiene el siguiente valor:
AIC = 8,84 2 8 = 7,15
Qu valor debe tomar este ndice? Ullman (1996) seala que lo suficientemente bajo pero,
dado que no est normalizado a un intervalo 0-1, suficientemente bajo solo puede
entenderse en trminos comparativos con otros modelos tericos, es decir, servir como
indicador para sealar si el modelo que hemos contrastado es mejor o peor que otro modelo
contrastado previamente, pero no ofrece un nivel de ajuste absoluto. Esta es la razn de que
siempre vaya acompaado por el AIC del modelo independiente, que se supone que es la base
que cualquier modelo terico debe mejorar y cuanto mayor sea la diferencia del valor del AIC
del modelo comparado con el valor correspondiente independiente, tanto mejor. En nuestro
ejemplo lo mejora muy claramente, dado que el AIC en el modelo independiente toma el
valor:
AIC = 392,81 2 15 = 362,81
ndice CAIC
El Consistent AIC (CAIC) es la correccin propuesta por Bozdogan (1987) al AIC, siendo
vlidos todos los comentarios efectuados para este ltimo. Su expresin es la siguiente:
28
2
CAIC = teorico
( ln N + 1 ) glteorico
En nuestro ejemplo, como puede verse en el cuadro 13.9, toma el siguiente valor:
CAIC = 8,84 ( ln 275 + 1 ) 8 = 44, 09
El ltimo grupo de ndices que analizaremos son los que Ullman (1996) denomina basados en
los residuos que no son sino un promedio de las diferencias entre las varianzas y covarianzas
muestrales y las estimadas que se derivan del modelo. Esto es:
q
( sij ij )
RMR =
i =1 j =1
q ( q + 1) / 2
donde toda la notacin es conocida, pero recordemos que q era el nmero de variables
observadas. En nuestro ejemplo este ndice toma el valor de 0.027.
Como los residuos sin estandarizar estn afectados por la escala en que se mide la variable, se
suelen utilizar los residuos estandarizados construyndose el llamado SRMR (Standardized
RMR) que est acotado entre 0 y 1, siendo recomendables valores inferiores a 0,05. Como
puede verse en el cuadro 13.9, el ndice SRMR se sita ligeramente por debajo de 0,05
(0,044).
13.5.3 Convergencia en el proceso de estimacin
Byrne (1994) plantea que, en cuanto que la estimacin del modelo es un proceso iterativo, el
hecho de que el algoritmo converja de una manera rpida, es indicador de un buen ajuste del
modelo. La autora considera que, si despus de dos o tres iteraciones, el cambio medio en las
estimaciones de los parmetros se estabiliza en valores muy bajos, estaremos probablemente
ante un ajuste adecuado.
El EQS ofrece (cuadro 13.10) la informacin del nmero de iteraciones que han sido
necesarias para la convergencia y el cambio medio en los parmetros en cada una de ellas
(parameter abs change). Puede comprobarse como, efectivamente, esta convergencia se ha
producido en apenas 6 iteraciones y cmo, a partir de la tercera, los cambios han sido
mnimos.
29
ITERATION
1
2
3
4
5
6
PARAMETER
ABS CHANGE
0.298689
0.124292
0.026794
0.008439
0.001469
0.000443
ALPHA
1.00000
1.00000
1.00000
1.00000
1.00000
1.00000
FUNCTION
0.88599
0.10692
0.03287
0.03231
0.03227
0.03227
Al presentar los distintos ndices de ajuste, hemos podido comprobar que en el modelo que
hemos tomado como ejemplo se ha obtenido un buen ajuste a los datos. Llegados a este
punto, vamos a analizar e interpretar los resultados que hemos mostrado.
13.6 INTERPRETACIN DEL MODELO
Hasta este momento nos hemos centrado en analizar la razonabilidad del modelo en trminos
globales (su ajuste). Ahora vamos a examinar si los estimadores de los parmetros son
tambin razonables en dos sentidos: (i) toman valores adecuados tericamente? y (ii) son
significativos?.
La mayor parte de la informacin necesaria para esta fase, ya se ha mostrado en los cuadros
13.4, 13.5 y 13.6 y a ellos referiremos nuestros comentarios.
En primer lugar, vamos a analizar si los valores que toman los parmetros estimados son o no
compatibles con el modelo estadstico. Para que exista tal compatibilidad las respuestas a las
siguientes preguntas deben ser en todos casos negativas:
Si hubiera respuestas no negativas, y aunque el ajuste global del modelo fuera ptimo,
estaramos ante un indicador claro de que (Long, 1983) esta incompatibilidad puede haberse
originado por uno o ms de los siguientes motivos:
1. El modelo est mal especificado.
2. Los datos no respaldan la hiptesis de normalidad multivariante de las variables
observadas
3. La muestra es demasiado pequea
4. El modelo est demasiado cerca de no estar identificado, lo que hace la estimacin de
algunos parmetros difcil o inestable.
5. Los valores perdidos de algunas variables observadas han provocado que cada
elemento de la matriz de covarianzas muestral est calculado sobre una muestra
diferente.
30
Si se revisan los cuadros 13.4 a 13.6 se puede comprobar que, en el modelo del ejemplo, no se
presenta ninguna de las incompatibilidades sealadas.
La segunda cuestin que debemos examinar es la significatividad estadstica de cada
parmetro individual. Centraremos la explicacin en los coeficientes de regresin entre
variables observadas y factores comunes, aunque lo expuesto es vlido para el resto de
parmetros (varianzas y covarianzas).
Si tomamos, por ejemplo, la segunda ecuacin del cuadro 13.4, comprobamos que aparecen
las tres lneas que estn reproducidas en el cuadro 13.11. La primera de ellas ofrece la
ecuacin correspondiente a la variable observada calificacin en Filosofa (FSF o V2). Esta
ecuacin se expresa como una combinacin lineal del factor comn inteligencia verbal (F1)
multiplicado por el coeficiente de regresin estimado (0,509) y un error de medida (E2).
Cuadro 13.11 Ecuacin con errores estndar y estadstico t
FSF
=V2
.509*F1
.068
7.467
+ 1.000 E2
31
=V1
=V2
=V3
=V4
=V5
=V6
=
=
=
=
=
=
.732 F1
.688*F1
.492*F1
.759 F2
.760*F2
.615*F2
+
+
+
+
+
+
.682
.725
.871
.651
.650
.789
E1
E2
E3
E4
E5
E6
F
--I F2
I F1
I
IQ
IV
.582*I
I
I
Esta informacin se suele presentar grficamente tal y como se recoge en la figura 13.5.
Figura 13.5 Modelo AFC estimado
0,582
0,732
0,688
x1
0,682
0,759
x3
x2
0,725
0,492
0,871
0,760
x4
0,651
0,650
32
x5
0,615
x6
0,789
Como seala Ullman (1996), existen bsicamente dos motivos para reespecificar un modelo
(esto es, eliminar o introducir relaciones entre las variables que los conforman): (i) mejorar su
ajuste o (ii) contrastar alguna hiptesis terica. Existen, sin embargo, muchos problemas que
pueden generarse como consecuencia de una reespecificacin poco meditada. Como veremos
a continuacin, existen dos instrumentos analticos el contraste del multiplicador de
Lagrange y el contraste de Wald que nos indican qu relaciones causales pueden aadirse o
eliminarse y qu mejoras en el ajuste obtendramos con cada una de esta modificaciones. Si el
investigador cae en la tentacin de ir incorporando o eliminando relaciones sin ms, hasta
lograr un ajuste razonable y no tiene en cuenta si estas modificaciones estn o no soportadas
por el marco terico que sustenta su investigacin, puede provocarse que el modelo al que se
llega no sea en absoluto generalizable (McCallumn, Roznowski y Necowitz, 1992).
En este mismo sentido, Pedhazur (1982) y Sorbom (1989) afirman que es cientficamente
incorrecto modificar un modelo simplemente porque mejore su ajuste, ya que el cambio debe
ser tericamente interpretable y el investigador debe ser capaz de justificar cul es el motivo
para aadir una relacin causal determinada.
Todo lo expuesto lleva a Hatcher (1994) a plantear las siguientes recomendaciones para la
modificacin de un modelo, aunque la mayora se basan en el trabajo de McCallumn,
Roznowski y Necowitz (1992):
1. Utilizar muestras grandes. Los modelos basados en menos de 100 o 150 casos llevan
a modelos finales poco estables si las modificaciones se basan en los datos y no en la
teora.
2. Hacer pocas modificaciones. Es posible que las primeras modificaciones puedan estar
derivadas de un modelo que refleje las relaciones poblacionales; las siguientes,
probablemente, reflejarn relaciones especficas de la muestra.
3. Realizar solo aquellos cambios que puedan ser interpretados desde una perspectiva
terica o tengan soporte en trabajos precedentes. En todo caso, se deben detallar todos
los cambios realizados sobre el modelo inicial en el informe del trabajo final.
4. Seguir un procedimiento paralelo de especificacin. Siempre que sea posible, el
investigador debera trabajar con dos muestras independientes. Si las dos muestras
desembocan en las mismas modificaciones del modelo, se podr tener una mayor
confianza en la estabilidad del mismo.
5. Comparar modelos alternativos desde el principio. Ms que proponer un modelo e ir
modificndolo, puede ser conveniente en algunas ocasiones plantear modelos
alternativos y determinar con cul se obtiene un mejor ajuste.
6. Finalmente, describir detalladamente las limitaciones de su estudio. Como indica
Hatcher (1994), la mayora de los trabajos que se publican estn basados en una nica
muestra y sobre los que se efectan sucesivas modificaciones basadas en los datos
hasta lograr un ajuste razonable. Si se sigue este enfoque, sera recomendable que el
trabajo advirtiera al lector de todas estas circunstancias.
Una vez planteadas estas precauciones, veamos a continuacin los instrumentos de que se
dispone para reespecificar un modelo.
33
El contraste ML permite evaluar la mejora que se obtiene al aadir una relacin causal o una
nueva covarianza al modelo terico. Para determinar si esta mejora es estadsticamente
significativa, el estadstico lleva asociado un nivel de significacin.
El EQS ofrece dos versiones de este contraste, la univariante y la multivariante. En la
univariante se muestra el incremento que se producira en la 2 si se introdujera, por separado,
cada una de las relaciones consideradas. Esta aproximacin univariante tiene el problema de
que, al no considerar las covarianzas entre los distintos parmetros estimados, harn que
aparezcan como candidatos a aadirse al modelo y mejorar su ajuste bastantes parmetros. El
enfoque multivariante, sin embargo, identifica el parmetro que conducira a un mayor
incremento en el estadstico 2 del modelo. Despus de tener en consideracin su
introduccin, muestra el parmetro cuya inclusin causara el siguiente mayor incremento.
Cuadro 13.13 Contraste univariante del multiplicador de Lagrange
LAGRANGE MULTIPLIER TEST (FOR ADDING PARAMETERS)
ORDERED UNIVARIATE TEST STATISTICS:
NO
--
CODE
----
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
6
12
6
12
6
6
6
12
6
6
12
6
12
6
6
6
12
6
6
6
6
0
0
PARAMETER
--------E3,E1
V2,F2
E5,E4
V6,F1
E4,E1
E4,E2
E2,E1
V3,F2
E4,E3
E6,E2
V1,F2
E3,E2
V4,F1
E6,E5
E5,E2
E5,E1
V5,F1
E6,E4
E6,E3
E6,E1
E5,E3
V1,F1
V4,F2
CHI-SQUARE
----------
PROBABILITY
-----------
4.741
4.741
2.098
2.098
1.714
1.680
1.675
1.675
1.540
1.413
1.125
1.125
1.000
1.000
0.387
0.190
0.069
0.069
0.055
0.034
0.017
0.000
0.000
0.029
0.029
0.148
0.148
0.190
0.195
0.196
0.196
0.215
0.235
0.289
0.289
0.317
0.317
0.534
0.663
0.793
0.793
0.815
0.853
0.897
1.000
1.000
34
PARAMETER CHANGE
---------------0.156
0.174
0.063
0.182
-0.065
0.035
-0.091
-0.142
-0.058
0.034
-0.167
-0.039
-0.134
-0.031
-0.006
0.008
-0.013
-0.022
0.012
0.010
-0.002
0.000
0.000
CHI-SQUARE
---------4.741
D.F.
---1
PROBABILITY
----------0.029
UNIVARIATE INCREMENT
-------------------CHI-SQUARE
---------4.741
PROBABILITY
----------0.029
Los cuadros 13.13 y 13.14 recogen la informacin sealada que se solicit al programa con la
opcin /LMTEST que apareca en la sintaxis ofrecida en el cuadro 13.2. En el contraste
univariante, se observa que hay dos parmetros que, individualmente, seran candidatos a
conseguir una mejora significativa del modelo. Estos dos parmetros se corresponden con la
introduccin de una covarianza entre los factores especficos E1 y E3, en el primer caso, y
con la inclusin de una relacin causal entre la variable observada V2 y el factor comn F2,
en el segundo caso. En ambos casos el contraste ofrece el valor aproximado que tendra el
parmetro si se aadiera (parameter change).
Sin embargo, como se ha sealado, estos contrastes tienen el inconveniente que no tiene en
cuenta las covarianzas entre los distintos estimadores de los parmetros, por lo que es
conveniente centrar la atencin en el contraste multivariante, que descuenta estos efectos
comunes. Si nos fijamos en el cuadro 13.14, comprobamos que ahora slo propone la
inclusin de una relacin, o path causal, entre la variable V2 y el factor comn F2. Y slo
incluye este parmetro porque el enfoque multivariante hace que compruebe que, tras hacerlo,
ninguna otra adicin provocara mejoras significativas en la 2. La necesidad estadstica de
introducir este parmetro no es excesiva, dado que el contraste demuestra que la mejora sera
slo significativa al 5% y no al 1% (p=0.029) y hara que el estadstico 2 disminuyera en
4.74 unidades. Debe producirse esta modificacin del modelo? La respuesta debe proceder
del anlisis terico del investigador. El modelo tiene un ajuste suficientemente razonable,
tiene sentido que exista una relacin causal entre la inteligencia cuantitativa y la filosofa?
existe soporte terico para esta relacin? hay trabajos previos que lo apuntan? Si no es as,
no debera introducirse la relacin propuesta por el contraste LM, dado que el ajuste del
modelo sin ella es razonable.
13.7.3 Contraste de Wald
35
En nuestro ejemplo, como se comprueba en el cuadro 13.15, no hay relaciones que pudieran
suprimirse pero, en el caso de que existieran, deberan hacerse las mismas consideraciones de
naturaleza terica que se han efectuado en el caso de inclusin de nuevos parmetros.
En general, tanto el contraste LM como el de Wald son procedimientos paso a paso, por lo
que el error tipo I suele sobreestimarse. Por esta razn algunos autores (Ullman, 1996)
recomiendan ser conservadores en el nivel de significacin considerado. Por ejemplo =0,01
para Lagrange y =0.05 para Wald.
Tambin seala esta autora que, de acuerdo con McCallum (1986), el orden en que los
parmetros se eliminen o aadan puede afectar a la significatividad de los restantes, por lo que
se recomienda aadir todos los parmetros necesarios antes de eliminar los innecesarios.
Cuadro 13.15 Contraste de Wald
CHI-SQUARE
----------
D.F.
----
PROBABILITY
-----------
UNIVARIATE INCREMENT
-------------------CHI-SQUARE
----------
PROBABILITY
-----------
************
NONE OF THE FREE PARAMETERS IS DROPPED IN THIS PROCESS.
El problema con que nos enfrentamos es el siguiente. Como seala Martn Armario (1993),
las organizaciones se ven obligadas a estar pendientes tanto de sus clientes como de la
competencia, aunque su gestin de marketing puede variar la importancia que concede a uno
u otro factor a lo largo del tiempo. Nuestro investigador quiere desarrollar un instrumento de
medida de estos dos aspectos del enfoque de marketing, la orientacin al cliente y la
orientacin a la competencia, para determinar, en cada momento del tiempo, cul est
primando por encima del otro en un sector determinado.
Basndose en el trabajo de Narver y Slater (1990), desarrolla una escala de 11 preguntas
donde las 6 primeras se han diseado para medir la orientacin al cliente y las 5 siguientes
para medir la orientacin a la competencia, tal y como se sintetiza en el cuadro 13.16.
Pero una escala de medida debe demostrar su validez convergente, esto es, si se supone que
esas 11 preguntas estn midiendo dos factores latentes o constructor distintos, cada grupo de
36
variables observadas deben tener cargas significativas sobre su respectivo factor comn, y no
sobre los dems (puede consultarse Kster, Vila y Alds, 2000 para profundizar en el tema de
la validacin de escalas). Por este motivo, tras realizar una encuesta a 375 empresas, con el
cuestionario del cuadro 13.16, se realiza una aplicacin del mtodo AFC para constatar la
plausibilidad del modelo recogido en la figura 13.6. Si este modelo ofrece un ajuste razonable
y todas las cargas factoriales planteadas son significativas, ser una evidencia que apoyar la
validez convergente de estos indicadores (Anderson y Gerbing, 1988).
Cuadro 13.16 Escala de medida a validar
Valore su acuerdo o desacuerdo con las siguientes afirmaciones en una escala de siete puntos
donde 1=totalmente en desacuerdo; 7=totalmente de acuerdo.
ORIENTACIN AL CLIENTE
V1. Nos preocupamos por responder a las exigencias de los clientes
V2. Ofrecemos servicios post-venta
V3. Comprendemos las necesidades de los clientes
V4. Nos fijamos objetivos de satisfaccin del cliente
V5. Medimos el grado de satisfaccin del cliente
V6. Las acciones de mi empresa van dirigidas a que el cliente obtenga ms por el mismo precio
ORIENTACIN A LA COMPETENCIA
V7. Poseemos informacin sobre la cuota de mercado de la competencia
V8. Damos una respuesta rpida a las acciones de la competencia
V9. La alta direccin efecta anlisis de las estrategias de la competencia
V10. El personal de ventas regularmente comparte informacin con nuestro negocio en relacin a
la estrategia de los competidores.
V11. Vemos como ventajas competitivas las oportunidades de mercado
37
12=21
Orientacin
al cliente
11
21
31
41
51
61
72
82
92
Orientacin a la
competencia
102
112
v1
v2
v3
v4
v5
v6
v7
v8
v9
v10
v11
10
11
V1
8,48
4,03
3,32
4,76
5,34
2,72
1,97
1,56
1,81
1,53
0,06
V2
V3
8,79
2,68
4,81
4,62
1,89
3,54
1,47
2,97
2,72
0,52
5,32
2,71
2,62
1,68
1,05
1,39
1,70
0,28
0,60
V4
10,14
5,02
2,23
3,45
2,52
2,26
2,43
-0,37
V5
V6
V7
V8
V9
8,60
2,33
2,46
1,03
2,36
1,55
0,84
7,31
0,60
1,07
0,53
0,27
1,34
8,61
1,94
3,04
3,03
-0,61
7,07
2,53
1,92
0,29
7,34
3,08
0,83
V10
8,09
0,43
V11
1,34
El primer paso consiste en identificar el modelo terico ilustrado en la figura 13.6. Para ello
es necesario determinar los parmetros que se han de estimar y los que se han de constreir a
un valor prefijado, de acuerdo con las especificaciones dadas. En este sentido, se llevan a
cabo las siguientes tareas:
1. Establecimiento de la escala de los factores comunes. Puede fijarse la carga factorial
entre una variable observada y el factor comn a 1 o la varianza de ese factor comn a
1. En este caso, se ha optado por fijar la varianza del factor comn a uno, como se
ilustra en la figura 13.7.
2. Comprobacin de la identificabilidad de la parte del modelo que contiene la relacin
entre las variables observadas y los factores. Como tenemos dos factores y ms de tres
variables observadas por cada uno de ellos, se han asumido las siguientes supuestos:
los trminos de error estn incorrelacionados entre s; cada variable carga solo sobre
un factor; se permite a los factores que covaren; y se fijan a 1 los parmetros de los
coeficientes de regresin de los trminos de error en las ecuaciones de las variables
observadas. Todos estos supuestos se recogen en la figura 13.7.
.
38
12=21=*
11=1
1
Orientacin
al cliente
22=1
2
v2
v3
v4
v5
Orientacin a la
competencia
v7
v6
v8
v9
1*
2*
3*
4*
5*
6*
7*
9*
v10
1
9*
v11
1
10*
11*
Una vez identificado el modelo, escribimos la sintaxis del SAS CALIS que permite su
contrastacin, tal como aparece recogida en el cuadro 13.18. Hemos optado por utilizar la
opcin de formulacin equivalente al EQS (opcin LINEQS de la sintaxis) para facilitar la
comparabilidad de la misma con la mostrada con anterioridad. Comentamos a continuacin
los elementos bsicos de la misma.
39
V1-V11;
375
375
.
.
.
.
5.32
.
2.71 10.14
2.62 5.02
1.68 2.23
1.05 3.45
1.39 2.52
1.70 2.26
0.28 2.43
0.60 -0.37
375
.
.
.
.
8.60
2.33
2.46
1.03
2.36
1.55
0.84
375
375
.
.
.
.
.
.
.
.
.
.
7.31
.
0.60 8.61
1.07 1.94
0.53 3.04
0.27 3.03
1.34 -0.61
375
.
.
.
.
.
.
.
7.07
2.53
1.92
0.29
375
.
.
.
.
.
.
.
.
7.34
3.08
0.83
375
.
.
.
.
.
.
.
.
.
8.09
0.43
375
.
.
.
.
.
.
.
.
.
.
8.25
Como se puede comprobar al examinar el cuadro 13.18, la sintaxis del SAS CALIS es muy
similar a la del EQS. La primera parte de la misma (DATA) se limita a suministrar al
programa la matriz de varianzas covarianzas con la que ha de trabajar y el nmero de casos
(375) que la han generado. En la segunda parte (PROC CALIS) se dan las siguientes
instrucciones: el anlisis se ha de efectuar sobre la matriz de varianzas covarianzas
(COVARIANCES) y no sobre la matriz de correlacin; se debe imprimir la matriz de
correlacin (CORR); se debe imprimir la matriz de varianzas covarianzas residual, tanto la
absoluta como la estandarizada (RESIDUAL); se solicita que ofrezca los indicadores
necesarios para reespecificar el modelo, caso de que el ajuste no sea bueno, es decir, los
contrastes de Wald y multiplicadores de Lagrange (MODIFICATION); y, finalmente, se
indica al programa que efecte una estimacin por mxima verosimilitud (METHOD=ML).
Caso de optar por otro procedimiento se utilizaran los siguientes cdigos: GLS para mnimos
cuadrados generalizados; LSGLS para realizar primero una estimacin por mnimos
40
cuadrados sin ponderar, seguida de otra por mnimos cuadrados generalizados; LSML para
realizar primero una estimacin por mnimos cuadrados sin ponderar seguida por una por
mxima verosimilitud; y, finalmente, ULS para realizar una estimacin por mnimos
cuadrados sin ponderar.
El paso siguiente consiste en introducir las ecuaciones que, como se seal, se efecta en este
caso siguiendo la notacin de Bentler y Weeks (1980), lo que se le indica al programa
mediante la instruccin LINEQS. A partir de aqu la sintaxis es inmediata y se deriva de
manera directa de la figura 13.7. Las variables se denotan con la letra V, los coeficientes de
regresin con la letra L (de loadings) seguida por los dos elementos que une (V1 y F1, por
ejemplo), los factores comunes se denotan con la letra F y los trminos de error por la letra E.
El trmino STD introduce las varianzas que se desea estimar o fijar a un valor determinado. Si
se fijan se pone el valor (F1=1) y si se dejan libres para su estimacin, se le asigna un nombre
(E1-E11=VARE1-VARE11). De forma anloga, las covarianzas entre los factores comunes se
introduce con COV; as se indica que se quiere estimar la covarianza entre F1 y F2
asignndole el nombre CF1F2 mediante la instruccin: F1 F2 = CF1F2.
Explicada la sintaxis del SAS CALIS, pasamos a examinar los resultados. En primer lugar, el
programa ofrece la matriz de varianzas covarianzas residual como primer indicador de ajuste.
Lo hace tanto en su versin original como estandarizada y, al igual que el EQS, muestra los
10 residuos ms grandes y una media de los residuos, tanto global, como los que estn fuera
de la diagonal. En el cuadro 13.19 ofrecemos la matriz de residuos estandarizados. De su
anlisis se comprueba que existen algunas variables con residuos elevados, como V7 y V2 o
V10 y V3, lo que constituye un indicio de que la relacin entre las mismas no ha sido bien
recogida por el modelo propuesto.
Si se analiza grficamente la distribucin de los residuos (cuadro 13.20) se comprueba que
aunque la distribucin es aproximadamente simtrica y centrada en cero, existen demasiados
residuos fuera del intervalo [-1;1], mostrando tambin problemas en el ajuste del modelo.
Finalmente, el anlisis del historial de iteraciones (cuadro 13.21) no muestra problemas de
convergencia, ya que sta se produce a partir de la tercera iteracin, no efectuando el
programa ninguna advertencia sobre la misma (GCONV convergence criterion satisfied).
41
V1
V2
V3
V4
V5
V6
V7
V8
V9
V10
V11
V1
V2
V3
V4
V5
V6
0.000000000
-3.357227097
2.967204321
-1.246975692
3.069122401
1.877452055
-1.059194816
-0.262920898
-2.517730704
-1.962033167
-0.570490414
-3.357227097
0.000000000
0.076573558
1.190600216
0.003342966
-1.095682629
4.496137954
-0.138686540
2.723908897
2.459194714
0.702822447
2.967204321
0.076573558
0.000000000
-1.095790386
-2.237389256
1.328560327
-1.053078900
1.601857105
1.162790049
-3.515198142
1.403369934
-1.246975692
1.190600216
-1.095790386
0.000000000
-0.208504765
-0.509764345
3.393318795
2.567732915
-0.628459373
0.916976181
-1.558406356
3.069122401
0.003342966
-2.237389256
-0.208504765
0.000000000
-0.260239832
0.480245969
-2.183475608
-0.427554446
-2.047080370
1.539342408
1.877452055
-1.095682629
1.328560327
-0.509764345
-0.260239832
0.000000000
-1.372962599
0.864289775
-1.977122902
-2.106146228
3.138667879
V1
V2
V3
V4
V5
V6
V7
V8
V9
V10
V11
V7
V8
V9
V10
V11
-1.059194816
4.496137954
-1.053078900
3.393318795
0.480245969
-1.372962599
0.000000000
-1.144338122
-1.465373166
1.084653990
-3.135821742
-0.262920898
-0.138686540
1.601857105
2.567732915
-2.183475608
0.864289775
-1.144338122
0.000000000
1.252373332
-0.449518533
0.093296378
-2.517730704
2.723908897
1.162790049
-0.628459373
-0.427554446
-1.977122902
-1.465373166
1.252373332
0.000000000
0.699166646
1.881433740
-1.962033167
2.459194714
-3.515198142
0.916976181
-2.047080370
-2.106146228
1.084653990
-0.449518533
0.699166646
0.000000000
0.310648263
-0.570490414
0.702822447
1.403369934
-1.558406356
1.539342408
3.138667879
-3.135821742
0.093296378
1.881433740
0.310648263
0.000000000
V10,V3
-3.5152
V7,V4
3.3933
V2,V1
-3.3572
V11,V6
3.1387
V8,V4
2.5677
42
V11,V7
-3.1358
V5,V1
3.0691
V3,V1
2.9672
V9,V2
2.7239
-3.50000
-3.25000
-3.00000
-2.75000
-2.50000
-2.25000
-2.00000
-1.75000
-1.50000
-1.25000
-1.00000
-0.75000
-0.50000
-0.25000
0
0.25000
0.50000
0.75000
1.00000
1.25000
1.50000
1.75000
2.00000
2.25000
2.50000
2.75000
3.00000
3.25000
3.50000
3.75000
4.00000
4.25000
4.50000
1
1
1
0
1
0
4
2
1
2
6
0
3
4
2
14
2
2
2
3
3
2
2
0
1
2
1
2
1
0
0
0
1
1.52%
1.52%
1.52%
0.00%
1.52%
0.00%
6.06%
3.03%
1.52%
3.03%
9.09%
0.00%
4.55%
6.06%
3.03%
21.21%
3.03%
3.03%
3.03%
4.55%
4.55%
3.03%
3.03%
0.00%
1.52%
3.03%
1.52%
3.03%
1.52%
0.00%
0.00%
0.00%
1.52%
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
*
*
*
*
****
**
*
**
******
***
****
**
**************
**
**
**
***
***
**
**
*
**
*
**
*
optcrit
0.4045
0.4032
0.4031
0.4031
0.4031
0.4031
0.4031
0.4031
difcrit
0.0233
0.00128
0.000074
5.396E-6
4.375E-7
3.825E-8
3.513E-9
3.32E-10
maxgrad
0.0439
0.00188
0.00304
0.00018
0.00022
0.00003
0.00002
4.06E-6
lambda
0
0
0
0
0
0
0
0
rho
0.882
0.903
0.956
1.037
1.120
1.187
1.236
1.267
43
Los indicadores de bondad de ajuste aparecen en el cuadro 13.22. En dicho cuadro se han
subrayado aquellos que se comentaron en el desarrollo del tema y que estn presentes en el
programa SAS CALIS. Todos parecen sealar que existe un problema de ajuste. As aunque
la chi cuadrado es inferior a la del modelo independiente (150,75<1109,31), es significativa,
con lo que se rechaza la hiptesis nula de que las matrices nc y sean iguales, hecho no
deseable. Por otra parte, los ndices NFI (0,8641) y NNFI (0,8693) no son superiores a 0,9; lo
mismo ocurre con los ndices CFI (0,8978) y AGFI (0,8940).
Esta informacin ya debera llevar al investigador a dudar de la validez convergente de la
escala que ha utilizado. Pero si pese a saber que su escala no es vlida en este sentido, desea
saber cul es la causa que origina los problemas en su instrumento de medicin, debera
seguir con el anlisis de los resultados. En primer lugar, debe analizar la significatividad de
los parmetros estimados, dado que quizs los problemas de ajuste se deban solamente a que
alguno de los items de la escala no guarde una relacin significativa con el factor. El cuadro
13.23 nos muestra la parte de la solucin que afecta a la relacin entre las variables
observadas y los factores comunes. De su anlisis se aprecia que prcticamente todas las
cargas factoriales son significativas, ya que los estadsticos t, excepto el correspondiente a
V11, superan ampliamente a 2 en valor absoluto.
Una primera modificacin podra ir en la lnea de eliminar esta relacin. Pero recordemos
nuestra insistencia de que no se trata de lograr un ajuste estadstico, sino que cada
reespecificacin del modelo debe tener una justificacin terica de acuerdo con los objetivos
de la investigacin. En este caso, si la eliminacin de la relacin desembocara en un buen
ajuste, la nica consecuencia sera que la escala que mide la orientacin a la competencia
44
tendra un item menos de los inicialmente propuestos, pero sera vlida en un sentido
convergente, lo que puede ser hasta deseable en trminos de parsimonia.
Para estimar este nuevo modelo, bastara eliminar la ltima ecuacin del cuadro 13.18 y
cualquier referencia a la variable V11 de la sintaxis, incluyendo la matriz de varianzas y
covarianzas. Si se hace esto, se obtendra el ajuste del modelo que sintetizan los ndices del
cuadro 13.24 donde, aunque se producen ligeras mejoras, estas no son suficientes para
considerar como bueno el ajuste del modelo. Llegados a este punto, el investigador ya sabe
que en ningn caso su escala va a gozar de validez convergente, porque cualquier otro tipo de
modificacin que ahora presentaremos ya supone cambios demasiados importantes respecto al
modelo terico como para considerarlo vlido. Qu otras modificaciones se pueden
introducir? El cuadro 13.25 nos ofrece los contraste de Lagrange y de Wald que nos sirven
como indicador.
Cuadro 13.23 Parmetros estimados
Covariance Structure Analysis: Maximum Likelihood Estimation
Manifest Variable Equations
V1
=
Std Err
t Value
2.2132*F1
+
0.1372 LV1F1
16.1305
1.0000 E1
V2
=
Std Err
t Value
2.0465*F1
+
0.1443 LV2F1
14.1828
1.0000 E2
V3
=
Std Err
t Value
1.3029*F1
+
0.1180 LV3F1
11.0399
1.0000 E3
V4
=
Std Err
t Value
2.2377*F1
+
0.1541 LV4F1
14.5202
1.0000 E4
V5
=
Std Err
t Value
2.2573*F1
+
0.1375 LV5F1
16.4143
1.0000 E5
V6
=
Std Err
t Value
1.0553*F1
+
0.1454 LV6F1
7.2583
1.0000 E6
V7
=
Std Err
t Value
1.7469*F2
+
0.1663 LV7F2
10.5077
1.0000 E7
V8
=
Std Err
t Value
1.2564*F2
+
0.1539 LV8F2
8.1613
1.0000 E8
V9
=
Std Err
t Value
1.8519*F2
+
0.1523 LV9F2
12.1590
1.0000 E9
V10
=
Std Err
t Value
1.6100*F2
+
0.1619 LV10F2
9.9469
1.0000 E10
V11
=
Std Err
t Value
0.2065*F2
+
0.1745 LV11F2
1.1834
1.0000 E11
45
46
E2 : F2
21.1263 : 0.000
E10 : E3
13.6276 : 0.000
E2 : E1
11.2709 : 0.001
E11 : E6
10.4606 : 0.001
E7 : E2
9.9540 : 0.002
E11 : E7
9.8334 : 0.002
E1 : F1
9.5723 : 0.002
E1 : F2
9.5721 : 0.002
E5 : E1
9.4192 : 0.002
V1 : F2
9.5720 : 0.002
V4 : F2
5.4948 : 0.019
V6 : F2
3.9647 : 0.046
V7 : F1
3.8312 : 0.050
Covariance Structure Analysis: Maximum Likelihood Estimation
Stepwise Multivariate Wald Test
--------------------------------------------------------------------------Cumulative Statistics
Univariate Increment
Parameter
Chi-Square
D.F.
Prob
Chi-Square
Prob
--------------------------------------------------------------------------LV11F2
1.400515
1
0.2366
1.400515
0.2366
Para la introduccin de las dos cambios sealadas hay que modificar la sintaxis de 13.18,
expresando la ecuacin correspondiente a V2 de esta forma
V2=LV2F1 F1+LV2F2 F2+E2
Con estas modificaciones el ajuste del modelo mejora significativamente, como se aprecia en
el cuadro 13.26, logrndose incluso que el estadstico 2 sea no significativo para un nivel
=0,05 (p=0,08) y que los ndices GFI, AGFI, NFI, NNFI y CFI superen el valor de 0,9.
Como se comprueba en el cuadro 13.27, todos los parmetros que relacionan los factores
comunes con las variables observadas son significativos (t supera ampliamente 2 en valor
absoluto), como tambin lo es la covarianza entre los factores comunes y el resto de
parmetros estimados (cuadro 13.28). De la solucin estandarizada del cuadro 13.29,
obtendramos la sntesis grfica del modelo que se ilustra en la figura 13.8.
47
Cuadro 13.26 Indices de bondad de ajuste tras eliminar V11 e introducir la relacin V2F2
Covariance Structure Analysis: Maximum Likelihood Estimation
Fit criterion . . . . . . . . . . . . . . . . . .
0.2580
Goodness of Fit Index (GFI) . . . . . . . . . . .
0.9519
GFI Adjusted for Degrees of Freedom (AGFI). . . .
0.9198
Root Mean Square Residual (RMR) . . . . . . . . .
0.3884
Parsimonious GFI (Mulaik, 1989) . . . . . . . . .
0.6980
Chi-square = 44.8992
df = 33
Prob>chi**2 = 0.0810
Null Model Chi-square:
df = 45
500.2508
RMSEA Estimate . . . . . . . . . 0.0455 90%C.I.[., 0.0764]
Probability of Close Fit . . . . . . . . . . . .
0.5596
ECVI Estimate . . . . . . . . . . 0.5280 90%C.I.[., 0.6556]
Bentler's Comparative Fit Index . . . . . . . . .
0.9739
Normal Theory Reweighted LS Chi-square . . . . .
43.9820
Akaike's Information Criterion. . . . . . . . . .
-21.1008
Bozdogan's (1987) CAIC. . . . . . . . . . . . . . -158.5388
Schwarz's Bayesian Criterion. . . . . . . . . . . -125.5388
McDonald's (1989) Centrality. . . . . . . . . . .
0.9666
Bentler & Bonett's (1980) Non-normed Index. . . .
0.9644
Bentler & Bonett's (1980) NFI . . . . . . . . . .
0.9102
James, Mulaik, & Brett (1982) Parsimonious NFI. .
0.6675
Z-Test of Wilson & Hilferty (1931). . . . . . . .
1.3992
Bollen (1986) Normed Index Rho1 . . . . . . . . .
0.8776
Bollen (1988) Non-normed Index Delta2 . . . . . .
0.9745
Hoelter's (1983) Critical N . . . . . . . . . . .
185
48
2.2636*F1
0.2004 LV1F1
11.2943
1.0000 E1
V2
=
Std Err
t Value
1.4923*F1
0.2551 LV2F1
5.8511
0.8903*F2
0.2674 LV2F2
3.3291
V3
=
Std Err
t Value
1.3095*F1
0.1733 LV3F1
7.5568
1.0000 E3
V4
=
Std Err
t Value
2.2110*F1
0.2275 LV4F1
9.7174
1.0000 E4
V5
=
Std Err
t Value
2.2799*F1
0.2018 LV5F1
11.2967
1.0000 E5
V6
=
Std Err
t Value
1.0767*F1
0.2133 LV6F1
5.0485
1.0000 E6
V7
=
Std Err
t Value
1.8117*F2
0.2400 LV7F2
7.5486
1.0000 E7
V8
=
Std Err
t Value
1.1893*F2
0.2249 LV8F2
5.2878
1.0000 E8
V9
=
Std Err
t Value
1.8173*F2
0.2201 LV9F2
8.2568
1.0000 E9
V10
=
Std Err
t Value
1.6372*F2
+
0.2344 LV10F2
6.9860
49
1.0000 E10
1.0000 E2
Cuadro 13.26 Indices de bondad de ajuste tras eliminar V11 e introducir la relacin V2F2
Equations with Standardized Coefficients
V1
V2
V3
V4
V5
V6
V7
V8
V9
V10
0.7773*F1
LV1F1
0.5034*F1
LV2F1
0.5678*F1
LV3F1
0.6943*F1
LV4F1
0.7775*F1
LV5F1
0.3982*F1
LV6F1
0.6174*F2
LV7F2
0.4473*F2
LV8F2
0.6708*F2
LV9F2
0.5756*F2
LV10F2
50
+ 0.6291 E1
+ 0.3003*F2
LV2F2
+ 0.8232 E3
+ 0.7196 E4
+ 0.6289 E5
+ 0.9173 E6
+ 0.7866 E7
+ 0.8944 E8
+ 0.7417 E9
+ 0.8177 E10
+ 0.7039 E2
Orientacin
al cliente
Orientacin a la
competencia
0.300
0.617
0.777
v1
v2
0.629
0.567
0.503
0.703
v3
0.823
0.694
v4
0.719
0.777
0.398
v5
v6
0.628
v7
0.670 0.575
v8
0.786
0.917
0.447
v9
0.894
0.741
v10
0.817
10
REFERENCIAS BIBLIOGRFICAS
Akaike, H. (1987): Factor Analysis and AIC. Psychometrika, vol. 52, pp. 317-332.
Anderson, J.C. y Gerbing, D.W. (1984): The effect of sampling error on covergence,
improper solutions, and goodness of fit indices for maximum likelihood confirmatory
factor analysis. Psychometrika, vol. 49, pp. 155-173.
Anderson, J.C. y Gerbing, D.W. (1988): Structural equation modelling in practice: A review
and recommended two step approach. Psychological Bulletin, n 103, pp. 411-423.
Bearden, W.O.; Sharma, S. y Teel, J.E. (1982): Sample sizes effects on chi square and other
statistics used in evaluating causal models. Journal of Marketing Research, Vol. 19,
pp. 425-430.
Bentler, P.M. (1988): Comparative fit indeces in structural models. Psychological Bulletin,
107, pp. 238-246.
Bentler, P.M. (1992): On the fit of models to covariances and methodology to the Bulletin.
Psychological Bulletin, 112, pp. 400-404.
Bentler, P.M. (1995): EQS Structural Equations Program Manual. Encino, CA: Multivariate
Software, Inc.
Bentler, P.M. y Bonett, D.G. (1980): Significance tests and goodness of fit in the analysis of
covariance structures. Psychological Bulletin, 88, pp. 588-606.
Bentler, P.M. y Weeks, D.G. (1980): Linear structural equations with latent variables.
Psychometrika, vol. 45, pp. 289-308.
Bollen, K.A. (1989): Structural Equations with Latent Variables. Nueva York: Wiley.
Bozdogan, H. (1987): Model selection and Akaikes information criteria: The general theory
and its analytical extensions. Psychometrika, vol. 52, pp. 345-370.
Browne, M.W. y Cudeck, R. (1993): Alternative ways of assessing model fit. En Bollen,
K.A. y Long, J.S. (eds), Testing Structural Models. Newbury Park: Sage.
Byrne, B. (1994): Structural Equation Modeling with EQS and EQS/Windows. Thousand
Oaks, CA: Sage.
51
Hatcher, L. (1994): A Step-by-Step Apporach to Using the SAS System for Factor Anlisis and
Structural Equation Modelling. Cary, NC: Sas Institute Inc.
Hu, L.T.; Bentler, P.M. y Kano, Y. (1992): Can test statistics in covariance structure
analyses be trusted?. Psychological Bulletin, n 112, pp. 351-362.
Jreskog, K.G. y Srbom, D. (1989): Lisrel 7: A guide to the Program Applications. Chicago:
SPSS Inc.
Long, J.S. (1983): Confirmatory Factor Analysis. Sage University Paper series on
Quantitative Applications in the Social Sciences, n 07-033. Newbury Park, CA: Sage.
Marsh, H.W.; Balla, J.R. y McDonald, R. (1988): Goodness of fit indexes in confirmatory
factor analysis: the effect of sample size. Psychological Bulletin, Vol. 105, pp. 430445.
Martn Armario, E. (1993): Marketing. 1 edicin. Barcelona: Ariel.
McCallum, R.C. (1986): Specification searches in covariance structure modelling.
Psychological Bulletin, 100, pp. 107-120.
McCallum, R.C.; Roznowski, M. y Necowitz, L.B. (1982): Model modifications in
covariance structure analysis: the problem of capitalization on chance. Psychological
Bulletin, 111, pp. 490-504.
McDonald, R.P. y Marsh, H.W. (1990): Choosing a multivariate model: noncentrality and
goodness of fit. Psychological Bulletin, 107, pp. 247-255.
Narver, J.C. y Slater, S.F. (1990): The effect of a market orientation on business
profitability. Journal of Marketing, vol. 54, octubre, pp. 20-35.
Pedhazur, E. (1982): Multiple Regression in behavioural research. Nueva York: Holt.
Sharma, S. (1996): Applied Multivariate Techniques. Nueva York: John Wiley & Sons, Inc.
Sorbom, D. (1989): Model modification, Psychometrika, vol 54, pp. 371-384.
Tabachnick, B.G. y Fidell, L.S. (1996): Using Multivariate Statistics. 3 edicin. Nueva York:
Harper Collins.
Tanaka, J.S. (1993): Multifaceted conceptions of fit. En Bollen, K.A. y Long, J.S. (eds),
Testing Structural Models. Newbury Park: Sage.
Ullman, J.D. (1996): Structural Equation Modelling, en Tabachnick y Fidell (1996), pp.
709-812.
Vila, N.; Kster, I. y Alds, J. (2000): Desarrollo y Validacin de Escalas de Medida en
Marketing. Quaderns de Treball. N 104. Facultad de Economa, Universitat de
Valencia.
Williams, L.J. y Holahan, P.J. (1994): Parsimony-based fit indices for multiple indicator
models: Do they work? Structural Equation Modeling, Vol. 1, pp. 161-189.
52
APNDICE
A13.1 El problema de la indentificacin
x = +
Por otra parte, la matriz que contiene las varianzas y covarianzas de las variables
observadas puede descomponerse tal y como se mostraba en la ecuacin (13-3)
= +
= M
entonces:
&& && + = ( M 1 ) ( M ) +
= ( M 1M ) +
= +
= E [ ( )() ] = ME [ ] M = M M
= ( MM 1 ) ( MM1 ) +
= + =
Dado que las matrices marcadas con slo seran iguales a las originales en el caso en que
M=I, existen infinitas matrices M invertibles que dan lugar a infinitas soluciones del modelo.
En consecuencia, este modelo se definira como no identificado.
53
54
Afirmacin
I1
I2
I3
I4
It is not right to purchase foreign products, because it puts American out of jobs
I5
I6
We should purchase products manufactured in America instead of letting other countries get rich off us
I7
Americans should not buy foreign products, because this hurts American business and causes
unemployment
I8
I9
We should buy from foreign countries only those products that we cannot obtain within our own country
I10
American consumers who purchase products made in other countries are responsible for putting their
fellow Americans out of work
4.174
2.769
1.845
2.791
2.386
2.645
2.619
2.134
2.522
1.831
4.340
1.994
2.827
2.610
2.950
2.719
2.535
2.369
2.091
2.742
2.257
1.609
2.101
1.795
2.057
1.856
1.132
4.300
2.737
2.901
2.999
2.739
2.776
1.832
3.689
2.697
2.908
2.334
2.375
1.831
4.080
2.802
2.785
2.610
1.920
3.988
2.582 3.590
2.774 2.341 3.987
2.074 1.740 1.736 3.284
55