11° Semana Analisis Multivariante
11° Semana Analisis Multivariante
11° Semana Analisis Multivariante
11
SEMESTRE 2017 – II
Sesión 20 y 21
ANÁLISIS
FACTORIAL
EXPLORATORIO
continuación
MODELO FACTORIAL
X ΛF ε
Se le denomina modelo factorial con “ k” factores comunes
y con X centrado, donde :
ψ1 0 .......... 0
0 ψ ........... 0
2
. . ........... .
0 0 ..........
. ψp
Matriz de varianzas específicas.
4
HIPÓTESIS BÁSICAS
5
Estructura de la Matriz de Covarianzas de X
6
Las comunalidades tras la extracción, nos dan una idea de
la calidad de representación de las variables originales en
los factores retenidos en el análisis.
Cov x j , Fk jk j kj
es la carga de la j-ésima variable sobre el k-ésimo factor.
7
En la práctica se tienen que estimar los parámetros del
modelo a partir de una muestra, de modo que el problema se
centra en encontrar los valores de las comunalidades y
varianzas específicas tales que la matriz de covarianzas
muestral S es aproximadamente:
ˆ ˆ
S ΛΛ Ψ
' ˆ
8
Estructura de la matriz de Correlaciones de X
ˆ ˆ' Ψ
R* ΛΛ ˆ
R* denominada también matriz de correlación reproducida
11
LA ESTIMACIÓN DE LOS FACTORES
Existen varios métodos para estimar o extraer los factores
comunes:
1º Componentes principales
12
Este método tiene la ventaja de estar basado en el modelo del
Análisis Factorial por lo que suele proporcionar mejores
estimaciones que el método anterior.
Sin embargo, no está garantizada su convergencia, sobre todo
en muestras pequeñas.
R* = R-Ψ = '
13
Ejemplo
14
Variables:
x1 Nutrición y atención médica básica
x2 Agua y salubridad
x3 Abrigo
x4 Seguridad personal
x5 Acceso a los conocimientos básicos
x6 Acceso a la información y las comunicaciones
x7 Salud y bienestar
x8 Calidad del medio ambiente
x9 Derechos personales
x10 Libertad personal y de elección
x11 Tolerancia e inclusión
x12 Acceso a la educación superior
15
CRITERIOS PARA LA SELECCIÓN DEL NÚMERO DE
FACTORES
16
2º Porcentaje de varianza total atribuible a cada factor, se
utiliza para obtener un porcentaje acumulado de varianza
mínima. No se ha establecido un punto de corte absoluto
que determine el número de factores a considerar. Por
ejemplo en las Ciencias Sociales se considera como
porcentaje mínimo el 60% de la varianza total debido a “la
menor precisión” de la información que se analiza en ese
sector.
17
4º Significatividad, se verifica mediante pruebas
estadísticas que se utilizan, cuando los factores son
extraídos mediante el método de máxima verosimilitud o
mínimos cuadrados.
18
Z
7
6
5
Variances
4
3
2
1
0
21
INTERPRETACIÓN DE LA MATRIZ DE
FACTORES
1. Matriz factorial o matriz de factoresΛ̂ , contiene los pesos,
coeficientes o cargas factoriales. Con los factores
ortogonales y los datos estandarizados, estas cargas son
equivalentes a las correlaciones entre variables y factor.
2. , indica la proporción de la varianza de la variable
explicada por el respectivo factor.
3. Los autovalores para cada factor se obtienen :
5. La comunalidad:
25
Autovalores calculados a partir
de las Cargas factoriales
[1,] 7.29994461
[2,] 1.28232910
[3,] 0.75920805
[4,] 0.68831731
[5,] 0.54931080 12
[6,] 0.35764538 k
ˆ ˆ 2
i 1
ik
k 1, 2, .....,12
[7,] 0.29344236
[8,] 0.20604358
[9,] 0.18522755
[10,] 0.15520734
[11,] 0.12605753
[12,] 0.09726639
26
6.- La varianza específica estimada, indica la proporción de la
varianza de la variable que no es explicada por los factores
comunes.
28
El modelo factorial estimado:
.
.
z p ˆp1 F 1 ˆp 2 F 2 ......... ˆpk F k
29
Rotación de factores
Cuando no se puede interpretar con claridad los factores; la
rotación facilita la interpretación de la matriz factorial,
redistribuyendo la varianza de los primeros factores a los
últimos, para encontrar un patrón de factores más simple y
significativo.
Los métodos de rotación intentan aproximar la solución
obtenida al Principio de Estructura Simple (Thurstone,
1935) según el cual la matriz de cargas factoriales debe
reunir las siguientes características:
1) Cada factor debe tener unos pocos pesos altos y los otros
próximos a cero.
2) cada variable no debe estar saturada más que en un factor.
30
3) No deben existir factores con la misma distribución, es
decir, dos factores distintos deben presentar distribuciones
diferentes de cargas altas y bajas.
cos( ) sen( )
T
sen( cos( )
32
Varimax, minimiza el número de variables que tienen las
mayores cargas factoriales en cada factor, maximizando la
varianza de las cargas factoriales al cuadrado. Es el más
empleado. Simplifica la interpretación de los factores.
El método varimax determina la matriz de forma que se
maximice la suma de las varianzas:
33
CARGAS FACTORIALES ROTADOS
(VARIMAX)
RC1 RC2
x1 0.6790897333 0.08845269
x2 0.8864939538 0.28063463
x3 0.8686784237 0.29793358
x4 0.5487579561 0.43661819
x5 0.8959185074 0.19270354
0.794 0.608
x6 0.7143418862 0.54528573 T
x7 -0.0008861803 0.73067719 0.608 0.794
x8 0.4462028707 0.77026118
x9 0.2902437750 0.74935195
x10 0.6253429890 0.62155129
x11 0.3388975459 0.75425198
x12 0.8181934303 0.40431403
34
Indicadores de Progreso Social 2016
1.0
x7 x11x8
x9
0.5
x10
x6
x4 x12
x3
x2
x5
0.0
F2
x1
-0.5
-1.0
F1
35
PUNTUACIONES FACTORIALES
Son las proyecciones de cada individuo de la muestra
sobre cada uno de los factores elegidos. Para El Modelo
Factorial :
38
ESTIMACIÓN DE LOS COEFICIENTES DE LAS
PUNTUACIONES FACTORIALES
Regresión de Thompson.- Los coeficientes de las
puntuaciones factoriales en este caso tienen una media 0 y
una varianza igual al cuadrado de las correlaciones
múltiples entre las puntuaciones estimadas de los factores
y los valores verdaderos de los factores. Pueden estar
correlacionados incluso cuando se asume que los factores
son ortogonales.
Para datos normalmente distribuidos, se tiene que :
39
El vector estimado de las puntuaciones factoriales (método
MC), para el r-ésimo individuo es :
40
El vector de ponderaciones estimado para obtener
las puntuaciones factoriales
ˆ [,1]
W ˆ [, 2]
W
x1 0.22702789 -0.16279948
x2 0.24510775 -0.12298642
x3 0.23306311 -0.10808007
x4 0.07013864 0.06638255
x5 0.27592793 -0.17357727
x6 0.09846481 0.07390228
x7 -0.22708997 0.39636344
x8 -0.07183483 0.27907197
x9 -0.12378910 0.31613765
x10 0.04144566 0.14286448
x11 -0.10707753 0.30369470
x12 0.18113061 -0.03474545
Fˆr Zr W
ˆ
r r 1, 2, ...,160 41
ESTIMACIONES DE LAS PUNTUACIONES
FACTORIALES
2
1
0
FR2
-1
-2
-2 -1 0 1
FR1
2
153 67
51
14810 4
82
11
x7 17 12
9
13 x8
x11
x9 3
1416
15 x10
14924252118
29 20 x6
0.5
41
1 44 28 x4 x12
2726 19
117 49
48 32 x3
x2
136 70 22
112
139 100156
151
109
160 96 92 85
155
62 53 46 38 23 x5
115
123 107 97 9087 30
124 7864 152 40 33
138 31 x1
135
0.0
129 108105 159 60
68
72 51
0
119
126 142 134 5952 42 39
140137 121 99 8174 157 34
36
35
146 82 15043
61 45
122
144 101
103 95 50
143114
102 86
80
141
133154 130 120
118 88 69 57
585447
113 55
-1
-0.5
94 83 65
147106 8471
110 98 7973
7767
127
132 93
145 8963
91 66
-2
104
-1.0
158 75
76
-2 -1 0 1 2
FR1
44
VALIDACIÓN DEL MODELO FACTORIAL
45
RESIDUOS DEL MODELO
FACTORIAL( 67%<0.05)
46
BIBLIOGRAFÍA