Estadistica 2 Diseños Factoriales
Estadistica 2 Diseños Factoriales
Estadistica 2 Diseños Factoriales
PROFESOR:
Arturo Mndez
MATERIA:
Estadstica inferencial
TEMA:
Unidad IV Conceptos bsicos en diseos factoriales
ALUMNO:
Valdez Castrejn Alan Isai.
SEMESTRE: 4t YA
CICLO ESCOLAR:
Enero-Junio
FECHA DE ENTREGA:
28 de Mayo del 2011.
ndice
[TRABAJO DE INVESTIGACION]
INTRODUCCIN
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
Los experimentos factoriales se usan en casi todos los campos de investigacin. Son de gran valor en el trabajo
exploratorio (Niveles ptimos o combinacin ptima de los factores).
Un diseo factorial aquel en el que el conjunto de tratamientos est conformado por todas las posibles
combinaciones de los distintos niveles de los factores involucrados. Un factor es un ingrediente que interviene en un
tratamiento, mientras que el nivel es cada una de las dosis o categoras de cada factor.
En estadstica, un experimento factorial completo es un experimento cuyo diseo consta de dos o ms factores, cada
uno de los cuales con distintos valores o "niveles", y cuyas unidades experimentales cubren todas las posibles
combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el estudio del efecto de cada
factor sobre la variable respuesta, as como el efecto de las interacciones entre factores sobre la dicha variable.
La aleatorizacin de los tratamientos se lleva a cabo de acuerdo con el diseo experimental de que se trate. Recordar
que el nmero de tratamientos es la combinacin de los niveles de cada uno de los factores.
Las 3 razones principales para realizar experimentos factoriales son las siguientes
I.
II.
III.
Para obtener informacin de los efectos medios de todos los factores de un experimento simple de tamao
moderado.
Para ampliar la base de las inferencias de un factor para probarlo bajo condiciones variadas de otros.
Para evaluar la manera en la cual, los efectos de los factores interactan con cada uno.
Adems un experimento factorial es ms completo porque se puede obtener ms informacin y un grado de precisin
mayor del mismo nmero de observaciones.
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
El objetivo de un diseo factorial es estudiar el efecto de varios factores sobre una o varias respuestas o
caractersticas de calidad, es decir, lo que se busca es estudiar la relacin entre los factores y la respuesta, con la
finalidad de conocer mejor como es esta relacin y generar conocimiento que permita tomar acciones y decisiones
que mejoren el desempeo del proceso. Por ejemplo uno de los objetivos particulares ms importantes que en general
tiene un diseo factorial es encontrar nuevas condiciones de operacin del proceso que eliminen o disminuyen cierto
problema de calidad en la variable de salida.
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
Los factores pueden ser de tipo cualitativo (mquinas, tipos de material, operador, la presencia o ausencia de una
operacin previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presin, etc.). Para poder estudiar la
manera en que influye cada factor sobre la variable de respuesta, es necesario elegir al menos dos niveles de pruebas
para cada uno de ellos (tres mquinas, dos operadores, tres velocidades, dos temperaturas). Con el diseo factorial
completo se corren aleatoriamente en el proceso todas las posibles combinaciones que pueden formarse con los
niveles seleccionados.
DEFINICIONES:
Diseo factorial: Diseo experimental que sirve para estudiar el efecto individual y de interaccin de varios factores
sobre una o varias respuestas.
Factor cualitativo: Sus niveles toman valores discretos o de tipo nominal que no pueden ser fracciones. Ejemplos:
mquinas, lotes, marcas, etc.
Factor cuantitativo: Sus niveles de prueba pueden tomar cualquier valor dentro de cierto intervalo. La escala es
continua, como por ejemplo temperatura, velocidad, presin, etc.
Arreglo factorial: Conjunto de puntos experimentales o tratamientos que pueden formarse al considerar todas las
posibilidades de combinacin de los niveles de los factores.
Efecto de un factor: Es el cambio observado en la variable de respuesta debido a un cambio de nivel en el factor.
Efecto principal: Es igual a la respuesta promedio observada en el nivel alto de un factor menos la respuesta
promedio en el nivel bajo.
Efecto de interaccin: Dos factores interactan significativamente sobre la variable de respuesta cuando el efecto de
uno depende del nivel en que est el otro.
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
[TRABAJO DE INVESTIGACION]
Modelo matemtico.
El modelo matemtico asociado al diseo de dos factores-tratamiento con interaccin y replicado es el siguiente:
Y ijk=+ i + j +
Para cada
i = 1,2,...,a; j = 1,2,...,b; k = 1,2,...,n,
Con restricciones
Donde:
: Es la media general.
: Es el efecto (positivo o negativo) debido al i-simo nivel del factor A.
: Es el efecto (positivo o negativo) del j-simo nivel del factor B.
: Representa al efecto de interaccin en la combinacin ij.
ijk
: Es el error aleatorio que supone sigue una distribucin con media cero y
varianza constante
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
y . j . y ..
y i .. y .. 2+ an
j=1
a
y ijk y =bn
i=1
k=1
b
j=1
a
i=1
y ij.
y ijk yij 2
k=1
b
j=1
j=1
a
+n
i=1
Estadstica inferencial 2
[TRABAJO DE INVESTIGACION]
a
Y ..= y ijk
i=1 j=1 k=1
*Media global
y =
y ..
abn
y i ..= y ijk
j =1 k=1
y i ..
bn
y . j .= y ijk
i =1 k=1
y. j .
an
Suma de cuadrados
Efecto
A
Efecto
B
Efecto
AB
Error
Total
Estadstica inferencial 2
Suma de
cuadrados M.
Fcal
a1
b1
(a-1)(b-1)
ab(n-1)
abn-1
9
[TRABAJO DE INVESTIGACION]
cuando
cuando
2.2.4 Ejemplo:
Estadstica inferencial 2
10
[TRABAJO DE INVESTIGACION]
En la tabla adjunta se presentan los tiempos, en minutos, de conexin con una direccin de internet desde cuatro
puntos geogrficos de una regin y en tres horas determinadas. El experimento se repeta cuatro veces y era diseado
para estudiar la influencia del factor hora de conexin y el factor lugar de la conexin en la variable de inters
tiempo de conexin.
Analizar estos datos y estudiar la influencia de los dos factores.
Lugar A
Lugar B
Lugar C
Lugar D
Hora 1
0'31
0'46
0'45
0'43
0'82
0'88
1'10
0'72
0'43
0'63
0'45
0'76
0'45
0'66
0'71
0'62
Hora 2
0'36
0'40
0'29
0'23
0'92
0'49
0'61
1'24
0'44
0'31
0'35
0'40
0'56
0'71
1'02
0'38
Hora 3
0'22
0'18
0'21
0'23
0'30
0'38
0'37
0'29
0'23
0'24
0'25
0'22
0'30
0'31
0'36
0'33
Solucin.
Estimacin de los parmetros.
Se obtienen las siguientes tablas de medias y estimaciones
..
L-A
L-B
L-C
L-D
0'413
0'880
0'568
0'610
0'618
0'139
0'320
0'815
0'375
0'667
0'544
0'065
0'210
0'335
0'235
0'325
0'276
-0'203
. .
.j
0'314
0'677
0'393
0'534
-0'165
0'198
-0'086
0'055
H-1
1j
H-2
2j
H-3
3j
.
ij
H-1
Estadstica inferencial 2
...
= 0'479
L-A
L-B
L-C
L-D
-0'040
0'064
0'036
-0'063
11
[TRABAJO DE INVESTIGACION]
H-2
-0'059
0'073
-0'083
0'068
H-3
0'099
-0'139
0'045
-0'006
Residuos
Lugar A
Lugar B
Lugar C
Lugar D
Hora 1
-0'103
0'047
0'037
0'017
-0'060
0'000
0'220
-0'160
-0'138
0'062
-0'118
0'192
-0'160
0'050
0'100
0'010
Hora 2
0'040
0'080
-0'030
-0'090
0'105
-0'325
-0'205
0'425
0'065
-0'065
-0'025
0'025
-0'107
0'043
-0'353
-0'287
Hora 3
0'010
-0'030
0'000
0'020
-0'035
0'045
0'035
-0'045
-0'005
0'005
0'015
-0'015
-0'025
-0'015
0'035
0'005
Tabla ANOVA
Fuentes de
variacin
Suma de
cuadrados
Grados de
libertad
CM
p - valor
Factor hora
1'0330
0'5165
23'222
0'0000
Factor lugar
0'9212
0'3071
13'806
0'0000
Interaccin
0'2501
0'0417
1'874
0'1123
2'2043
11
Error
0'8007
36
0.0222
= 0'149
Total
3'0050
47
0'0639
= 0'253
12
[TRABAJO DE INVESTIGACION]
Estadstica inferencial 2
13
[TRABAJO DE INVESTIGACION]
SC
GL
CM
F0
Valor-p
Efecto A
Efecto B
SCA
SCB
a-1
b-1
CMA
CMB
CMA/CME
CMB/CME
P(F> F0A)
P(F> F0B)
Efecto C
SCC
c-1
CMC
CMC/CME
P(F> F0C)
Efecto AB
Efecto AC
SCAB
SCAC
(a-1)(b-1)
(a-1)(c-1)
CMAB
CMAC
CMAB/CME
CMAC/CME
P(F> F0AB)
P(F> F0AC)
Efecto BC
SCBC
(b-1)(c-1)
CMBC
CMBC/CME
P(F> F0BC)
Efecto ABC
SCABC
(a-1)(b-1)(c-1)
CMABC
CMABC/CME
P(F> F0ABC)
Estadstica inferencial 2
14
[TRABAJO DE INVESTIGACION]
Error
Total
SCE
SCT
abc(n-1)
abcn-1
CME
donde:
FV: Fuente de Variacin.
SC: Suma de Cuadrados.
GL: Grados de Libertad.
CM: Cuadrado Medio.
Fo: f Fisher calculado.
Al efecto cuyo valor-p sea menor al valor especificado para , se declara estadsticamente significativo o se dice que
est activo. El ANOVA de tres factores dado en la tabla anterior tiene cuatro renglones adicionales, por los nuevos
cuatro efectos que pueden estudiarse. Las sumas de cuadrados son muy similares a las obtenidas para dos factores.
FORMULAS
Suma de Cuadrados
Las sumas de cuadrados son muy similares a las obtenidas para dos factores; habr que considerar un subndice
adicional para el tercer factor, comenzando otra vez por la suma de cuadrados total, stas resultan ser:
a
2
SCT ijk
i 1 j 1 k 1 l 1
...2
,
N
Dnde:
N = a*b*c*n es el total de observaciones en el experimento; el subndice k representa ahora el tercer factor y l las
repeticiones. Las sumas de cuadrados de efectos son:
Estadstica inferencial 2
15
[TRABAJO DE INVESTIGACION]
Restando stas del total, la suma de cuadrados del error resulta ser:
Cuyos respectivos grados de libertad se dan en la tabla ANOVA anterior. Una vez hecho el ANOVA, se procede a
interpretar los efectos activos, y luego (aunque no necesariamente despus) a diagnosticar la calidad del modelo.
Cuadrado Medio
Estadstica inferencial 2
16
[TRABAJO DE INVESTIGACION]
CM =
SC
GL
Donde:
Modelo estadstico
En un diseo factorial a*b*c se supone que el comportamiento de la respuesta Y puede describirse mediante el
modelo de efectos dado por:
Yijkl = +ai + j + k + ()ij + ()ik + ()jk + ()ijk + ijkl;
I=1,2,,a; j=1,2,,b; k=1,2,,c; l=1,2,,n
Donde:
= media general
i = efecto del nivel i-simo del factor A
j = efecto del nivel j del factor B
k = efecto del nivel k en el factor C
()ij, ()ik, ()jk = efectos de interacciones dobles (de dos factores) en los niveles ij, ik, jk, respectivamente.
()ijk : efecto de interaccin triple en la combinacin o punto ijk
ijkl : error aleatorio en la combinacin ijkl
l : repeticiones o replicas del experimento
Todos los efectos cumplen la restriccin de sumar cero, es decir, son desviaciones respecto a la medida general .
3.2.4 MANEJO DE HIPTESIS Y SUS CONDICIONES
El estudio factorial de tres factores (A,B,C) permite investigar los efectos A,B,C,AB,AC,BC y ABC donde el nivel
de desglose o detalle con el que puede estudiarse depende del nmero de niveles utilizado en cada factor. Por
ejemplo si un factor se prueba en dos niveles, todo su efecto marginal es lineal, o sea que su efecto individual no se
Estadstica inferencial 2
17
[TRABAJO DE INVESTIGACION]
puede descomponer; pero si tuviera tres niveles, su efecto marginal se puede descomponer en una parte lineal y otra
cuadrtica pura.
Hiptesis nula
H
0A
: todas las
0AB
: todas las
ijAB=0
ijk=0
f A=
Regin de rechazo
MSA
MSE
f AB =
f A F , I1 , IJK (L1)
MSAB
MSE
f ABC =
MSABC
MSE
En resumen se tienen siete efectos de inters sin considerar el desglose y con ellos se pueden plantear las siete
hiptesis nulas:
1.
2.
3.
4.
H0: Efecto A = 0
H0: Efecto B = 0
H0: Efecto C = 0
H0: Efecto AB = 0
5. H0: Efecto AC = 0
6. H0: Efecto BC = 0
7. H0: Efecto ABC = 0
C2
6
0
8
6
5
5
5
5
7
5
7
0
5
3
5
5
A2
B1
7
5
7
0
5
3
5
5
6
7
6
7
5
2
5
2
7
3
6
8
5
2
5
4
A3
B1
73
68
57
54
6
2
7
6
4
4
4
8
6
8
6
5
4
4
4
8
B1
6
5
6
5
4
5
4
5
7
1
7
2
6
0
6
7
8
0
8
0
6
0
6
7
B1
8
0
8
0
6
0
6
5
7
6
7
0
5
2
5
2
7
1
6
8
5
1
4
8
B1
7
5
7
3
5
0
5
4
7
5
7
5
5
6
5
9
7
5
7
5
5
5
5
0
7
5
7
7
5
7
5
5
a=3
b=2
c=2
Estadstica inferencial 2
18
[TRABAJO DE INVESTIGACION]
n=6
1.
2.
3.
4.
5.
6.
7.
SC A =
=13.86
226
72
SC B =
=480.5
326
72
SC C =
=6086.72
326
72
SC AB=
13.86480.5=788.25
26
72
13.866086.72=40.86
26
72
480.56086.72=56.89
36
72
Estadstica inferencial 2
19
[TRABAJO DE INVESTIGACION]
2
SC ABC =
778.2540.8656.8913.86
622
72
480.56086.72=31.01
SC T =
=8339.78
6
72
Grados de Libertad
GL A =31=2
GL B=21=1
GLC =21=1
Cuadrado Medio
CM A =
13.86
=6.93
2
CM B=
480.5
=480.5
1
CM C =
6086.72
=6086.72
1
GL AB =( 31 ) (21)=2
CM AB =
788.25
=394.12
2
GL AC = (31 ) (21)=2
CM AC =
40.86
=20.43
2
GL BC =( 21 ) (21)=1
CM BC =
56.89
=56.89
1
GL ABC =( 31 )( 21 ) (21)=2
CM ABC =
Estadstica inferencial 2
31.03
=15.51
2
20
[TRABAJO DE INVESTIGACION]
GL ERROR =322(61)=60
CM ERROR =
A1
B1
75 75
C1
6
0
8 70 70
6
= 436
A2
B1
67 73 73
B1
62 68
67
76
68
68
= 416
65
C2
A3
B1
B1
76 71 75 75 75 75
65
72
70
80
80
= 463
68
73
= 433
= 864
75
75
77
= 885
52
57
44
44
45
60
60
60
52
51
50
56
55
57
52
54
54
48
48
45
67
67
65
52
48
54
59
50
55
= 321
TOTAL = 762
TOTAL =
737
= 1499
= 274
= 379
= 653
TOTAL = 675
=
2061
= 452
52
= 647
TOTAL
65
B1
71 80 80
= 401
= 852
5 53 53
5
5 55 55
5
= 326
841.66
=14.03
60
= 307
=
1939
= 332
= 639
TOTAL = 1517
TOTAL = 1524
B1 = 2177
B2 = 2363
B1
B2
B1
B2
con
con
con
con
C1
C1
C2
C2
=
=
=
=
1270
1331
907
1032
Estadstica inferencial 2
21
Tabla ANOVA
FV
SC
GL
CM
FO
FTABLAS
A: Tipo
13.86
6.93
0.49
3.15
B: Abertura
480.5
480.5
34.25
C:
Temperatura
AB
6086.72
6086.72
433.90
788.25
394.12
28.10
3.15
AC
40.86
20.43
1.46
3.15
BC
56.89
56.89
4.06
ABC
31.03
15.51
1.11
3.15
Error
841.66
60
14.03
Total
8339.78
71
Conclusi
n
ACEPTA
RECHAZ
A
RECHAZ
A
RECHAZ
A
ACEPTA
RECHAZ
A
ACEPTA
Conclusiones
1.
2.
3.
4.
5.
6.
7.
Ho se
Ho se
Ho se
Ho se
Ho se
Ho se
Ho se
1.1.1
Considere f factores A, B, C,, K con niveles a, b, c,, k respectivamente, donde la letra K denota al f-simo o
ltimo factor del conjunto a estudiar, no necesariamente al dcimoprimero que es lugar de esta letra en el
alfabeto. Con estos niveles y factores se puede construir el diseo factorial general a x b x x k, que consiste de
a x b x x k tratamientos o puntos de prueba. Con este diseo se pueden estudiar f efectos principales, f(f-1)/2
interacciones dobles, f(f-1)(f-2)/(3 x 2) interacciones triples, y as sucesivamente hasta la nica interaccin de los
f factores (ABCK). el clculo del nmero de interacciones de cierta cantidad m de factores se hace mediante la
operacin combinaciones de f en m
m! ( f m) !
f ! ()
f =f !
()
seleccionar m factores de los f, donde f! = f x (f-1) x x 2 x 1. En resumen con el factorial general descrito se
pueden estudiar los siguientes 2f 1 efectos.
1.1.2
()
El anlisis factorial puede identificar la estructura de las relaciones entre las variables mediante la investigacin de
las correlaciones entre las variables. Por ejemplo supongamos que tenemos 100 encuestados basados en 10
caractersticas. Si el objetivo de la investigacin fuera el resumen de las caractersticas, se aplicara el anlisis
factorial a una matriz de correlacin de las variables. A este tipo de anlisis factorial se le conoce como anlisis
factorial R. ste analiza una serie de variables para identificar las dimensiones que son latentes (que no son fciles
de observar). Tambin se puede aplicar el anlisis factorial a la matriz de correlacin de los encuestados individuales
basada en sus caractersticas. A ste tipo se le denomina anlisis factorial Q, siendo un mtodo para combinar
grandes grupos de personas en grupos claramente diferentes dentro de una poblacin mayor. Pero generalmente para
analizar este tipo de cuestiones se utiliza el tipo de anlisis cluster.
2. Reduccin de datos
El anlisis factorial tambin puede: identificar las variables suplentes de una serie de variables ms grande para su
utilizacin en anlisis de multivariantes posteriores o crear una serie de valores completamente nueva, mucho ms
pequea en nmero, para reemplazar parcial o completamente la serie original de variables para su inclusin en
tcnicas posteriores. En ambos casos el propsito es retener la naturaleza y el carcter de las variables originales,
pero reducir su nmero.
El resumen de datos hace que la identificacin de los factores sean fines de por s; las estimaciones de los factores y
las contribuciones de cada variable a los factores constituyen todo lo que se necesita para el anlisis.
Adems, el investigador debe intentar minimizar el nmero de variables que se incluyen; no obstante, debe
mantener un numero razonable de variables por factor. Si se est diseando un estudio para valorar una estructura
propuesta, el investigador deber incluir varias variables (cinco o ms) que deban representar cada factor propuesto.
3. Tamao muestral
Generalmente el investigador no usara el anlisis factorial para una muestra inferior a 50 observaciones, y
preferiblemente el tamao muestral debera ser 100 o ms grande. Como regla general, el mnimo es tener por lo
menos un nmero de observaciones cinco veces mayor que el nmero de variables a ser analizadas.
utiliza el anlisis de componentes principales cuando el objetivo es resumir la mayora de la informacin original
(varianza) en una cantidad mnima de factores con propsitos de prediccin. Por el contrario, se utiliza el anlisis
factorial comn para identificar los factores subyacentes o las dimensiones que reflejan qu es lo que las variables
comparten en comn.
El anlisis factorial comn frente a anlisis de componentes
El investigador puede usar dos modelos bsicos para obtener soluciones factoriales. Estos se conocen como anlisis
factorial comn y anlisis de componentes principales. Con el fin de seleccionar el modelo apropiado, en primer
lugar el investigador tiene que comprender las diferencias entre los tipos de varianzas. Para los propsitos del
anlisis factorial, existen tres tipos de varianza total:
1. Comn
2. Especifica (nica)
3. Error
Se define la varianza comn como aquella que se comparte con todas las otras variables en el anlisis. La varianza
especfica es aquella asociada solamente con una variable especfica. La varianza de error es aquella que se debe a la
poca fiabilidad en el proceso de recoleccin de datos, error de medicin o componente aleatorio en el fenmeno
medido.
El anlisis de componentes principales considera la varianza total y estima los factores que contienen proporciones
bajas de la varianza nica, y en algunos casos, de la de error.
En el anlisis factorial comn se incorporan las varianzas compartidas en la diagonal.
La seleccin de un modelo u otro se basa en 2 criterios:
1. Los objetivos del anlisis factorial
2. El grado de conocimiento anterior acerca de las varianzas
El anlisis de componentes principales es apropiado cuando el inters principal se centra en la prediccin o el
mnimo numero de factores necesarios para justificar la porcin mxima de la varianza representada en la serie de
variables original, y cundo el conocimiento previo sugiere que la varianza especifica y de error representan una
porcin relativamente pequea de la varianza total. Por el contrario cuando el objetivo es identificar las dimensiones
latentes o las construcciones representadas en las variables originales y el investigador tiene poco conocimiento
acerca de la varianza especifica y de error, lo mas apropiado es usar el modelo factorial comn.
Criterios para el clculo del nmero de factores a ser extrados
En general se utilizan los siguientes criterios para la extraccin del nmero de factores:
Criterio de raz latente. Es la tcnica ms utilizada por su sencillez. La racionalidad que se usa es que cualquier
factor individual debera justificar la varianza de por lo menos una nica variable. Cada variable contribuye con un
valor de 1 para el autovalor total. Por tanto, slo se consideran los factores que tienen races latentes; explican al
menos una variable, se considera que todos los factores con races latentes menores que 1 no son significativas y por
tanto, se desestiman a la hora de incorporarlos a la interpretacin.
Criterio a priori. El criterio a priori es un criterio simple y a la vez razonable bajo ciertas circunstancias. Con su
aplicacin, el investigador ya sabe cuntos factores hay que extraer antes de iniciar el anlisis factorial. El
investigador simplemente instruye al computador para parar el anlisis cuando se haya extrado el nmero de
factores deseado.
Criterio de porcentaje de la varianza. El criterio de porcentaje de varianza es una aproximacin que se basa en
obtener un porcentaje acumulado especificado de la varianza total extrada. El propsito es asegurar una
significacin prctica de los factores derivados, asegurando que explican por lo menos una cantidad especificada de
la varianza. En las ciencias naturales, el procedimiento de factores normalmente no debera ser detenido hasta que
los factores extrados cuenten con por lo menos un 95% de la varianza o hasta que el factor justifique solamente una
pequea porcin (menos del 5%). Por contraste, en las ciencias sociales, donde la informacin muchas veces es
menos precisa, es normal considerar una solucin que represente un 60% de la varianza total como satisfactoria.
Criterio de contraste de cada. El contraste de cada se utiliza para identificar el nmero ptimo de factores que
pueden ser extrados antes de que la cantidad de la varianza nica empiece a dominar en la varianza comn. Se
estima el contraste de cada con el trazo de races latentes en funcin del nmero de factores en su orden de
extraccin, y se utiliza la forma de la curva consiguiente para evaluar el punto de corte.
Heterogeneidad de la muestra. La existencia de varianza compartida entre las variables es el ncleo tanto de los
modelos de factores comunes como de los de componentes. Un supuesto subyacente es que la varianza compartida se
extiende a lo largo de toda la muestra. Si la muestra es heterognea al menos con respecto a un subconjunto de
variables, los primeros factores representaran aquellas variables que son ms homogneas a lo largo de toda la
muestra. Las variables con mayor capacidad de discriminar entre subconjuntos muestrales cargaran sobre los ltimos
factores.
del primer factor. Los factores subsiguientes se definen de forma anloga hasta haber agotado la varianza de los
datos.
Las soluciones factoriales no rotadas alcanzan el objetivo de reduccin de los datos, pero el investigador debe
preguntarse si la solucin factorial no rotada facilita una informacin que ofrezca la interpretacin ms adecuada de
las variables examinadas. La mayor de las veces no resulta as. La carga factorial es el medio para interpretar la
funcin que cada variable desempea al definir cada factor. Las cargas factoriales son la correlacin entre cada
variable y el factor. Las cargas indican el grado de correspondencia entre cada variable y el factor, haciendo una
variable con mayor carga representativa del factor. La solucin factorial no rotada puede no dar un patrn
significativo de cargas de las variables. Si se espera que los factores no rotados sean significativos, el usuario puede
especificar que la rotacin no se lleve a cabo. Generalmente la rotacin es deseable porque simplifica la estructura de
los factores, y habitualmente es difcil determinar si los factores no rotados sern significativos. Por tanto, el segundo
paso hace un uso de un mtodo de rotacin para lograr soluciones factoriales ms simples y tericamente ms
significativas. En muchos casos la rotacin de los factores mejora la interpretacin disminuyendo alguna de las
ambigedades que a menudo acompaan a las soluciones factoriales inicialmente no rotadas.
En una tercera etapa, el investigador valora la necesidad de especificar de nuevo el modelo de factores debido a:
1. La eliminacin de variables en el anlisis
2. El deseo de emplear un mtodo de rotacin diferente para la interpretacin
3. La necesidad de extraer un numero diferente de factores
4. El deseo de cambiar de un mtodo de extraccin a otro
La especificacin nueva del modelo factorial viene acompaada de la vuelta a la etapa de extraccin, rotacin de
factores y de nuevo a su interpretacin.
Rotacin de factores
Una herramienta importante al interpretar los factores es la rotacin de factores. El termino rotacin significa
exactamente lo que indica. Concretamente, se giran en el origen los ejes de referencia de los factores hasta alcanzar
una determinada posicin. Como se indico previamente, las soluciones factoriales no rotadas extraen factores segn
su orden de importancia. El primer factor tiende a ser un factor general por el que casi toda variable se ve afectada
significativamente dando cuenta del mayor porcentaje de varianza. El segundo y siguientes factores se basan en la
varianza residual. Cada uno explica porcentajes de varianza cada vez menores. El efecto ltimo de rotar la matriz de
factores es redistribuir la varianza de los primeros factores a los ltimos para lograr un patrn de factores ms simple
y tericamente ms significativo.
1.1.3
Fuente de Variacin
Suma de Cuadrados
Grados de libertad
SCA
a-1
SCK
SCAB
k-1
(a-1)(b-1)
SC(K-1)K
SCABC
(l-1)(k-1)
(a-1)(b-1)(c-1)
SC(K-2)(K-1)K
(m-1)(l-1)(k-1)
E f . ( K2 ) ( K1 ) K
SCABK
SCE
(a-1)(b-1)(k-1)
abck(n-1)
SCT
(abckn)-1
Ef .A
Ef .K
E f . AB
E f . K ( K 1 )
E f . ABC
E f . AB K
Error
Total
SC T = Y ij mr
i=1 j=1
m=1 r=1
Y ..
N
SC A =
i=1
Y i
Y
bc lkn
N
Y 2j
Y 2
SC B =
N
j=1 ac lkn
b
Y k
Y
SC C =
N
k=1 ab lkn
SC K =
m=1
Y m
Y
abc ln
N
b
SC AB=
i =1 j=i
Y 2ij Y 2
SC A SC B ; ;
c lkn
N
2
SC ( K1 ) K =
p =1 m=i
Y pm Y
SC ( K1)SC K ;
abc n
N
2
Y
Y
SC ABC = ijk SC A SC B SC AC SC BC ; ;
lkn
N
i=1 j=i k =1
a
Y ij pm Y
SC AB K =
S C A SC ABSC AB K 1
n
N
i=1 j=i
p=1 m=i