Estadistica 2 Diseños Factoriales

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 32

INSTITUTO TECNOLGICO DE ZACATEPEC

PROFESOR:
Arturo Mndez

MATERIA:
Estadstica inferencial

TEMA:
Unidad IV Conceptos bsicos en diseos factoriales

ALUMNO:
Valdez Castrejn Alan Isai.

SEMESTRE: 4t YA

CARRERA: Ing. Industrial.

CICLO ESCOLAR:
Enero-Junio

FECHA DE ENTREGA:
28 de Mayo del 2011.

ndice

[TRABAJO DE INVESTIGACION]

INTRODUCCIN
Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]

Los experimentos factoriales se usan en casi todos los campos de investigacin. Son de gran valor en el trabajo
exploratorio (Niveles ptimos o combinacin ptima de los factores).
Un diseo factorial aquel en el que el conjunto de tratamientos est conformado por todas las posibles
combinaciones de los distintos niveles de los factores involucrados. Un factor es un ingrediente que interviene en un
tratamiento, mientras que el nivel es cada una de las dosis o categoras de cada factor.
En estadstica, un experimento factorial completo es un experimento cuyo diseo consta de dos o ms factores, cada
uno de los cuales con distintos valores o "niveles", y cuyas unidades experimentales cubren todas las posibles
combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el estudio del efecto de cada
factor sobre la variable respuesta, as como el efecto de las interacciones entre factores sobre la dicha variable.
La aleatorizacin de los tratamientos se lleva a cabo de acuerdo con el diseo experimental de que se trate. Recordar
que el nmero de tratamientos es la combinacin de los niveles de cada uno de los factores.
Las 3 razones principales para realizar experimentos factoriales son las siguientes
I.

II.
III.

Para obtener informacin de los efectos medios de todos los factores de un experimento simple de tamao
moderado.
Para ampliar la base de las inferencias de un factor para probarlo bajo condiciones variadas de otros.
Para evaluar la manera en la cual, los efectos de los factores interactan con cada uno.

Adems un experimento factorial es ms completo porque se puede obtener ms informacin y un grado de precisin
mayor del mismo nmero de observaciones.

Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]

4.2 CONCEPTOS BSICOS EN DISEO FACTORIAL

El objetivo de un diseo factorial es estudiar el efecto de varios factores sobre una o varias respuestas o
caractersticas de calidad, es decir, lo que se busca es estudiar la relacin entre los factores y la respuesta, con la
finalidad de conocer mejor como es esta relacin y generar conocimiento que permita tomar acciones y decisiones
que mejoren el desempeo del proceso. Por ejemplo uno de los objetivos particulares ms importantes que en general
tiene un diseo factorial es encontrar nuevas condiciones de operacin del proceso que eliminen o disminuyen cierto
problema de calidad en la variable de salida.

Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]
Los factores pueden ser de tipo cualitativo (mquinas, tipos de material, operador, la presencia o ausencia de una
operacin previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presin, etc.). Para poder estudiar la
manera en que influye cada factor sobre la variable de respuesta, es necesario elegir al menos dos niveles de pruebas
para cada uno de ellos (tres mquinas, dos operadores, tres velocidades, dos temperaturas). Con el diseo factorial
completo se corren aleatoriamente en el proceso todas las posibles combinaciones que pueden formarse con los
niveles seleccionados.
DEFINICIONES:
Diseo factorial: Diseo experimental que sirve para estudiar el efecto individual y de interaccin de varios factores
sobre una o varias respuestas.
Factor cualitativo: Sus niveles toman valores discretos o de tipo nominal que no pueden ser fracciones. Ejemplos:
mquinas, lotes, marcas, etc.
Factor cuantitativo: Sus niveles de prueba pueden tomar cualquier valor dentro de cierto intervalo. La escala es
continua, como por ejemplo temperatura, velocidad, presin, etc.
Arreglo factorial: Conjunto de puntos experimentales o tratamientos que pueden formarse al considerar todas las
posibilidades de combinacin de los niveles de los factores.
Efecto de un factor: Es el cambio observado en la variable de respuesta debido a un cambio de nivel en el factor.
Efecto principal: Es igual a la respuesta promedio observada en el nivel alto de un factor menos la respuesta
promedio en el nivel bajo.
Efecto de interaccin: Dos factores interactan significativamente sobre la variable de respuesta cuando el efecto de
uno depende del nivel en que est el otro.

Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]

4.3 Diseos factoriales con dos factores

4.3.1 PRESENTACIN DEL MODELO


El modelo de diseo de experimentos con dos factores tratamiento con interaccin se conoce como modelo
completo de dos vas o modelo de anlisis de la varianza de dos vas.
Para presentar las formulas generales para el anlisis de varianza de un experimento de dos factores que utiliza
observaciones repetidas en un diseo por completo aleatorio, debe considerarse el caso de n repeticiones de las
combinaciones del tratamiento, determinadas por niveles del factor A y b niveles del factor B. las observaciones
pueden clasificarse usando un arreglo rectangular, donde los renglones representan los niveles del factor A; y las
columnas, los factor B. Cada combinacin de tratamiento define una celda del arreglo. As, se tienen ab celdas, cada
Y ijk
una de las cuales contiene n observaciones. Se denota con
la k-sima observacin en el i-simo nivel del
factor A y el j-simo nivel del factor B.
Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]
Modelo matemtico.
El modelo matemtico asociado al diseo de dos factores-tratamiento con interaccin y replicado es el siguiente:

Y ijk=+ i + j +
Para cada
i = 1,2,...,a; j = 1,2,...,b; k = 1,2,...,n,
Con restricciones

Donde:
: Es la media general.
: Es el efecto (positivo o negativo) debido al i-simo nivel del factor A.
: Es el efecto (positivo o negativo) del j-simo nivel del factor B.
: Representa al efecto de interaccin en la combinacin ij.
ijk

: Es el error aleatorio que supone sigue una distribucin con media cero y

varianza constante

y son independientes entre si.

4.1.2 ESTIMACIN DE PARAMETROS


Los parmetros del modelo se obtienen por mnimos cuadrados, tcnica que se basa en minimizar la suma de los
cuadrados de los residuos.

Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]
y . j . y ..

y i .. y .. 2+ an

j=1
a

y ijk y =bn
i=1

k=1
b

j=1
a

i=1

y ij.

y ijk yij 2

k=1
b

j=1

j=1
a

+n
i=1

Simblicamente la identidad de cuadrados se escribe as:


SST = SSA + SSB +SS(AB) + SSE
Donde SSA y SSB denominan la suma de cuadrados para los efectos principales A y B, respectivamente, SS(AB)
recibe el nombre de suma de cuadrados de la interaccin para A y B, y SSE es la suma de errores al cuadrado. La
participacin de los grados de libertad se efecta de acuerdo con la identidad
abn1=( a1 ) + ( b1 )+ ( a+1 ) ( b1 ) +ab (n1)
*Suma de todas las observaciones

Estadstica inferencial 2

[TRABAJO DE INVESTIGACION]
a

Y ..= y ijk
i=1 j=1 k=1

*Media global
y =

y ..
abn

*Total en el nivel i del factor A


b

y i ..= y ijk
j =1 k=1

*Media en el nivel i del factor A


yi ..=

y i ..
bn

*Total en el nivel j del factor B


a

y . j .= y ijk
i =1 k=1

*Media en el nivel i del factor B


y . j .=

y. j .
an

4.1.3 TABLA ANOVA PARAMETROS


Fuente

Suma de cuadrados

Efecto
A
Efecto
B
Efecto
AB
Error
Total
Estadstica inferencial 2

Suma de
cuadrados M.

Fcal

a1
b1
(a-1)(b-1)
ab(n-1)
abn-1
9

[TRABAJO DE INVESTIGACION]

Manejo de pruebas de hiptesis


*Hiptesis para el efecto A
H 0 ; 1=2==a=0
H 1 ; 1 0 para alg n i

La hiptesis nula se rechaza al nivel de significancia cuando

*Hiptesis para el efecto B


H 0 ; 1= 2== b =0
H 1 ; 1 0 para alguni
La hiptesis se rechaza al nivel e significancia

cuando

*Hiptesis para el efecto AB


H 0 ; ( )ij =0 para todo i
H 1 ; ( )ij 0 para algun i
La hiptesis se rechaza al nivel e significancia

cuando

2.2.4 Ejemplo:

Estadstica inferencial 2

10

[TRABAJO DE INVESTIGACION]
En la tabla adjunta se presentan los tiempos, en minutos, de conexin con una direccin de internet desde cuatro
puntos geogrficos de una regin y en tres horas determinadas. El experimento se repeta cuatro veces y era diseado
para estudiar la influencia del factor hora de conexin y el factor lugar de la conexin en la variable de inters
tiempo de conexin.
Analizar estos datos y estudiar la influencia de los dos factores.
Lugar A

Lugar B

Lugar C

Lugar D

Hora 1

0'31
0'46

0'45
0'43

0'82
0'88

1'10
0'72

0'43
0'63

0'45
0'76

0'45
0'66

0'71
0'62

Hora 2

0'36
0'40

0'29
0'23

0'92
0'49

0'61
1'24

0'44
0'31

0'35
0'40

0'56
0'71

1'02
0'38

Hora 3

0'22
0'18

0'21
0'23

0'30
0'38

0'37
0'29

0'23
0'24

0'25
0'22

0'30
0'31

0'36
0'33

Solucin.
Estimacin de los parmetros.
Se obtienen las siguientes tablas de medias y estimaciones
..

L-A

L-B

L-C

L-D

0'413

0'880

0'568

0'610

0'618

0'139

0'320

0'815

0'375

0'667

0'544

0'065

0'210

0'335

0'235

0'325

0'276

-0'203

. .
.j

0'314

0'677

0'393

0'534

-0'165

0'198

-0'086

0'055

H-1

1j

H-2

2j

H-3

3j

.
ij

H-1
Estadstica inferencial 2

...

= 0'479

L-A

L-B

L-C

L-D

-0'040

0'064

0'036

-0'063
11

[TRABAJO DE INVESTIGACION]
H-2

-0'059

0'073

-0'083

0'068

H-3

0'099

-0'139

0'045

-0'006

De donde se deduce la siguiente tabla de residuos:

Residuos

Lugar A

Lugar B

Lugar C

Lugar D

Hora 1

-0'103
0'047

0'037
0'017

-0'060
0'000

0'220
-0'160

-0'138
0'062

-0'118
0'192

-0'160
0'050

0'100
0'010

Hora 2

0'040
0'080

-0'030
-0'090

0'105
-0'325

-0'205
0'425

0'065
-0'065

-0'025
0'025

-0'107
0'043

-0'353
-0'287

Hora 3

0'010
-0'030

0'000
0'020

-0'035
0'045

0'035
-0'045

-0'005
0'005

0'015
-0'015

-0'025
-0'015

0'035
0'005

Tabla ANOVA
Fuentes de
variacin

Suma de
cuadrados

Grados de
libertad

CM

p - valor

Factor hora

1'0330

0'5165

23'222

0'0000

Factor lugar

0'9212

0'3071

13'806

0'0000

Interaccin

0'2501

0'0417

1'874

0'1123

Variab. Exp. Total

2'2043

11

Error

0'8007

36

0.0222

= 0'149

Total

3'0050

47

0'0639

= 0'253

Se aceptar la hiptesis de no influencia de la interaccin entre lugar y hora.


Estadstica inferencial 2

12

[TRABAJO DE INVESTIGACION]

Se rechaza esta hiptesis de no influencia del factor hora.

Se rechaza esta hiptesis de no influencia del factor lugar.

4.4Diseos factoriales con 3 factores

Estadstica inferencial 2

13

[TRABAJO DE INVESTIGACION]

4.4.1 ESTIMACION DE LOS PARAMETROS DEL MODELO DE EFECTOS FIJOS


Cuando se tiene tres factores (A B y C) y el numero de niveles de prueba en cada uno de ellos son a, b y c, se puede
construir el arreglo factorial a*b*c, que consiste de a*b*c tratamientos o puntos experimentales. Entre los arreglos de
este tipo que se utilizan con frecuencia entre aplicaciones diversas se encuentra. El factorial 2 3, el factorial 33 y los
factoriales mixtos con no ms de cuatro niveles en dos de los factores, por ejemplo, el factorial 4*3*2 y el factorial
4*4*2 por mencionar dos de ellos.
El estudio factorial de tres factores (A, B y C) permitir investigar los efectos: A, B, C, AB, AC, BC y ABC, donde el
nivel de desglose o detalle con el que pueden estudiarse depende el nmero de niveles utilizado en cada factor. Por
ejemplo, si un factor se prueba en dos niveles todo su efecto marginal (individual) es lineal, o sea que su efecto
individual no se pueda descomponer; pero si tuviera tres niveles, su efecto marginal se puede descomponer en una
parte lineal y otra cuadrtica pura.
3.2.3 CUADRO DE ANALISIS DE VARIANZA
Tabla ANOVA Para el diseo factorial a*b*c
FV

SC

GL

CM

F0

Valor-p

Efecto A
Efecto B

SCA
SCB

a-1
b-1

CMA
CMB

CMA/CME
CMB/CME

P(F> F0A)
P(F> F0B)

Efecto C

SCC

c-1

CMC

CMC/CME

P(F> F0C)

Efecto AB
Efecto AC

SCAB
SCAC

(a-1)(b-1)
(a-1)(c-1)

CMAB
CMAC

CMAB/CME
CMAC/CME

P(F> F0AB)
P(F> F0AC)

Efecto BC

SCBC

(b-1)(c-1)

CMBC

CMBC/CME

P(F> F0BC)

Efecto ABC

SCABC

(a-1)(b-1)(c-1)

CMABC

CMABC/CME

P(F> F0ABC)

Estadstica inferencial 2

14

[TRABAJO DE INVESTIGACION]
Error
Total

SCE
SCT

abc(n-1)
abcn-1

CME

donde:
FV: Fuente de Variacin.
SC: Suma de Cuadrados.
GL: Grados de Libertad.
CM: Cuadrado Medio.
Fo: f Fisher calculado.
Al efecto cuyo valor-p sea menor al valor especificado para , se declara estadsticamente significativo o se dice que
est activo. El ANOVA de tres factores dado en la tabla anterior tiene cuatro renglones adicionales, por los nuevos
cuatro efectos que pueden estudiarse. Las sumas de cuadrados son muy similares a las obtenidas para dos factores.

FORMULAS
Suma de Cuadrados

Las sumas de cuadrados son muy similares a las obtenidas para dos factores; habr que considerar un subndice
adicional para el tercer factor, comenzando otra vez por la suma de cuadrados total, stas resultan ser:
a

2
SCT ijk

i 1 j 1 k 1 l 1

...2
,
N

Dnde:
N = a*b*c*n es el total de observaciones en el experimento; el subndice k representa ahora el tercer factor y l las
repeticiones. Las sumas de cuadrados de efectos son:

Estadstica inferencial 2

15

[TRABAJO DE INVESTIGACION]

Restando stas del total, la suma de cuadrados del error resulta ser:

SC E SCT SC A SC B SCC SC AB SC AC SC BC SC ABC

Cuyos respectivos grados de libertad se dan en la tabla ANOVA anterior. Una vez hecho el ANOVA, se procede a
interpretar los efectos activos, y luego (aunque no necesariamente despus) a diagnosticar la calidad del modelo.

Cuadrado Medio

Estadstica inferencial 2

16

[TRABAJO DE INVESTIGACION]

CM =

SC
GL

Donde:

CM = Cuadrado Medio del efecto


SC = Suma de cuadrado del efecto
GL = Grados de libertad del efecto

Modelo estadstico
En un diseo factorial a*b*c se supone que el comportamiento de la respuesta Y puede describirse mediante el
modelo de efectos dado por:
Yijkl = +ai + j + k + ()ij + ()ik + ()jk + ()ijk + ijkl;
I=1,2,,a; j=1,2,,b; k=1,2,,c; l=1,2,,n
Donde:
= media general
i = efecto del nivel i-simo del factor A
j = efecto del nivel j del factor B
k = efecto del nivel k en el factor C
()ij, ()ik, ()jk = efectos de interacciones dobles (de dos factores) en los niveles ij, ik, jk, respectivamente.
()ijk : efecto de interaccin triple en la combinacin o punto ijk
ijkl : error aleatorio en la combinacin ijkl
l : repeticiones o replicas del experimento
Todos los efectos cumplen la restriccin de sumar cero, es decir, son desviaciones respecto a la medida general .
3.2.4 MANEJO DE HIPTESIS Y SUS CONDICIONES
El estudio factorial de tres factores (A,B,C) permite investigar los efectos A,B,C,AB,AC,BC y ABC donde el nivel
de desglose o detalle con el que puede estudiarse depende del nmero de niveles utilizado en cada factor. Por
ejemplo si un factor se prueba en dos niveles, todo su efecto marginal es lineal, o sea que su efecto individual no se
Estadstica inferencial 2

17

[TRABAJO DE INVESTIGACION]
puede descomponer; pero si tuviera tres niveles, su efecto marginal se puede descomponer en una parte lineal y otra
cuadrtica pura.
Hiptesis nula
H

0A

: todas las

0AB

Valor del estadstico de


prueba
=0

: todas las

ijAB=0

H 0ABC: todas las

ijk=0

f A=

Regin de rechazo

MSA
MSE

f AB =

f A F , I1 , IJK (L1)

MSAB
MSE

f ABC =

f AB F , ( I1) ( J1) , IJK (L1)

MSABC
MSE

f AB F , ( I1) ( J1)(k1), IJK (L1)

En resumen se tienen siete efectos de inters sin considerar el desglose y con ellos se pueden plantear las siete
hiptesis nulas:
1.
2.
3.
4.

H0: Efecto A = 0
H0: Efecto B = 0
H0: Efecto C = 0
H0: Efecto AB = 0

5. H0: Efecto AC = 0
6. H0: Efecto BC = 0
7. H0: Efecto ABC = 0

3.2.5 EJEMPLO EXPLICADO


Se desea investigar el efecto del tipo de suspensin (A), abertura de malla (B) y temperatura de ciclaje (C) en el
volumen de sedimentacin Y(%) de una suspensin. Para ello se decide correr un experimento factorial 3*2*2 con
seis rplicas, y las observaciones obtenidas en las 72 corridas experimentales se muestran en la siguiente tabla:
A1
B1
C1

C2

6
0
8
6
5
5
5
5

7
5
7
0
5
3
5
5

A2
B1

7
5
7
0
5
3
5
5

6
7
6
7
5
2
5
2

7
3
6
8
5
2
5
4

A3

B1
73
68
57
54

6
2
7
6
4
4
4
8

6
8
6
5
4
4
4
8

B1
6
5
6
5
4
5
4
5

7
1
7
2
6
0
6
7

8
0
8
0
6
0
6
7

B1
8
0
8
0
6
0
6
5

7
6
7
0
5
2
5
2

7
1
6
8
5
1
4
8

B1
7
5
7
3
5
0
5
4

7
5
7
5
5
6
5
9

7
5
7
5
5
5
5
0

7
5
7
7
5
7
5
5

a=3
b=2
c=2
Estadstica inferencial 2

18

[TRABAJO DE INVESTIGACION]
n=6
1.
2.
3.
4.
5.
6.
7.

H0: Efecto A es considerablemente influyente en los resultados.


H0: Efecto B es considerablemente influyente en los resultados.
H0: Efecto C es considerablemente influyente en los resultados.
H0: Efecto AB es considerablemente igual en conjunto.
H0: Efecto AC es considerablemente igual en conjunto.
H0: Efecto BC es considerablemente igual en conjunto.
H0: Efecto ABC es considerablemente igual en conjunto.

Suma de Cuadrados (SC)

SC A =

14992 +1517 2+1524 2 45702

=13.86
226
72

SC B =

21772+ 23632 45702

=480.5
326
72

SC C =

2601 + 1939 4570

=6086.72
326
72

SC AB=

762 + 737 +675 + 842 +740 +784 4570

13.86480.5=788.25
26
72

8522+ 8642 +885 2 +6472 +6532 +6392 45702


SC AC =

13.866086.72=40.86
26
72

12702 +13312 +9072 +10322 4570 2


SC BC =

480.56086.72=56.89
36
72

Estadstica inferencial 2

19

[TRABAJO DE INVESTIGACION]
2

SC ABC =

436 + 416 +401 ++332 4570

778.2540.8656.8913.86
622
72

480.56086.72=31.01

SC T =

60 +75 +75 + +55 4570

=8339.78
6
72

Grados de Libertad

GL A =31=2
GL B=21=1
GLC =21=1

Cuadrado Medio

CM A =

13.86
=6.93
2

CM B=

480.5
=480.5
1

CM C =

6086.72
=6086.72
1

GL AB =( 31 ) (21)=2

CM AB =

788.25
=394.12
2

GL AC = (31 ) (21)=2

CM AC =

40.86
=20.43
2

GL BC =( 21 ) (21)=1

CM BC =

56.89
=56.89
1

GL ABC =( 31 )( 21 ) (21)=2

CM ABC =

Estadstica inferencial 2

31.03
=15.51
2

20

[TRABAJO DE INVESTIGACION]
GL ERROR =322(61)=60

CM ERROR =

A1
B1
75 75

C1

6
0
8 70 70
6
= 436

A2

B1
67 73 73

B1
62 68

67

76

68

68

= 416

65

C2

A3
B1
B1
76 71 75 75 75 75

65

72

70

80

80

= 463

68

73

= 433

= 864

75

75

77

= 885

52

57

44

44

45

60

60

60

52

51

50

56

55

57

52

54

54

48

48

45

67

67

65

52

48

54

59

50

55

= 321

TOTAL = 762

TOTAL =
737
= 1499

= 274

= 379

= 653
TOTAL = 675

=
2061

= 452

52

= 647

TOTAL

65

B1
71 80 80

= 401

= 852
5 53 53
5
5 55 55
5
= 326

841.66
=14.03
60

= 307

=
1939

= 332

= 639

TOTAL = 842 TOTAL = 740 TOTAL = 784

TOTAL = 1517

TOTAL = 1524

B1 = 2177
B2 = 2363

B1
B2
B1
B2

con
con
con
con

C1
C1
C2
C2

=
=
=
=

1270
1331
907
1032

Estadstica inferencial 2

21

Tabla ANOVA
FV

SC

GL

CM

FO

FTABLAS

A: Tipo

13.86

6.93

0.49

3.15

B: Abertura

480.5

480.5

34.25

C:
Temperatura
AB

6086.72

6086.72

433.90

788.25

394.12

28.10

3.15

AC

40.86

20.43

1.46

3.15

BC

56.89

56.89

4.06

ABC

31.03

15.51

1.11

3.15

Error

841.66

60

14.03

Total

8339.78

71

Conclusi
n
ACEPTA
RECHAZ
A
RECHAZ
A
RECHAZ
A
ACEPTA
RECHAZ
A
ACEPTA

Conclusiones
1.
2.
3.
4.
5.
6.
7.

Ho se
Ho se
Ho se
Ho se
Ho se
Ho se
Ho se

rechaza, la temperatura de ciclaje si influye.


rechaza, la abertura de la malla si influya.
acepta, el tipo de suspensin no influye.
rechaza la temperatura de ciclaje no es igual a la abertura de la malla en conjunto.
acepta, la temperatura de ciclaje es igual al tipo de suspensin en conjunto.
rechaza, la abertura de la malla no es igual al tipo de suspensin en conjunto.
acepta, los tres factores en conjunto se comportan en forma similar.

Diseo factorial general

1.1.1

DISEO FACTORIAL GENERAL

Considere f factores A, B, C,, K con niveles a, b, c,, k respectivamente, donde la letra K denota al f-simo o
ltimo factor del conjunto a estudiar, no necesariamente al dcimoprimero que es lugar de esta letra en el
alfabeto. Con estos niveles y factores se puede construir el diseo factorial general a x b x x k, que consiste de
a x b x x k tratamientos o puntos de prueba. Con este diseo se pueden estudiar f efectos principales, f(f-1)/2
interacciones dobles, f(f-1)(f-2)/(3 x 2) interacciones triples, y as sucesivamente hasta la nica interaccin de los
f factores (ABCK). el clculo del nmero de interacciones de cierta cantidad m de factores se hace mediante la

operacin combinaciones de f en m

m! ( f m) !
f ! ()
f =f !

()

que cuenta el nmero de maneras diferentes de

seleccionar m factores de los f, donde f! = f x (f-1) x x 2 x 1. En resumen con el factorial general descrito se
pueden estudiar los siguientes 2f 1 efectos.

1.1.2

PASOS PARA EL ANLISIS FACTORIAL

(1f )=f efectos principales ( A , B , , K)


f = f ( f 1 ) interacciones dobles ( AB, AC , , ( k1 ) K )
2
2

()

( f 1f )=f interacciones de f 1 factores ( AB K1, AB ( K2 ) K , )


f =1interaccion de todos los factores ( ABC , K ) .
f

Primer paso: Objetivos del anlisis factorial


El punto de comienzo en el anlisis factorial es el problema objeto de investigacin. El propsito general de las
tcnicas analticas de factores es encontrar una manera de resumir la informacin contenida en una serie de variables
originales en una serie mas pequea de dimensiones compuestas o factores nuevos con una mnima perdida de datos.
Las tcnicas del anlisis factorial pueden satisfacer cualquiera de estos 2 objetivos:
1. La identificacin de estructura mediante el resumen de datos
2. La reduccin de datos
1. La identificacin de estructura mediante resumen de datos

El anlisis factorial puede identificar la estructura de las relaciones entre las variables mediante la investigacin de
las correlaciones entre las variables. Por ejemplo supongamos que tenemos 100 encuestados basados en 10
caractersticas. Si el objetivo de la investigacin fuera el resumen de las caractersticas, se aplicara el anlisis
factorial a una matriz de correlacin de las variables. A este tipo de anlisis factorial se le conoce como anlisis
factorial R. ste analiza una serie de variables para identificar las dimensiones que son latentes (que no son fciles
de observar). Tambin se puede aplicar el anlisis factorial a la matriz de correlacin de los encuestados individuales
basada en sus caractersticas. A ste tipo se le denomina anlisis factorial Q, siendo un mtodo para combinar
grandes grupos de personas en grupos claramente diferentes dentro de una poblacin mayor. Pero generalmente para
analizar este tipo de cuestiones se utiliza el tipo de anlisis cluster.
2. Reduccin de datos
El anlisis factorial tambin puede: identificar las variables suplentes de una serie de variables ms grande para su
utilizacin en anlisis de multivariantes posteriores o crear una serie de valores completamente nueva, mucho ms
pequea en nmero, para reemplazar parcial o completamente la serie original de variables para su inclusin en
tcnicas posteriores. En ambos casos el propsito es retener la naturaleza y el carcter de las variables originales,
pero reducir su nmero.
El resumen de datos hace que la identificacin de los factores sean fines de por s; las estimaciones de los factores y
las contribuciones de cada variable a los factores constituyen todo lo que se necesita para el anlisis.

Segundo paso: El diseo de un anlisis factorial


El diseo de un anlisis factorial implica tres decisiones bsicas:
1. Clculo de datos de entrada
2. El diseo de estudio en termino de numero de variables, las propiedades de medicin y los tipos permisibles
3. El tamao de muestra
1. Las correlaciones entre las variables
La primera decisin en el diseo se concentra en la aproximacin que se usa para calcular la matriz de correlacin
tanto para el anlisis de tipo R como para el del tipo Q. el investigador puede ocupar la matriz de datos de entrada a
partir del clculo de las correlaciones entre las variables, empleando el anlisis del tipo R. el investigador tambin
pude elegir la matriz de correlacin de las correlaciones entre los encuestados individuales. En este tipo de anlisis,
el resultado ser una matriz factorial que identifica sujetos similares.
2. La seleccin de variables y cuestiones de medicin
Ahora es necesario abordar 2 preguntas: Cmo se miden las variables? Y Cuntas variables deberan ser? Se
supone que las variables a incluir en el anlisis tienen escala mtrica. En algunos casos, se pueden utilizar variables
ficticias (codificadas 0-1), aunque se consideran como no mtricas.

Adems, el investigador debe intentar minimizar el nmero de variables que se incluyen; no obstante, debe
mantener un numero razonable de variables por factor. Si se est diseando un estudio para valorar una estructura
propuesta, el investigador deber incluir varias variables (cinco o ms) que deban representar cada factor propuesto.
3. Tamao muestral
Generalmente el investigador no usara el anlisis factorial para una muestra inferior a 50 observaciones, y
preferiblemente el tamao muestral debera ser 100 o ms grande. Como regla general, el mnimo es tener por lo
menos un nmero de observaciones cinco veces mayor que el nmero de variables a ser analizadas.

Tercer paso: Supuestos en el anlisis factorial


Los supuestos bsicos subyacentes del anlisis factorial son ms de tipo conceptual que estadstico. Desde un punto
de vista estadstico, se pueden obviar supuestos de normalidad, homocedasticidad y linealidad siendo consientes de
que su incumplimiento produce una disminucin en las correlaciones observadas. En realidad, solo es necesaria la
normalidad cuando se aplica una prueba estadstica a la significacin de los factores; sin embargo, raramente se
utilizan estas pruebas. De hecho es deseable que haya cierto grado de multicolinealidad, dado que el objetivo es
identificar series de variables interrelacionadas.
Adicionalmente a las bases estadsticas para las correlaciones de la matriz de datos, el investigador tiene que
asegurarse tambin de que la matriz tiene suficientes correlaciones para justificar la aplicacin de dicho anlisis. Si la
inspeccin visual revela que no hay nmero sustancial de correlaciones mayores a 0.30, entonces el anlisis es
inapropiado.
Otra manera de determinar la conveniencia del anlisis es examinar la matriz de correlacin entera. El contraste de
esfericidad de Bartlett, una prueba estadstica para la presencia de correlaciones entre variables, es una de estas
herramientas. Proporciona la probabilidad estadstica de que la matriz de correlacin de las variables sea una matriz
identidad.
Otra medida para cuantificar el grado de intercorrelaciones entre las variables y la conveniencia del anlisis es la
medida de suficiencia de muestreo (MSA). Este ndice se extiende de 0 a 1, llegando a 1 cuando cada variable es
perfectamente predicha sin error por las otras variables.
Los supuestos conceptuales que subyacen en el anlisis factorial se relacionan con la serie de variables seleccionadas
y la muestra elegida. Un supuesto bsico del anlisis factorial es que existe una estructura subyacente en la serie de
variables seleccionadas. Es responsabilidad del investigador asegurarse de que las pautas observadas sean validas y
conceptualmente apropiadas para utilizar el anlisis factorial.
Cuarto paso: La estimacin de los factores y la valoracin del ajuste general
Una vez que se especifican las variables y se separa la matriz de correlacin, ya se est preparado para aplicar el
anlisis factorial que identifique la estructura subyacente de las relaciones. Para realizar esta operacin, es necesario
tomar decisiones con respecto a: el mtodo de extraccin de los factores; y el nmero de factores seleccionados para
representar la estructura subyacente de los datos. La seleccin del mtodo depende del objetivo del investigador. Se

utiliza el anlisis de componentes principales cuando el objetivo es resumir la mayora de la informacin original
(varianza) en una cantidad mnima de factores con propsitos de prediccin. Por el contrario, se utiliza el anlisis
factorial comn para identificar los factores subyacentes o las dimensiones que reflejan qu es lo que las variables
comparten en comn.
El anlisis factorial comn frente a anlisis de componentes
El investigador puede usar dos modelos bsicos para obtener soluciones factoriales. Estos se conocen como anlisis
factorial comn y anlisis de componentes principales. Con el fin de seleccionar el modelo apropiado, en primer
lugar el investigador tiene que comprender las diferencias entre los tipos de varianzas. Para los propsitos del
anlisis factorial, existen tres tipos de varianza total:
1. Comn
2. Especifica (nica)
3. Error
Se define la varianza comn como aquella que se comparte con todas las otras variables en el anlisis. La varianza
especfica es aquella asociada solamente con una variable especfica. La varianza de error es aquella que se debe a la
poca fiabilidad en el proceso de recoleccin de datos, error de medicin o componente aleatorio en el fenmeno
medido.
El anlisis de componentes principales considera la varianza total y estima los factores que contienen proporciones
bajas de la varianza nica, y en algunos casos, de la de error.
En el anlisis factorial comn se incorporan las varianzas compartidas en la diagonal.
La seleccin de un modelo u otro se basa en 2 criterios:
1. Los objetivos del anlisis factorial
2. El grado de conocimiento anterior acerca de las varianzas
El anlisis de componentes principales es apropiado cuando el inters principal se centra en la prediccin o el
mnimo numero de factores necesarios para justificar la porcin mxima de la varianza representada en la serie de
variables original, y cundo el conocimiento previo sugiere que la varianza especifica y de error representan una
porcin relativamente pequea de la varianza total. Por el contrario cuando el objetivo es identificar las dimensiones
latentes o las construcciones representadas en las variables originales y el investigador tiene poco conocimiento
acerca de la varianza especifica y de error, lo mas apropiado es usar el modelo factorial comn.
Criterios para el clculo del nmero de factores a ser extrados
En general se utilizan los siguientes criterios para la extraccin del nmero de factores:
Criterio de raz latente. Es la tcnica ms utilizada por su sencillez. La racionalidad que se usa es que cualquier
factor individual debera justificar la varianza de por lo menos una nica variable. Cada variable contribuye con un
valor de 1 para el autovalor total. Por tanto, slo se consideran los factores que tienen races latentes; explican al
menos una variable, se considera que todos los factores con races latentes menores que 1 no son significativas y por
tanto, se desestiman a la hora de incorporarlos a la interpretacin.

Criterio a priori. El criterio a priori es un criterio simple y a la vez razonable bajo ciertas circunstancias. Con su
aplicacin, el investigador ya sabe cuntos factores hay que extraer antes de iniciar el anlisis factorial. El
investigador simplemente instruye al computador para parar el anlisis cuando se haya extrado el nmero de
factores deseado.
Criterio de porcentaje de la varianza. El criterio de porcentaje de varianza es una aproximacin que se basa en
obtener un porcentaje acumulado especificado de la varianza total extrada. El propsito es asegurar una
significacin prctica de los factores derivados, asegurando que explican por lo menos una cantidad especificada de
la varianza. En las ciencias naturales, el procedimiento de factores normalmente no debera ser detenido hasta que
los factores extrados cuenten con por lo menos un 95% de la varianza o hasta que el factor justifique solamente una
pequea porcin (menos del 5%). Por contraste, en las ciencias sociales, donde la informacin muchas veces es
menos precisa, es normal considerar una solucin que represente un 60% de la varianza total como satisfactoria.
Criterio de contraste de cada. El contraste de cada se utiliza para identificar el nmero ptimo de factores que
pueden ser extrados antes de que la cantidad de la varianza nica empiece a dominar en la varianza comn. Se
estima el contraste de cada con el trazo de races latentes en funcin del nmero de factores en su orden de
extraccin, y se utiliza la forma de la curva consiguiente para evaluar el punto de corte.
Heterogeneidad de la muestra. La existencia de varianza compartida entre las variables es el ncleo tanto de los
modelos de factores comunes como de los de componentes. Un supuesto subyacente es que la varianza compartida se
extiende a lo largo de toda la muestra. Si la muestra es heterognea al menos con respecto a un subconjunto de
variables, los primeros factores representaran aquellas variables que son ms homogneas a lo largo de toda la
muestra. Las variables con mayor capacidad de discriminar entre subconjuntos muestrales cargaran sobre los ltimos
factores.

Quinto paso: Interpretacin de los factores


Para interpretar los factores y seleccionar la solucin factorial definitiva se deben seguir tres pasos.
En primer lugar, se calcula la matriz inicial de factores no rotados para que nos d una indicacin preliminar acerca
del nmero de factores a extraer. La matriz de factores contiene las cargas factoriales para cada variable sobre cada
factor. Al calcular la matriz de factores no rotada, el investigador simplemente est interesado en la mejor
combinacin lineal de variables, es decir, en encontrar aquella combinacin particular de las variables originales que
cuenta con el mayor porcentaje de varianza de los datos. En consecuencia, el primer factor puede contemplarse como
el mejor resumen de las relaciones lineales que los datos manifiestan.
El segundo factor se define como la segunda mejor combinacin lineal de las variables, sujeta a la restriccin de que
sea ortogonal al primer factor. Para ser ortogonal al primer factor el segundo factor debe derivarse de la varianza
restante tras la extraccin del primer factor. As, el segundo factor puede definirse como la combinacin lineal de las
variables que da cuenta del mayor porcentaje de la varianza residual una vez se ha eliminado de los datos el efecto

del primer factor. Los factores subsiguientes se definen de forma anloga hasta haber agotado la varianza de los
datos.
Las soluciones factoriales no rotadas alcanzan el objetivo de reduccin de los datos, pero el investigador debe
preguntarse si la solucin factorial no rotada facilita una informacin que ofrezca la interpretacin ms adecuada de
las variables examinadas. La mayor de las veces no resulta as. La carga factorial es el medio para interpretar la
funcin que cada variable desempea al definir cada factor. Las cargas factoriales son la correlacin entre cada
variable y el factor. Las cargas indican el grado de correspondencia entre cada variable y el factor, haciendo una
variable con mayor carga representativa del factor. La solucin factorial no rotada puede no dar un patrn
significativo de cargas de las variables. Si se espera que los factores no rotados sean significativos, el usuario puede
especificar que la rotacin no se lleve a cabo. Generalmente la rotacin es deseable porque simplifica la estructura de
los factores, y habitualmente es difcil determinar si los factores no rotados sern significativos. Por tanto, el segundo
paso hace un uso de un mtodo de rotacin para lograr soluciones factoriales ms simples y tericamente ms
significativas. En muchos casos la rotacin de los factores mejora la interpretacin disminuyendo alguna de las
ambigedades que a menudo acompaan a las soluciones factoriales inicialmente no rotadas.
En una tercera etapa, el investigador valora la necesidad de especificar de nuevo el modelo de factores debido a:
1. La eliminacin de variables en el anlisis
2. El deseo de emplear un mtodo de rotacin diferente para la interpretacin
3. La necesidad de extraer un numero diferente de factores
4. El deseo de cambiar de un mtodo de extraccin a otro
La especificacin nueva del modelo factorial viene acompaada de la vuelta a la etapa de extraccin, rotacin de
factores y de nuevo a su interpretacin.

Rotacin de factores
Una herramienta importante al interpretar los factores es la rotacin de factores. El termino rotacin significa
exactamente lo que indica. Concretamente, se giran en el origen los ejes de referencia de los factores hasta alcanzar
una determinada posicin. Como se indico previamente, las soluciones factoriales no rotadas extraen factores segn
su orden de importancia. El primer factor tiende a ser un factor general por el que casi toda variable se ve afectada
significativamente dando cuenta del mayor porcentaje de varianza. El segundo y siguientes factores se basan en la
varianza residual. Cada uno explica porcentajes de varianza cada vez menores. El efecto ltimo de rotar la matriz de
factores es redistribuir la varianza de los primeros factores a los ltimos para lograr un patrn de factores ms simple
y tericamente ms significativo.

1.1.3

EXTRACCIN DE MATRIZ FACTORIAL

ANOVA para el diseo factorial general a x b x x k

Fuente de Variacin

Suma de Cuadrados

Grados de libertad

SCA

a-1

SCK
SCAB

k-1
(a-1)(b-1)

SC(K-1)K
SCABC

(l-1)(k-1)
(a-1)(b-1)(c-1)

SC(K-2)(K-1)K

(m-1)(l-1)(k-1)

E f . ( K2 ) ( K1 ) K

SCABK
SCE

(a-1)(b-1)(k-1)
abck(n-1)

SCT

(abckn)-1

Ef .A

Ef .K

E f . AB

E f . K ( K 1 )
E f . ABC

E f . AB K
Error
Total

La suma de cuadrados totales est dada por


a

SC T = Y ij mr
i=1 j=1

m=1 r=1

Y ..
N

Donde N = abc kn es el total de observaciones en el experimento; los subndices k y m representan al tercero y


ltimo factor, respectivamente.
Las sumas de cuadrados de efectos son:
a

SC A =
i=1

Y i
Y

bc lkn
N

Y 2j
Y 2
SC B =

N
j=1 ac lkn
b

Y k
Y
SC C =

N
k=1 ab lkn

SC K =

m=1

Y m
Y

abc ln
N
b

SC AB=
i =1 j=i

Y 2ij Y 2

SC A SC B ; ;
c lkn
N
2

SC ( K1 ) K =

p =1 m=i

Y pm Y

SC ( K1)SC K ;
abc n
N
2

Y
Y
SC ABC = ijk SC A SC B SC AC SC BC ; ;
lkn
N
i=1 j=i k =1
a

Y ij pm Y
SC AB K =

S C A SC ABSC AB K 1
n
N
i=1 j=i
p=1 m=i

Finalmente, la suma de cuadrado del error se calcula por


SC E=SCT SC A SC K SC AB SC ( K1) K SC ABC SC AB K
Slo en el caso irreal de que todos los posibles efectos en el factorial general estn activos, es necesario realizar al
menso dos rplicas del experimento. En las situaciones reales se replican al menso dos veces (y no siempre) slo los
diseos factoriales consistentes de 16 o menos puntos de prueba.

Modelos de efectos aleatorios

También podría gustarte