Capitulo 4
Capitulo 4
Capitulo 4
1 Introducción
2 El diseño 22
3 El diseño 2k
4 Algoritmo de Yates
5 Fracciones de Diseño Factoriales
6 Diseños Plackett-Burman
7. Diseños Jerárquicos o Anidados
1 Introducción
Experimentos factoriales: Análisis de un conjunto de factores cada uno con distintos
niveles
Necesitamos 3125
diseños experimentales
Si tenemos 5 factores con 5 niveles cada uno
y hacemos todas las combinaciones posibles
Normalmente solo pocos factores serán relevantes
Experimento inicial: Probar muchos factores con solo dos niveles
Diseños 2k k factores
El cálculo de los efectos. En este diseño hay tres efectos de interés: los dos efectos
principales (A y B) y el efecto de interacción (AB). Con el uso de la notación de Yates
como los totales de las n repeticiones en cada punto de diseño, se tiene:
Efecto A =1 / 2n [a + ab – b- (1)] =1 / 2n [a + ab] - 1 / 2n [b + (1)]
Efecto B =1 / 2n [b + ab- a- (1)] = 1 /2n [b + ab] - 1 /2n [a + (1)]
Efecto AB =1 / 2n [ab + (1) – a - b] = 1 / 2n [ab - b] -1 /2n [a - (1)]
Efecto A = (1/2*4(15+34) - 1/2*4(20+3))*2 = 6.5
Efecto B = (1/2*4(20+34) - 1/2*4(15+3))*2 = 9
Efecto AB =(1/2*4(34-20) - 1/2*4(15-3))*2 = 0.5
El modelo es el de 2 factores:
Yij = μ +αi+βj+αiβj +uij ; i,j = 1,2
Ecuación o modelo de regresión:
Yij = μ +α2Da+β2Db+(αβ)22Dab +uij
𝜇 = ∑2𝑖=1 ∑2𝑗=1 𝑌𝑖𝑗/4 =18
El diseño 23
Diseño Estandar 23
a b c ab ac bc abc Respuesta y
- - - + + + - Y111=1
+ - - - - + + Y211=a
- + - - + - + Y121=b
+ + - + - - - Y221=ab
- - + + - - + Y112=c
+ - + - + - - Y212=ac
- + + - - + - Y122=bc
+ + + + + + + Y222=abc
16
16 datos
Parámetros
Algoritmo de Yates
Gráfico de Pareto
Gráfico de Probabilidad Normal
Programa SPSS
4. Algoritmo de Yates
Un diseño factorial con repeticiones contiene ensayos 2k. El algoritmo de Yates
considera k+2 columnas, la primera de las cuales contiene la matriz del diseño de
experimentos, es decir, los 2k tratamientos escritos en orden estándar de Yates.
2. En la columna 1 se escribe el resultado correspondiente a cada tratamiento listado
en la columna como se muestra en la tabla de más abajo.
Si el diseño se repitiese, se escribiría la media de los resultados obtenidos en las
repeticiones de cada tratamiento.
3. En la mitad superior de la columna 2 se escriben en orden las sumas de pares
consecutivos de la columna 1, es decir, el primero más el segundo, el tercero más el
cuarto, y así sucesivamente. En la mitad inferior de la columna 3 se introduce, en
orden, las diferencias entre los mismos pares consecutivos observados antes, es decir,
el segundo dato menos el primero, el cuarto menos el tercero, etc.
4. Las columnas 3, 4, …, se obtienen de la misma forma que la columna 2, es decir,
obteniendo en cada paso sumas y diferencias de pares de la columna precedente en la
forma descrita en la etapa 3.
5. Los resultados obtenidos en la última columna (columna k+2) se etiquetan con g(T),
g(A),g(B), g(AB), etc. El primer valor dividido por N da la media de todos los
experimentos realizados. Las estimaciones de los efectos principales y de las
interacciones se obtienen dividiendo cada g( ) por N/2.
Gráfico de Pareto
Regla Empírica 1
Regla de Pareto: la mayoría de la variabilidad es debida a muy pocas causas
Regla Empírica 2
Los efectos de las interacciones suelen ser menores que el de las variables principales
implicadas
Regla Empírica 3
Si un factor no es relevante, no lo suele ser tampoco su interacción
Para construir el grafico ordenar de mayor a menos independiente del signo es decir en
valor absoluto
c 50
b 47
d 32.25
bc 24.75
a 24.5
bd 8.5
bcd 8.25
abd 7.75
ac 4.25
acd 4.25
abcd 3
ab 2.75
ad 2.5
abc 2.5
cd 1
Grafico de Pareto
cd
abc
ad
ab
abcd Variables
acd
significativas
ac
abd
bcd
bd
a
bc
d
b
c
0 5 10 15 20 25 30 35 40 45 50
Factores e
Interacciones Valores Yates ni (ni-0.5)/N
c 50 15 0.96666667
b 47 14 0.9
d 32.25 13 0.83333333
bc 24.75 12 0.76666667
bd 8.5 11 0.7
bcd 8.25 10 0.63333333
ac 4.25 9 0.56666667
acd 4.25 8 0.5
ab 2.75 7 0.43333333
cd -1 6 0.36666667
ad -2.5 5 0.3
abc -2.5 4 0.23333333
abcd -3 3 0.16666667
abd -7.75 2 0.1
a -24.5 1 0.03333333
Gráfico de Probabilidad Normal Variables
Significativas
1
c
0.9 b
d
0.8
bc
0.7
0.6
0.5
0.4
0.3
0.2
0.1
a
0
-30 -20 -10 0 10 20 30 40 50 60
Programa SPSS
Para hacer un análisis estadístico primero iniciamos eliminando las interacciones de 3 y
4 variables o factores que suponemos no serán significativos y parecerán en el análisis
de varianza (ANOVA) como valores residuales o error.
De esta tabla se eligen las variables significativas para la realización de una regresión
lineal y conocer los valores que conformaran el modelo matemático. Ya sea con las
colas de significación valores menores a 0.05 (95 % de confianza) o comparando el F
calculado con el Ftablas.
Regresión Lineal
Ecuación de Regresión o Modelo Matemático
450
400
350
300
ppm
250
Observados
200
Modelo
150
100
50
0
0 2 4 6 8 10 12 14 16 18
No Experimentos
Errores
30
20
10
Errores
0
0 2 4 6 8 10 12 14 16 18
-10
-20
-30
No Experimentos
EJEMPLO.-
USO DEL DISEÑO FACTORIAL EN LA SÍNTESIS DE PRODUCTOS DE QUÍMICA
FINA
(Homologo Aceite de Jojoba)
Son productos de alto valor agregado y pequeños tonelajes fabricados como procesos
discontinuos y polivalentes.
Aceite de Jojoba.- Éster de alto peso molecular (Usos: Plastificante para la industria
cosmética, farmacéutica, alimenticia). Se encuentra en la Jojoba y esperma de ballena.
Equipo Experimental.- Reactor tanque agitado a vacío con sus respectivos controles de
Temperatura (T) y agitación.
Materiales usados. -
Catalizador: Cloruro de cobalto
Ácido oleico al 99 % de pureza
Alcohol oleico al 98 % de pureza
Método Analítico. - Cromatógrafo de gases y espectrofotómetro de masas.
Calidad del Producto. - Se determinó midiendo punto de solidificación, índice de
saponificación, índice de Iodo y viscosidad.
Método de Operación. - Se introducen los reactivos al reactor provisto de un
condensador con reflujo.
Se realiza vacío hasta 0.1 mm Hg y se calienta los reactivos a la temperatura deseada.
Se agitan durante dos horas y se analizan las muestras al finalizar la reacción. Durante
cada experimento permanece cte. la T, P y velocidad de agitación.
Análisis Estadístico.- En este trabajo, el tipo de diseño seleccionado para el estudio de
un éster análogo del aceite de Jojoba ha sido un diseño factorial de ( un factor a tres
niveles y dos factores a dos niveles ) . Los factores elegidos, considerando los
aspectos químicos del proceso fueron,
Temperatura (T) con dos niveles (100 y 150 ºC); Concentración inicial de catalizador
(C) con dos niveles (0.1 y 0.05 gr); Relación inicial molar (M) alcohol – ácido en tres
niveles (0.5,1,y 1.5) .
Matriz de Experimentación de un Diseño
Experimento Respuesta Niveles Codificados
No. azar TºC C(gr) M Rend XT XC XM
1 12 150 0.1 1.5 78.10 +1 +1 +1
2 10 100 0.1 1.5 13.40 -1 +1 +1
3 9 150 0.05 1.5 77.00 +1 -1 +1
4 11 100 0.05 1.5 18.10 -1 -1 +1
5 3 150 0.1 1.0 70.00 +1 +1 0
6 6 100 0.1 1.0 14.00 -1 +1 0
7 4 150 0.05 1.0 60.40 +1 -1 0
8 5 100 0.05 1.0 10.70 -1 -1 0
9 1 150 0.1 0.5 34.10 +1 +1 -1
10 7 100 0.1 0.5 10.70 -1 -1 -1
11 2 150 0.05 0.5 33.00 +1 -1 -1
12 8 100 0.05 0.5 10.00 -1 -1 -1
= 35.792 A B C
En la tabla siguiente se muestra el análisis de ANOVA obtenido por el programa SPSS
de variables principales y de interacciones tomadas de dos de donde se puede
seleccionar las variables significativas cuyas colas de significación sean menores a
0,05 (95 % de confianza).
En la tabla siguiente se muestra la matriz ANOVA obtenida del programa SPSS
mediante regresión lineal para obtener los coeficientes del modelo matemático
Coeficientesa
Coeficientes
Coeficientes no estandarizad 95.0% intervalo de
estandarizados os confianza para B
Modelo matemático
Rend = 35.792 + 22.975 Xt + 12,35 Xm + 9,65 Xm Xt
90
80
70
60
50
Rend
Observado
40
Modelo
30
20
10
0
1 3 5 7 9 11
No Experimentos
Errores
10
0
1 3 5 7 9 11
-5
-10
-15
No Experimentos
5 Fracciones de diseños factoriales
La motivación de los diseño 2k es analizar muchos factores con pocos experimentos
elementales
Objetivo de las fracciones: Conseguir analizar k factores con menos de 2 k experimentos
elementales fracción de un diseño factorial completo.
Es un diseño factorial en el que no se realizan todos los experimentos factoriales. Si se
elige la fracción adecuadamente se podrán estimar los factores de forma independiente
(aunque con menos precisión). Nos centraremos en fracciones que sean (1/2p) x
número de datos del diseño completo (p = 1: la mitad, p=2 la cuarta parte, p = 3 la
octava parte…)
Fracciones de un 23
Diseño Estandar 23
a b c ab ac bc abc Respuesta y
- - - + + + - Y111=1
+ - - - - + + Y211=a
- + - - + - + Y121=b
+ + - + - - - Y221=ab
- - + + - - + Y112=c
+ - + - + - - Y212=ac
- + + - - + - Y122=bc
+ + + + + + + Y222=abc
Si dos efectos tienen la misma columna de signos, su efecto no se puede estimar por
separado. La columna de respuesta estima la suma de ambos efectos.
Por lo que el efecto a y la interacción bc están confundidas. También decimos que en
este diseño la confusión es a = bc
Otras confusiones b = ac; c = ab
Tiene sentido aceptar un diseño con confusiones si suponemos que uno de los efectos
confundidos no es significativo, entonces la estimación corresponde al otro efecto.
Que fracción será mejor Ɂ
La que tenga una confusión de los efectos principales con las interacciones de orden
más alto posible.
Como encontrarla Ɂ
Ejemplo: Consideremos una semifracción del diseño 24.
Utilizaremos el diseño 24-1.
1º. - Se escribe el diseño básico que es 23 como se muestran en las tres primeras
columnas de la figura Nº
Este diseño básico tiene el Nº necesario de corridas (8) , pero solo tres columnas
(factores). Se genera la cuarta (D). Multiplicando los signos (+)(-) en las columnas
A,B,C.
2 + - - - a
3 - + - - b
4 + + - + abd
5 - - + - c
6 + - + + acd
7 + - + + bcd
8 + + + - abc
En este caso la fracción más conveniente es la última tabla ya que se puede evaluar
los efectos principales y dispone de las interacciones más altas posibles.
Ejemplo Ilustrativo
USE OF FRECTIONAL FACTORIAL DESIGN FOR SELECTION OF NUTRIENTS FOR CULTURING
Paecilomyces variotii IN EUCALYPTUS HEMICELLULOSIC HYDROLYSATE
Realizamos una ANOVA solamente con los efectos principales para poder seleccionar
los efectos significativos
Resultados Efectos Principales
De esta tabla seleccionamos las siguientes variables rb, as, ur sp, ft con un nivel de
confianza del 74,2 %.
Diseño Factorial Fraccionario 25-1
Se realiza un nuevo diseño factorial fraccionario con las variables seleccionadas, como
se muestra en la tabla siguiente.
Realizamos una ANOVA solamente con los efectos principales para poder seleccionar
los efectos significativos como se muestra en la siguiente tabla
Realizamos una ANOVA con los efectos principales y las interacciones tomadas de
dos, eligiendo la interacción Ft Sp para poder seleccionar los efectos significativos
como se muestra en la siguiente tabla
Seleccionamos las variables significativas con un 86.5 de confianza Rb, As, RbFt, UrFt
Para obtener los coeficientes del modelo por regresión lineal como se muestra en la
tabla.
Modelo matemático
Biomasa = 6,617 + 1,817 As + 1,433 Rb – 1,361 UrFt - 0,989 RbFt
14
12
10
8
Biomasa
Observados
6
Modelo
4
0
0 2 4 6 8 10 12 14 16 18
No Experimentos
Errores
4
0
0 2 4 6 8 10 12 14 16
-2
-4
6 Diseños Plackett-Burman
En 1946, R.L. Plackett y J.P. Burman publicó su ahora famoso paper "The Design of
Optimal Multifactorial Experiments " en Biometrika (vol. 33). Este paper describe la
construcción de planes muy económicos con el número de corridas un múltiplo de
cuatro (en lugar de potencia a la 2). los planes de Plackett-Burman son los planes de
diseño de Tamizado (screening) muy eficaces cuando sólo los efectos principales son
de interés.
Los diseños Plackett-Burman (PB) son usados para experimentos de tamizado porque,
en un plan PB, los efectos principales están, en general, muy confundido con las
interacciones de dos-factores. Los diseños PB por ejemplo con 12 corridas, pueden
usarse para un experimento que contiene hasta 11 factores.
Ejemplo Ilustrativo
X1: Tasa de alimentación X2: Cantidad de catalizador X3: Tasa de agitación X4:
Temperatura X5: Concentración
Y: Porcentaje de reacción
Respuesta Unidades
%
reacted
En las tabla siguiente se muestra las variables originales manipulables y la variable respuesta y en la
siguiente se muestra la misma tabla con las variables manipulables codificadas
Experiment feed % Catalyst agitation temperature Concent % Reacted
1 0 0 0 0 0 65
2 -1 -1 -1 -1 1 56
3 1 -1 -1 -1 -1 53
4 -1 1 -1 -1 -1 63
5 1 1 -1 -1 1 65
6 -1 -1 1 -1 -1 53
7 1 -1 1 -1 1 55
8 -1 1 1 -1 1 67
9 1 1 1 -1 -1 61
10 0 0 0 0 0 67
11 -1 -1 -1 1 -1 69
12 1 -1 -1 1 1 45
13 0 1 -1 1 1 78
14 1 1 -1 1 -1 93
15 0 -1 1 1 1 49
16 1 -1 1 1 -1 60
17 -1 1 1 1 -1 95
18 1 1 1 1 1 82
19 0 0 0 0 0 63
Factores Bajo Alto Unidades Continuo
feed rate 10 15 liters/min si
catalyst 1 2 % si
agitation 100 120 rpm si
temperatura 140 180 degrees si
concentration 3 6 % si
Respuesta Unidades
reacted %
En la tabla siguiente se observa la tabla ANOVA obtenida con el programa SPSS de las
variables principales de la cual se observa como variables significativas catalys y temp
De la tabla se puede observar que las variables principales catalyst, temp y concent y
las interacciones catalyst-temp y temp-concent son significativas.
Con estas variables se realiza el análisis de regresión lineal para obtener el modelo
matemático correspondiente
Porcreac = 65,211 + 10,25 catalyst + 6,125 temp – 3,125 concent + 5,375 catalistemp
- 4,75 tempconcent
100
90
80
70
60
Porreac
50
Observado
40
Modelo
30
20
10
0
1 3 5 7 9 11 13 15 17 19
No Experimentos
Errores
10
8
6
4
2
0
-2 1 3 5 7 9 11 13 15 17 19
-4
-6
-8
Diseños Jerárquicos o Anidados
En ciertos experimentos multifactoriales los niveles de un factor son similares para
diferentes niveles del otro factor.
Ejemplo. -
Considere una compañía que compra materia prima a tres diferentes proveedores. La
compañía desea determinar si la pureza de la materia prima de cada una es la misma.
Hay cuatro lotes de materia prima disponible de cada proveedor. Se hacen tres
determinaciones de la pureza en cada lote.
Modelo General:
I = 1,2,…a
J = 1,2,…b
k = 1,2,…n
n Nº de réplicas = 3
2 2
Y = (Yijk)
Fuente Variación Suma Cuadrados DF Cuadrados
Medios
a 2 2
A Ssa = Yi /bn - Y /abn a-1 Ssa/n-1
a b 2
B(dentro a) Ssb(a) = Yij /n a(b-1) Ssb(a)/a(b-1)
Error Sse= Sst-Ssa-Ssb(a) ab(n-1) Sse/ab(n-1)
2 2
Total Sst= Yijk - y /abn abn-1
Análisis de Varianza. -
Fuente Suma de Cuadrados G.L. C.M. Fc Ft (95 %)
Proveedores (A) 15.06 2 7.528 2.85 Ft(2,24) = 3.40
No hay influencia significativa entre proveedores (No se puede elegir mejor proveedor)
Si hay diferencia significativa entre lotes lo que significa que la variabilidad del proceso
del proveedor es muy alta. El control de calidad del proceso del proveedor es deficiente.
Para un valor de las colas de significación 0.05 (nivel de confianza del 95 %)
Bibliografía