2 Selección Factores 2017 PDF

DISEÑO EXPERIMENTAL Y
OPTIMIZACIÓN DE SISTEMAS
CON MÚLTIPLES RESPUESTAS
Parte 2: Selección de factores
Héctor Goicoechea
E-mail: [email protected]
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Identificación de factores y
respuestas
Selección de factores
Diseños de Screening
o Cribado
Factores No Eliminar
Cambio de
significativos? niveles factor
Si
Optimización Respuestas óptimas

Diseños de Optimización Conclusiones
Etapa de screening: selección de factores
- Muchas pruebas
experimentales Diseños de screening
Investigar todos los
para la
factores - Mucho tiempo
selección de factores
- Mucho dinero
Primera etapa del análisis
• Delimitar el problema, definir la hipótesis,

establecer el objetivo del experimento-
resultado deseado.
• Seleccionar la variable respuesta que

representa al problema que hay que resolver y
determinar cómo se va a medir de manera
confiable.
Primera etapa del análisis
• Determinar qué factores se van a estudiar, para
analizar su influencia sobre la respuesta, sobre
la base de información y experiencia previa.
• Seleccionar el rango experimental a estudiar y

el diseño de experimentos adecuado.
• Realizar el experimento y seleccionar los

factores que tengan una influencia significativa
sobre la respuesta.
5
Diseños experimentales: gran
variedad
Etapa de screening: Selección de factores
Diseños más usados para realizar experimentos de
previsualización o screening para factores numéricos
y categóricos
 Factorial completo o total a dos

niveles (2k)
 Factorial fraccionado a dos niveles

(2k-p)
 Placket-Burman (muchos factores)

Selección del diseño
Aspectos que influyen en la selección de un diseño
 Naturaleza del problema, conocimiento previo y tipo
de información que se desea obtener.
 Número y tipo de factores e interacciones que se

deben estudiar.
 Restricciones operativas, de costo y tiempo.
 Necesidad de bloqueo.
 Características o propiedades de cada diseño.
 Facilidad de comprensión e implementación.
Características de los diseños
Ortogonalidad
Rotabilidad
Error estandar-leverage
Eficiencia
Resolución
ORTOGONALIDAD
• Los coeficientes estimados en el modelo ajustado no

están correlacionados entre si.
• Las columnas de la matriz del diseño deben estar

formadas por vectores independientes entre si.
Minimizar la Varianza de los

Coeficientes de Regresión
Modelo para un sistema lineal de 2 componentes:
y = b0 + b1 x1 + b2 x2 y X
y = X b + e = ypred + e b
b0
= b1
b2
(XTX)-1XT y = (XTX)-1XTX b
b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]
ypred = X (XTX)-1XT y  ypred = H y (H es conocida

como matriz “hat” por sombrero)
Xb = X(XTX)-1XT y
Pero XTX es singular en un diseño cuyas columnas están

correlacionadas
ROTABILIDAD
La varianza de la respuesta predicha en un punto cualquiera del

espacio experimental es solamente función de la distancia al punto
del centro del diseño.
Proporcionar un error de predicción estable en el

entorno experimental
LEVERAGE (PALANCA)
• Depende de la matriz experimental y del modelo
seleccionado (construcción de X).
• No depende del error experimental de la respuesta

y debe evaluarse antes de experimentar.
• La varianza de la respuesta
estimada en un punto se
obtiene multiplicando el
leverage por la varianza
experimental.
EFICIENCIA
• Cociente entre coeficientes estimados y

puntos experimentales.
• Se necesitan como mínimo la misma cantidad de

puntos experimentales diferentes en el diseño
que coeficientes a estimar.
• Para evaluar la falta de ajuste se hacen

repeticiones de un punto del diseño.
RESOLUCIÓN
Diseños factoriales fraccionados
Indica el nivel de confusiones que se presentan en la

estimación de efectos, dando una idea de que tan
bien pueden estimarse los efectos potencialmente
importantes mediante el diseño.
Confusiones
Cuando dos o más factores, con nombres distintos,

comparten la misma columna de signos (-1 y +1),
no se sabe que factor es el responsable del efecto
estimado.
Hay confusión
16
DISEÑOS FACTORIALES
Diseños factoriales completos a dos niveles: 2k
 Se investigan todas las posibles combinaciones de los niveles de
los factores.
 La cantidad de puntos experimentales esta dada por 2 k
 Útiles para 2  k  5 (4 a 32 tratamientos)
 Permiten estimar los efectos de todos los factores principales y

sus interacciones.
 Son diseños ortogonales y rotables.
El número de experimentos crece rápidamente con el

número de factores
Diseños factoriales completos a dos niveles
Efecto de un factor – Representación gráfica
Efectos estimables en los diseños factoriales
completos a dos niveles
La construcción de la matriz del diseño (k columnas y 2k renglones
considerando una réplica) se hace alternando los signos – y + en la primer
columna, dos menos y dos más en la segunda, cuatro menos y cuatro más
en la tercera y así sucesivamente.
Diseños factoriales completos a dos
Matriz del diseño 22 niveles
Representación geométrica
Efecto de un factor
Efecto de la interacción
Ejemplo:
Se necesita incrementar la eficiencia de un procedimiento de
extracción de cromo (VI) en muestras de agua de rio utilizando la
metodología de microextracción en fase líquida
A microextraction procedure based on an ionic liquid as an ion-pairing agent optimized using a design of experiments for chromium
species separation and determination in water samples. Anal. Methods, 2013, 5, 5065. P Berton, L Vera Candioti, H Goicoechea, R
Wuilloud
Considerando un diseño 27 con 128 experimentos:
Qué efectos se pueden estimar con 128 experimentos?
Se pueden
estimar 127
efectos
Hay que encontrar una estrategia que permita reducir de

manera importante el número de tratamientos
experimentales
Mientras más grande es el valor de k, mayor es el grado de

fraccionamiento que admite el diseño
“Aliasing”
Efectos alias son efectos que se confunden y no es

posible separarlos.
Para interpretar los efectos alias es necesario suponer

que solo uno de ellos es responsable del efecto
observado y que los demás efectos son nulos.
Se utiliza el principio de jerarquía.

“Aliasing”
No es una buena estrategia utilizar diseños

donde se alían dos efectos que son
potencialmente importantes, tales como
efectos principales y las interacciones
dobles.
Diseño 24-1
Diseño 24-1
Diseño 25-2
Cuando un diseño se fracciona mucho no hay confianza

en la estimación de los efectos principales
Resolución de los diseños factoriales
fraccionados
Factorial completo
Permite estimar todos los efectos principales y sus
interacciones sin confusiones.
Resolución V o mayor
Los efectos principales y las interacciones dobles se
confunden con interacciones triples o de orden mayor.
Resolución IV
Los efectos principales no se confunden entre ellos ni con
interacciones dobles, pero si estas entre si.
Resolución III
Los efectos principales no se confunden entre ellos pero
hay efectos principales que se confunden con
interacciones dobles.
38
Se busca la máxima resolución posible con un nº razonable de

corridas experimentales y de gasto de recursos
Resolución III: no recomendados. En algunos casos es arriesgado

suponer de antemano que ninguna interacción doble esta activa. Se
usan cuando hay muchos factores o cuando cada corrida es
demasiado cara.
Resolución IV: para 5  k  15 existen diseños que no requieren más

de 32 ensayos y proporcionan información de todos los efectos
principales y de algunas de las interacciones dobles.
Resolución V y VI: cuando se pueden hacer más ensayos.

Un caso especial: PLACKETT-BURMAN
• Es un tipo especial de diseño factorial fraccionario (altamente

fraccionado con resolución III).
• Es útil cuando existen múltiples factores.
• El diseño mínimo permite estudiar hasta 11 factores con 12

experimentos.
• Las interacciones dobles tienen un complejo alias con los

términos principales.
DISEÑO DE PLACKETT-BURMAN
• Permite estudiar efectos principales, suponiendo

que no existen interacciones entre los factores.
• Si hay interacciones, el diseño puede fallar, es

decir, puede considerar significativos efectos que no
lo son y viceversa.
• En general, cuando hay interacciones importantes,

el ajuste de PB es malo.
• ¿Hay alguna manera de superar este problema?

El nº de puntos del diseño

N es múltiplo de cuatro.
Se pueden estudiar hasta k

factores en N
experimentos donde
k =N-1.
Cuando hay menos factores que el máximo a estudiar (por

ejemplo 8 factores y doce experimentos (11 permitidos
para el estudio):
Variables dummy (se usan para estimar el error)
Diseño de Plackett-Burman para el
problema
…
Estimación de efectos
Construcción de un modelo matemático que
explique la variación
Resultados
¿Qué factor es significativo?
Pregunta:
Los efectos ¿son estadísticamente
significativos?
La respuesta se puede obtener de dos maneras:

• Gráfica
• ANOVA
Evaluación de los efectos
Opciones gráficas
Se decide cuáles de los efectos principales, interacciones
dobles y triples se pueden enviar al error. La SCerror en un
ANOVA posterior contendrá los efectos “excluidos”.
Gráfica de Pareto
Gráfica de Probabilidad Normal (Daniel)
Gráfica de Probabilidad Media Normal (Daniel)
Opciones gráficas, más ANOVA

Opciones gráficas
54
Opciones gráficas
Diagrama de Pareto
Gráfico que permite discriminar entre las causas

más importantes de un problema y las que afectan
menos.
Se basa en la idea de que unos pocos factores son

los responsables de los cambios significativos en
la respuesta.
Opciones gráficas - Pareto
Pareto permite tener una idea visual
rápida sobre que factor es más
influyente.
No aporta información sobre su

significancia, es decir que hay que
hacer un test estadístico.
Opciones gráficas
Diagrama de Pareto – Método de Bonferroni
Representación gráfica de los valores t de los efectos
Opciones gráficas
Diagrama de Pareto – Método de Bonferroni
Representación gráfica de los valores t de los efectos
Modelo
Respuesta = media general + efectos principales de los
factores + efectos de interacción + error
Naranja: positivos
Azules: negativos
Opciones gráficas
GRÁFICA
DE
DANIEL
Los efectos de los factores que se alejan de la línea recta,

no forman parte de una distribución normal, por lo tanto
son significativos.
Importante: es una interpretación contraria a la que se hará

para residuos en una parte posterior del estudio.
Opciones gráficas
GRÁFICO DE EFECTOS EN PAPEL PROBABILÍSTICO NORMAL
GRÁFICA DE
DANIEL
Opciones gráficas
Test de Shapiro Wilk
Opciones gráficas
Gráfico Semi-Normal
Papel 99
probabílístico
% Probabilidad semi-normal
medio normal 97
95
A
90
85
80
B
70
60 Efectos significativos
D
40
20
0 C
|Efecto|
0.00 10.24 20.48 30.71 40.95
Solo utiliza la parte positiva de la distribución

normal estándar
Opciones gráficas
ANOVA: Prueba de hipótesis
(ANOVA)
Modelo de efectos: ANOVA
Respuesta = media general + efectos principales de los

factores + efectos de interacción + error
Variabilidad
debida al
Variabilidad Variabilidad
Variabilidad error
debida al debida al
efecto error debida al efecto
El objetivo es:
- Seleccionar aquellos efectos de factores o

interacciones que sean significativos y que
formarán parte del modelo, explicando el
comportamiento de la respuesta y …
- Aquellos que sean no significativos que

pueden utilizarse para conformar el error.
67
Ejemplo: uso de un diseño completo y réplica
En una fábrica de dispositivos electrónicos hay roturas y
se piensa que hay tres factores (temperaturas de la etapa
de procesamiento) responsables del problema.
Para determinar si estos factores son significativos y

posteriormente encontrar una combinación de niveles
donde la cantidad de piezas rotas sea mínima, se decide
correr un diseño factorial 23 con dos réplicas, trabajando
con una respuesta que es la proporción de piezas rotas.
Diseño factorial 23
T1: Temperatura de grabado (-3 a -1 ºC)
T2: Temperatura de piraña (60 a 98 ºC)
T3: Temperatura de agua (20 a 78 ºC)
+1
Factor 2
-1
-1 Factor 1 +1
Forma de operar:
1- Hacer un ANOVA con todos los efectos.
2- Hacer un ANOVA que sólo incluya los términos

significativos, mandando al error los efectos que
claramente no son significativos.
3- Revalorar los términos que estaban en situación

dudosa
70
Construcción del Modelo
Regresión lineal múltiple
Ecuación de regresión
error
1
Respuesta i  Efectoi
(variable dependiente) 2
Coeficientes de regresión
Factores
(variables independientes)
Método de los cuadrados mínimos

• Importancia del efecto

Coeficientes
• Cantidad de factores que intervienen
en el comportamiento de la respuesta
Complejidad • Tipo de relación que existe entre la

respuesta y esos factores
• Uso que se le va a dar al modelo
Polinomios más Polinomios más

simples complejos
¿Para que construimos modelos matemáticos?
Polinomios simples
• Seleccionar factores significativos
Modelos Lineales
• Evaluar interacciones entre los factores
Modelos con
• Explorar el comportamiento de la Interacciones
respuesta en un entorno experimental
acotado Modelos Cuadráticos
• Describir lo más exactamente posible el Modelos Cúbicos

comportamiento de la respuesta
• Encontrar un óptimo para la respuesta Polinomios complejos

CONSTRUCCIÓN DE UN MODELO
¿Cómo obtenemos el mejor modelo a partir de los datos

experimentales recolectados con un diseño de experimentos?
1- Ajustar los distintos tipos de modelos posibles a los datos
 Lineal
 Lineal con Interacción
 Cuadrático
2- Para cada uno de los modelos calcular la significancia de

la regresión (idoneidad del modelo), la falta de ajuste y el
coeficiente de determinación (R2 aj )
CONSTRUCCIÓN DE UN MODELO
CMR
Significancia de la Regresión F0   F0.05,k,nk 1
CME
CMLOF
Falta de Ajuste F0   F0.05,m2,nm
CMEPuro
3- Seleccionar el modelo con mayor idoneidad, menos falta de

ajuste y mayor (R2 aj )
¿Cómo se calcula una varianza?
Analizar el cálculo de la desviación

estándar
x1
x2 𝑛 2
x3 𝑖=1 (𝑥𝑝 − 𝑥𝑖)
𝑠=
. 𝑛−1
.
.
xn Varianza = s2
xpromedio
n
Test de hipótesis para comparar
varianzas: prueba F
Hipótesis: Nula (H0): s12 = s22
Alternativa (H1): s12 > s22
Test estadístico F:
Comparación de dos varianzas muestrales
Se calcula el estadístico F
2
s1
Fc  2
s2 Siendo s1 > s2
F( n1 1),( n2 1),
Si F calculado es menor al F tabulado, las series son

homogéneas u homocedásticas
Si F calculado es mayor al F tabulado, las series son
heterogéneas o heterocedásticas
Si la probabilidad correspondiente a ese F calculado es
menor a 0.05, las series son heterogéneas o heterocedásticas
FBCB UNL Distribución F
3.072
Cuando hay muchos términos en el modelo, se
prefiere R2aj sobre R2 (para no incrementar en
forma artificial con cada término que se agrega).
R2aj baja con cada término artificial que se agrega.
Se cumple: 0 ≤ R2aj ≤ R2 ≤ 1
Se espera que sea al menos igual a 0.7

Calidad del ajuste
Verificación de los
supuestos del ANOVA
Conclusiones
ANOVA
ANOVA
Cálculo de Contraste y Suma de cuadrados
ANOVA
𝑆𝐶𝑇 = 𝑥𝑖 − 𝑥 2
= 1576.9
Resumen del análisis
Calidad del ajuste del modelo de regresión
lineal simple
Prueba de falta de ajuste: es necesario que para cada
valor de x haya varias observaciones de y (repeticiones)
y y4-1
y4-2
y4-3
x1 x2 x3 x4 x5 x
H0 : el modelo se ajusta de manera adecuada a los datos
H1 : el modelo no se ajusta en forma satisfactoria
SCE = SCEP +SCFA → SCFA = SCE - SCEP

Para m niveles distintos de x y ni repeticiones dentro de
cada nivel:
Si Fcal  F(, m-2, N-m) o si p<0.05
Se rechaza Ho
Verificación de los
supuestos del ANOVA
89
Evaluación de los Modelos
 ¿Se cumplen los supuestos en los que se basa la

regresión por cuadrados mínimos?
 ¿Cuáles son los supuestos?
Normalidad Homocedasticidad Independencia
 ¿Provee una aproximación adecuada a la
función real?
 Si el modelo no es adecuado y no está correctamente
ajustado:
- La selección de factores no será confiable.
- La exploración y optimización del sistema no será
adecuada.
Análisis de Residuos
Mucha utilidad en la comprobación de los
supuestos
RESIDUO
eij  yij  yˆ ij
Diferencia entre la
respuesta
observada y la
predicha por el
modelo
92
Normalidad de los residuos
Gráfico de probabilidad normal
Si los residuos se acomodan

aproximadamente a lo largo
de una recta, se considera que
el supuesto de normalidad
está satisfecho.
Recordar que al analizar efectos le dábamos una interpretación

diferente (transparencia N° 54)
Homocedasticidad de los residuos
Gráfico de residuos vs. valor predicho
Si los residuos se
distribuyen
Residuo
aleatoriamente, se
considera que el
supuesto de
homocedasticidad
está satisfecho.
Valor predicho
Independencia de los residuos
Gráfico de residuos vs. orden del experimento
Si los residuos se
distribuyen
aleatoriamente, se
Residuo
considera que el
supuesto de
independencia está
satisfecho.
Otros enfoques y usos:
Escalado de residuos para la detección de
Outliers
Residuo estandarizado
eij
d ij 
σˆ
σˆ  MC E
Útil para detectar atípicos (outlier):

residuo estandarizado mucho más
grande que los demás
Otros enfoques y usos:
Escalado de residuos para la detección de
Outliers
Residuo estudentizado
Medida de la
localización del
eij
rij  punto en el espacio
experimental
σˆ (1  hij )
0  hij  1
Más confiable para
detectar atípicos
Escalado de residuos
Gráficas de residuo estudentizados
Residuo estudentizado Residuo estudentizado
Un desvío del comportamiento

normal debe estar sustentado
por más de un residuo
Escalado de residuos
Gráficas de residuos escalados
escalados
L
Reiduo Estudentizado
Escalado
Escaladodede
residuos
residuos
Gráficas de residuos estudentizados – Aplicación de pruebas
GRAFICAS DE estadísticas
RESIDUO ESTUDENTIZADOS
Posibles causas de puntos atípicos
 Errores experimentales.
 Errores de transcripción.
 Ubicación en una región del espacio experimental
en la que el modelo, que aparentemente estaba bien
ajustado, no esta haciendo una buena predicción de la
respuesta.
Otra gráfica útil: Capacidad predictiva del
modelo
Aproximación a la función real
Gráfica que muestra la bondad de ajuste: cuanto más se aproximen
los datos a la diagonal, mejor es el modelo
Se pueden detectar
datos que no son bien
predichos por el
modelo
Incumplimiento de los supuestos
Cuando los residuos provienen de una muestra
pequeña, pueden esperarse pequeños desvíos de la
normalidad y la homocedasticidad.
¿Qué hacemos si no podemos ajustar adecuadamente un

modelo a los datos experimentales?
¿Qué pasa si los residuos son marcadamente?
No normales
Heterocedásticos
Correlaciondados
Transformar la respuesta
Métodos no paramétricos (ANN)
Transformación de la respuesta
 Estabilizar la varianza de la respuesta.
 Lograr que la distribución de la respuesta sea

cercana a la normal.
 Mejorar el ajuste del modelo a los datos.

Se aplica una función matemática a la respuesta para

obtener una respuesta transformada

y´ y
Parámetro de
transformación
 La transformación elegida se basa en el método de la

máxima probabilidad.
 Se realizan análisis de varianza para los modelos obtenidos

al utilizar diversos valores para lambda y se selecciona el
que produce menor suma de cuadrados del error.
yk 0
Si la respuesta tiene valores negativos debe sumarse una

constante para lograr que todos los datos sean positivos
antes de aplicar la transformación.
 Valores de - 3 a +3
En general se prueban entre 10 y 20 valores de λ

y se construye una gráfica.
Si el intervalo
calculado incluye al
1
no es necesario
transformar los
datos.
Transformaciones más frecuentes
Primer ajuste de un modelo para estudiar el comportamiento de una
respuesta en función de tres factores
El análisis de gráficas de residuos demuestra

heterocedasticidad
Mala predicción.
El modelo no es capaz de predecir bien los datos
No hay un buen ajuste.
El intervalo de confianza
no incluye al uno
Se sugiere transformación logarítmica
(esto lo determina el programa usado)
Ajuste con los datos transformados y´ ln y
¡Se logra ajustar adecuadamente un modelo mas

sencillo!
Otras gráfica útiles para la detección de
puntos atípicos e influyentes
Residuo estudentizado Residuo estudentizado
internamente externamente
eij eij
rij  tij 
σˆ (1  hij ) σˆ (ij ) (1  hij )
Estimada
Estimada como
internamente como
CME al ajustar el modelo
CME obtenido al ajustar
cuando se quita el dato yij
el modelo con TODOS
los datos
Puntos atípicos e influyentes
Residuo estudentizado externamente OUTLIERT
Medida en términos de ‘t’ de cuanto se desvía el valor experimental

del valor predicho, después de eliminar un experimento dado.
error que habría en la estimación del

punto 8 si elimino este punto del
análisis
Si el residuo estudentizado externamente supera el límite dado

por las líneas rojas se considera un punto atípico.
Puntos influyentes
Puntos que tienen una influencia desproporcionada en el
modelo.
Suele suceder en estos casos que los parámetro del modelo dependen más de la
influencia de este punto que del conjunto formado por el resto de los puntos.
LEVERAGE
hii yˆ  Hy
Elemento de la diagonal
Matriz que determina la varianza y
de la matriz H
covarianza de la respuesta predicha
y de los residuos
Leverage
promedio
Puntos influyentes
LEVERAGE
Depende de la matriz
experimental y del modelo que se
quiere ajustar.
Es decir que se puede conocer

antes de realizar los
experimentos.
Puntos influyentes
Puntos Influyentes
Este parámetro se calcula

para cada coeficiente del
modelo.
Puntos Influyentes
Valores altos están asociados con alto leverage y alto

residuo estudentizado.
Gráfica Evaluación Respuesta Respuesta Acción
esperada No esperada
Probabilidad Distribución normal de res. Línea recta Curva forma de Transformación de
Normal «S» respuesta
Residuos vs. Constancia de varianza Dispersión al Varianza Transformación de
Predicho azar expandida respuesta
Residuos vs. Outliers Dispersión al Tendencia Ramdomización y
Orden azar blockeo
Residuos vs. Constancia de varianza Dispersión al Curvatura Nuevo modelo de
Factor dependiendo nivel del azar pronunciada regresión
factor
Residuo Outliers ≤ 3.5 estándar Rechazar
Estudentizado desviación
Externamente
Leverage Influencia del punto ≤1 Agregar puntos
experimental en el error de
predicción
DFFITS Influencia del punto < 2/√P/N Agregar puntos
experimental en predicción P: parámetros
N: núm. Exp.
DFBETAS Influencia de punto < 2/√N Agregar puntos
experimental en coeficiente
Distancia de Outliers < 2 promedio Rechazar
Cook Cook
AJUSTE FINAL DEL MODELO
Modelo Definitivo
Modelo Reducido y Jerárquico
Significancia de la Regresión Ajustar el Modelo

Falta de Ajuste
Eliminar puntos con
Verificación de los residuos atípicos
Supuestos del ANOVA
Aplicar transformaciones
Puntos Influyentes Eliminar puntos influyentes
Modelo Definitivo
¡Importante!
El análisis de los residuos (para ver

supuestos del modelo) se realiza en
forma iterativa con el análisis de
los efectos (tanto para esta etapa
como para la siguiente
(optimización)
123
124
Problema
(D. Montgomery, ‘Diseño y análisis de experimentos’, 1991)
Se utiliza una máquina para alisar la superficie de trabajo de
una hélice. Se quiere saber que parámetros influyen en la
desviación del perfil
Parámetros (-1 y +1):
A: Desplazamiento en eje x (0.001 plg) 0 15
B: Desplazamiento en eje y (0.001 plg) 0 15
C: Desplazamiento en eje z (0.001 plg) 0 15
D: Fabricante de la herramienta 1 2
E: Desplazamiento en eje a (0.001 º) 0 30
F: Velocidad del uso (%) 90 110
G: Altura del montaje (0.001 plg) 0 15
H: Rapidez de alimentación 90 110
- Se usa como variable respuesta la desviación estándar de la diferencia

entre perfil real y especificado.
- Como la máquina tiene 4 husos, se eligen 4 bloques.
- Se quieren estudiar factores principales e interacciones.
128
Confusiones
Se debe
analizar si
la
interacción
AD es
factible o
si es
alguno de
los alias 129
Problema
En una fábrica de semiconductores se quiere mejorar el

rendimiento usando DOE. Los factores que podrían tener
mayor influencia sobre la variable respuesta (rendimiento)
son cinco y se decide correr un diseño 25 con una sola
réplica (32 tratamientos)
A = Nivel de la abertura (pequeña – grande)

B = Tiempo de exposición (20% abajo – 20% arriba)
C = Tiempo de revelado (30 seg – 45 seg)
D = Dimensión de la máscara (pequeña – grande)
E = Tiempo de grabado (14.5 min – 15.5 min)
¿Es posible incluir los 31 efectos en el análisis?
NO, el ANOVA quedaría incompleto ya que no habría

grados de libertad para el error.
Se hace un ANOVA preliminar, donde se mandan al

error las interacciones de tres factores en adelante:
(Yates).
132
133
134
Eliminando aquellos factores e interacciones con p>0.05:
136
137
Detección de un punto influyente…
Verificación de los supuestos del ANOVA 138

El supuesto de
normalidad se cumple
El supuesto de
independencia
se cumple
La situación con los efectos es tan

contundente que aún una violación
clara de los supuestos difícilmente
cambiaria las conclusiones
140
ETAPA-SCREENING Resumen
OPCIONES GRÁFICAS ANOVA PRELIMINAR
ANOVA
Es el mejor ANOVA-modelo final donde sólo se incluyen términos
significativos, o ¿hay que seguir excluyendo efectos?
 Los grados de libertad del error deben ser al menos 8 para tener un ANOVA
confiable.
 Indicadores del ajuste (R cuadrado ajustado).
Verificación de los supuestos del modelo que corresponde al mejor

ANOVA
Conclusiones
Cálculo de los coeficientes del modelo
Para que es necesario conocer el modelo de regresión?

Puntos al centro
Tratamiento formado por la combinación del nivel
intermedio o medio de todos los factores del diseño
(+1, +1)
Puntos al centro
 Grados de libertad adicionales para el error en la tabla de

ANOVA
 Las repeticiones al centro permiten detectar la posible
presencia de curvatura
¿Como evaluar la curvatura?
145
146

2 Selección Factores 2017 PDF

Cargado por

Copyright:

Formatos disponibles

2 Selección Factores 2017 PDF

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2 Selección Factores 2017 PDF

Cargado por

Copyright:

Formatos disponibles

DISEÑO EXPERIMENTAL Y

Optimización Respuestas óptimas

• Delimitar el problema, definir la hipótesis,

• Seleccionar la variable respuesta que

• Seleccionar el rango experimental a estudiar y

• Realizar el experimento y seleccionar los

 Factorial completo o total a dos

 Factorial fraccionado a dos niveles

 Placket-Burman (muchos factores)

 Número y tipo de factores e interacciones que se

• Los coeficientes estimados en el modelo ajustado no

• Las columnas de la matriz del diseño deben estar

Minimizar la Varianza de los

ypred = X (XTX)-1XT y  ypred = H y (H es conocida

Pero XTX es singular en un diseño cuyas columnas están

La varianza de la respuesta predicha en un punto cualquiera del

Proporcionar un error de predicción estable en el

• No depende del error experimental de la respuesta

• Cociente entre coeficientes estimados y

• Se necesitan como mínimo la misma cantidad de

• Para evaluar la falta de ajuste se hacen

Diseños factoriales fraccionados

Indica el nivel de confusiones que se presentan en la

Diseños factoriales fraccionados

Cuando dos o más factores, con nombres distintos,

 La cantidad de puntos experimentales esta dada por 2 k

 Útiles para 2  k  5 (4 a 32 tratamientos)

 Permiten estimar los efectos de todos los factores principales y

 Son diseños ortogonales y rotables.

El número de experimentos crece rápidamente con el

Qué efectos se pueden estimar con 128 experimentos?

Hay que encontrar una estrategia que permita reducir de

Mientras más grande es el valor de k, mayor es el grado de

Efectos alias son efectos que se confunden y no es

Para interpretar los efectos alias es necesario suponer

Se utiliza el principio de jerarquía.

No es una buena estrategia utilizar diseños

Cuando un diseño se fracciona mucho no hay confianza

Se busca la máxima resolución posible con un nº razonable de

Resolución III: no recomendados. En algunos casos es arriesgado

Resolución IV: para 5  k  15 existen diseños que no requieren más

Resolución V y VI: cuando se pueden hacer más ensayos.

• Es un tipo especial de diseño factorial fraccionario (altamente

• Es útil cuando existen múltiples factores.

• El diseño mínimo permite estudiar hasta 11 factores con 12

• Las interacciones dobles tienen un complejo alias con los

• Permite estudiar efectos principales, suponiendo

• Si hay interacciones, el diseño puede fallar, es

• En general, cuando hay interacciones importantes,

• ¿Hay alguna manera de superar este problema?

El nº de puntos del diseño

Se pueden estudiar hasta k

Cuando hay menos factores que el máximo a estudiar (por

La respuesta se puede obtener de dos maneras:

Opciones gráficas, más ANOVA

Gráfico que permite discriminar entre las causas

Se basa en la idea de que unos pocos factores son

No aporta información sobre su

Los efectos de los factores que se alejan de la línea recta,

Importante: es una interpretación contraria a la que se hará