2 Selección Factores 2017 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 146

DISEÑO EXPERIMENTAL Y

OPTIMIZACIÓN DE SISTEMAS
CON MÚLTIPLES RESPUESTAS
Parte 2: Selección de factores
Héctor Goicoechea
E-mail: [email protected]
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Identificación de factores y
respuestas

Selección de factores

Diseños de Screening
o Cribado

Factores No Eliminar
Cambio de
significativos? niveles factor

Si

Optimización Respuestas óptimas


Diseños de Optimización Conclusiones
Etapa de screening: selección de factores

- Muchas pruebas
experimentales Diseños de screening
Investigar todos los
para la
factores - Mucho tiempo
selección de factores
- Mucho dinero
Primera etapa del análisis

• Delimitar el problema, definir la hipótesis,


establecer el objetivo del experimento-
resultado deseado.

• Seleccionar la variable respuesta que


representa al problema que hay que resolver y
determinar cómo se va a medir de manera
confiable.
Primera etapa del análisis
• Determinar qué factores se van a estudiar, para
analizar su influencia sobre la respuesta, sobre
la base de información y experiencia previa.

• Seleccionar el rango experimental a estudiar y


el diseño de experimentos adecuado.

• Realizar el experimento y seleccionar los


factores que tengan una influencia significativa
sobre la respuesta.
5
Diseños experimentales: gran
variedad
Etapa de screening: Selección de factores
Diseños más usados para realizar experimentos de
previsualización o screening para factores numéricos
y categóricos

 Factorial completo o total a dos


niveles (2k)

 Factorial fraccionado a dos niveles


(2k-p)

 Placket-Burman (muchos factores)


Selección del diseño
Aspectos que influyen en la selección de un diseño
 Naturaleza del problema, conocimiento previo y tipo
de información que se desea obtener.

 Número y tipo de factores e interacciones que se


deben estudiar.
 Restricciones operativas, de costo y tiempo.
 Necesidad de bloqueo.
 Características o propiedades de cada diseño.
 Facilidad de comprensión e implementación.
Características de los diseños

Ortogonalidad

Rotabilidad

Error estandar-leverage

Eficiencia

Resolución
ORTOGONALIDAD

• Los coeficientes estimados en el modelo ajustado no


están correlacionados entre si.

• Las columnas de la matriz del diseño deben estar


formadas por vectores independientes entre si.

Minimizar la Varianza de los


Coeficientes de Regresión
Modelo para un sistema lineal de 2 componentes:
y = b0 + b1 x1 + b2 x2 y X
y = X b + e = ypred + e b
b0
= b1
b2
(XTX)-1XT y = (XTX)-1XTX b

b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]

ypred = X (XTX)-1XT y  ypred = H y (H es conocida


como matriz “hat” por sombrero)
Xb = X(XTX)-1XT y

Pero XTX es singular en un diseño cuyas columnas están


correlacionadas
ROTABILIDAD

La varianza de la respuesta predicha en un punto cualquiera del


espacio experimental es solamente función de la distancia al punto
del centro del diseño.

Proporcionar un error de predicción estable en el


entorno experimental
LEVERAGE (PALANCA)
• Depende de la matriz experimental y del modelo
seleccionado (construcción de X).

• No depende del error experimental de la respuesta


y debe evaluarse antes de experimentar.

• La varianza de la respuesta
estimada en un punto se
obtiene multiplicando el
leverage por la varianza
experimental.
EFICIENCIA

• Cociente entre coeficientes estimados y


puntos experimentales.

• Se necesitan como mínimo la misma cantidad de


puntos experimentales diferentes en el diseño
que coeficientes a estimar.

• Para evaluar la falta de ajuste se hacen


repeticiones de un punto del diseño.
RESOLUCIÓN

Diseños factoriales fraccionados

Indica el nivel de confusiones que se presentan en la


estimación de efectos, dando una idea de que tan
bien pueden estimarse los efectos potencialmente
importantes mediante el diseño.
Confusiones

Diseños factoriales fraccionados

Cuando dos o más factores, con nombres distintos,


comparten la misma columna de signos (-1 y +1),
no se sabe que factor es el responsable del efecto
estimado.
Hay confusión

16
DISEÑOS FACTORIALES
Diseños factoriales completos a dos niveles: 2k
 Se investigan todas las posibles combinaciones de los niveles de
los factores.

 La cantidad de puntos experimentales esta dada por 2 k

 Útiles para 2  k  5 (4 a 32 tratamientos)

 Permiten estimar los efectos de todos los factores principales y


sus interacciones.

 Son diseños ortogonales y rotables.

El número de experimentos crece rápidamente con el


número de factores
Diseños factoriales completos a dos niveles
Efecto de un factor – Representación gráfica
Efectos estimables en los diseños factoriales
completos a dos niveles
Diseños factoriales completos a dos niveles
La construcción de la matriz del diseño (k columnas y 2k renglones
considerando una réplica) se hace alternando los signos – y + en la primer
columna, dos menos y dos más en la segunda, cuatro menos y cuatro más
en la tercera y así sucesivamente.
Diseños factoriales completos a dos
Matriz del diseño 22 niveles

Representación geométrica
Diseños factoriales completos a dos niveles
Efecto de un factor
Diseños factoriales completos a dos niveles

Efecto de la interacción
Ejemplo:
Se necesita incrementar la eficiencia de un procedimiento de
extracción de cromo (VI) en muestras de agua de rio utilizando la
metodología de microextracción en fase líquida

A microextraction procedure based on an ionic liquid as an ion-pairing agent optimized using a design of experiments for chromium
species separation and determination in water samples. Anal. Methods, 2013, 5, 5065. P Berton, L Vera Candioti, H Goicoechea, R
Wuilloud
Considerando un diseño 27 con 128 experimentos:

Qué efectos se pueden estimar con 128 experimentos?

Se pueden
estimar 127
efectos

Hay que encontrar una estrategia que permita reducir de


manera importante el número de tratamientos
experimentales
Diseños factoriales fraccionados
Diseños factoriales fraccionados
Diseños factoriales fraccionados

Mientras más grande es el valor de k, mayor es el grado de


fraccionamiento que admite el diseño
Diseños factoriales fraccionados
Diseños factoriales fraccionados
“Aliasing”

Efectos alias son efectos que se confunden y no es


posible separarlos.

Para interpretar los efectos alias es necesario suponer


que solo uno de ellos es responsable del efecto
observado y que los demás efectos son nulos.

Se utiliza el principio de jerarquía.


Diseños factoriales fraccionados

“Aliasing”

No es una buena estrategia utilizar diseños


donde se alían dos efectos que son
potencialmente importantes, tales como
efectos principales y las interacciones
dobles.
Diseños factoriales fraccionados
Diseño 24-1
Diseños factoriales fraccionados
Diseño 24-1
Diseños factoriales fraccionados
Diseño 25-2
Diseños factoriales fraccionados

Cuando un diseño se fracciona mucho no hay confianza


en la estimación de los efectos principales
Resolución de los diseños factoriales
fraccionados
Factorial completo
Permite estimar todos los efectos principales y sus
interacciones sin confusiones.

Resolución V o mayor
Los efectos principales y las interacciones dobles se
confunden con interacciones triples o de orden mayor.

Resolución IV
Los efectos principales no se confunden entre ellos ni con
interacciones dobles, pero si estas entre si.

Resolución III
Los efectos principales no se confunden entre ellos pero
hay efectos principales que se confunden con
interacciones dobles.
38
Diseños factoriales fraccionados

Se busca la máxima resolución posible con un nº razonable de


corridas experimentales y de gasto de recursos

Resolución III: no recomendados. En algunos casos es arriesgado


suponer de antemano que ninguna interacción doble esta activa. Se
usan cuando hay muchos factores o cuando cada corrida es
demasiado cara.

Resolución IV: para 5  k  15 existen diseños que no requieren más


de 32 ensayos y proporcionan información de todos los efectos
principales y de algunas de las interacciones dobles.

Resolución V y VI: cuando se pueden hacer más ensayos.


Un caso especial: PLACKETT-BURMAN

• Es un tipo especial de diseño factorial fraccionario (altamente


fraccionado con resolución III).

• Es útil cuando existen múltiples factores.

• El diseño mínimo permite estudiar hasta 11 factores con 12


experimentos.

• Las interacciones dobles tienen un complejo alias con los


términos principales.
DISEÑO DE PLACKETT-BURMAN

• Permite estudiar efectos principales, suponiendo


que no existen interacciones entre los factores.

• Si hay interacciones, el diseño puede fallar, es


decir, puede considerar significativos efectos que no
lo son y viceversa.

• En general, cuando hay interacciones importantes,


el ajuste de PB es malo.

• ¿Hay alguna manera de superar este problema?


DISEÑO DE PLACKETT-BURMAN

El nº de puntos del diseño


N es múltiplo de cuatro.

Se pueden estudiar hasta k


factores en N
experimentos donde
k =N-1.
DISEÑO DE PLACKETT-BURMAN

Cuando hay menos factores que el máximo a estudiar (por


ejemplo 8 factores y doce experimentos (11 permitidos
para el estudio):
Variables dummy (se usan para estimar el error)
Diseño de Plackett-Burman para el
problema


Estimación de efectos
Estimación de efectos
Estimación de efectos
Construcción de un modelo matemático que
explique la variación
Resultados
¿Qué factor es significativo?

Pregunta:
Los efectos ¿son estadísticamente
significativos?

La respuesta se puede obtener de dos maneras:


• Gráfica
• ANOVA
Evaluación de los efectos
Opciones gráficas
Se decide cuáles de los efectos principales, interacciones
dobles y triples se pueden enviar al error. La SCerror en un
ANOVA posterior contendrá los efectos “excluidos”.
Gráfica de Pareto
Gráfica de Probabilidad Normal (Daniel)
Gráfica de Probabilidad Media Normal (Daniel)

Opciones gráficas, más ANOVA


Opciones gráficas

54
Opciones gráficas

Diagrama de Pareto

Gráfico que permite discriminar entre las causas


más importantes de un problema y las que afectan
menos.

Se basa en la idea de que unos pocos factores son


los responsables de los cambios significativos en
la respuesta.
Opciones gráficas - Pareto
Pareto permite tener una idea visual
rápida sobre que factor es más
influyente.

No aporta información sobre su


significancia, es decir que hay que
hacer un test estadístico.
Opciones gráficas
Diagrama de Pareto – Método de Bonferroni
Representación gráfica de los valores t de los efectos
Opciones gráficas
Diagrama de Pareto – Método de Bonferroni
Representación gráfica de los valores t de los efectos
Modelo
Respuesta = media general + efectos principales de los
factores + efectos de interacción + error

Naranja: positivos
Azules: negativos
Opciones gráficas

GRÁFICA
DE
DANIEL

Los efectos de los factores que se alejan de la línea recta,


no forman parte de una distribución normal, por lo tanto
son significativos.

Importante: es una interpretación contraria a la que se hará


para residuos en una parte posterior del estudio.
Opciones gráficas
GRÁFICO DE EFECTOS EN PAPEL PROBABILÍSTICO NORMAL

GRÁFICA DE
DANIEL
Opciones gráficas
Test de Shapiro Wilk
Opciones gráficas
Gráfico Semi-Normal

Papel 99
probabílístico

% Probabilidad semi-normal
medio normal 97
95
A
90

85
80
B

70
60 Efectos significativos
D
40

20

0 C
|Efecto|

0.00 10.24 20.48 30.71 40.95

Solo utiliza la parte positiva de la distribución


normal estándar
Opciones gráficas
ANOVA: Prueba de hipótesis

(ANOVA)
Modelo de efectos: ANOVA

Respuesta = media general + efectos principales de los


factores + efectos de interacción + error

Variabilidad
debida al
Variabilidad Variabilidad
Variabilidad error
debida al debida al
efecto error debida al efecto
El objetivo es:

- Seleccionar aquellos efectos de factores o


interacciones que sean significativos y que
formarán parte del modelo, explicando el
comportamiento de la respuesta y …

- Aquellos que sean no significativos que


pueden utilizarse para conformar el error.

67
Ejemplo: uso de un diseño completo y réplica
En una fábrica de dispositivos electrónicos hay roturas y
se piensa que hay tres factores (temperaturas de la etapa
de procesamiento) responsables del problema.

Para determinar si estos factores son significativos y


posteriormente encontrar una combinación de niveles
donde la cantidad de piezas rotas sea mínima, se decide
correr un diseño factorial 23 con dos réplicas, trabajando
con una respuesta que es la proporción de piezas rotas.
Diseño factorial 23
T1: Temperatura de grabado (-3 a -1 ºC)
T2: Temperatura de piraña (60 a 98 ºC)
T3: Temperatura de agua (20 a 78 ºC)

+1

Factor 2

-1

-1 Factor 1 +1
Forma de operar:

1- Hacer un ANOVA con todos los efectos.

2- Hacer un ANOVA que sólo incluya los términos


significativos, mandando al error los efectos que
claramente no son significativos.

3- Revalorar los términos que estaban en situación


dudosa

70
Construcción del Modelo
Regresión lineal múltiple
Ecuación de regresión

error

1
Respuesta i  Efectoi
(variable dependiente) 2
Coeficientes de regresión
Factores
(variables independientes)

Método de los cuadrados mínimos


Construcción del Modelo

• Importancia del efecto


Coeficientes
• Cantidad de factores que intervienen
en el comportamiento de la respuesta

Complejidad • Tipo de relación que existe entre la


respuesta y esos factores

• Uso que se le va a dar al modelo

Polinomios más Polinomios más


simples complejos
Construcción del Modelo
¿Para que construimos modelos matemáticos?
Polinomios simples
• Seleccionar factores significativos
Modelos Lineales
• Evaluar interacciones entre los factores
Modelos con
• Explorar el comportamiento de la Interacciones
respuesta en un entorno experimental
acotado Modelos Cuadráticos

• Describir lo más exactamente posible el Modelos Cúbicos


comportamiento de la respuesta

• Encontrar un óptimo para la respuesta Polinomios complejos


CONSTRUCCIÓN DE UN MODELO
Construcción del Modelo

¿Cómo obtenemos el mejor modelo a partir de los datos


experimentales recolectados con un diseño de experimentos?

1- Ajustar los distintos tipos de modelos posibles a los datos

 Lineal
 Lineal con Interacción
 Cuadrático

2- Para cada uno de los modelos calcular la significancia de


la regresión (idoneidad del modelo), la falta de ajuste y el
coeficiente de determinación (R2 aj )
CONSTRUCCIÓN DE UN MODELO
Construcción del Modelo

CMR
Significancia de la Regresión F0   F0.05,k,nk 1
CME

CMLOF
Falta de Ajuste F0   F0.05,m2,nm
CMEPuro

3- Seleccionar el modelo con mayor idoneidad, menos falta de


ajuste y mayor (R2 aj )
¿Cómo se calcula una varianza?

Analizar el cálculo de la desviación


estándar
x1
x2 𝑛 2
x3 𝑖=1 (𝑥𝑝 − 𝑥𝑖)
𝑠=
. 𝑛−1
.
.
xn Varianza = s2

xpromedio
n
Test de hipótesis para comparar
varianzas: prueba F
Hipótesis: Nula (H0): s12 = s22
Alternativa (H1): s12 > s22
Test estadístico F:
Comparación de dos varianzas muestrales
Se calcula el estadístico F

2
s1
Fc  2
s2 Siendo s1 > s2

F( n1 1),( n2 1),

Si F calculado es menor al F tabulado, las series son


homogéneas u homocedásticas
Si F calculado es mayor al F tabulado, las series son
heterogéneas o heterocedásticas
Si la probabilidad correspondiente a ese F calculado es
menor a 0.05, las series son heterogéneas o heterocedásticas
FBCB UNL Distribución F

3.072
Cuando hay muchos términos en el modelo, se
prefiere R2aj sobre R2 (para no incrementar en
forma artificial con cada término que se agrega).
R2aj baja con cada término artificial que se agrega.

Se cumple: 0 ≤ R2aj ≤ R2 ≤ 1

Se espera que sea al menos igual a 0.7


Calidad del ajuste

Verificación de los
supuestos del ANOVA

Conclusiones
ANOVA
ANOVA
Cálculo de Contraste y Suma de cuadrados
ANOVA

𝑆𝐶𝑇 = 𝑥𝑖 − 𝑥 2
= 1576.9
Resumen del análisis
Calidad del ajuste del modelo de regresión
lineal simple
Prueba de falta de ajuste: es necesario que para cada
valor de x haya varias observaciones de y (repeticiones)
y y4-1

y4-2
y4-3

x1 x2 x3 x4 x5 x
H0 : el modelo se ajusta de manera adecuada a los datos
H1 : el modelo no se ajusta en forma satisfactoria

SCE = SCEP +SCFA → SCFA = SCE - SCEP


Para m niveles distintos de x y ni repeticiones dentro de
cada nivel:
Si Fcal  F(, m-2, N-m) o si p<0.05

Se rechaza Ho
Verificación de los
supuestos del ANOVA

89
Evaluación de los Modelos

 ¿Se cumplen los supuestos en los que se basa la


regresión por cuadrados mínimos?
 ¿Cuáles son los supuestos?
Normalidad Homocedasticidad Independencia
 ¿Provee una aproximación adecuada a la
función real?
 Si el modelo no es adecuado y no está correctamente
ajustado:
- La selección de factores no será confiable.
- La exploración y optimización del sistema no será
adecuada.
Análisis de Residuos
Mucha utilidad en la comprobación de los
supuestos
RESIDUO

eij  yij  yˆ ij

Diferencia entre la
respuesta
observada y la
predicha por el
modelo
92
Normalidad de los residuos
Gráfico de probabilidad normal

Si los residuos se acomodan


aproximadamente a lo largo
de una recta, se considera que
el supuesto de normalidad
está satisfecho.

Recordar que al analizar efectos le dábamos una interpretación


diferente (transparencia N° 54)
Homocedasticidad de los residuos

Gráfico de residuos vs. valor predicho

Si los residuos se
distribuyen
Residuo

aleatoriamente, se
considera que el
supuesto de
homocedasticidad
está satisfecho.

Valor predicho
Independencia de los residuos

Gráfico de residuos vs. orden del experimento

Si los residuos se
distribuyen
aleatoriamente, se
Residuo

considera que el
supuesto de
independencia está
satisfecho.
Otros enfoques y usos:
Escalado de residuos para la detección de
Outliers
Residuo estandarizado

eij
d ij 
σˆ
σˆ  MC E

Útil para detectar atípicos (outlier):


residuo estandarizado mucho más
grande que los demás
Otros enfoques y usos:
Escalado de residuos para la detección de
Outliers
Residuo estudentizado
Medida de la
localización del
eij
rij  punto en el espacio
experimental
σˆ (1  hij )
0  hij  1
Más confiable para
detectar atípicos
Escalado de residuos
Gráficas de residuo estudentizados

Residuo estudentizado Residuo estudentizado

Un desvío del comportamiento


normal debe estar sustentado
por más de un residuo
Escalado de residuos
Gráficas de residuos escalados

escalados
L
Reiduo Estudentizado
Escalado
Escaladodede
residuos
residuos
Gráficas de residuos estudentizados – Aplicación de pruebas
GRAFICAS DE estadísticas
RESIDUO ESTUDENTIZADOS
Posibles causas de puntos atípicos
 Errores experimentales.
 Errores de transcripción.
 Ubicación en una región del espacio experimental
en la que el modelo, que aparentemente estaba bien
ajustado, no esta haciendo una buena predicción de la
respuesta.
Otra gráfica útil: Capacidad predictiva del
modelo
Aproximación a la función real
Gráfica que muestra la bondad de ajuste: cuanto más se aproximen
los datos a la diagonal, mejor es el modelo

Se pueden detectar
datos que no son bien
predichos por el
modelo
Incumplimiento de los supuestos
Cuando los residuos provienen de una muestra
pequeña, pueden esperarse pequeños desvíos de la
normalidad y la homocedasticidad.

¿Qué hacemos si no podemos ajustar adecuadamente un


modelo a los datos experimentales?
¿Qué pasa si los residuos son marcadamente?

No normales
Heterocedásticos

Correlaciondados

Transformar la respuesta
Métodos no paramétricos (ANN)
Transformación de la respuesta

 Estabilizar la varianza de la respuesta.

 Lograr que la distribución de la respuesta sea


cercana a la normal.

 Mejorar el ajuste del modelo a los datos.


Transformación de la respuesta

Se aplica una función matemática a la respuesta para


obtener una respuesta transformada


y´ y
Parámetro de
transformación

 La transformación elegida se basa en el método de la


máxima probabilidad.

 Se realizan análisis de varianza para los modelos obtenidos


al utilizar diversos valores para lambda y se selecciona el
que produce menor suma de cuadrados del error.
Transformación de la respuesta

yk 0

Si la respuesta tiene valores negativos debe sumarse una


constante para lograr que todos los datos sean positivos
antes de aplicar la transformación.

 Valores de - 3 a +3

En general se prueban entre 10 y 20 valores de λ


y se construye una gráfica.
Transformación de la respuesta

Si el intervalo
calculado incluye al
1
no es necesario
transformar los
datos.
Transformaciones más frecuentes
Transformación de la respuesta
Primer ajuste de un modelo para estudiar el comportamiento de una
respuesta en función de tres factores
Transformación de la respuesta

El análisis de gráficas de residuos demuestra


heterocedasticidad
Transformación de la respuesta

Mala predicción.
El modelo no es capaz de predecir bien los datos
No hay un buen ajuste.
Transformación de la respuesta

El intervalo de confianza
no incluye al uno
Se sugiere transformación logarítmica
(esto lo determina el programa usado)
Transformación de la respuesta
Ajuste con los datos transformados y´ ln y

¡Se logra ajustar adecuadamente un modelo mas


sencillo!
Otras gráfica útiles para la detección de
puntos atípicos e influyentes
Residuo estudentizado Residuo estudentizado
internamente externamente

eij eij
rij  tij 
σˆ (1  hij ) σˆ (ij ) (1  hij )

Estimada
Estimada como
internamente como
CME al ajustar el modelo
CME obtenido al ajustar
cuando se quita el dato yij
el modelo con TODOS
los datos
Puntos atípicos e influyentes
Residuo estudentizado externamente OUTLIERT

Medida en términos de ‘t’ de cuanto se desvía el valor experimental


del valor predicho, después de eliminar un experimento dado.

error que habría en la estimación del


punto 8 si elimino este punto del
análisis

Si el residuo estudentizado externamente supera el límite dado


por las líneas rojas se considera un punto atípico.
Puntos influyentes
Puntos que tienen una influencia desproporcionada en el
modelo.
Suele suceder en estos casos que los parámetro del modelo dependen más de la
influencia de este punto que del conjunto formado por el resto de los puntos.

LEVERAGE

hii yˆ  Hy
Elemento de la diagonal
Matriz que determina la varianza y
de la matriz H
covarianza de la respuesta predicha
y de los residuos

Leverage
promedio
Puntos influyentes
LEVERAGE

Depende de la matriz
experimental y del modelo que se
quiere ajustar.

Es decir que se puede conocer


antes de realizar los
experimentos.
Puntos influyentes
Puntos Influyentes

Este parámetro se calcula


para cada coeficiente del
modelo.
Puntos Influyentes

Valores altos están asociados con alto leverage y alto


residuo estudentizado.
Gráfica Evaluación Respuesta Respuesta Acción
esperada No esperada
Probabilidad Distribución normal de res. Línea recta Curva forma de Transformación de
Normal «S» respuesta
Residuos vs. Constancia de varianza Dispersión al Varianza Transformación de
Predicho azar expandida respuesta
Residuos vs. Outliers Dispersión al Tendencia Ramdomización y
Orden azar blockeo
Residuos vs. Constancia de varianza Dispersión al Curvatura Nuevo modelo de
Factor dependiendo nivel del azar pronunciada regresión
factor
Residuo Outliers ≤ 3.5 estándar Rechazar
Estudentizado desviación
Externamente
Leverage Influencia del punto ≤1 Agregar puntos
experimental en el error de
predicción
DFFITS Influencia del punto < 2/√P/N Agregar puntos
experimental en predicción P: parámetros
N: núm. Exp.
DFBETAS Influencia de punto < 2/√N Agregar puntos
experimental en coeficiente
Distancia de Outliers < 2 promedio Rechazar
Cook Cook
AJUSTE FINAL DEL MODELO
Modelo Definitivo
Modelo Reducido y Jerárquico

Significancia de la Regresión Ajustar el Modelo


Falta de Ajuste
Eliminar puntos con
Verificación de los residuos atípicos
Supuestos del ANOVA
Aplicar transformaciones

Puntos Influyentes Eliminar puntos influyentes

Modelo Definitivo
¡Importante!

El análisis de los residuos (para ver


supuestos del modelo) se realiza en
forma iterativa con el análisis de
los efectos (tanto para esta etapa
como para la siguiente
(optimización)

123
124
Problema
(D. Montgomery, ‘Diseño y análisis de experimentos’, 1991)
Se utiliza una máquina para alisar la superficie de trabajo de
una hélice. Se quiere saber que parámetros influyen en la
desviación del perfil
Parámetros (-1 y +1):
A: Desplazamiento en eje x (0.001 plg) 0 15
B: Desplazamiento en eje y (0.001 plg) 0 15
C: Desplazamiento en eje z (0.001 plg) 0 15
D: Fabricante de la herramienta 1 2
E: Desplazamiento en eje a (0.001 º) 0 30
F: Velocidad del uso (%) 90 110
G: Altura del montaje (0.001 plg) 0 15
H: Rapidez de alimentación 90 110

- Se usa como variable respuesta la desviación estándar de la diferencia


entre perfil real y especificado.
- Como la máquina tiene 4 husos, se eligen 4 bloques.
- Se quieren estudiar factores principales e interacciones.
128
Confusiones

Se debe
analizar si
la
interacción
AD es
factible o
si es
alguno de
los alias 129
Problema

En una fábrica de semiconductores se quiere mejorar el


rendimiento usando DOE. Los factores que podrían tener
mayor influencia sobre la variable respuesta (rendimiento)
son cinco y se decide correr un diseño 25 con una sola
réplica (32 tratamientos)

A = Nivel de la abertura (pequeña – grande)


B = Tiempo de exposición (20% abajo – 20% arriba)
C = Tiempo de revelado (30 seg – 45 seg)
D = Dimensión de la máscara (pequeña – grande)
E = Tiempo de grabado (14.5 min – 15.5 min)
¿Es posible incluir los 31 efectos en el análisis?

NO, el ANOVA quedaría incompleto ya que no habría


grados de libertad para el error.

Se hace un ANOVA preliminar, donde se mandan al


error las interacciones de tres factores en adelante:
(Yates).

132
133
134
Eliminando aquellos factores e interacciones con p>0.05:
136
137
Detección de un punto influyente…

Verificación de los supuestos del ANOVA 138


El supuesto de
normalidad se cumple
El supuesto de
independencia
se cumple

La situación con los efectos es tan


contundente que aún una violación
clara de los supuestos difícilmente
cambiaria las conclusiones

140
ETAPA-SCREENING Resumen

OPCIONES GRÁFICAS ANOVA PRELIMINAR

ANOVA
Es el mejor ANOVA-modelo final donde sólo se incluyen términos
significativos, o ¿hay que seguir excluyendo efectos?

 Los grados de libertad del error deben ser al menos 8 para tener un ANOVA
confiable.
 Indicadores del ajuste (R cuadrado ajustado).

Verificación de los supuestos del modelo que corresponde al mejor


ANOVA

Conclusiones
Cálculo de los coeficientes del modelo

Para que es necesario conocer el modelo de regresión?


Puntos al centro
Tratamiento formado por la combinación del nivel
intermedio o medio de todos los factores del diseño

(+1, +1)
Puntos al centro

 Grados de libertad adicionales para el error en la tabla de


ANOVA
 Las repeticiones al centro permiten detectar la posible
presencia de curvatura
¿Como evaluar la curvatura?

145
146

También podría gustarte