2 Selección Factores 2017 PDF
2 Selección Factores 2017 PDF
2 Selección Factores 2017 PDF
OPTIMIZACIÓN DE SISTEMAS
CON MÚLTIPLES RESPUESTAS
Parte 2: Selección de factores
Héctor Goicoechea
E-mail: [email protected]
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Identificación de factores y
respuestas
Selección de factores
Diseños de Screening
o Cribado
Factores No Eliminar
Cambio de
significativos? niveles factor
Si
- Muchas pruebas
experimentales Diseños de screening
Investigar todos los
para la
factores - Mucho tiempo
selección de factores
- Mucho dinero
Primera etapa del análisis
Ortogonalidad
Rotabilidad
Error estandar-leverage
Eficiencia
Resolución
ORTOGONALIDAD
b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]
• La varianza de la respuesta
estimada en un punto se
obtiene multiplicando el
leverage por la varianza
experimental.
EFICIENCIA
16
DISEÑOS FACTORIALES
Diseños factoriales completos a dos niveles: 2k
Se investigan todas las posibles combinaciones de los niveles de
los factores.
Representación geométrica
Diseños factoriales completos a dos niveles
Efecto de un factor
Diseños factoriales completos a dos niveles
Efecto de la interacción
Ejemplo:
Se necesita incrementar la eficiencia de un procedimiento de
extracción de cromo (VI) en muestras de agua de rio utilizando la
metodología de microextracción en fase líquida
A microextraction procedure based on an ionic liquid as an ion-pairing agent optimized using a design of experiments for chromium
species separation and determination in water samples. Anal. Methods, 2013, 5, 5065. P Berton, L Vera Candioti, H Goicoechea, R
Wuilloud
Considerando un diseño 27 con 128 experimentos:
Se pueden
estimar 127
efectos
“Aliasing”
Resolución V o mayor
Los efectos principales y las interacciones dobles se
confunden con interacciones triples o de orden mayor.
Resolución IV
Los efectos principales no se confunden entre ellos ni con
interacciones dobles, pero si estas entre si.
Resolución III
Los efectos principales no se confunden entre ellos pero
hay efectos principales que se confunden con
interacciones dobles.
38
Diseños factoriales fraccionados
…
Estimación de efectos
Estimación de efectos
Estimación de efectos
Construcción de un modelo matemático que
explique la variación
Resultados
¿Qué factor es significativo?
Pregunta:
Los efectos ¿son estadísticamente
significativos?
54
Opciones gráficas
Diagrama de Pareto
Naranja: positivos
Azules: negativos
Opciones gráficas
GRÁFICA
DE
DANIEL
GRÁFICA DE
DANIEL
Opciones gráficas
Test de Shapiro Wilk
Opciones gráficas
Gráfico Semi-Normal
Papel 99
probabílístico
% Probabilidad semi-normal
medio normal 97
95
A
90
85
80
B
70
60 Efectos significativos
D
40
20
0 C
|Efecto|
(ANOVA)
Modelo de efectos: ANOVA
Variabilidad
debida al
Variabilidad Variabilidad
Variabilidad error
debida al debida al
efecto error debida al efecto
El objetivo es:
67
Ejemplo: uso de un diseño completo y réplica
En una fábrica de dispositivos electrónicos hay roturas y
se piensa que hay tres factores (temperaturas de la etapa
de procesamiento) responsables del problema.
+1
Factor 2
-1
-1 Factor 1 +1
Forma de operar:
70
Construcción del Modelo
Regresión lineal múltiple
Ecuación de regresión
error
1
Respuesta i Efectoi
(variable dependiente) 2
Coeficientes de regresión
Factores
(variables independientes)
Lineal
Lineal con Interacción
Cuadrático
CMR
Significancia de la Regresión F0 F0.05,k,nk 1
CME
CMLOF
Falta de Ajuste F0 F0.05,m2,nm
CMEPuro
xpromedio
n
Test de hipótesis para comparar
varianzas: prueba F
Hipótesis: Nula (H0): s12 = s22
Alternativa (H1): s12 > s22
Test estadístico F:
Comparación de dos varianzas muestrales
Se calcula el estadístico F
2
s1
Fc 2
s2 Siendo s1 > s2
F( n1 1),( n2 1),
3.072
Cuando hay muchos términos en el modelo, se
prefiere R2aj sobre R2 (para no incrementar en
forma artificial con cada término que se agrega).
R2aj baja con cada término artificial que se agrega.
Se cumple: 0 ≤ R2aj ≤ R2 ≤ 1
Verificación de los
supuestos del ANOVA
Conclusiones
ANOVA
ANOVA
Cálculo de Contraste y Suma de cuadrados
ANOVA
𝑆𝐶𝑇 = 𝑥𝑖 − 𝑥 2
= 1576.9
Resumen del análisis
Calidad del ajuste del modelo de regresión
lineal simple
Prueba de falta de ajuste: es necesario que para cada
valor de x haya varias observaciones de y (repeticiones)
y y4-1
y4-2
y4-3
x1 x2 x3 x4 x5 x
H0 : el modelo se ajusta de manera adecuada a los datos
H1 : el modelo no se ajusta en forma satisfactoria
Se rechaza Ho
Verificación de los
supuestos del ANOVA
89
Evaluación de los Modelos
eij yij yˆ ij
Diferencia entre la
respuesta
observada y la
predicha por el
modelo
92
Normalidad de los residuos
Gráfico de probabilidad normal
Si los residuos se
distribuyen
Residuo
aleatoriamente, se
considera que el
supuesto de
homocedasticidad
está satisfecho.
Valor predicho
Independencia de los residuos
Si los residuos se
distribuyen
aleatoriamente, se
Residuo
considera que el
supuesto de
independencia está
satisfecho.
Otros enfoques y usos:
Escalado de residuos para la detección de
Outliers
Residuo estandarizado
eij
d ij
σˆ
σˆ MC E
escalados
L
Reiduo Estudentizado
Escalado
Escaladodede
residuos
residuos
Gráficas de residuos estudentizados – Aplicación de pruebas
GRAFICAS DE estadísticas
RESIDUO ESTUDENTIZADOS
Posibles causas de puntos atípicos
Errores experimentales.
Errores de transcripción.
Ubicación en una región del espacio experimental
en la que el modelo, que aparentemente estaba bien
ajustado, no esta haciendo una buena predicción de la
respuesta.
Otra gráfica útil: Capacidad predictiva del
modelo
Aproximación a la función real
Gráfica que muestra la bondad de ajuste: cuanto más se aproximen
los datos a la diagonal, mejor es el modelo
Se pueden detectar
datos que no son bien
predichos por el
modelo
Incumplimiento de los supuestos
Cuando los residuos provienen de una muestra
pequeña, pueden esperarse pequeños desvíos de la
normalidad y la homocedasticidad.
No normales
Heterocedásticos
Correlaciondados
Transformar la respuesta
Métodos no paramétricos (ANN)
Transformación de la respuesta
y´ y
Parámetro de
transformación
yk 0
Valores de - 3 a +3
Si el intervalo
calculado incluye al
1
no es necesario
transformar los
datos.
Transformaciones más frecuentes
Transformación de la respuesta
Primer ajuste de un modelo para estudiar el comportamiento de una
respuesta en función de tres factores
Transformación de la respuesta
Mala predicción.
El modelo no es capaz de predecir bien los datos
No hay un buen ajuste.
Transformación de la respuesta
El intervalo de confianza
no incluye al uno
Se sugiere transformación logarítmica
(esto lo determina el programa usado)
Transformación de la respuesta
Ajuste con los datos transformados y´ ln y
eij eij
rij tij
σˆ (1 hij ) σˆ (ij ) (1 hij )
Estimada
Estimada como
internamente como
CME al ajustar el modelo
CME obtenido al ajustar
cuando se quita el dato yij
el modelo con TODOS
los datos
Puntos atípicos e influyentes
Residuo estudentizado externamente OUTLIERT
LEVERAGE
hii yˆ Hy
Elemento de la diagonal
Matriz que determina la varianza y
de la matriz H
covarianza de la respuesta predicha
y de los residuos
Leverage
promedio
Puntos influyentes
LEVERAGE
Depende de la matriz
experimental y del modelo que se
quiere ajustar.
Modelo Definitivo
¡Importante!
123
124
Problema
(D. Montgomery, ‘Diseño y análisis de experimentos’, 1991)
Se utiliza una máquina para alisar la superficie de trabajo de
una hélice. Se quiere saber que parámetros influyen en la
desviación del perfil
Parámetros (-1 y +1):
A: Desplazamiento en eje x (0.001 plg) 0 15
B: Desplazamiento en eje y (0.001 plg) 0 15
C: Desplazamiento en eje z (0.001 plg) 0 15
D: Fabricante de la herramienta 1 2
E: Desplazamiento en eje a (0.001 º) 0 30
F: Velocidad del uso (%) 90 110
G: Altura del montaje (0.001 plg) 0 15
H: Rapidez de alimentación 90 110
Se debe
analizar si
la
interacción
AD es
factible o
si es
alguno de
los alias 129
Problema
132
133
134
Eliminando aquellos factores e interacciones con p>0.05:
136
137
Detección de un punto influyente…
140
ETAPA-SCREENING Resumen
ANOVA
Es el mejor ANOVA-modelo final donde sólo se incluyen términos
significativos, o ¿hay que seguir excluyendo efectos?
Los grados de libertad del error deben ser al menos 8 para tener un ANOVA
confiable.
Indicadores del ajuste (R cuadrado ajustado).
Conclusiones
Cálculo de los coeficientes del modelo
(+1, +1)
Puntos al centro
145
146