Unidad V Análisis de Datos
Unidad V Análisis de Datos
Unidad V Análisis de Datos
NACIONAL DE MÉXICO
INSTITUTO TECNOLÓGICO DE MINATITLAN
Análisis De Datos
Experimentales
Análisis De Diseños
Factoriales
UNIDAD V
2021
índice
Introducción.................................................................................................................................................3
Análisis de diseños de factoriales.................................................................................................................7
¿Qué es un diseño factorial?....................................................................................................................7
¿Qué es un diseño factorial completo y un diseño factorial fraccionado?.............................................10
Diseños factoriales completos............................................................................................................10
Diseños factoriales fraccionados........................................................................................................10
¿Qué es un diseño factorial completo de 2 niveles?..........................................................................11
Comparación......................................................................................................................................11
2.1 Diseño factorial 2 a la k....................................................................................................................12
¿Qué es un diseño factorial 2 k?.............................................................................................................12
2.2 Diseño factorial 3 a la k....................................................................................................................17
Glosario......................................................................................................................................................19
Bibliografía................................................................................................................................................20
Introducción
En todos los diseños las unidades experimentales se clasifican por tratamientos; pero en
algunos, estos se clasifican preferentemente en bloques, filas, parcelas principales y otras
modalidades. El análisis de varianza utiliza las medias de dichos agrupamientos, denominadas
fuente de variación, para estimar varianzas o más precisamente cuadrados medios. Un
cuadrado medio que estima la dispersión entre mediciones de parcelas debidas a causas
aleatorias; esta se denomina error experimental. En ausencia de diferencias reales debidas a
medias de los tratamientos, bloques u otras fuentes de variación, dichos cuadrados medios
serán, en promedio, iguales. Sólo esporádicamente un cuadrado medio se desviará de otro de
manera considerable, exclusivamente por casualidad. Cuando una prueba F indica que el
cuadrado medio de una de las fuentes de variación es significativamente mayor que el
cuadrado medio debido a efectos aleatorios, decimos que existen diferencias reales entre las
medias de aquella fuente particular de variación; empero, recuérdese: siempre existe una
probabilidad definida de que estemos equivocados en semejante conclusión. Está en manos del
experimentador seleccionar las probabilidades para las cuales se encuentra dispuesto a
concluir que existen efectos reales.
Un tipo de diseño es el diseño factorial, en él se tienen dos o más factores, los cuales tienen
dos o más niveles, y se investigan todas las posibles combinaciones de los niveles de los
factores en cada ensayo completo o réplica del experimento. Estos factores se estudian porque
es principio se piensa que tienen un efecto conjunto de estos sobre una respuesta. El efecto de
un factor se define como el cambio en la respuesta producido por un cambio en el nivel del
factor. Con frecuencia, éste se conoce como efecto principal porque se refiere a los factores de
interés primordial del experimento.
Existen varios casos especiales del diseño factorial general que resultan importantes porque
se usan ampliamente en el trabajo de investigación, y porque constituyen la base para otros
diseños de gran valor práctico. El caso más importante en diseño factorial es el 2k , en el cual
se tienen k factores con dos niveles cada uno (superior, inferior). El diseño 2k resulta muy útil
cuando tenemos muchos factores por investigar ya que representa un número menor de
corridas con las cuales se pueden estudiar k factores en un diseño factorial completo.
Debido a que sólo hay dos niveles para cada factor, se debe suponer que la respuesta es
aproximadamente lineal en el intervalo de los niveles elegidos de los factores.
- Montgomery 1991
Los diseños factoriales son ampliamente utilizados en experimentos en los que intervienen
varios factores para estudiar el efecto conjunto de éstos sobre una variable de interés. Existen
varios casos especiales del diseño factorial general que resultan importantes porque se usan
ampliamente en el trabajo de investigación, además de constituir la base para otros diseños de
gran valor práctico.
Uno de los mas importantes de estos casos especiales ocurre cuando se tienen k factores,
cada uno con dos niveles. Estos niveles pueden ser cuantitativos como sería el caso de dos
valores de temperatura, presión o tiempo, pero también pueden ser cualitativos como sería el
caso de dos máquinas, dos operadores, los niveles “superior” e “inferior” de un factor, o
quizás, la ausencia o presencia de un factor. Una replica completa de tal diseño requiere que se
recopilen
2 x 2 … x 2=2k
Para aumentar el rendimiento de una planta, existen muchos factores que influyen
siembra, etc.
Igual sucede con los animales, si se desea el aumento de peso, se puede lograr modificando
La fertilización puede ser 1.5, 2.0 o 2.5 kg por hectárea; igualmente el riego puede ser una
lámina de 1, 2 o 3 cm
Los diseños factoriales consisten en un análisis de varianza donde se van a probar dos o más
factores donde cada uno va a tener dos o más niveles. A cada factor se le llamará factor A, B,
Un diseño factorial es un tipo de experimento diseñado que permite estudiar los efectos que
varios factores pueden tener en una respuesta. Al realizar un experimento, variar los niveles de
todos los factores al mismo tiempo en lugar de uno a la vez, permite estudiar las interacciones
entre los factores.
En las siguientes gráficas, cada punto representa una combinación única de niveles de
factores.
Se puede ejecutar el diseño factorial completo o una fracción del diseño factorial.
Cuando se tiene un diseño factorial con puntos centrales, se puede probar si existe
curvatura en la superficie de respuesta. Sin embargo, no puede modelar el efecto de esa
curvatura en ningún lugar, excepto en el punto central. En otras palabras, solo se puede
calcular los valores ajustados en los puntos de vértice y el punto central del diseño, por lo que
no puede crear una gráfica de contorno. Debe tener términos cuadráticos en el modelo a fin de
modelar la curvatura en toda la superficie de respuesta. Esto es posible con un diseño de
superficie de respuesta ampliando el diseño factorial con puntos axiales para crear un diseño
de superficie de respuesta central compuesto a partir de un diseño factorial.
Diseño factorial
Es una prueba cuyo diseño consta de dos o más factores, cada uno de los cuales, con distintos
valores o niveles, cuyas unidades experimentales cubren todas las posibles combinaciones de
dichos niveles en todos los factores. Este tipo de experimentos permiten estudiar el efecto de
cada factor sobre la variable respuesta, así como el efecto de las interacciones entre factores
Video
https://www.youtube.com/watch?v=s48ZO5YgZuc
Ejemplo
Suponga que un ingeniero desea estudiar la energía total usada por cada uno de dos diferentes
motores, A y B, funcionando cada uno en alguna de las siguientes dos velocidades: 2000 o
3000 RPM.
motor A, a 2000 RPM, motor B a 2000 RPM, motor A a 3000 RPM, y motor B a 3000 RPM.
Cada combinación de un solo nivel seleccionado con cada factor está presente una vez.
porque considera dos niveles (la base) para cada uno de dos factores (la potencia o exponente),
Los diseños pueden implicar muchas variables independientes. otro ejemplo, los efectos de tres
variables entradas se pueden evaluar en ocho condiciones experimentales ilustradas como las
esquinas de un cubo.
Esto se puede conducir con o sin repetición, dependiendo de su propósito previsto y recursos
dependiente y las interacciones posibles (en caso de haber más de 3 se habla de un hiperespacio).
La técnica fundamental consiste en repartir el total en componentes mediante sumas de
Por ejemplo
niveles.
SC
total =SCerror +SCtratamientos
Los grados de libertad se pueden repartir de manera similar y especifican distribuciones chi-
Ejemplo
Con dos factores y dos niveles en cada factor, un experimento factorial tendría en total cuatro
procesamiento, puede optarse por un diseño factorial fraccional, en el que se omitan algunas
En un diseño factorial completo de 2 niveles, cada factor experimental tiene solo dos
niveles. Las corridas experimentales incluyen todas las combinaciones de estos niveles de
factores. Aunque los diseños factoriales de 2 niveles no pueden explorar completamente una
amplia región del espacio de los factores, sí proporcionan información útil con un número
relativamente reducido de corridas por factor. Puesto que los diseños factoriales de 2 niveles
pueden identificar tendencias importantes, se pueden usar como punto de partida para realizar
experimentos adicionales. Por ejemplo, cuando necesite explorar una región donde crea que
puede existir una configuración óptima, podrá ampliar un diseño factorial para formar un diseño
central compuesto.
Comparación
Los siguientes diagramas muestran un diseño factorial completo en comparación con un diseño
factorial fraccionado de ½.
El diseño factorial completo contiene el doble de puntos de diseño que el diseño fraccionado de
½. La respuesta se mide solo en los cuatro de los ocho puntos de vértice posibles de la porción
factorial del diseño. Sin embargo, con este diseño, los efectos principales se confundirán con las
interacciones de 2 factores.
En este diseño se puede analizar modelos en los cuales dos o más factores pueden influir en la
1. Identificar los factores que pueden influir en la variable respuesta y proponer un modelo
7. Realizar la diagnosis del modelo mediante el análisis de los residuos Un diseño factorial es
aquél en el que se investigan todas las posibles combinaciones de los niveles de los factores en
cada ensayo completo. En este caso se dicen que están cruzados, apareciendo el concepto de
interacción
Son denominados diseño factorial 2k los diseños en los cuales cada uno de los factores
cuenta con dos niveles, es decir cuando se realiza un experimento con un número de factores k
en el que cada uno de estos solo puede adoptar dos niveles. Estos niveles podrían ser
cuantitativos o cualitativos y una réplica completa de tal diseño requiere que realizar 2k
combinaciones.
Este diseño describe como realizar los experimentos de la forma más adecuada para
conocer simultáneamente qué efecto tienen k factores sobre una respuesta y descubrir si
interaccionan entre ellos.
Además, estos diseños presentan diferentes ventajas en relación con otros tipos de diseños.
Es posible realizarlos de forma secuencial, de forma que una vez realizada una
ronda del diseño factorial se puede montar una nueva para realizar una investigación
más específica.
Video
https://www.youtube.com/watch?v=hQLZA_ezqbw
Ejemplo:
Supongamos que se ensayan dos factores, digamos humedad (h), y temperatura (t), cada
uno en dos niveles, y que observamos su efecto sobre el comportamiento de insectos.
Sean ho y h1 los niveles ensayados de humedad, y to y t1 los niveles ensayados de temperatura
(4 combinaciones de tratamientos):
donde:
µ = Efecto general
βk= Efecto del bloque k
τij = Efecto del tratamiento hitj
eijk = Error con las propiedades usuales (media cero, varianza constante y no correlación
con otros términos de error)
yijk = la característica observada
Concepto de interacción
Para ilustrar de forma intuitiva lo que es la interacción vamos a tomar dos conjuntos de datos.
α\β β1 β2
α1 10 20
α2 30 40
10+20 30+40
Eα = 2
−
2
=−20
−10+30 20+40
Eβ = 2
−
20
=−10
De forma similar, los efectos del factor β para los niveles α1 y α2 son, respectivamente:
Eβ|α1 = 10 − 20 = −10
Eβ|α2 = 30 − 40 = −10
Entonces, el efecto de uno de los factores no depende de los niveles del otro factor, lo cual indica que no
hay interacción entre los factores. Cuando ambos factores tienen dos niveles, el efecto de la interacción es
la diferencia entre los promedios de las diagonales, que es en este caso:
Ejemplo:
En este diseño se realizan todas las combinaciones posibles entre los efectos, para ello se
crea la matriz de diseño. En ella se utilizan los signos – y + para ambos niveles de un factor y
se realiza de la siguiente forma:
Estos modelos pueden ser sin réplica o con ellas, es decir puede realizarse una sola vez
cada una de las combinaciones obteniendo solamente una respuesta para cada una de las
combinaciones o pueden realizarse el número de veces que se considere necesario obteniendo
así más de una respuesta para cada combinación, en este caso habrá que tener en cuenta ambas
respuestas.
El modelo más sencillo para el diseño factorial 2k es el modelo 22 , sin réplica, el cual
cuenta con dos factores de dos niveles cada uno. Estos factores por ejemplos podrían ser A y
B, los cuales tienen cada uno dos niveles a los que trabajar, alto y bajo denominados
arbitrariamente. Las unidades experimentales se obtienen tomando las cuatro posibles
combinaciones de ambos factores y replicándolo n veces, con n > 1.
2.2 Diseño factorial 3 a la k.
Los diseños factoriales 3k cuentan con un número de factores k, los cuales tienen tres
niveles cada uno. Por lo que una réplica completa de este diseño tendrá un número de
observaciones igual a 3k . Esto nos muestra una desventaja con respecto al diseño factorial
2k , se requiere un mayor número de experimentos en este nuevo diseño.
Los casos anteriores explicaban los diseños en bloques donde sólo se tiene un factor de
tratamientos, y el resto son factores de bloques que tienen una importancia secundaria en la
investigación experimental.
Experimento factorial
cuyas unidades experimentales cubren todas las posibles combinaciones de esos niveles
en todos los factores.
Este tipo de experimentos permiten el estudio del efecto de cada factor sobre la variable
respuesta, así como el efecto de las interacciones entre factores sobre dicha variable.
Permite determinar una combinación de niveles de los factores en la que el desempeño
del experimento sea mejor.
Para estudiar cómo influyen los factores sobre la variable de respuesta hay que elegir al
menos dos niveles de prueba para cada factor.
Con el diseño factorial completo se corren aleatoriamente todas las posibles
combinaciones que pueden formarse con los niveles de los factores a investigar.
Para obtener el número de corridas experimentales se multiplica el número de
tratamientos por el número de réplicas, donde una de éstas se lleva a cabo cada vez que
se corre el arreglo completo.
La familia de diseños factoriales 3 k consiste en k factores cada uno con tres niveles de
prueba.
El efecto principal de un factor con dos niveles es la diferencia entre la respuesta media
observada cuando dicho factor estuvo en su primer nivel, y la respuesta media observada
cuando el factor estuvo en su segundo nivel.
Los valores absolutos (sin importar el signo) de los efectos principales y del efecto de
interacción son una medida de importancia de su efecto sobre la variable de respuesta.
Se llama réplica a cada corrida completa del arreglo factorial. Si se hacen n réplicas, el
número total de corridas experimentales es n (a × b).
Si hay menos de cuatro factores, se corren replicados para tener la potencia necesaria en
las pruebas estadísticas sobre los efectos de interés. Si se hacen n réplicas, el número total
de corridas experimentales es n (a × b).
Glosario
ANOVA:
Análisis de Varianza.
Axial:
Adjetivo que hace referencia a relativo a un eje.
Corridas experimentales:
Diseño factorial:
Experimento diseñado que permite estudiar los efectos que varios factores pueden tener
en una respuesta.
Efecto de un factor:
Estimar:
Factores:
Factoriales fraccionados:
Conjunto de experimentos.
fertilización:
Media replica:
RPM:
Bibliografía
Abu- Mostafa, M.-i. y.-T. (2015). Aprendiendo de los datos. Los Ángeles: AMLBook, 2012.
Matsui, R. D. (2016). el arte de las ciencias de datos. los ángeles: skybrude consulting llc.
Soo, A. N. (2018). Numsense! Ciencia de datos para el profano: sin matemáticas agregadas. san
francisco: Grupo de Ciencias de Gestión e Investigación Operativa.
Montgomery, D.C. y Runger, G.C. (2012). Probabilidad y estadística aplicada a la ingeniería (2 ed). Limusa
Wiley
Jhonson, R.A. (2012). Probabilidad y estadística para Ingenieros (8 ed). México. Pearson Educación de
México.