Diseño de Experimentos de Un Factor
Diseño de Experimentos de Un Factor
Diseño de Experimentos de Un Factor
Competencias
1. Identificar dentro de la familia de los diseños experimentales, aquellos utilizados en la
comparación de tratamientos.
4. Verificar los supuestos del modelo estadístico en diseños con un solo factor.
que se prueba con la técnica estadística llamada Análisis de Varianza (ANOVA) con uno, dos,
tres o cuatro criterios de clasificación, dependiendo del número de factores de bloques
incorporados al diseño.
El modelo estadístico que describe el comportamiento de la variable observada Y en cada diseño,
incorpora un término adicional por cada factor de bloqueo controlado.
De acuerdo con los modelos dados en la tabla, para cada diseño comparativo se tienen al menos
dos fuentes de variabilidad: los tratamientos o niveles del factor de interés y el error aleatorio.
Se agrega una nueva fuente de variabilidad por cada factor de bloque que se controla
directamente. Se observa que los diseños suponen que no hay efectos de interacción entre los
factores, lo cual sería lo deseable que ocurra; de no ocurrir así, tal efecto se recarga al error y el
problema de comparación no se resuelve con éxito.
Un efecto de interacción entre dos factores hace referencia a que el efecto de cada factor
depende del nivel en que se encuentra el otro.
Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor
presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se
deberá al error experimental.
2.3. Diseño completamente al azar y ANOVA
Muchas comparaciones, como las antes mencionadas, se hacen con base en el diseño
completamente al azar (DCA), que es el más simple de todos los diseños que se utilizan para
comparar dos o más tratamientos, dado que sólo consideran dos fuentes de variabilidad: los
tratamientos y el error aleatorio. En la siguiente unidad veremos diseños que consideran la
influencia de otras fuentes de variabilidad (bloques).
Este diseño se llama completamente al azar porque todas las corridas experimentales se
realizan en orden aleatorio completo. De esta manera, si durante el estudio se hacen en total
N pruebas, éstas se corren al azar, de manera que los posibles efectos ambientales y temporales
se vayan repartiendo equitativamente entre los tratamientos.
Ejemplo 1
Comparación de cuatro métodos de ensamble. Un equipo de mejora investiga el efecto de
cuatro métodos de ensamble A, B, C y D, sobre el tiempo de ensamble en minutos con un nivel
de significancia de 0.05. En primera instancia, la estrategia experimental es aplicar cuatro veces
los cuatro métodos de ensamble en orden completamente aleatorio (las 16 pruebas en orden
aleatorio). Los tiempos de ensamble obtenidos se muestran en la tabla 2.1. Si se usa el diseño
completamente al azar (DCA), se supone que, además del método de ensamble, no existe
ningún otro factor que influya de manera significativa sobre la variable de respuesta (tiempo de
ensamble)
Ejemplo 2
Comparación de cuatro tipos de cuero. Un fabricante de calzado desea mejorar la calidad de
las suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles
en el mercado. Para ello, prueba los cueros con una máquina que hace pasar los zapatos por
una superficie abrasiva; la suela de éstos se desgasta al pasarla por dicha superficie. Como
criterio de desgaste se usa la pérdida de peso después de un número fijo de ciclos. Se prueban
en orden aleatorio 24 zapatos, seis de cada tipo de cuero. Al hacer las pruebas en orden
completamente al azar se evitan sesgos y las mediciones en un tipo de cuero resultan
independientes de las demás. Los datos (en miligramos) sobre el desgaste de cada tipo de cuero
se muestran en la tabla 2.2
El objetivo del análisis de varianza en el DCA es probar las hipótesis de igualdad de los
tratamientos con respecto a la media de la correspondiente variable de respuesta:
Como nuestro estadístico de prueba F (9,42) excede el valor crítico tabulado (3,49), rechazamos
la hipótesis nula y aceptamos la alterna, concluyendo que sí hay diferencia o efecto de los
métodos de ensamble en cuanto a su tiempo promedio.
Análisis del ejemplo 2 (comparación de cuatro tipos de cuero). La interrogante que se planteó
en el problema de la comparación entre los cuatro tipos de cuero fue: ¿existen diferencias entre
el desgaste promedio de los diferentes tipos de cuero? La respuesta a esta pregunta es el
resultado de contrastar las hipótesis:
En el resultado de comparación de parejas arrojado por minitab, por el método de LSD,
observamos que este nos indica los intervalos de confianza para las comparaciones de cada par
de muestras, por lo que debemos tomar el punto medio de cada comparación (centro) y
contrastarlo con el valor del estadístico t de student obtenido en tablas (2,42) y tomar la
decisión que corresponda
En las comparaciones donde la diferencia observada es mayor que el rango respectivo, se
concluye que esas medias son significativamente diferentes. Si dos medias caen entre otras
dos que no son muy diferentes, entonces esas dos medias poblacionales también se
consideran estadísticamente iguales.
Ejemplo. Supongamos que nos interesa probar las seis hipótesis para los cuatro métodos de
ensamble del problema anterior.
Estos rangos se comparan con las diferencias de medias de acuerdo al método descrito
anteriormente.
Método de Dunnet (Comparación de tratamientos con un control).
En muchos problemas científicos y de ingeniería no interesa extraer inferencias con respecto a
todas las posibles comparaciones entre las medias de los tratamientos. En su lugar, el
experimento a menudo dicta la necesidad de comparar de manera simultánea cada tratamiento
con un control. Por ejemplo, al comparar varios medicamentos para el resfriado es conveniente
que uno de los tratamientos sea que los pacientes no utilicen ningún medicamento, esto sirve
como referencia para decidir la posible utilidad de los medicamentos.
Cabe enfatizar el hecho de que el ajuste de los puntos a una recta no tiene que ser perfecto,
dado que el análisis de varianza resiste pequeñas y moderadas desviaciones al supuesto de
normalidad.
Independencia
La suposición de independencia en los residuos puede verificarse si se grafica el orden en que
se colectó un dato contra el residuo correspondiente. De esta manera, si al graficar en el eje
horizontal el tiempo (orden de corrida) y en el eje vertical los residuos, se detecta una tendencia
o patrón no aleatorio claramente definido, esto es evidencia de que existe una correlación entre
los errores y, por lo tanto, el supuesto de independencia no se cumple. Si el comportamiento
de los puntos es aleatorio dentro de una banda horizontal, el supuesto se está cumpliendo.
En el ejemplo para comparar los cuatro tipos de cuero, las gráficas resultantes figuras 2.2 y 2.3.
Se observa el cumplimiento de los supuestos de normalidad y varianza constante, sin embargo,
en las dos gráficas es notorio un punto que se aleja bastante del resto, el cual es un punto
aberrante cuyo origen debe investigarse
Aunque existen varios métodos para estimar el tamaño muestral, muchas veces tienen poca
aplicabilidad porque requieren cierto conocimiento previo sobre la varianza del error
experimental.
Si recurrimos a la experiencia vemos que el número de réplicas en la mayoría de las situaciones
experimentales en las que se involucra un factor varía entre cinco y diez; incluso, en algún caso
puede llegar hasta 30. La tendencia podría inclinarse por un extremo de este rango e incluso
salirse de éste, de acuerdo con las siguientes consideraciones:
A menor diferencia que se espera en los tratamientos, mayor será la cantidad de réplicas
si se quieren detectar diferencias significativas, y viceversa, es decir, si se esperan
grandes diferencias quizá con pocas replicas sea suficiente
Si son varios tratamientos (cuatro o más), entonces éste es un punto favorable para reducir
el número de réplicas.
Además de lo anterior, es preciso considerar los costos y el tiempo global del experimento. De
aquí que si toman en cuenta las consideraciones antes expuestas se podrá establecer el tamaño
de muestra que permita responder en una primera fase las preguntas más importantes que se
plantearon con el experimento
2.6. Uso de un software estadístico
Excel
a) En una hoja de Excel capturar primeramente la tabla de datos
b) En la misma hoja de cálculo seleccionar del cintillo superior Datos, luego Análisis de datos
c) Seleccionar análisis de varianza de un factor en la ventana desplegada
d) En rango de entrada (en ventana de captura) seleccionar todos los grupos, incluyendo su
rótulo (sombrearlos con el mouse), automáticamente se incluyen.
Nota: Si no aparece Análisis de datos en la parte superior derecha de la hoja de cálculo, se deberá
de activar de la siguiente manera:
En el símbolo del sistema en la parte superior izquierda de los encabezados dar clic.
Nota como no está instalada esta herramienta el sistema nos preguntara si queremos
instalarla a lo que indicaremos que si, y la instalara en un par de minutos.
Minitab
En la hoja de cálculo que despliega Minitab capturar nuestra tabla de datos indicando sus
correspondientes rótulos en la primer fila que no está numerada