06 Diseo de Experimentos
06 Diseo de Experimentos
06 Diseo de Experimentos
2/25
Diseño de experimentos
Diseño de experimentos
I. Introducción
Anteriormente, se han descrito métodos de inferencias sobre la media y la varianza de una población y de dos
poblaciones.
En esta unidad se ampliarán dichos métodos y se realizará una introducción a los modelos estadísticos,
agrupados bajo el nombre de diseño de experimentos.
El objetivo principal de estos modelos es estudiar la asociación entre una o más variables y la
variable de interés.
El diseño de experimentos
Agrupa el conjunto modelos estadísticos clásicos, cuyo objetivo es estudiar si determinados factores influyen en
la variable de interés y, si existe influencia de algún factor, cuantificarla.
A continuación se exponen algunas situaciones comunes donde cabría aplicar el diseño estadístico de
experimentos:
El departamento de I+D está interesado en conocer el rendimiento de un determinado tipo de máquina en las
unidades producidas por día. En este caso, se desea estudiar la influencia del trabajador que la maneja y la
marca de la máquina.
El departamento de Recursos Humanos está investigando qué tipo de empresa de formación es mejor para sus
empleados. Para ello analiza la impartición de la misma materia con distintos métodos de training en grupos
experimentales de trabajadores: desea comprobar si el método de formación utilizado influye en las
calificaciones de sus empleados.
En el marketing digital podría usarse para identificar la página web con la que más convierten los clientes. En
este caso, se crearían cuatro versiones diferentes de una página de destino; después se mostrarían durante tres
semanas a los visitantes del sitio las cinco versiones (incluida la de control) para ver cuál resulta con la tasa de
conversión más alta.
3/25
Diseño de experimentos
En esta unidad también se presentará el análisis de la varianza (ANOVA). Se trata de un modelo estadístico que
permite, a través del análisis de la variabilidad explicada, determinar la asociación entre una variable
continua y una o más variables categóricas.
II. Objetivos
En esta unidad se presentan los conceptos básicos del diseño de experimentos. Al final de esta sesión, el
estudiante poseerá las diferentes competencias:
Tiene su origen en la investigación con el objetivo de estudiar el impacto de ciertas variables, conocidas como
factores, sobre una variable respuesta producida tras la realización del experimento.
Esta metodología busca diseñar las condiciones ideales de un producto, proceso o servicio
para que cumpla con ciertas expectativas con el mínimo número de experimentos o pruebas.
Así pues, el diseño de experimentos resulta de gran utilidad en situaciones en las que se
investiga un producto complicado cuyo comportamiento está influenciado por gran variedad de
factores que no siempre están bajo control y deben ajustarse para su optimización. Como en la
mayoría de los casos en el ámbito de la investigación, para que la metodología de diseño de
experimentos sea eficaz es fundamental que el experimento esté bien diseñado.
4/25
Diseño de experimentos
Ventajas
Además, una de las ventajas que ofrece la metodología basada en el diseño de experimentos es que permite
conocer exactamente cómo influye cada factor y, de este modo, será posible decidir qué implementar o eliminar
de en un determinado producto. También permite estudiar cada combinación de factores, puesto que varios
factores pueden inteactuar.
5/25
Diseño de experimentos
Se produce por las diferentes condiciones experimentales impuestas en el diseño por el propio experimentador.
Este tipo de variabilidad es parte del diseño y se espera que, cuando esta variabilidad existe de forma
importante, se agrupe formando clusters. Cuando exista este tipo de variabilidad, debería ser identificada y
cuantificada por el modelo.
Se debe al ruido aleatorio. El término de ruido aleatorio hace referencia al componente de variabilidad no
planificada, comúnmente denominada error de medida. Es una variabilidad impredecible, inevitable y que se
considera tolerable.
Produce una variación sistemática en los resultados y es debida a causas desconocidas y no planificadas.
Dicho de otro modo, existe un sesgo en los resultados producido sistemáticamente por causas desconocidas.
Esta variabilidad supone la principal causa de conclusiones erróneas y estudios sesgados al tratar de ajustar un
modelo estadístico de forma incorrecta.
Replicados.
Aleatorización.
Formación de bloques.
1. Objetivos
Una fuente de variación es cualquier cosa que pueda generar variabilidad en la respuesta. Se distinguen dos
tipos:
Factores tratamiento
Se denomina factor tratamiento a cualquier variable de interés para el experimentador cuyo posible efecto
6/25
Diseño de experimentos
sobre la respuesta se quiere estudiar. Los factores tratamiento pueden ser cualitativos o cuantitativos. Debe
tenerse en cuenta que los factores cuantitativos son tratados como cualitativos y sus niveles son elegidos
equiespaciados o se codifican. Cuando en un experimento se trabaja con más de un factor, se denomina:
Niveles
Son las distintas modalidades con las que se presenta un factor. Nivel del factor: es cada una de
las categorías, valores o formas especificas del factor.
Tratamiento
Observación
Experimento factorial
Unidades experimentales
Son los objetos, individuos, intervalos de espacio o tiempo sobre los que se experimenta.
Factores ruido
En cualquier experimento, además de los factores tratamiento cuyo efecto sobre la respuesta se quiere
evaluar, también influyen otros factores de escaso interés en el estudio, pero cuya influencia sobre la
respuesta puede aumentar significativamente la variabilidad no planificada. Pueden ser de diversos tipos.
Factor bloque
Covariable
Una covariable es cualquier variable continua, que usualmente no se controla durante la recogida
de datos. Incluyéndola en el modelo, permite incluir y adaptar las variables de entrada que se
midieron, pero no se aleatorizaron o controlaron en el experimento. Al agregar covariables, se
puede mejorar considerablemente la exactitud del modelo y se puede reducir el error en este para
incrementar la potencia de las pruebas de los factores.
Ruido
7/25
Diseño de experimentos
3. R egla de asignación
Elegir las unidades experimentales y las reglas de asignación en relación con las condiciones de estudio. La
regla de asignación o diseño experimental especifica que unidades experimentales se observarán en cada
tratamiento.
4. Variable respuesta
Es importante precisar de antemano cuál es la variable respuesta y en qué unidades se mide. Además, es
importante anticiparse a los posibles problemas para intentar descubrir nuevas fuentes de variación o simplificar
el procedimiento experimental antes de comenzar.
5. Modelo de diseño
Especificar el modelo de diseño de experimentos. El tipo de modelo depende del tipo de los factores incluidos.
El tipo de un factor, a su vez, puede ser:
Es un factor en el que los niveles han sido seleccionados por el experimentador. Es apropiado cuando el
interés se centra en comparar el efecto sobre la respuesta de esos niveles específicos. Ejemplo: un agricultor
está interesado en comparar el rendimiento de cuatro máquinas del mismo tipo que tiene su cooperativa.
Es un factor del que solo se incluye en el experimento una muestra aleatoria simple de todos los posibles
niveles del mismo. Evidentemente, se utilizan estos factores cuando el experimento tiene un número muy
grande de niveles y no es razonable o posible trabajar con todos ellos. En este caso, interesa examinar la
variabilidad de la respuesta debida a la población entera de niveles del factor. Ejemplo: una empresa
multinacional que tiene en plantilla 3 500 trabajadores está interesada en estudiar la influencia del factor
trabajador en la variable tiempo de respuesta a un cliente.
Modelo mixto
8/25
Diseño de experimentos
6. Análisis estadístico
En esta etapa no se debe perder de vista que los resultados experimentales son observaciones muestrales, no
poblacionales. Por ello, se debe recurrir a métodos estadísticos inferenciales para ver si las diferencias o
efectos muestrales (experimentales) son lo suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso). La técnica estadística central en el análisis de los experimentos es el llamado
análisis de varianza ANOVA, que se verá en el siguiente apartado.
7. Interpretación y conclusiones
Aquí, con el respaldo del análisis estadístico formal, se debe analizar con detalle lo que ha pasado en el
experimento, desde contrastar las conjeturas iniciales con los resultados del experimento, hasta observar los
nuevos aprendizajes que sobre el proceso se lograron, verificar supuestos y elegir el tratamiento ganador,
siempre con apoyo de las pruebas estadísticas.
El modelo del análisis de la varianza (ANOVA) permitirá abordar este tipo de situaciones. Se
trata de una generalización de los t-test para dos muestras al caso de diseños con más de dos
muestras.
Variable independiente
Variable categórica que define los grupos a comparar se le llama variable independiente o factor
Variable dependiente
Los factores que varían entre sujetos son los que no se miden dos (o más) veces para un mismo sujeto: la edad
(un sujeto no puede tener dos edades diferentes), el género, la raza, etc. O simplemente los que, según el
experimento, solo afectan una vez a cada sujeto. A cada sujeto se le asigna un único valor para ese factor.
9/25
Diseño de experimentos
Los factores que varían dentro de los sujetos, conocidos también como intrasujetos, son los que se miden varias
veces para el mismo sujeto.
Por ejemplo: seguimiento del mismo tratamiento tomando muestras en varios momentos.
Los momentos en los que se toman las muestras son niveles y el tiempo es el factor
intrasujetos, ya que para un mismo sujeto se repiten las mediciones. A cada sujeto se le
asignan tantos valores de ese factor como niveles tenga este.
Esta diferenciación de los tipos de factores será muy importante a la hora de elegir entre los diferentes modelos
ANOVA a utilizar.
También conocido como ANOVA de un factor, examina la igualdad de las medias de la población para un
resultado cuantitativo y una única variable categórica con dos o más niveles de tratamiento. Cada sujeto estará
expuesto a un único nivel de este tratamiento. La hipótesis nula es que no hay diferencia entre las medias de las
variables categóricas y la alternativa; que al menos una de las medias de un nivel difiere del resto.
El hecho de verificar la hipótesis nula de que hay igualdad de medias entre grupos se puede interpretar como
que las observaciones proceden de un único grupo cuya media y variabilidad es la misma que la de cualquiera
de los grupos por separado. ANOVA es la forma más simple de mediar la variabilidad.
La cuestión es que, si alguno de los grupos presenta unos valores que en media se alejan del
resto, esto se apreciará en el contraste como una fuente extra de variabilidad no explicable por
el azar. Se trata de identificar cuándo se rechaza la hipótesis nula (cuando el p-valor es menor
que 0,05) y cuándo se acepta (cuando es mayor).
Hay una serie de premisas que se deben cumplir, ordenadas de mayor exigencia a menor, para poder llevar a cabo
el modelo ANOVA de una vía:
Dos observaciones son independientes cuando una no depende de la otra. Es decir: el resultado de la primera
observación no influye en el resultado de la siguiente. Este supuesto es el más importante, ya que, de no
cumplirse, esto puede invalidar las conclusiones del análisis porque produce errores en el cálculo de las
varianzas y, por tanto, en los intervalos de confianza y las pruebas de hipótesis deducidas.
10/25
Diseño de experimentos
Homocedasticidad
Hay que comprobar que las varianzas de los grupos son iguales. Para ello, se puede emplear el test de
homoceasticidad visto en la unidad cuatro.
Normalidad
La distribución de los datos debe aproximarse a la de una normal. Se vio en la unidad tres cómo comprobarlo.
Una empresa de telecomunicaciones está interesada en conocer si hay algún día laborable más propenso para
captar clientes. Para ello, se diseñaron cinco campañas con los siguientes nombres para cada día de la semana
a lo largo de seis semanas: rojo (lunes), amarillo (martes), azul (miércoles), blanco (jueves) y verde (viernes). Se
cuantificó el número de captados:
Para calcular la tabla ANOVA, primero se hace uso de la función “aov” de la siguiente forma:
clientesnuevos <- c(178, 120, 300, 400 ,500, 340,160, 111 ,200 ,201 ,140 ,70,370, 320, 150, 250, 390
,410,210, 120 ,140, 170 ,130 ,170,450, 590 ,480 ,460 ,380 ,470)
campanya <- as.factor(c(rep(c("rojo","azul", "verde", "blanco", "amarillo"), each =6)))
boxplot(clientesnuevos ~ campanya, col = c("red","yellow", "blue", "white","green") , ylab =
"Número de clientes nuevos")
## Call:
## aov(formula = lm(clientesnuevos ~ campanya))
##
## Terms:
## campanya Residuals
## Sum of Squares 429314.7 189578.0
## Deg. of Freedom 4 25
##
## Residual standard error: 87.08111
## Estimated effects may be unbalanced
11/25
Diseño de experimentos
summary(anova)
names(anova)
Bajo H0, el estadístico de contraste F se distribuye como una F de grados de libertad (I-1) (visto
en la unidad tres), (n-I) donde I es el número de grupos disponibles y n el tamaño total de la
muestra. Se obtiene el cuantil buscado mediante la siguiente función de R:
Los argumentos que se pueden pasar a las funciones expuestas en la anterior tabla son:
Vector de probabilidades.
df1, df2:
ncp
Parámetro que determina la centralidad de la gráfica de la distribución F. Si se omite, el estudio se realiza con
la gráfica no centralizada.
“lower.tail”
Parámetro booleano. Si es TRUE (por defecto), las probabilidades son P[X ≤ x]; de lo contrario, P [X > x].
## [1] 3.68232
12/25
Diseño de experimentos
Valores del estadístico > 3,68232 estarán incluidos en la región de rechazo. En este caso, el F obtenido en el test
ANOVA que se pudo ver antes, 14,15 es mucho mayor que el valor crítico obtenido.
Los cinco aspectos que más influyen en la selección de un diseño experimental, por lo general, llevan a cambiar de
diseño, son:
Intersujeto:
De grupos aleatorios
Dos grupos.
Multigrupo.
13/25
Diseño de experimentos
De bloques
Bloques al azar.
Cuadrado latino.
Grupos apareados.
Mixtos.
Intersujeto
De grupos aleatorios.
De bloques.
Intrasujeto
Mixtos.
Son aquellos que se realizan sobre los mismos sujetos que pasan por todas las condiciones experimentales. Se
llevan a cabo comparaciones entre las distintas condiciones y se utilizan las medidas de cada sujeto para medir
estas.
Este tipo de diseño es especialmente útil para el estudio del comportamiento de un mismo grupo de
personas bajo distintas condiciones.
14/25
Diseño de experimentos
Este tipo de diseño suele ser utilizado con mayor frecuencia en el ámbito clínico: una de las situaciones más
simples de investigación clínica es aquella en la que se trabaja con dos grupos (normalmente, uno de control y otro
experimental).
Ejemplo
Se pretende estudiar el efecto de dos campañas de fidelidad sobre la tasa de retención de una compañía de
seguros y se hace la predicción de que la campaña A determinará una mejor tasa de retención que la campaña
B.
Para comenzar, se selecciona una muestra aleatoria de 12 clientes que fueron asignados al azar en una
encuesta a las dos condiciones de tratamiento (campañas). A continuación, se aplica a los sujetos una prueba
de serie de preguntas relacionados con su seguro valorando en una escala de Likert (del 1 al 5).
Así pues, en este experimento se trata de comparar la ejecución o variable de medida de dos grupos
independientes formados por sujetos elegidos al azar de una población.
En él se utiliza como unidad de medida el ítem de la pregunta. Dado que todos los ítems tienen el mismo
valor asociativo, debe entenderse que dicha unidad es constante y que, en consecuencia, se trata de una
escala de intervalo.
Partiendo de estos presupuestos y teniendo en cuenta que los datos proceden de una población con
distribución normal, se puede utilizar como prueba de hipótesis la t de Student.
Diseño multigrupo
Los diseños multigrupo
Son estructuras con una sola variable independiente de tres o más valores o niveles. El diseño multigrupo
totalmente al azar requiere la asignación aleatoria de los sujetos de la muestra a los distintos grupos, sin
restricción alguna. Se suelen utilizar cuando, además de la magnitud del efecto, interesa precisar el tipo de
relación.
Prueba de significación general → Análisis de la variancia (ANOVA) unifactorial para datos independientes.
Datos no relacionados.
15/25
Diseño de experimentos
Si la variable independiente es cuantitativa → Análisis de tendencias. Este análisis trata de ajustar funciones
matemáticas (tendencias) que relacionen la variable independiente con la variable dependiente.
Ejemplo
En un grupo de estudiantes se quiere comprobar si el repaso es una variable decisiva para retener mejor los
conocimientos de un examen. Por ello se establecen los siguientes niveles de repaso:
Una sola presentación de los temas y, por tanto, condición sin repaso (A1).
Dos presentaciones sucesivas del mismo tema (A2).
Tres presentaciones del mismo tema (A3).
Cuatro presentaciones (A4).
La tasa de presentación es, en todos los casos, de 10 minutos por tema. El estudiante lee en voz alta cada
tema. Acto seguido, se pasa a una prueba de test (variable criterio) y se contabiliza la cantidad de respuestas
correctas. Así se obtienen los siguientes datos hipotéticos del experimento:
Matriz de datos
Matriz de datos
S1 S2 S3 S4
2 4 3 9
1 3 7 7
1 1 10 10
6 7 7 9
8 3 2 10
Diseños de bloques
16/25
Diseño de experimentos
Se utiliza frecuentemente para minimizar el efecto de la variabilidad cuando se asocia con unidades discretas
(por ejemplo, ubicación, operador, planta, lote, tiempo). Garantizan los grupos equivalentes.
Utiliza la técnica de bloqueo y puede usarse tanto en diseños unifactoriales como factoriales. Minimiza la varianza
error y controla la varianza sistemática.
La variable de bloqueo se mide antes de formar los grupos para garantizar su equivalencia. La
medida pretratamiento se toma una vez formados los grupos para comprobar que son
equivalentes.
El análisis de datos se realiza con las mismas técnicas que para los grupos aleatorios independientes:
Con técnicas de dos variables: incorporando la VB como variable de estudio a la hora de analizar los datos
(ANOVA de dos factores o ANCOVA).
En el caso de los grupos apareados, una prueba de muestras relacionadas (paramétricas o no paramétricas).
Cada bloque constituye una réplica exacta del experimento porque dentro de cada bloque se aplican todos los
niveles.
Los sujetos tienen que ser idénticos (en los anteriores, bastaba con que fueran similares). En este caso a la VB
se la denomina variable de apareo (VA) o variable equiparada. Ejemplo: pares de gemelos criados juntos.
Ejemplo
Este tipo de diseño de experimentos se usa frecuentemente en la agricultura. En el siguiente ejemplo se calcula
en R el rendimiento del grano de arroz de variedad IR8 con seis diferentes niveles de siembra, usando diseño
de BCA con cuatro repeticiones. (Gómez y Gómez, 1984).
Rendimiento de grano de arroz variedad IR8 con seis diferentes niveles de siembra, usando diseño de BCA
con cuatro repeticiones
17/25
Diseño de experimentos
1 25 RepI 5113
2 25 RepII 5398
3 25 RepIII 5307
4 25 RepIV 4678
5 50 RepI 5346
6 50 RepII 5952
7 50 RepIII 4719
8 50 RepIV 4264
9 75 RepI 5272
10 75 RepII 5713
11 75 RepIII 5483
12 75 RepIV 4749
str(semilla)
18/25
Diseño de experimentos
$ rend: int 5113 5398 5307 4678 5346 5952 4719 4264 5272 5713 ...
semilla$trt = factor(semilla$trt)
attach(semilla)
rep
# Gráfico
Response: rend
19/25
Diseño de experimentos
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
anova(lm(rend ~ trt))
Response: rend
20/25
Diseño de experimentos
21/25
Diseño de experimentos
22/25
Diseño de experimentos
VII. Resumen
23/25
Diseño de experimentos
Ejercicios
Caso práctico
I. PROBLEMA
Una empresa quiere determinar si las diferentes formaciones que reciben sus empleados tienen influencia en el
tiempo que tardan en realizar una tarea. Los doce empleados nuevos son distribuidos en cuatro grupos de tres
personas cada uno. A cada grupo, se le asigna aleatoriamente un tipo de formación. Los resultados en la
mencionada tarea, con el correspondiente tipo de formación, son los siguientes:
tiempo=c(2,3,5,6,4,2,3,5,2,3,1,4)
formacion = as.factor(rep(c("1","2","3","4"),each=3))
(datos=data.frame(tiempo,formacion))
## tiempo formacion
## 1 2 1
## 2 3 1
## 3 5 1
## 4 6 2
## 5 4 2
## 6 2 2
## 7 3 3
## 8 5 3
## 9 2 3
## 10 3 4
## 11 1 4
## 12 4 4
Se pide
¿Qué conclusiones se obtienen? ¿La formación tiene influencia sobre los tiempos o no?
Solución
La solución de este caso práctico viene resuelta en el siguiente archivo: solución.
24/25
Diseño de experimentos
Recursos
Glosario.
Aleatorización: consiste en hacer experimentos en orden aleatorio. Este principio aumenta la posibilidad
de que el supuesto de independencia de los errores se cumpla. Asignación al azar de tratamiento a las
unidades experimentales. Es una suposición frecuente en los modelos estadísticos de diseño de
experimentos en que las observaciones o los errores en ellas están distribuidos independientemente. La
aleatorización hace válida esta suposición.
Bloqueo: es tomar en cuenta de forma adecuada todos los factores que pueden afectar a la respuesta
observada. Distribución de las unidades experimentales en bloques, de manera que las unidades dentro de
un bloqueo sean relativamente homogéneas. De esta manera, la mayor parte de la variación predecible
entre las unidades queda confundida con el efecto de los bloques.
Error experimental: componente del error aleatorio que refleja los errores del experimentador en la
planificación y ejecución del experimento.
Factor: una variable independiente. En la mayoría de las investigaciones se trata con más de una variable
independiente y con los cambios que ocurren estas cuando varían una o más de las variables
independientes.
Tratamiento: conjunto particular de condiciones experimentales que deben imponerse a una unidad
experimental dentro de los confines del diseño seleccionado.
Unidad experimental: es la muestra de unidades que es necesario producir en una condición para obtener
una medición o dato representativo. Unidad a la cual se le aplica un solo tratamiento en una reproducción
del experimento.
Variables de respuesta: es la característica del producto cuyo valor interesa mejorar mediante el diseño
de experimentos.
25/25