06 Diseo de Experimentos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

Diseño de experimentos

© Ediciones Roble, S.L.


Indice
Diseño de experimentos 3
I. Introducción 3
II. Objetivos 4
III. Metodología del diseño de experimentos 4
3.1. Tipos de variabilidad 5
3.2. Etapas en el diseño de experimentos 6
IV. Análisis de varianza (ANOVA) 9
4.1. ANOVA de una vía (entre sujetos) 10
V. Clasificación y selección de los diseños experimentales 13
VI. Diseños unifactoriales intersujetos 14
Diseños de grupos aleatorios 14
Diseño multigrupo 15
Diseños de bloques 16
VII. Resumen 23
Ejercicios 24
Caso práctico 24
Se pide 24
Solución 24
Recursos 25
Glosario. 25

2/25
Diseño de experimentos

Diseño de experimentos

I. Introducción
Anteriormente, se han descrito métodos de inferencias sobre la media y la varianza de una población y de dos
poblaciones.

En esta unidad se ampliarán dichos métodos y se realizará una introducción a los modelos estadísticos,
agrupados bajo el nombre de diseño de experimentos.

El objetivo principal de estos modelos es estudiar la asociación entre una o más variables y la
variable de interés.

El diseño de experimentos

Agrupa el conjunto modelos estadísticos clásicos, cuyo objetivo es estudiar si determinados factores influyen en
la variable de interés y, si existe influencia de algún factor, cuantificarla.

A continuación se exponen algunas situaciones comunes donde cabría aplicar el diseño estadístico de
experimentos:

Determinar la organización de los productos de un supermercado para mejorar las ventas.

El departamento de I+D está interesado en conocer el rendimiento de un determinado tipo de máquina en las
unidades producidas por día. En este caso, se desea estudiar la influencia del trabajador que la maneja y la
marca de la máquina.

El departamento de Recursos Humanos está investigando qué tipo de empresa de formación es mejor para sus
empleados. Para ello analiza la impartición de la misma materia con distintos métodos de training en grupos
experimentales de trabajadores: desea comprobar si el método de formación utilizado influye en las
calificaciones de sus empleados.

En el marketing digital podría usarse para identificar la página web con la que más convierten los clientes. En
este caso, se crearían cuatro versiones diferentes de una página de destino; después se mostrarían durante tres
semanas a los visitantes del sitio las cinco versiones (incluida la de control) para ver cuál resulta con la tasa de
conversión más alta.

3/25
Diseño de experimentos

Snálisis de la varianza (ANOVA)

En esta unidad también se presentará el análisis de la varianza (ANOVA). Se trata de un modelo estadístico que
permite, a través del análisis de la variabilidad explicada, determinar la asociación entre una variable
continua y una o más variables categóricas.

II. Objetivos
En esta unidad se presentan los conceptos básicos del diseño de experimentos. Al final de esta sesión, el
estudiante poseerá las diferentes competencias:

Saber los motivos por los que se realiza un experimento.

Conocer los diferentes tipos de variabilidad.

Entender las principales etapas de un diseño de experimentos.

Conocer la técnica estadística ANOVA.

Clasificar y seleccionar las diferentes técnicas de diseño de experimentos.

III. Metodología del diseño de experimentos


La metodología de diseño de experimentos

Tiene su origen en la investigación con el objetivo de estudiar el impacto de ciertas variables, conocidas como
factores, sobre una variable respuesta producida tras la realización del experimento.

Esta metodología busca diseñar las condiciones ideales de un producto, proceso o servicio
para que cumpla con ciertas expectativas con el mínimo número de experimentos o pruebas.
Así pues, el diseño de experimentos resulta de gran utilidad en situaciones en las que se
investiga un producto complicado cuyo comportamiento está influenciado por gran variedad de
factores que no siempre están bajo control y deben ajustarse para su optimización. Como en la
mayoría de los casos en el ámbito de la investigación, para que la metodología de diseño de
experimentos sea eficaz es fundamental que el experimento esté bien diseñado.

4/25
Diseño de experimentos

Ventajas

Además, una de las ventajas que ofrece la metodología basada en el diseño de experimentos es que permite
conocer exactamente cómo influye cada factor y, de este modo, será posible decidir qué implementar o eliminar
de en un determinado producto. También permite estudiar cada combinación de factores, puesto que varios
factores pueden inteactuar.

¿Por qué realizar un experimento?

Determinar las principales causas de variación en la respuesta.


Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable de
interés o respuesta.
Comparar las respuestas en diferentes niveles de observación de variables controladas.
Obtener un modelo estadístico que permita hacer predicciones de respuestas futuras.
No siempre es posible el tener datos históricos.
Estudiar la interacción de varios factores en la respuesta de un producto.

¿Para qué sirve realizar un experimento?

Los principales beneficios de usar la metodología del diseño de experimentos son:

Obtener información confiable. La información de los factores que intervienen en un proceso (y su


interacción entre ellos) se obtiene de manera más rápida y con evidencia estadística.
Mejoras de procesos al determinar la mejor respuesta de salida.
Reducción de los costes de producción y mantenimiento.

¿Qué proporciona un experimento?

La metodología del diseño de experimentos proporciona un procedimiento eficiente para planificar


experimentos, de forma que los datos obtenidos puedan ser analizados para alcanzar conclusiones y objetivos
válidos. Con esta técnica se puede conseguir, entre otras cosas, mejorar el rendimiento de un proceso, reducir
la variabilidad o los costes de producción y aumentar la calidad de los productos o servicios.

3.1. Tipos de variabilidad

Uno de los principales objetivos de los modelos de diseño de experimentos es estudiar la


variabilidad de un proceso.

Los resultados de cualquier experimento están sometidos a tres tipos de variabilidad:

5/25
Diseño de experimentos

Variabilidad sistemática y planificada

Se produce por las diferentes condiciones experimentales impuestas en el diseño por el propio experimentador.
Este tipo de variabilidad es parte del diseño y se espera que, cuando esta variabilidad existe de forma
importante, se agrupe formando clusters. Cuando exista este tipo de variabilidad, debería ser identificada y
cuantificada por el modelo.

Variabilidad típica de la naturaleza del problema y del experimento

Se debe al ruido aleatorio. El término de ruido aleatorio hace referencia al componente de variabilidad no
planificada, comúnmente denominada error de medida. Es una variabilidad impredecible, inevitable y que se
considera tolerable.

Variabilidad sistemática y no planificada

Produce una variación sistemática en los resultados y es debida a causas desconocidas y no planificadas.
Dicho de otro modo, existe un sesgo en los resultados producido sistemáticamente por causas desconocidas.
Esta variabilidad supone la principal causa de conclusiones erróneas y estudios sesgados al tratar de ajustar un
modelo estadístico de forma incorrecta.

Para controlar la variabilidad existen tres técnicas:

Replicados.

Aleatorización.

Formación de bloques.

3.2. Etapas en el diseño de experimentos


A continuación, se enumeran las etapas que deben seguirse para una correcta planificación de un diseño
experimental, etapas que deben ser ejecutadas de forma secuencial.

1. Objetivos

Definir los objetivos del experimento.

2. Identificar todas las posibles fuentes de variación

Una fuente de variación es cualquier cosa que pueda generar variabilidad en la respuesta. Se distinguen dos
tipos:

Factores tratamiento

Se denomina factor tratamiento a cualquier variable de interés para el experimentador cuyo posible efecto

6/25
Diseño de experimentos

sobre la respuesta se quiere estudiar. Los factores tratamiento pueden ser cualitativos o cuantitativos. Debe
tenerse en cuenta que los factores cuantitativos son tratados como cualitativos y sus niveles son elegidos
equiespaciados o se codifican. Cuando en un experimento se trabaja con más de un factor, se denomina:

Niveles

Son las distintas modalidades con las que se presenta un factor. Nivel del factor: es cada una de
las categorías, valores o formas especificas del factor.

Tratamiento

Cada una de las combinaciones de niveles de los distintos factores.

Observación

Es una medida en las condiciones determinadas por uno de los tratamientos.

Experimento factorial

Diseño de experimentos en que existen observaciones de todos los posibles tratamientos.

Unidades experimentales

Son los objetos, individuos, intervalos de espacio o tiempo sobre los que se experimenta.

Factores ruido

En cualquier experimento, además de los factores tratamiento cuyo efecto sobre la respuesta se quiere
evaluar, también influyen otros factores de escaso interés en el estudio, pero cuya influencia sobre la
respuesta puede aumentar significativamente la variabilidad no planificada. Pueden ser de diversos tipos.

Factor bloque

Si el factor de ruido es conocido y controlable, se utilizan bloques para eliminar su efecto en la


comparación estadística de los tratamientos. Desde un punto de vista matemático, el tratamiento
que se hace de los factores-bloque es el mismo que el de los factores tratamiento en los que no
hay interacción, pero su concepto dentro del modelo de diseño de experimentos es diferente. Un
factor bloque es un factor del que no se está interesado en conocer su influencia, pero se
incorpora al diseño del experimento para disminuir la variabilidad residual del modelo.

Covariable

Una covariable es cualquier variable continua, que usualmente no se controla durante la recogida
de datos. Incluyéndola en el modelo, permite incluir y adaptar las variables de entrada que se
midieron, pero no se aleatorizaron o controlaron en el experimento. Al agregar covariables, se
puede mejorar considerablemente la exactitud del modelo y se puede reducir el error en este para
incrementar la potencia de las pruebas de los factores.

Ruido

Si el experimentador está interesado en la variabilidad de la respuesta cuando se modifican las


condiciones experimentales, entonces los factores ruido son incluidos deliberadamente en el
experimento y no se aísla su efecto por medio de bloques. Se habla entonces de factores ruido.

7/25
Diseño de experimentos

3. ​R egla de asignación

Elegir las unidades experimentales y las reglas de asignación en relación con las condiciones de estudio. La
regla de asignación o diseño experimental especifica que unidades experimentales se observarán en cada
tratamiento.

4. Variable respuesta

Es importante precisar de antemano cuál es la variable respuesta y en qué unidades se mide. Además, es
importante anticiparse a los posibles problemas para intentar descubrir nuevas fuentes de variación o simplificar
el procedimiento experimental antes de comenzar.

5. Modelo de diseño

Especificar el modelo de diseño de experimentos. El tipo de modelo depende del tipo de los factores incluidos.
El tipo de un factor, a su vez, puede ser:

Factor de efectos fijos

Es un factor en el que los niveles han sido seleccionados por el experimentador. Es apropiado cuando el
interés se centra en comparar el efecto sobre la respuesta de esos niveles específicos. Ejemplo: un agricultor
está interesado en comparar el rendimiento de cuatro máquinas del mismo tipo que tiene su cooperativa.

Factor de efectos aleatorios

Es un factor del que solo se incluye en el experimento una muestra aleatoria simple de todos los posibles
niveles del mismo. Evidentemente, se utilizan estos factores cuando el experimento tiene un número muy
grande de niveles y no es razonable o posible trabajar con todos ellos. En este caso, interesa examinar la
variabilidad de la respuesta debida a la población entera de niveles del factor. Ejemplo: una empresa
multinacional que tiene en plantilla 3 500 trabajadores está interesada en estudiar la influencia del factor
trabajador en la variable tiempo de respuesta a un cliente.

El modelo, según sean los factores incluidos, se puede clasificar en:

Modelo de efectos fijos

Todos los factores son factores de efectos fijos.

Modelo de efectos aleatorios

Todos los factores son factores de efectos aleatorios.

Modelo mixto

Hay factores de efectos fijos y factores de efectos aleatorios.

8/25
Diseño de experimentos

6. Análisis estadístico

En esta etapa no se debe perder de vista que los resultados experimentales son observaciones muestrales, no
poblacionales. Por ello, se debe recurrir a métodos estadísticos inferenciales para ver si las diferencias o
efectos muestrales (experimentales) son lo suficientemente grandes para que garanticen diferencias
poblacionales (o a nivel proceso). La técnica estadística central en el análisis de los experimentos es el llamado
análisis de varianza ANOVA, que se verá en el siguiente apartado.

7. Interpretación y conclusiones

Aquí, con el respaldo del análisis estadístico formal, se debe analizar con detalle lo que ha pasado en el
experimento, desde contrastar las conjeturas iniciales con los resultados del experimento, hasta observar los
nuevos aprendizajes que sobre el proceso se lograron, verificar supuestos y elegir el tratamiento ganador,
siempre con apoyo de las pruebas estadísticas.

IV. Análisis de varianza (ANOVA)


Los procedimientos de las pruebas t vistos en la unidad tres sirven también para comparar dos muestras y
permiten comparar las medias de dos poblaciones o las respuestas medias a dos tratamientos de un
experimento. Sin embargo, en ocasiones se necesitan comparar más de dos grupos.

El modelo del análisis de la varianza (ANOVA) permitirá abordar este tipo de situaciones. Se
trata de una generalización de los t-test para dos muestras al caso de diseños con más de dos
muestras.

Variable independiente

Variable categórica que define los grupos a comparar se le llama variable independiente o factor

Variable dependiente

Variable cuantitativa en la que se comparan los grupos, se llama variable dependiente.

Los factores o variables independientes pueden ser a su vez de dos tipos:

Los factores que varían entre sujetos son los que no se miden dos (o más) veces para un mismo sujeto: la edad
(un sujeto no puede tener dos edades diferentes), el género, la raza, etc. O simplemente los que, según el
experimento, solo afectan una vez a cada sujeto. A cada sujeto se le asigna un único valor para ese factor.

9/25
Diseño de experimentos

Los factores que varían dentro de los sujetos, conocidos también como intrasujetos, son los que se miden varias
veces para el mismo sujeto.

Por ejemplo: seguimiento del mismo tratamiento tomando muestras en varios momentos.
Los momentos en los que se toman las muestras son niveles y el tiempo es el factor
intrasujetos, ya que para un mismo sujeto se repiten las mediciones. A cada sujeto se le
asignan tantos valores de ese factor como niveles tenga este.

Esta diferenciación de los tipos de factores será muy importante a la hora de elegir entre los diferentes modelos
ANOVA a utilizar.

4.1. ANOVA de una vía (entre sujetos)


ANOVA de una vía (one way ANOVA)

También conocido como ANOVA de un factor, examina la igualdad de las medias de la población para un
resultado cuantitativo y una única variable categórica con dos o más niveles de tratamiento. Cada sujeto estará
expuesto a un único nivel de este tratamiento. La hipótesis nula es que no hay diferencia entre las medias de las
variables categóricas y la alternativa; que al menos una de las medias de un nivel difiere del resto.

El hecho de verificar la hipótesis nula de que hay igualdad de medias entre grupos se puede interpretar como
que las observaciones proceden de un único grupo cuya media y variabilidad es la misma que la de cualquiera
de los grupos por separado. ANOVA es la forma más simple de mediar la variabilidad.

La cuestión es que, si alguno de los grupos presenta unos valores que en media se alejan del
resto, esto se apreciará en el contraste como una fuente extra de variabilidad no explicable por
el azar. Se trata de identificar cuándo se rechaza la hipótesis nula (cuando el p-valor es menor
que 0,05) y cuándo se acepta (cuando es mayor).

Hay una serie de premisas que se deben cumplir, ordenadas de mayor exigencia a menor, para poder llevar a cabo
el modelo ANOVA de una vía:

Independencia de las observaciones

Dos observaciones son independientes cuando una no depende de la otra. Es decir: el resultado de la primera
observación no influye en el resultado de la siguiente. Este supuesto es el más importante, ya que, de no
cumplirse, esto puede invalidar las conclusiones del análisis porque produce errores en el cálculo de las
varianzas y, por tanto, en los intervalos de confianza y las pruebas de hipótesis deducidas.

10/25
Diseño de experimentos

Homocedasticidad

Hay que comprobar que las varianzas de los grupos son iguales. Para ello, se puede emplear el test de
homoceasticidad visto en la unidad cuatro.

Normalidad

La distribución de los datos debe aproximarse a la de una normal. Se vio en la unidad tres cómo comprobarlo.

Un ejemplo con este tipo de ANOVA

Una empresa de telecomunicaciones está interesada en conocer si hay algún día laborable más propenso para
captar clientes. Para ello, se diseñaron cinco campañas con los siguientes nombres para cada día de la semana
a lo largo de seis semanas: rojo (lunes), amarillo (martes), azul (miércoles), blanco (jueves) y verde (viernes). Se
cuantificó el número de captados:

Rojo: 178, 120, 300, 400, 500, 340.


Azul: 160, 111, 200, 201, 140, 70.
Verde: 370, 320, 150, 250, 390, 410.
Blanco: 210, 120, 140, 170, 130, 170.
Amarillo: 450, 590, 480, 460, 380, 470.

Para calcular la tabla ANOVA, primero se hace uso de la función “aov” de la siguiente forma:

clientesnuevos <- c(178, 120, 300, 400 ,500, 340,160, 111 ,200 ,201 ,140 ,70,370, 320, 150, 250, 390
,410,210, 120 ,140, 170 ,130 ,170,450, 590 ,480 ,460 ,380 ,470)
campanya <- as.factor(c(rep(c("rojo","azul", "verde", "blanco", "amarillo"), each =6)))
boxplot(clientesnuevos ~ campanya, col = c("red","yellow", "blue", "white","green") , ylab =
"Número de clientes nuevos")

Esta es la forma de llevar a cabo un ANOVA en R:

anova <- aov( lm(clientesnuevos ~ campanya))


anova

## Call:
## aov(formula = lm(clientesnuevos ~ campanya))
##
## Terms:
## campanya Residuals
## Sum of Squares 429314.7 189578.0
## Deg. of Freedom 4 25
##
## Residual standard error: 87.08111
## Estimated effects may be unbalanced

11/25
Diseño de experimentos

summary(anova)

Df Sum Sq Mean Sq F value Pr(>F)


campanya 4 429315 107329 14.15 3.65e-06 ***
Residuals 25 189578 7583
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Elementos generados en el ANOVA:

names(anova)

## [1] "coefficients" "residuals" "effects" "rank"


## [5] "fitted.values" "assign" "qr" "df.residual"
## [9] "contrasts" "xlevels" "call" "terms"
## [13] "model"

Bajo H0, el estadístico de contraste F se distribuye como una F de grados de libertad (I-1) (visto
en la unidad tres), (n-I) donde I es el número de grupos disponibles y n el tamaño total de la
muestra. Se obtiene el cuantil buscado mediante la siguiente función de R:

Los argumentos que se pueden pasar a las funciones expuestas en la anterior tabla son:

Vector de probabilidades.

df1, df2:

Grados de libertad; “df1” corresponde al numerador y “df2” al denominador.

ncp

Parámetro que determina la centralidad de la gráfica de la distribución F. Si se omite, el estudio se realiza con
la gráfica no centralizada.

“lower.tail”

Parámetro booleano. Si es TRUE (por defecto), las probabilidades son P[X ≤ x]; de lo contrario, P [X > x].

qf(0.05, 3-1, 18-3, lower.tail = F)

## [1] 3.68232

12/25
Diseño de experimentos

Valores del estadístico > 3,68232 estarán incluidos en la región de rechazo. En este caso, el F obtenido en el test
ANOVA que se pudo ver antes, 14,15 es mucho mayor que el valor crítico obtenido.

V. Clasificación y selección de los diseños experimentales


Existen muchos diseños experimentales para estudiar la gran diversidad de situaciones que ocurren en la
práctica.
Esta cantidad de diseños hace necesario saber cómo elegir el más adecuado para una situación dada y, por ende,
es preciso conocer cómo se clasifican los diseños de acuerdo con su objetivo y su alcance.

Los cinco aspectos que más influyen en la selección de un diseño experimental, por lo general, llevan a cambiar de
diseño, son:

El número de factores a estudiar.

El número de niveles que se prueban en cada factor.

El objetivo del experimento.

Los efectos que interesa investigar (relación factores-respuesta).

El costo del experimento, tiempo y precisión deseada.

Utilizando el número de variables, los diseños experimentales se clasifican en:

Diseños experimentales univariados

Estudian una variable. Se clasifican:

Intersujeto:

De grupos aleatorios

Dos grupos.
Multigrupo.

13/25
Diseño de experimentos

De bloques

Bloques al azar.
Cuadrado latino.
Grupos apareados.

Mixtos.

Estudian más de una variable. Se clasifican en:

Intersujeto

De grupos aleatorios.
De bloques.

Intrasujeto

Mixtos.

VI. Diseños unifactoriales intersujetos


Los diseños unifactoriales intersujetos

Son aquellos que se realizan sobre los mismos sujetos que pasan por todas las condiciones experimentales. Se
llevan a cabo comparaciones entre las distintas condiciones y se utilizan las medidas de cada sujeto para medir
estas.

Este tipo de diseño es especialmente útil para el estudio del comportamiento de un mismo grupo de
personas bajo distintas condiciones.

Diseños de grupos aleatorios


Se basa en formar grupos de manera aleatoria y asignarles, también aleatoriamente, el tratamiento. Es un
diseño poco usado, pues, debido a su sencillez, aporta poca información.

Los diseños de dos grupos pueden ser:

Diseño de dos grupos completamente al azar.

Diseño de dos grupos emparejados.

14/25
Diseño de experimentos

Este tipo de diseño suele ser utilizado con mayor frecuencia en el ámbito clínico: una de las situaciones más
simples de investigación clínica es aquella en la que se trabaja con dos grupos (normalmente, uno de control y otro
experimental).

Ejemplo

Se pretende estudiar el efecto de dos campañas de fidelidad sobre la tasa de retención de una compañía de
seguros y se hace la predicción de que la campaña A determinará una mejor tasa de retención que la campaña
B.
Para comenzar, se selecciona una muestra aleatoria de 12 clientes que fueron asignados al azar en una
encuesta a las dos condiciones de tratamiento (campañas). A continuación, se aplica a los sujetos una prueba
de serie de preguntas relacionados con su seguro valorando en una escala de Likert (del 1 al 5).

Así pues, en este experimento se trata de comparar la ejecución o variable de medida de dos grupos
independientes formados por sujetos elegidos al azar de una población.

En él se utiliza como unidad de medida el ítem de la pregunta. Dado que todos los ítems tienen el mismo
valor asociativo, debe entenderse que dicha unidad es constante y que, en consecuencia, se trata de una
escala de intervalo.

Partiendo de estos presupuestos y teniendo en cuenta que los datos proceden de una población con
distribución normal, se puede utilizar como prueba de hipótesis la t de Student.

Diseño multigrupo
Los diseños multigrupo

Son estructuras con una sola variable independiente de tres o más valores o niveles. El diseño multigrupo
totalmente al azar requiere la asignación aleatoria de los sujetos de la muestra a los distintos grupos, sin
restricción alguna. Se suelen utilizar cuando, además de la magnitud del efecto, interesa precisar el tipo de
relación.

Las pruebas estadísticas a realizar en este tipo de experimentos son:

Prueba de significación general → Análisis de la variancia (ANOVA) unifactorial para datos independientes.
Datos no relacionados.

Si la variable independiente es categórica o cuantitativa → Comparaciones múltiples (contrastes parciales).

15/25
Diseño de experimentos

Si la variable independiente es cuantitativa → Análisis de tendencias. Este análisis trata de ajustar funciones
matemáticas (tendencias) que relacionen la variable independiente con la variable dependiente.

Ejemplo

En un grupo de estudiantes se quiere comprobar si el repaso es una variable decisiva para retener mejor los
conocimientos de un examen. Por ello se establecen los siguientes niveles de repaso:

Una sola presentación de los temas y, por tanto, condición sin repaso (A1).
Dos presentaciones sucesivas del mismo tema (A2).
Tres presentaciones del mismo tema (A3).
Cuatro presentaciones (A4).

La tasa de presentación es, en todos los casos, de 10 minutos por tema. El estudiante lee en voz alta cada
tema. Acto seguido, se pasa a una prueba de test (variable criterio) y se contabiliza la cantidad de respuestas
correctas. Así se obtienen los siguientes datos hipotéticos del experimento:

Matriz de datos

Matriz de datos

S1 S2 S3 S4

2 4 3 9

1 3 7 7

1 1 10 10

6 7 7 9

8 3 2 10

Diseños de bloques

16/25
Diseño de experimentos

El diseño de bloques aleatorizados

Se utiliza frecuentemente para minimizar el efecto de la variabilidad cuando se asocia con unidades discretas
(por ejemplo, ubicación, operador, planta, lote, tiempo). Garantizan los grupos equivalentes.

Utiliza la técnica de bloqueo y puede usarse tanto en diseños unifactoriales como factoriales. Minimiza la varianza
error y controla la varianza sistemática.

La variable de bloqueo se mide antes de formar los grupos para garantizar su equivalencia. La
medida pretratamiento se toma una vez formados los grupos para comprobar que son
equivalentes.

El análisis de datos se realiza con las mismas técnicas que para los grupos aleatorios independientes:

Con técnicas de dos variables: incorporando la VB como variable de estudio a la hora de analizar los datos
(ANOVA de dos factores o ANCOVA).

En el caso de los grupos apareados, una prueba de muestras relacionadas (paramétricas o no paramétricas).

Existen diferentes tipos de diseños de bloques aleatorios:

Diseños de bloques aleatorios completos

Cada bloque constituye una réplica exacta del experimento porque dentro de cada bloque se aplican todos los
niveles.

Diseños de bloques aleatorios incompletos

Se aplican sólo algunas condiciones dentro de cada bloque.

Diseño de grupos aparejados o equiparados

Los sujetos tienen que ser idénticos (en los anteriores, bastaba con que fueran similares). En este caso a la VB
se la denomina variable de apareo (VA) o variable equiparada. Ejemplo: pares de gemelos criados juntos.

Ejemplo

Este tipo de diseño de experimentos se usa frecuentemente en la agricultura. En el siguiente ejemplo se calcula
en R el rendimiento del grano de arroz de variedad IR8 con seis diferentes niveles de siembra, usando diseño
de BCA con cuatro repeticiones. (Gómez y Gómez, 1984).

Rendimiento de grano de arroz variedad IR8 con seis diferentes niveles de siembra, usando diseño de BCA
con cuatro repeticiones

17/25
Diseño de experimentos

trt rep rend

1 25 RepI 5113

2 25 RepII 5398

3 25 RepIII 5307

4 25 RepIV 4678

5 50 RepI 5346

6 50 RepII 5952

7 50 RepIII 4719

8 50 RepIV 4264

9 75 RepI 5272

10 75 RepII 5713

11 75 RepIII 5483

12 75 RepIV 4749

13 100 RepI 5164

14 100 RepII 4831

15 100 RepIII 4986

16 100 RepIV 4410

17 125 RepI 4804

18 125 RepII 4848

19 125 RepIII 4432

20 125 RepIV 4748

21 150 RepI 5254

22 150 RepII 4542

23 150 RepIII 4919

24 150 RepIV 4098

str(semilla)

'data.frame': 24 obs. of 3 variables:

18/25
Diseño de experimentos

$ trt : int 25 25 25 25 50 50 50 50 75 75 ...

$ rep : Factor w/ 4 levels "RepI","RepII",..: 1 2 3 4 1 2 3 4 1 2 ...

$ rend: int 5113 5398 5307 4678 5346 5952 4719 4264 5272 5713 ...

# Convirtiendo "trt" en variables categóricas

semilla$trt = factor(semilla$trt)

# Reorganizando tabla (no necesario)

attach(semilla)

xtabs(rend ~ trt + rep)

rep

trt RepI RepII RepIII RepIV

25 5113 5398 5307 4678

50 5346 5952 4719 4264

75 5272 5713 5483 4749

100 5164 4831 4986 4410

125 4804 4848 4432 4748

150 5254 4542 4919 4098

# Gráfico

with (semilla, interaction.plot(rep, trt, rend))

# Análisis de varianza (completo)

anova(lm(rend ~ rep + trt))

Analysis of Variance Table

Response: rend

19/25
Diseño de experimentos

Df Sum Sq Mean Sq F value Pr(>F)

rep 3 1944361 648120 5.86 0.0074 **

trt 5 1198331 239666 2.17 0.1128

Residuals 15 1658376 110558

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# Análisis de varianza (sin bloques)

anova(lm(rend ~ trt))

Analysis of Variance Table

Response: rend

Df Sum Sq Mean Sq F value Pr(>F)

trt 5 1198331 239666 1.2 0.35

Residuals 18 3602737 200152

# Diagnosticos del modelo

plot(lm(rend ~ rep + trt))

20/25
Diseño de experimentos

21/25
Diseño de experimentos

22/25
Diseño de experimentos

VII. Resumen

En esta unidad, se ha introducido el diseño estadístico de experimentos. Se han indicado


la s limitaciones de la experimentación tradicional variando un factor cada vez y se han
presentado las etapas en la aplicación del diseño estadístico de experimentos.

L a experimentación es intrínseca a la mayoría de las investigaciones científicas y


tecnológicas, en muchas de las cuales, los resultados de la variable de interés se ven afectados
por la presencia de distintos factores, cuya influencia puede estar oculta por la variabilidad de
los resultados muestrales. Es fundamental conocer los factores que influyen realmente y
estimar esta influencia. Para lograrlo, será necesario diseñar los experimentos.

U n diseño experimental quedará determinado por la elección de las unidades


experimentales, los tratamientos, y el mecanismo de asignación de los tratamientos a las
unidades. Del análisis estadístico de la información recogida en la experimentación se
derivarán las conclusiones.

23/25
Diseño de experimentos

Ejercicios

Caso práctico
I. PROBLEMA

Una empresa quiere determinar si las diferentes formaciones que reciben sus empleados tienen influencia en el
tiempo que tardan en realizar una tarea. Los doce empleados nuevos son distribuidos en cuatro grupos de tres
personas cada uno. A cada grupo, se le asigna aleatoriamente un tipo de formación. Los resultados en la
mencionada tarea, con el correspondiente tipo de formación, son los siguientes:

tiempo=c(2,3,5,6,4,2,3,5,2,3,1,4)
formacion = as.factor(rep(c("1","2","3","4"),each=3))
(datos=data.frame(tiempo,formacion))

## tiempo formacion
## 1 2 1
## 2 3 1
## 3 5 1
## 4 6 2
## 5 4 2
## 6 2 2
## 7 3 3
## 8 5 3
## 9 2 3
## 10 3 4
## 11 1 4
## 12 4 4

Se pide
¿Qué conclusiones se obtienen? ¿La formación tiene influencia sobre los tiempos o no?

Solución
La solución de este caso práctico viene resuelta en el siguiente archivo: solución.

24/25
Diseño de experimentos

Recursos

Glosario.
Aleatorización: consiste en hacer experimentos en orden aleatorio. Este principio aumenta la posibilidad
de que el supuesto de independencia de los errores se cumpla. Asignación al azar de tratamiento a las
unidades experimentales. Es una suposición frecuente en los modelos estadísticos de diseño de
experimentos en que las observaciones o los errores en ellas están distribuidos independientemente. La
aleatorización hace válida esta suposición.

Bloqueo: es tomar en cuenta de forma adecuada todos los factores que pueden afectar a la respuesta
observada. Distribución de las unidades experimentales en bloques, de manera que las unidades dentro de
un bloqueo sean relativamente homogéneas. De esta manera, la mayor parte de la variación predecible
entre las unidades queda confundida con el efecto de los bloques.

Error experimental: componente del error aleatorio que refleja los errores del experimentador en la
planificación y ejecución del experimento.

Factor: una variable independiente. En la mayoría de las investigaciones se trata con más de una variable
independiente y con los cambios que ocurren estas cuando varían una o más de las variables
independientes.

Tratamiento: conjunto particular de condiciones experimentales que deben imponerse a una unidad
experimental dentro de los confines del diseño seleccionado.

Unidad experimental: es la muestra de unidades que es necesario producir en una condición para obtener
una medición o dato representativo. Unidad a la cual se le aplica un solo tratamiento en una reproducción
del experimento.

Variables de respuesta: es la característica del producto cuyo valor interesa mejorar mediante el diseño
de experimentos.

25/25

También podría gustarte