Comprime Un Fichero, Al Utilizar Un Programa de Compresión Teniendo en Cuenta El Tipo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 19

Introducción

Los modelos de diseño de experimentos son modelos estadísticos clásicos cuyo objetivo
es averiguar si unos determinados factores influyen en una variable de interés y, si existe
influencia de algún factor, cuantificar dicha influencia.
Unos ejemplos donde habría que utilizar estos modelos son los siguientes:

—En el rendimiento de un determinado tipo de máquina (unidades producidas por día):


se desea estudiar la influencia del trabajador que la maneja y la marca de la máquina.

—Se quiere estudiar la influencia de un tipo de pila eléctrica y de la marca, en la


duración de las pilas.

—Una compañía telefónica está interesada en conocer la influencia de varios factores en


la variable duración de una llamada telefónica. Los factores que se consideran son los
siguientes: hora a la que se produce la llamada; día de la semana en que se realiza la
llamada; zona de la ciudad desde la que se hace la llamada; sexo del que realiza la
llamada; tipo de teléfono (público o privado) desde el que se realiza la llamada.

—Una compañía de software está interesada en estudiar la variable porcentaje en que se


comprime un fichero, al utilizar un programa de compresión teniendo en cuenta el tipo
de programa utilizado y el tipo de fichero que se comprime.

—Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se
desean controlar diferentes factores: profesor que imparte la asignatura; método de
enseñanza; sexo del alumno.
La metodología del diseño de experimentos se basa en la experimentación. Es sabido
que si se repite un experimento, en condiciones indistinguibles, los resultados presentan una
cier- ta variabilidad. Si la experimentación se realiza en un laboratorio donde la mayoría de
las causas de variabilidad están muy controladas, el error experimental será pequeño y
habrá poca variación en los resultados del experimento. Pero si se experimenta en procesos
industriales o administrativos la variabilidad será mayor en la mayoría de los casos.
El objetivo del diseño de experimentos es estudiar si cuando se utiliza un determinado
tratamiento se produce una mejora en el proceso o no. Para ello se debe experimentar
aplicando el tratamiento y no aplicándolo. Si la variabilidad experimental es grande, sólo se
detectará la influencia del uso del tratamiento cuando éste produzca grandes cambios en
relación con el error de observación.
La metodología del diseño de experimentos estudia cómo variar las condiciones
habituales de realización de un proceso empírico para aumentar la probabilidad de detectar
cambios signi- ficativos en la respuesta; de esta forma se obtiene un mayor conocimiento del
comportamiento del proceso de interés.
Para que la metodología de diseño de experimentos sea eficaz es fundamental que el
experimento esté bien diseñado.
Un experimento se realiza por alguno de los siguientes motivos:
—Determinar las principales causas de variación en la respuesta.

—Encontrar las condiciones experimentales con las que se consigue un valor extremo en
la variable de interés o respuesta.
—Comparar las respuestas en diferentes niveles de observación de variables controladas.

—Obtener un modelo estadístico-matemático que permita hacer predicciones de


respuestas futuras.

La utilización de los modelos de diseño de experimentos se basa en la experimentación


y en el análisis de los resultados que se obtienen en un experimento bien planificado. En
muy pocas ocasiones es posible utilizar estos métodos a partir de datos disponibles o datos
históricos, aunque también se puede aprender de los estudios realizados a partir de datos
recogidos por observación, de forma aleatoria y no planificada. En el análisis estadístico de
datos históricos se pueden cometer diferentes errores, los más comunes son los siguientes
Tipos de variabilidad

Uno de los principales objetivos de los modelos estadísticos y, en particular, de los


modelos de diseño de experimentos, es controlar la variabilidad de un proceso aleatorio que
puede tener diferente origen. De hecho, los resultados de cualquier experimento están
sometidos a tres tipos de variabilidad cuyas características son las siguientes:

—Variabilidad sistemática y planificada: Esta variabilidad viene originada por la posi-


ble dispersión de los resultados debida a diferencias sistemáticas entre las
distintas condi- ciones experimentales impuestas en el diseño por expreso deseo
del experimentador. Es el tipo de variabilidad que se intenta identificar con el
diseño estadístico.
Cuando este tipo de variabilidad está presente y tiene un tamaño importante, se
espera que las respuestas tiendan a agruparse formando grupos (clusters).
Es deseable que exista esta variabilidad y que sea identificada y cuantificada por el
modelo.

—Variabilidad típica de la naturaleza del problema y del experimento: Es la va-


riabilidad debida al ruido aleatorio. Este término incluye, entre otros, a la
componente de variabilidad no planificada denominada error de medida. Es una
variabilidad impredecible e inevitable.

Esta variabilidad es la causante de que si en un laboratorio se toman medidas


repetidas de un mismo objeto ocurra que, en muchos casos, la segunda medida no
sea igual a la primera y, más aún, no se puede predecir sin error el valor de la tercera.
Sin embargo, bajo el aparente caos, existe un patrón regular de comportamiento en
esas medidas: todas ellas tenderán a fluctuar en torno a un valor central y siguiendo
un modelo de probabilidad que será importante estimar.

Esta variabilidad es inevitable pero, si el experimento ha sido bien planificado, es


posible estimar (medir) su valor, lo que es de gran importancia para obtener
conclusiones y poder hacer predicciones. Es una variabilidad que va a estar siempre
presente pero que es tolerable.

—Variabilidad sistemática y no planificada: Esta variabilidad produce una variación


sistemática en los resultados y es debida a causas desconocidas y no
planificadas. En otras palabras, los resultados están siendo sesgados
sistemáticamente por causas desconocidas. La presencia de esta variabilidad
supone la principal causa de conclusiones erróneas y estudios incorrectos al
ajustar un modelo estadístico.

Como se estudiará posteriormente, existen dos estrategias básicas para tratar de


evitar la presencia de este tipo de variabilidad: la aleatorización y la técnica de bloques.
Este tipo de variabilidad debe de intentar evitarse y su presencia lleva a conclusiones
erróneas.

Planificación de un experimento
La experimentación forma parte natural de la mayoría de las investigaciones científicas e
industriales, en muchas de las cuales, los resultados del proceso de interés se ven afectados
por la presencia de distintos factores, cuya influencia puede estar oculta por la
variabilidad
de los resultados muestrales. Es fundamental conocer los factores que influyen realmente y
estimar esta influencia. Para conseguir esto es necesario experimentar, variar las
condiciones que afectan a las unidades experimentales y observar la variable respuesta. Del
análisis y estudio de la información recogida se obtienen las conclusiones.
La forma tradicional que se utilizaba en la experimentación, para el estudio de estos pro-
blemas, se basaba en estudiar los factores uno a uno, esto es, variar los niveles de un factor
permaneciendo fijos los demás. Esta metodología presenta grandes inconvenientes:
—Es necesario un gran número de pruebas.

—Las conclusiones obtenidas en el estudio de cada factor tiene un campo de validez


muy restringido.
—No es posible estudiar la existencia de interacción entre los factores.
—Es inviable, en muchos casos, por problemas de tiempo o costo.

Las técnicas de diseño de experimentos se basan en estudiar simultáneamente los


efectos de todos los factores de interés, son más eficaces y proporcionan mejores resultados
con un menor coste.
A continuación se enumeran las etapas que deben seguirse para una correcta
planificación de un diseño experimental, etapas que deben ser ejecutadas de forma
secuencial. También se introducen algunos conceptos básicos en el estudio de los modelos
de diseño de experimentos.
Las etapas a seguir en el desarrollo de un problema de diseño de experimentos son
las siguientes:

—Definir los objetivos del experimento. Identificar todas las posibles fuentes de variación,
incluyendo:

(i) factores tratamiento y sus


niveles, (ii) unidades experimentales,
(iii) factores nuisance (molestos): factores bloque, factores ruido y covariables.

—Elegir una regla de asignación de las unidades experimentales a las condiciones de


estudio (tratamientos).
—Especificar las medidas con que se trabajará (la respuesta), el procedimiento
experimental y anticiparse a las posibles dificultades.
—Ejecutar un experimento piloto.
—Especificar el modelo.
—Esquematizar los pasos del análisis.
—Determinar el tamaño muestral.
—Revisar las decisiones anteriores. Modificarlas si se considera necesario.

Los pasos del listado anterior no son independientes y en un determinado momento


puede ser necesario volver atrás y modificar decisiones tomadas en algún paso previo.
A continuación se hace una breve descripción de las decisiones que hay que tomar en
cada uno de los pasos enumerados. Sólo después de haber tomado estas decisiones se
procederá a realizar el experimento.

1. Definir los objetivos del experimento: Se debe hacer una lista completa de las
preguntas concretas a las que debe dar respuesta el experimento. Es importante
indicar solamente cuestiones fundamentales ya que tratar de abordar problemas
colaterales pueden com- plicar innecesariamente el experimento.

Una vez elaborada la lista de objetivos, puede ser útil esquematizar el tipo de
conclusiones que se espera obtener en el posterior análisis de datos.

Normalmente la lista de objetivos es refinada a medida que se van ejecutando las


etapas del diseño de experimentos.

2. Identificar todas las posibles fuentes de variación: Una fuente de variación es cualquier
cosa que pueda generar variabilidad en la respuesta. Es recomendable hacer una lista
de todas las posibles fuentes de variación del problema, distinguiendo aquellas que, a
priori, generarán una mayor variabilidad. Se distinguen dos tipos:

— Factores tratamiento: son aquellas fuentes cuyo efecto sobre la respuesta es de


par- ticular interés para el experimentador.

— Factores nuisance: son aquellas fuentes que no son de interés directo pero que
se contemplan en el diseño para reducir la variabilidad no planificada.
A continuación se precisan más estos importantes conceptos.
(i) Factores y sus niveles.

Se denomina factor tratamiento a cualquier variable de interés para el experimenta-


dor cuyo posible efecto sobre la respuesta se quiere estudiar. Los niveles de un factor
tratamiento son los tipos o grados específicos del factor que se tendrán en cuenta en
la realización del experimento. Los factores tratamiento pueden ser cualitativos o
cuantita- tivos. Ejemplos de factores cualitativos y sus niveles respectivos son los
siguientes:
— proveedor (diferentes proveedores de una materia prima),
— tipo de máquina (diferentes tipos o marcas de máquinas),
— trabajador (los trabajadores encargados de hacer una tarea),

— tipo de procesador (los procesadores de los que se quiere comparar su


velocidad de ejecución),
— un aditivo químico (diferentes tipos de aditivos químicos),
— el sexo (hombre y mujer),

— un método de enseñanza (un número determinado de métodos de enseñanza


cuyos resultados se quieren comparar).
Ejemplos de factores cuantitativos son los siguientes:
— tamaño de memoria (diferentes tamaños de memoria de ordenadores),
— droga (distintas cantidades de la droga),

— la temperatura (conjuntos de temperaturas seleccionadas en unos rangos de


interés). Debe tenerse en cuenta que en el tratamiento matemático de los modelos de
diseño de experimento los factores cuantitativos son tratados como cualitativos y sus
niveles son
elegidos equiespaciados o se codifican. Por lo general, un factor no suele tener más
de
cuatro niveles.
Cuando en un experimento se trabaja con más de un factor, se denomina:
Tratamiento, a cada una de las combinaciones de niveles de los distintos factores.
Observación, es una medida en las condiciones determinadas por uno de los
tratamientos.
Experimento factorial, es el diseño de experimentos en que existen observaciones de
todos los posibles tratamientos.
(ii) Unidades experimentales.

Son el material donde evaluar la variable respuesta y al que se le aplican los distintos
niveles de los factores tratamiento.
Ejemplos de unidades experimentales son:
— en informática, ordenadores, páginas web, buscadores de internet,
— en agricultura, parcelas de tierra,
— en medicina, individuos humanos u animales,
— en industria, lotes de material, trabajadores, máquinas.

Cuando un experimento se ejecuta sobre un período de tiempo de modo que las


obser- vaciones se recogen secuencialmente en instantes de tiempo determinados,
entonces los propios instantes de tiempo pueden considerarse unidades
experimentales.

Es muy importante que las unidades experimentales sean representativas de la


población sobre la que se han fijado los objetivos del estudio. Por ejemplo, si se
utilizan los es- tudiantes universitarios de un país como unidades experimentales, las
conclusiones del experimento no son extrapolables a toda la población adulta del país.
(iii) Factores nuisance: bloques, factores ruido y covariables.

En cualquier experimento, además de los factores tratamiento cuyo efecto sobre la re-
spuesta se quiere evaluar, también influyen otros factores, de escaso interés en el
estudio, pero cuya influencia sobre la respuesta puede aumentar significativamente la
variabilidad no planificada. Con el fin de controlar esta influencia pueden incluirse en el
diseño nuevos factores que, atendiendo a su naturaleza, pueden ser de diversos tipos.

Factor bloque: En algunos casos el factor nuisance puede ser fijado en


distintos niveles, de modo que es posible controlar su efecto a esos niveles.
Entonces la forma de actuar es mantener constante el nivel del factor para un
grupo de unidades experimentales, se cambia a otro nivel para otro grupo y
así sucesivamente. Estos factores se denominan factores de bloqueo (factores
bloque) y las unidades experimentales evaluadas en un mis- mo nivel del bloqueo
se dice que pertenecen al mismo bloque. Incluso cuando el factor
nuisance no es medible, a veces es posible agrupar las unidades experimentales en
bloques de unidades similares: parcelas de tierra contiguas o períodos de tiempo
próximos prob- ablemente conduzcan a unidades experimentales más parecidas que
parcelas o períodos distantes.

Los modelos de diseño de experimentos, según sean los factores incluidos en el


mismo, se pueden clasificar en: modelo de efectos fijos, modelo de efectos aleatorios
y modelos mixtos. A continuación se precisan estas definiciones.

Factor de efectos fijos es un factor en el que los niveles han sido seleccionados por el
experimentador. Es apropiado cuando el interés se centra en comparar el efecto sobre
la respuesta de esos niveles específicos. Ejemplo: un empresario está interesado en
comparar el rendimiento de tres máquinas del mismo tipo que tiene en su empresa.
Factor de efectos aleatorios es un factor del que sólo se incluyen en el experimento una
muestra aleatoria simple de todos los posibles niveles del mismo. Evidentemente se
utilizan estos factores cuando tienen un número muy grande de niveles y no es
razonable o posible trabajar con todos ellos. En este caso se está interesado en
examinar la variabilidad de la respuesta debida a la población entera de niveles del
factor. Ejemplo: una cadena de hipermercados que tiene en plantilla 300 trabajadores de
caja está interesada en estudiar la influencia del factor trabajador en la variable tiempo
en el cobro çr en cuenta que:
a) Ningún método de análisis estadístico, por sofisticado que sea, permite extraer
conclusiones correctas en un diseño de experimentos mal planificado.
Recíprocamente, debe quedar claro que el análisis estadístico es una etapa más
que está completa- mente integrado en el proceso de planificación.

b) El análisis estadístico no es un segundo paso independiente de la tarea de


planificación. Es necesario comprender la totalidad de objetivos propuestos antes
de comenzar con el análisis. Si no se hace así, tratar que el experimento
responda a otras cuestiones a posteriori puede ser (lo será casi siempre)
imposible. Pero no sólo los objetivos están presentes al inicio del análisis sino
también la técnica experimental empleada.

c) No invertir nunca todo el presupuesto en un primer conjunto de experimentos y


utilizar en su diseño toda la información previa disponible.

d) ) Toda persona implicada en la ejecución del experimento y en la recolección de


los datos debe ser informada con precisión de la estrategia experimental
diseñada

Resumen de los principales conceptos

En esta sección se hace un resumen de la terminología común utilizada en la teoría de


los modelos de diseño de experimentos:

—Unidad experimental: son los objetos, individuos, intervalos de espacio o tiempo


sobre los que se experimenta.

—Variable de interés o respuesta: es la variable que se desea estudiar y controlar su


variabilidad.

—Factor: son las variables independientes que pueden influir en la variabilidad de la


variable de interés.
—Factor tratamiento: es un factor del que interesa conocer su influencia en la
respuesta.
—Factor bloque: es un factor en el que no se está interesado en conocer su
influencia en la respuesta pero se supone que ésta existe y se quiere controlar
para disminuir la variabilidad residual.
—Niveles: cada uno de los resultados de un factor. Según sean elegidos por el
experimen- tador o elegidos al azar de una amplia población se denominan factores de
efectos fijos o factores de efectos aleatorios.

—Tratamiento: es una combinación específica de los niveles de los factores en estudio.


Son, por tanto, las condiciones experimentales que se desean comparar en el
experimento. En un diseño con un único factor son los distintos niveles del factor y en
un diseño con varios factores son las distintas combinaciones de niveles de los
factores.
—Observación experimental: es cada medición de la variable respuesta.
—Tamaño del Experimento: es el número total de observaciones recogidas en el
diseño.

—Interacción de factores: existe interacción entre dos factores FI y FJ si el efecto de


algún nivel de FI cambia al cambiar de nivel en FJ . Esta definición puede hacerse
de forma simétrica y se puede generalizar a interacciones de orden tres o superior.

—Ortogonalidad de factores: dos factores FI y FJ con I y J niveles,


respectivamente, son ortogonales si en cada nivel i de FI el número de
observaciones de los J niveles de FJ están en las mismas proporciones. Esta
propiedad permite separar los efectos simples de los factores en estudio.

—Diseño equilibrado o balanceado: es el diseño en el que todos los tratamientos


son asignados a un número igual de unidades experimentales.

Principios básicos en el diseño de experimentos

Al planificar un experimento hay tres tres principios básicos que se deben tener siempre en
cuenta:
—El principio de aleatorización.
—El bloqueo.
—La factorización del diseño.
Los dos primeros (aleatorizar y bloquear) son estrategias eficientes para asignar los
tratamien- tos a las unidades experimentales sin preocuparse de qué tratamientos
considerar. Por el con- trario, la factorización del diseño define una estrategia eficiente para
elegir los tratamientos sin considerar en absoluto como asignarlos después a las unidades
experimentales.
Aleatorizar: “Aleatorizar todos los factores no controlados por el experimentador en el
diseño experimental y que pueden influir en los resultados serán asignados al azar a las
unidades experimentales”.
Ventajas de aleatorizar los factores no controlados:

—Transforma la variabilidad sistemática no planificada en variabilidad no planificada o


ruido aleatorio. Dicho de otra forma, aleatorizar previene contra la introducción de
sesgos en el experimento.
—Evita la dependencia entre observaciones al aleatorizar los instantes de recogida
muestral.
—Valida muchos de los procedimientos estadísticos más comunes.

Bloquear: “Se deben dividir o particionar las unidades experimentales en grupos llamados
bloques de modo que las observaciones realizadas en cada bloque se realicen bajo
condiciones experimentales lo más parecidas posibles”.
A diferencia de lo que ocurre con los factores tratamiento, el experimentador no está in-
teresado en investigar las posibles diferencias de la respuesta entre los niveles de los
factores bloque.
Bloquear es una buena estrategia siempre y cuando sea posible dividir las unidades
experi- mentales en grupos de unidades similares.
La ventaja de bloquear un factor que se supone que tienen una clara influencia en la
respuesta pero en el que no se está interesado, es la siguiente: Convierte la variabilidad
sistemática no planificada en variabilidad sistemática planificada.

Con el siguiente ejemplo se trata de indicar la diferencia entre las estrategias de aleatorizar y
de bloquear en un experimento Diseño con factores bloque anidados o jerarquizados: Dos
factores bloque se dicen anidados cuando observaciones pertenecientes a dos niveles
distintos de un factor bloque están automáti- camente en dos niveles distintos del segundo
factor bloque.

En la siguiente tabla puede observarse la diferencia entre ambos tipos de bloqueo.


Plan esquemático de experimentos con dos factores bloque

Diseños con dos o más factores

En algunas ocasiones se está interesado en estudiar la influencia de dos (o más)


factores tratamiento, para ello se hace un diseño de filas por columnas. En este modelo es
importante estudiar la posible interacción entre los dos factores. Si en cada casilla se tiene
una única observación no es posible estudiar la interacción entre los dos factores, para
hacerlo hay que replicar el modelo, esto es, obtener k observaciones en cada casilla, donde
k es el número de réplicas.
El modelo matemático de este diseño es:
Respuesta = Constante + Efecto Factor Fila + Efecto Factor Columna + Efecto Interacción
+ Error

Generalizar los diseños completos a más de dos factores es relativamente sencillo desde
un punto de vista matemático, pero en su aspecto práctico tiene el inconveniente de que al
aumentar el número de factores aumenta muy rápidamente el número de observaciones
necesario para estimar el modelo. En la práctica es muy raro utilizar diseños completos con
más de factores.
Un camino alternativo es utilizar fracciones factoriales que son diseños en los que se
supone que muchas de las interacciones son nulas, esto permite estudiar el efecto de un
número elevado de factores con un número relativamente pequeño de pruebas. Por
ejemplo, el diseño en cuadrado latino, en el que se supone que todas las interacciones son
nulas, permite estudiar tres factores de k niveles con solo k2 observaciones. Si se utilizase el
diseño equilibrado completo se necesitan k3 observaciones.

Diseños factoriales a dos niveles

En el estudio sobre la mejora de procesos industriales (control de calidad) es usual


trabajar en problemas en los que hay muchos factores que pueden influir en la variable de
interés. La utilización de experimentos completos en estos problemas tiene el gran
inconveniente de necesitar un número elevado de observaciones, además puede ser una
estrategia ineficaz porque, por lo general, muchos de los factores en estudio no son
influyentes y mucha información recogida no es relevante. En este caso una estrategia mejor
es utilizar una técnica secuencial donde se comienza por trabajar con unos pocos factores y
según los resultados que se obtienen se eligen los factores a estudiar en la segunda etapa.
Los diseños factoriales 2k son diseños en los que se trabaja con k factores, todos ellos
con dos niveles (se suelen denotar + y -). Estos diseños son adecuados para tratar el tipo
de problemas descritos porque permiten trabajar con un número elevado de factores y son
válidos para estrategias secuenciales.
Si k es grande, el número de observaciones que necesita un diseño factorial 2k es muy
grande (n= 2k). Por este motivo, las fracciones factoriales 2k−p son muy utilizadas, éstas son
diseños con k factores a dos niveles, que mantienen la propiedad de ortogonalidad de los
factores y donde se suponen nulas las interacciones de orden alto (se confunden con los
efectos simples) por lo que para su estudio solo se necesitan 2k−p observaciones (cuanto
mayor sea p menor número de observaciones se necesita pero mayor confusión de efectos
se supone).
En los últimos años Taguchi ha propuesto la utilización de fracciones factoriales con
factores a tres niveles en problemas de control de calidad industrial.

También podría gustarte