Series de Tiempo

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 12

SERIES DE TIEMPO

Modelo clasico de series de tiempo

Series de Tiempo es un método cuantitativo que utilizamos para determinar


patrones de comportamiento en los datos recolectados a través del tiempo. Nos
ayuda a manejar la incertidumbre asociada con los acontecimientos futuros. El
término Serie de Tiempo se usa para referirnos a cualquier grupo de información
estadística que se acumula a intervalos regulares con respecto en una variable de
interés.

El análisis de series de tiempo se representa por medio de una gráfica de líneas


sobre cuyo eje horizontal se representan los períodos y en cuyo eje vertical se
representan los valores de la serie de tiempo.

Analizar una serie de tiempo tiene como objetivos, entre otros:

- Determinar si se presentan ciertos patrones o pautas no aleatorias.

- Aislar y entonces estudiar sus componentes a fin de proporcionar claves para


movimientos futuros.

- Hace posible pronosticar los movimientos futuros así como otros aspectos que
estén sincronizados.

Componentes de la serie de tiempo

Para llevar a cabo un análisis de este tipo, primero se deben identificar los
componentes de la serie de tiempo, después aplicar las técnicas estadísticas para
su análisis y, finalmente, hacer las proyecciones o pronósticos de eventos futuros.

De esta forma, el análisis de series de tiempo es el procedimiento por el cual se


identifican y aíslan los factores relacionados con el tiempo que influyen en los
valores observados en las series de tiempo para que una vez identificados, estos
factores puedan contribuir a la interpretación de valores históricos de series de
tiempo y hasta entonces pronosticar valores futuros de series de tiempo.

Supondremos que en una serie existen cuatro tipos básicos de variación, los
cuales sobrepuestos o actuando en concierto, contribuyen a los cambios
observados en un período de tiempo y dan a la serie su aspecto errático. Estas
cuatro componentes son: Tendencia secular, variación estacional, variación cíclica
y variación irregular. Supondremos, además, que existe una relación multiplicativa

FRESUMEN DE UNIDAD 4 Y 5
entre estas cuatro componentes; es decir, cualquier valor de una serie es el
producto de factores que se pueden atribuir a las cuatro componentes. existen
cuatro tipos de cambio o variación implicados en el análisis de Series de Tiempo
son:

- Tendencia secular.
- Variación estacional.
- Variación cíclica.
- Variación Irregular.

Tendencia:

La tendencia secular o tendencia a largo plazo de una serie es por lo común el


resultado de factores a largo plazo. En términos intuitivos, la tendencia de una
serie de tiempo caracteriza el patrón gradual y consistente de las variaciones de la
propia serie, que se consideran consecuencias de fuerzas persistentes que
afectan el crecimiento o la reducción de la misma, tales como: cambios en la
población, en las características demográficas de la misma, cambios en los
ingresos, en la salud, en el nivel de educación y tecnología. Las tendencias a largo
plazo se ajustan a diversos esquemas. Algunas se mueven continuamente hacía
arriba, otras declinan, y otras más permanecen igual en un cierto período o
intervalo de tiempo.

Variación estacional

El componente de la serie de tiempo que representa la variabilidad en los datos


debida a influencias de las estaciones, se llama componente estacional. Esta
variación corresponde a los movimientos de la serie que recurren año tras año en
los mismos meses (o en los mismos trimestres) del año poco más o menos con la
misma intensidad. Por ejemplo: Un fabricante de albercas inflables espera poca
actividad de ventas durante los meses de otoño e invierno y tiene ventas máximas
en los de primavera y verano, mientras que los fabricantes de equipo para la nieve
y ropa de abrigo esperan un comportamiento anual opuesto al del fabricante de
albercas.

Variación cíclica

Con frecuencia las series de tiempo presentan secuencias alternas de puntos


abajo y arriba de la línea de tendencia que duran más de un año, esta variación se
mantiene después de que se han eliminado las variaciones o tendencias

FRESUMEN DE UNIDAD 4 Y 5
estacional e irregular. Un ejemplo de este tipo de variación son los ciclos
comerciales cuyos períodos recurrentes dependen de la prosperidad, recesión,
depresión y recuperación, las cuales no dependen de factores como el clima o las
costumbres sociales.

Variación irregular

Esta se debe a factores a corto plazo, imprevisibles y no recurrentes que afectan a


la serie de tiempo. Como este componente explica la variabilidad aleatoria de la
serie, es impredecible, es decir, no se puede esperar predecir su impacto sobre la
serie de tiempo. Existen dos tipos de variación irregular: a) Las variaciones que
son provocadas por acontecimientos especiales, fácilmente identificables, como
las elecciones, inundaciones, huelgas, terremotos. b) Variaciones aleatorias o por
casualidad, cuyas causas no se pueden señalar en forma exacta, pero que tienden
a equilibrarse a la larga.

Aplicación de ajustes estacionales

Una aplicación frecuente de los índices estacionales es el ajuste de los datos


observados de la serie de tiempo eliminando de los datos la influencia del
componente estacional. A estos datos ajustados se les llama datos ajustados
estacionalmente o datos desestacionalizados.

Los ajustes estacionales son especialmente importantes si se desea comparar


datos de varios meses para determinar si ha habido un incremento(o disminución)
relativo a las expectativas estacionales.

DISEÑO DE BLOQUES

Algunos experimentos diseñados pueden proveer información de manera efectiva


cuando las mediciones son difíciles o muy costosas de hacer o pueden minimizar
el efecto de variabilidad no deseada en la inferencia del tratamiento. A
continuación una breve discusión de los dos diseños comúnmente utilizadas. Para
mostrar estos diseños, se consideran dos factores de tratamiento (A y B) y su
interacción (A*B). Sin embargo, estos diseños no están restringidos a dos factores.
Si el diseño es balanceado, se puede utilizar el ANOVA balanceado para analizar
los datos. Si no es así, utilice GLM.

FRESUMEN DE UNIDAD 4 Y 5
DISEÑO DE BLOQUES ALEATORIZADOS

Un diseño de bloques aleatorizados es un diseño frecuentemente utilizado para


minimizar el efecto de la variabilidad cuando se asocia con unidades discretas (por
ejemplo, ubicación, operador, planta, lote, tiempo). El caso usual consiste en
distribuir aleatoriamente una réplica de cada combinación de tratamientos dentro
de cada bloque. Por lo general, no hay un interés intrínseco en los bloques, y se
considera que éstos son factores aleatorios. La suposición habitual es que el
bloque por interacción de tratamiento es cero, y esta interacción pasa a ser el
término de error para probar los efectos del tratamiento. Si designa la variable de
bloqueo como Bloque, los términos en el modelo serían entonces Bloque, A, B y
A*B. También especificaría el Bloque como el factor aleatorio.

DISEÑO DE CUADRADOS LATINOS CON MEDIDAS REPETIDAS

Un diseño con medidas repetidas es un diseño en el que se efectúan mediciones


repetidas en el mismo sujeto. Existen diversas maneras de asignar tratamientos a
los sujetos. Cuando se trata especialmente de sujetos vivos, puede sospecharse
que existen diferencias sistemáticas (atribuibles al aprendizaje, aclimatación,
resistencia, etc.) entre observaciones sucesivas. Una manera frecuente de asignar
tratamientos a los sujetos consiste en utilizar un diseño de cuadrados latinos. Una
de las ventajas de este diseño para un experimento de medidas repetidas es que
garantiza una fracción balanceada de un factorial completo (es decir, todas las
combinaciones de tratamientos representadas) cuando los sujetos son limitados y
el efecto de la secuencia del tratamiento puede considerarse insignificante.

Un diseño de cuadrados latinos es un diseño de bloques con dos variables de


bloques ortogonales. En un experimento agrícola, podría haber gradientes
perpendiculares que podrían inducirle a escoger este diseño. Para un experimento
de medidas repetidas, una variable de bloques es el grupo de sujetos y la otra es
el tiempo. Si el factor de tratamiento B tiene tres niveles, b1, b2 y b3, entonces una
de las doce asignaciones aleatorias posibles de los cuadrados latinos de los
niveles de B a los grupos de sujetos en el tiempo es:

FRESUMEN DE UNIDAD 4 Y 5
Tiempo 1 Tiempo 2 Tiempo 3

Grupo b2 b3 b1
1

Grupo b3 b1 b2
2

Grupo b1 b2 b3
3

Los sujetos reciben los niveles de tratamiento en el orden especificado en la fila.


En este ejemplo, los sujetos del grupo 1 recibirían los niveles de tratamiento en el
orden b2, b3, b1. Se debe elegir el intervalo entre las administraciones de
tratamiento con el fin de minimizar el efecto de arrastre del tratamiento previo.

Este diseño suele modificarse para proporcionar información acerca de uno o más
factores adicionales. Si a cada grupo se le asignara un nivel diferente del factor A,
entonces podría obtenerse información sobre los efectos de A y A*B con un
esfuerzo mínimo si es posible hacer una suposición sobre el efecto de la
secuencia asignada a los grupos. Si los efectos de la secuencia son insignificantes
en comparación con los efectos del factor A, entonces el efecto de grupo podría
atribuirse al factor A. Si las interacciones con el tiempo son insignificantes,
entonces puede obtenerse información parcial sobre la interacción A*B. En el
lenguaje de los diseños de medidas repetidas, el factor A se denomina factor entre
sujetos y el factor B se denomina factor por cada sujeto.

No es necesario aleatorizar los experimentos de medidas repetidas con un diseño


de cuadrados latinos.

DISEÑO CUADRADO LATINO : DCL El agrupamiento de las unidades


experimentales en dos direcciones (filas y columnas) y la asignación de los

FRESUMEN DE UNIDAD 4 Y 5
tratamientos al azar en las unidades, de tal forma que en cada fila y en cada
columna se encuentren todos los tratamientos constituye un diseño cuadrado
latino. Características: 1. Las u.e. se distribuyen en grupos , bajo dos criterios de
homogeneidad dentro de la fila y dentro de la columna y heterogeneidad en otra
forma. 2. En cada fila y en cada columna, el número de unidades es igual al
número de tratamientos. 3. Los tratamientos son asignados al azar en las
unidades experimentales dentro de cada fila y dentro de cada columna. 4. El
número de filas = número de columnas = número de tratamientos. 5. Los análisis
estadísticos T-student, Duncan, Tuckey y en pruebas de contraste se procede
como el diseño completo al azar y el diseño de bloques. La desviación estandar de
la diferencia de promedios y la desviación estandar del promedio, están en función
del cuadrado medio del error experimental.

DISEÑOS EN CUADRADOS GRECO-LATINOS

El modelo en cuadrado greco-latino se puede considerar como una extensión del


cuadrado latino en el que se incluye una tercera variable de control o variable de
bloque. En este modelo, como en el diseño en cuadrado latino, todos los factores
deben tener el mismo número de niveles K y el número de observaciones
necesarias sigue siendo K2 . Este diseño es, por tanto, una fracción del diseño
completo en bloques aleatorizados con un factor principal y 3 factores secundarios
que requeriría K4 observaciones. Los cuadrados greco-latinos se obtienen por
superposición de dos cuadrados latinos del mismo orden y ortogonales entre sí,
uno de los cuadrados con letras latinas el otro con letras griegas. Dos cuadrados
reciben el nombre de ortogonales si, al superponerlos, cada letra latina y griega
aparecen juntas una sola vez en el cuadrado resultante.

DISEÑO DE BLOQUES 3.1. Diseños en bloques completos al azar Un bloque es


(en Estadística) un grupo de observaciones que tienen condición de unicidad
estadística, esto es, que pueden y deben ser analizadas e interpretadas sólo de
modo conjunto. Se dice que un bloque es un bloque completo cuando todos sus
elementos componentes tienen valores válidos (es decir, no omitidos o “missing”).
En caso contrario, se dice que el bloque es un bloque incompleto. Generalmente,
un bloque está estadísticamente incompleto cuando alguno de los niveles
factoriales no posee valores. El interés por el análisis estadístico de bloques
incompletos estriba en estudiar el efecto que la omisión (deliberada o no) de cierto
nivel factorial tiene sobre la característica estudiada. Un bloque puede estar fijado
o establecido por el investigador de modo arbitrario. En este caso, se dice que ese
bloque es un bloque no aleatorio. Pero puede que este bloque esté fijado,

FRESUMEN DE UNIDAD 4 Y 5
configurado o seleccionado según la ley estadística del azar, en cuyo caso se dice
que el bloque es un bloque aleatorio. Diseño de Bloques como Alternativa al
ANOVA El diseño de bloques aleatorizados (completo o no) representa una
alternativa al ANOVA y al ANCOVA (Análisis de la Covarianza). Se somete a los
sujetos a medidas a un efecto adicional (los bloques) y se les agrupa de acuerdo
con sus puntuaciones. Los grupos de sujetos se convierten en los niveles de las
variables independientes (VI) de interés en el diseño factorial. La interpretación del
efecto principal de las VI de interés es directa. En el caso de ANCOVA, se elimina
la variación debida a la(s) covariable(s) de la estimación de la varianza del error y
se la evalúa como un efecto principal separado. Además, si en ANCOVA se
hubiesen violado las asunciones de homogeneidad de la regresión, se muestra
como una interacción entre los bloques y la(s) VI de interés.

Diseños Factoriales

El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una


o varias respuestas o características de calidad, es decir, lo que se busca es
estudiar la relación entre los factores y la respuesta, con la finalidad de conocer
mejor cómo es esta relación y generar conocimiento que permita tomar acciones y
decisiones que mejoren el desempeño del proceso. Por ejemplo, uno de los
objetivos particulares más importantes que en general tiene un diseño factorial es
determinar una combinación de niveles de los factores en la cual el desempeño
del proceso sea mejor que en las condiciones de operación actuales, es decir,
encontrar nuevas condiciones de operación del proceso que eliminen o
disminuyen cierto problema de calidad en la variable de salida.

Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador,
la presencia o ausencia de una operación previa, etc.) , o de tipo cuantitativo
(temperatura, humedad, velocidad, presión, etc.). Para poder estudiar la manera
en cómo influye cada factor sobre la variable respuesta, es necesario elegir al
menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial
completo se corren aleatoriamente en el proceso todas las posibles
combinaciones que pueden formarse con los niveles seleccionados.

Definición de experimento factorial

Un diseño de experimentos factorial o arreglo factorial es el conjunto de puntos


experimentales o tratamientos que pueden formarse considerando todas las
posibles combinaciones de los niveles de los factores. Por ejemplo, con k=2
factores ambos con dos niveles de prueba, se forma el diseño factorial 2x2=2 2 que
consiste de cuatro combinaciones o puntos experimentales. Considerando otra

FRESUMEN DE UNIDAD 4 Y 5
vez k=2 factores, pero ahora con tres niveles y el otro con dos niveles se puede
construir 3x2 combinaciones que dan lugar al diseño factorial 3x2.

Más en general, la familia de diseños factoriales 2 k consiste en k factores, todos


con dos niveles de prueba; la familia de diseños 3 k consiste de k factores cada uno
con tres niveles de prueba.

Diseño Factorial 22

Supongamos que se tienen dos factores A: tiempo y B: velocidad, cada uno con
dos niveles (bajo y alto), la respuesta es la cantidad de aditivo. En el experimento,
cada tratamiento se corrió tres veces (tres réplicas) lo que da un total de 12
corridas del proceso. Por simplicidad sólo se muestra los resultados de la primera
réplica:
Velocidad
Tiempo
600 1000
17,10 18,76
3 ─ ─
─ ─
16,26 18,16
6 ─ ─
─ ─

Efecto principal y efecto de interacción

El efcto de un factor se define como el cambio observado en la variable respuesta


debido a un cambio de nivel de tal factor. En particular los efectos principales, son
los cambios en la media de la variable respuesta debido a la acción individual de
cada factor. Matemáticamente el efecto principal de un factor es la diferencia entre
la respuesta media observada cuando tal factor estuvo en su nivel más alto y la
respuesta media observada cuando el factor estuvo en su nivel más bajo. Por
ejemplo, para los datos de la tabla anterior están daos por:

16.26+18.16 17.10+18.76
Efecto A: Tiempo= − =−0.72
2 2

18.76+18.16 17.10+16.26
Efecto B: Velocidad= − =1.78
2 2

Por otro lado, se dice que dos factores interactúan entre sí o que tienen un efecto
de interacción sobre la variable respuesta, cuando el efecto de un factor depende
del nivel en que se encuentra el otro. Por ejemplo, los factores tiempo y velocidad
interactúan si el efecto del tiempo es muy diferente en cada nivel de velocidad, o
viceversa, si el efecto de la velocidad depende del tiempo. Veamos esto con los
datos:

FRESUMEN DE UNIDAD 4 Y 5
Efecto A con B bajo: 16.26 – 17.10 = -0.84

Y cuando la velocidad es alta el efecto de A es:

Efecto A con B alto: 18.16 – 18.76 = -0.6

Si estos dos efectos de A en función del nivel B fueran diferentes, entonces eso
sería evidencia de que la elección más conveniente del nivel de A depende del
nivel en que esté B y viceversa. Es decir, eso sería evidencia de que los factores
A y B interactúan entre sí. En la práctica el cálculo del efecto de A en cada nivel de
B no se hace, y más bien se calcula el efecto global de la interacción entre los dos
factores. El efecto de interacción entre A y B, denotado por AB se calcula como la
diferencia entre la respuesta media cuando ambos factores se encuentran en el
mismo nivel ((bajo,bajo),(alto,alto)), y la respuesta media cuando los factores se
encuentran en niveles opuestos ((bajo, alto),(alto, bajo)). Para el ejemplo el efecto
de la interacción tiempo x temperatura está dado por:

17.10+18.16 16.26+18.76
AB= − =0.12
2 2

Los valores absolutos de los efectos principales y del efecto de la interacción son
una medida de la magnitud de su efecto sobre la variable respuesta. Así, entre
más grande sea el valor absoluto de un efecto, mayor influencia tendrá sobre la
variable respuesta. Sin embargo, para saber si los efectos son estadísticamente
significativos se requiere del análisis de varianza.

Ventajas de los diseños factoriales

1. Son diseños que se pueden aumentar para formar diseños compuestos en


caso de que se requiera una exploración más completa.
2. Se pueden correr fracciones de diseños factoriales, las cuales son de gran
utilidad en las primeras etapas de una investigación que involucra a muchos
factores, cuando interesa descartar de manera económica los que son
importantes, antes de hacer un estudio más detallado con los factores que
si son importantes.
3. Pueden utilizarse en combinación con diseños de bloques en situaciones en
las que no puede correrse el diseño factorial completo bajo las mismas
condiciones o circunstancias.
4. La interpretación y cálculo de los efectos en los experimentos factoriales se
puede hacer con aritmética elemental, en particular cuando cada factor se
prueba en dos niveles.

Diseños Factoriales con dos Factores

FRESUMEN DE UNIDAD 4 Y 5
Considere los factores A y B con a y b (a, b ≥ 2) niveles de prueba,
respectivamente. Con ellos se puede construir el diseño factorial a x b que
consiste en a x b tratamientos. Se llama réplica a cada repetición completa del
arreglo factorial. Los diseños factoriales que involucran menos de 4 factores se
corren replicados para poder tener la potencia necesaria en las pruebas
estadísticas sobre los efectos de interés, de tal forma que si se hacen n réplicas, el
número total de corridas experimentales es n(a x b).

Modelo Estadístico:

Con un diseño factorial a x b se pueden estudiar los efectos individuales y el


efecto de interacción de ambos factores. En términos estadísticos lo que se afirma
es que el comportamiento de la variable respuesta Y en el experimento con k
réplicas se podrá escribir mediante:

Y ijk =μ+α i+ β j+ ¿

i=1,2 , … , a j=1,2 ,… , b k =1,2 , … ,n

Donde μ es la media general, α i es el efecto del i-ésimo nivel del factor A, β j es el


efecto del j-ésimo nivel del factor B, ¿ representa el efecto de interacción en la
combinación ij y ε ijk es el error aleatorio que supone sigue una distribución con
media cero y varianza constante σ 2 y son independientes entre sí. Para que la
estimación de los parámetros en este modelo sea única, se introducen las
restricciones:
a b a

∑ αi=¿ ∑ β j=0 ¿ y ∑ ¿¿
i=1 j=1 i=1

Es decir, los efectos dados en el modelo son desviaciones respecto de la media


global.

Hipótesis a evaluar y análisis de varianza

Para el Factor A

H 0 : Efecto A=0

H 1 : Efecto A ≠ 0

FRESUMEN DE UNIDAD 4 Y 5
H 0 :α 1=α 2=…=α a =0

H 1 : α i ≠ 0 para algún i

Para el Factor B

H 0 : Efecto B=0

H 1 : Efecto B ≠0

H 0 : β1 =β2 =…= βb =0

H 1 : β j ≠ 0 para algún j

Para la interacción AB:

H 0 : Efecto AB=0

H 1 : Efecto AB≠ 0

H 0 :(αβ )ij =0 para todoij

H 1 :(αβ )ij ≠ 0 para algún ij

El ANOVA para un diseño factorial a x b con n réplicas resulta de descomponer la


variación total como:

SST=SSA+SSB+SSAB+SSE

Y la tabla de ANOVA está dada por:

Fuente de Suma de Grados de Cuadrados Estadístico


Variación cuadrados libertad medios F

Efecto A SSA a-1 CMA=SSA/(a-1) CMA/CME


Efecto B SSB b-1 CMB=SSB/(b-1) CMB/CME
Efecto AB SSAB (a-1)(b-1) CMAB=SSAB/((a-1)(b-1)) CMAB/CME
Error SSE ab(n-1) CME=SSE/(ab(n-1))
Total SST abn-1

FRESUMEN DE UNIDAD 4 Y 5
FRESUMEN DE UNIDAD 4 Y 5

También podría gustarte