SERIES DE TIEMPO CON RStudio

Está en la página 1de 12

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERÍA ESTADÍSTICA E INFORMÁTICA

ESCUELA PROFESIONAL DE INGENIERÍA ESTADÍSTICA E INFORMÁTICA

CURSO:

ESTADISTICA BAYESIANA

PRACTICA:

MODELO ARIMA

DOCENTE:

Dr. VARGAS VALVERDE CONFESOR MILAN

ESTUDIANTE:

SALCEDO PUMACCOLA BRITMAN

PUNO – PERU

2021
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

MODELO ARIMA

Se han analizado las series temporales desde un punto de vista determinista o clásico.

A partir de ahora se estudian desde un punto de vista estocástico o moderno, que utiliza

métodos más complejos y su aplicación requiere series más largas. Box y Jenkins han

desarrollado modelos estadísticos para series temporales que tienen en cuenta la

dependencia existente entre los datos, esto es, cada observación en un momento dado

es modelada en función de los valores anteriores. Los análisis se basan en un modelo

explícito.

Los modelos se conocen con el nombre genérico de ARIMA (AutoRegresive Integrated

Moving Average), que deriva de sus tres componentes AR (Autoregresivo),

I(Integrado) y MA (Medias Móviles). El modelo ARIMA permite describir un valor

como una función lineal de datos anteriores y errores debidos al azar, además, puede

incluir un componente cíclico o estacional. Es decir, debe contener todos los elementos

necesarios para describir el fenómeno. Box y Jenkins recomiendan como mínimo 50

observaciones en la serie temporal.

Series de Tiempo Univariado

Convertir a Objeto de Serie de Tiempo en RStudio

#Series de Tiempo Univariadas


#Paso 1. Convertir a objeto de Serie de Tiempo en R
SerieA.ts=ts(SerieA, start=c(1984,1), frequency = 12)
print(SerieA.ts)

Convertimos a clase ts

class(SerieA.ts)

1
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

con las funciones start y end vemos cuando inicia y termina.

start(SerieA.ts)
end(SerieA.ts)

Leemos los datos del año de 1984 al 2008.

serielog=log(SerieA.ts)
serielog

## Jan Feb Mar Apr May Jun Jul Aug


## 1984 2.251292 2.316291 2.372111 2.394891 2.389771 2.379639 2.367436 2.355178
## 1985 2.354513 2.376764 2.406675 2.421878 2.427631 2.422410 2.411619 2.398804
## 1986 2.427719 2.456507 2.505118 2.529163 2.527407 2.512522 2.488899 2.474772
## 1987 2.454791 2.476706 2.474435 2.465724 2.453846 2.438601 2.429394 2.413500
## 1988 2.383612 2.401887 2.412246 2.446945 2.447897 2.435979 2.423209 2.410003
## 1989 2.372204 2.382228 2.391328 2.399893 2.396258 2.385915 2.374813 2.362645
## 1990 2.329714 2.334762 2.330978 2.324933 2.315304 2.308865 2.298175 2.286456
## 1991 2.280953 2.285337 2.295661 2.310454 2.306478 2.298075 2.288182 2.273980
## 1992 2.246226 2.260721 2.264779 2.254969 2.242092 2.226460 2.213972 2.201659
## 1993 2.182449 2.210689 2.221050 2.228508 2.225380 2.211675 2.199999 2.186613
## 1994 2.185377 2.220616 2.243154 2.253710 2.253605 2.242304 2.229907 2.216264
## 1995 2.193997 2.197669 2.218442 2.224624 2.212551 2.198890 2.185602 2.172249
## 1996 2.140066 2.172021 2.179739 2.183126 2.172818 2.158599 2.142416 2.130135
## 1997 2.114688 2.165160 2.217354 2.236659 2.233342 2.220181 2.208055 2.197780
## 1998 2.175547 2.183576 2.194889 2.201549 2.187735 2.171109 2.159061 2.145112
## 1999 2.101325 2.114688 2.151181 2.188296 2.191654 2.177928 2.163668 2.150133
## 2000 2.120703 2.155708 2.192882 2.197780 2.186725 2.174865 2.160330 2.148968
## 2001 2.154085 2.225380 2.293242 2.320425 2.316587 2.307274 2.297271 2.287877
## 2002 2.259469 2.280033 2.316291 2.334374 2.339206 2.330006 2.317769 2.309958
## 2003 2.307772 2.340459 2.371551 2.388304 2.384534 2.373882 2.361891 2.350613
## 2004 2.334568 2.375836 2.387202 2.388855 2.379639 2.364620 2.354703 2.343727
## 2005 2.306876 2.320818 2.337373 2.338531 2.326692 2.312436 2.298677 2.285134
## 2006 2.277267 2.315600 2.323172 2.336697 2.328253 2.315699 2.303585 2.289804
## 2007 2.272332 2.276754 2.295661 2.313723 2.310652 2.296064 2.285032 2.272538

2
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

## 2008 2.254130 2.278907 2.295560 2.292636 2.280544 2.266958 2.254025 2.239965


## Sep Oct Nov Dec
## 1984 2.341613 2.333308 2.330395 2.335439
## 1985 2.390504 2.383704 2.381489 2.397259
## 1986 2.463768 2.452556 2.439909 2.435454
## 1987 2.402973 2.392152 2.385363 2.380749
## 1988 2.396713 2.386926 2.374813 2.363116
## 1989 2.352232 2.341421 2.329811 2.320720
## 1990 2.275728 2.271094 2.273980 2.276960
## 1991 2.263324 2.252870 2.244532 2.237727
## 1992 2.195557 2.185377 2.176795 2.175433
## 1993 2.177249 2.172021 2.170082 2.174183
## 1994 2.208714 2.198224 2.189416 2.184027
## 1995 2.161828 2.150016 2.138182 2.132390
## 1996 2.116978 2.103646 2.096176 2.093961
## 1997 2.187735 2.183238 2.178947 2.171679
## 1998 2.130610 2.116858 2.108636 2.103036
## 1999 2.139713 2.137357 2.127755 2.116376
## 2000 2.137475 2.131203 2.122980 2.115412
## 2001 2.281055 2.273774 2.266440 2.257901
## 2002 2.302585 2.297271 2.293544 2.297271
## 2003 2.339399 2.328935 2.319835 2.309362
## 2004 2.335730 2.324542 2.312535 2.303984
## 2005 2.273671 2.267579 2.260199 2.256751
## 2006 2.278907 2.268821 2.263844 2.261451
## 2007 2.267476 2.257901 2.246544 2.246226
## 2008 2.227538 2.215719 2.205083 2.199777

3
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

Ilustración 1. Serie de Tiempo de la SerieA.

#Stationarity: To know the number of differences that are required to achieve that the series
#be stationary
ndiffs(SerieA.ts)

Con este comando averiguamos el numero de diferencias que tiene la SerieAlog.

Prueba de Dicky-Fuller

#Paso 2.Prueba de DickeyFuller


adf.test(SerieA.ts)

##
## Augmented Dickey-Fuller Test
##
## data: SerieA.ts
## Dickey-Fuller = -1.2334, Lag order = 6, p-value = 0.8994
## alternative hypothesis: stationary

4
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

La prueba de Dicky Fuller nos sale negativa

Ilustración 2. Diferencias de la SerieA

En el grafico mostramos la media de la SerieA de -0.3 a 0.7 el cual se mantiene entre

ese intervalo.

adf.test(seriedif)

##
## Augmented Dickey-Fuller Test
##
## data: seriedif
## Dickey-Fuller = -10.613, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary

acf(seriedif)

5
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

Ilustración 3. Diferencias de la SerieA

adf.test(seriedif)

##
## Augmented Dickey-Fuller Test
##
## data: seriedif
## Dickey-Fuller = -10.613, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary

Aplicamos la prueba de la diferencia con Dickey Fuller

Prueba de Dickey Fuller con dos Diferencias

6
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

Ilustración 4. SerieA con dos Diferencias.

adf.test(seriedif2)

##
## Augmented Dickey-Fuller Test
##
## data: seriedif2
## Dickey-Fuller = -11.117, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary

Realizamos la prueba de Dickey Fuller con dos diferencias cambiando la media entre -

0.4 al 0.4.

7
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

Análisis Visual del Grafico

Vemos una media constante entre el año 1985 al 2000 teniendo una pequeña diferencia

en el año 2002.

Modelo ARIMA

#Modelo Arima
modelo1=arima(SerieA.ts,order=c(1,2,1))
summary(modelo1)

##
## Call:
## arima(x = SerieA.ts, order = c(1, 2, 1))
##
## Coefficients:
## ar1 ma1
## 0.0191 0.2969

8
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

## s.e. 0.1602 0.1504


##
## sigma^2 estimated as 0.01243: log likelihood = 230.89, aic = -455.78
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -0.001708912 0.111109 0.07294355 -0.0009988697 0.7348677 0.5865616
## ACF1
## Training set 0.001412786

tsdiag(modelo1)

Ilustración 5. Modelo de Residuales de Estandarización.

Los residuales de estandarización son de entre -2 al 2 con la media de -4 al 2 teniendo

una media entre esos intervalos.

Box.test(residuals(modelo1),type="Ljung-Box")

9
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

##
## Box-Ljung test
##
## data: residuals(modelo1)
## X-squared = 0.0006048, df = 1, p-value = 0.9804

La prueba de Ljung-Box tiene como finalidad que la chi-cuadrado es 0.0006048 y

margen de error de 0.02.

Pronostico ARIMA

#Pronosticos Arima
pronostico=forecast::forecast(modelo1,h=10)
pronostico

## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## Jan 2009 8.989383 8.846517 9.132249 8.770888 9.207878
## Feb 2009 8.956041 8.595642 9.316440 8.404858 9.507224
## Mar 2009 8.922704 8.290233 9.555174 7.955424 9.889984
## Apr 2009 8.889367 7.939540 9.839193 7.436733 10.342001
## May 2009 8.856030 7.549241 10.162819 6.857468 10.854592
## Jun 2009 8.822693 7.123294 10.522092 6.223686 11.421700
## Jul 2009 8.789356 6.664667 10.914045 5.539925 12.038787
## Aug 2009 8.756019 6.175691 11.336347 4.809748 12.702290
## Sep 2009 8.722682 5.658261 11.787103 4.036054 13.409310
## Oct 2009 8.689345 5.113955 12.264736 3.221257 14.157433

10
SERIES DE TIEMPO
UNIVERSIDAD NACIONAL DEL ALTIPLANO
INGENIERIA ESTADISTICA E INFORMATICA

Ilustración 6. Modelo ARIMA (1,2,1).

Pronostico del año 2009 teniendo una tendencia baja en la media hasta el mes de

Octubre con el modelo ARIMA 1,2,1.

Join in this link for help you/Junte-se a este link para ajudá-lo/Únete a este enlace para

ayudarte: https://rpubs.com/BritmanSalcedo/845796

11

También podría gustarte