Modelo Arima
Modelo Arima
Modelo Arima
Estimacin de un modelo
odelo ARIMA en la cuenca del estero Puangue
en Boquern
CI6110 Anlisis Hidrolgico y Evaluacin de Recursos Hdricos
Alumno:
Profesores:
es:
Felipe Uribe
James Mc Phee.
Phee
Ximena Vargas
Auxiliar:
Yuri Castillo
Fecha:
03/06/2014
03/06
Contenido
1-
Introduccin ................................................................................................................................ 3
2-
Objetivos ..................................................................................................................................... 4
2.1- Objetivo General ...................................................................................................................... 4
2.2- Objetivos Especficos................................................................................................................ 4
3-
Metodologa ................................................................................................................................ 5
4-
Resultados ................................................................................................................................... 6
4.1- Caracterizacin de la cuenca.................................................................................................... 6
4.2- Identificacin de perodos Pluvial y Nival ................................................................................ 7
4.3- Normalizacin .......................................................................................................................... 8
4.4.- Estandarizacin ....................................................................................................................... 9
4.5. Intercalacin............................................................................................................................. 9
4.6- Estacionalidad ........................................................................................................................ 10
4.7- Identificacin de los posibles modelos ARIMA ...................................................................... 11
4.8- Generacin de los posibles modelos ARIMA ......................................................................... 12
4.9- Seleccin del modelo ARIMA ................................................................................................. 13
4.10- Generacin de 30 series sintticas ...................................................................................... 14
4.11- Curvas de duracin .............................................................................................................. 14
5-
Conclusiones.............................................................................................................................. 15
6-
Anexos ....................................................................................................................................... 16
1- Introduccin
Hace ms de 50 aos, los modelos auto-regressive integrated moving average (ARIMA) se han
utilizado para pronosticar variables, ya sea en economa, hidrologa u otras disciplinas. El supuesto
detrs de esto es que la variable de pronstico est ligada mediante una funcin lineal con varias
observaciones pasadas y errores aleatorios. Esto implica necesariamente que el proceso
subyacente que genera la serie de tiempo con media tiene la forma
Los polinomios anteriores corresponden a los parmetros del modelo, y tienen orden p y q
respectivamente. Finalmente
es el operador de retroceso, Los errores aleatorios
tienen el supuesto que distribuyen con media 0 y varianza 2.
2- Objetivos
3- Metodologa
A) Rellenar los datos restantes de Puangue en Boquern, con la estacin vecina Colliguay
como parmetro.
B) Sacar por separado los caudales promedios pluvial y nival
C) Verificar si cumplen la prueba de normalidad, en caso de que no cumplan se aplicar el
cambio de variable Zt=ln(Q) y se verificar normalidad nuevamente
D) Se chequear estacionalidad, verificando que los estadsticos de 2 rangos pluviales y 2
rangos nivales sean iguales entre si.
E) Intercalar los datos pluviales y nivales
F) Verificar si tienen tendencia con el test de Mann-Kendall, en caso de que la respuesta sea
afirmativa, se le sacar la tendencia.
G) Con los datos sin tendencia, se aplicar un test de anlisis descriptivo para ver cmo
andan los grficos de autocorrelograma y autocorrelograma parcial
H) Se elegir posibles modelos ARIMA.
I) Se le harn test de normalidad a los residuos, junto con el criterio de Parsimonia e ndice
de AIC en caso de determinar cual modelo es mejor
J) Se generarn 30 series a partir de un modelo ARIMA genrico, con errores aleatorios que
distribuyen con media 0 y desviacin estndar 1
K) Se agregar tendencia a los datos en caso de que existiera, y se aplicar exponencial a
estos datos en caso de que no hayan sido normales en la parte c)
L) Finalmente se construirn las curvas de duracin mediante Weibull, identificando los
caudales con 85% de excedencia.
4- Resultados
Puangue en Boquern
3.00
Caudal [l/s]
2.50
2.00
1.50
Puangue en Boquern
1.00
0.50
0.00
0
10
12
14
Finalmente, se escogi grficamente como perodo Pluvial entre Abril y Septiembre, mientras que
el perodo nival corresponde entre Octubre y Marzo.
4.3- Normalizacin
Al obtener las 2 series de tiempo promedio nival y pluvial, se hizo una prueba de normalidad a
cada una en XLSTAT, la cual arroj que ninguna serie era normal ya que los p-values en los 4 test
obtuvieron valores menores al 0.001, lo que implica rechazar la hiptesis de normalidad.
Para normalizar las series, se tom logaritmo natural a cada una de esas series y se les aplic
nuevamente el test. Esta vez ambas sacaron valores mayores al 0.05 en todos sus p-values, lo que
provoca que las series fueron transformadas a normal. A continuacin se muestran los p-valor con
sus respectivas pruebas, tanto para rgimen pluvial y nival.
Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara
p-valor
0.946
0.894
0.715
0.724
Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara
p-valor
0.646
0.841
0.921
0.654
4.4.- Estandarizacin
La estandarizacin consiste en pasar cada serie de los regmenes por separado a otros trminos,
representados por la siguiente ecuacin:
4.5. Intercalacin
Una vez estandarizadas las 2 series por separado, se intercalaron para formar una sola serie. Luego
se aplic el test de Mann-Kendall en XLSTAT, obteniendo que matemticamente hay una
tendencia, tal como se muestra en la figura 3.
Con tendencia
2.5
2
y = -0.0096x + 0.3133
1.5
1
Series1
0.5
0
-0.5 0
Linear (Series1)
20
40
60
80
Linear (Series1)
-1
-1.5
-2
-2.5
Figura 3. Serie intercalada con tendencia
Para remover esta tendencia, a cada yt se le rest la ecuacin presentada en la figura 3, quedando
la muestra sin tendencia como se muestra en la figura 4.
9
Sin tendencia
2.5
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5
-3
Series1
20
40
60
Linear (Series1)
80
4.6- Estacionalidad
La serie sin tendencia se dividi en 2 partes iguales, que son los primeros 32 trminos y los ltimos
32 trminos. A cada uno se le sac la media y la desviacin estndar, obtenindose que son
estadsticamente iguales (andan del mismo orden). Por supuesto si la serie tuviera ms datos,
entonces la convergencia a que los estadsticos sean iguales es mayor.
Media 32 prim
Media 32 ult
Desv 32 prim
Desv 32 ult
-0.186
0.145
0.939
0.998
10
Autocorrelacione
0.6
0.4
0.2
0
0
-0.2
10
11
12
13
14
15
16
17
18
-0.4
-0.6
-0.8
-1
Desplazamiento
Figura 5. Autocorrelograma
Para la autocorrelacin parcial es prcticamente el mismo caso, no decrece pero trunca en uno,
por lo que el posible modelo es un AR(1).
Autocorrelograma parcial (-0.793991056084206)
1
Autocorrelacin parcial
0.8
0.6
0.4
0.2
0
-0.2
10
11
12
13
14
15
16
17
18
-0.4
-0.6
-0.8
-1
Desplazamiento
11
-0.793991056084206
0
0
10
20
30
40
50
60
70
-1
-2
-3
Paso de tiempo
-0.793991056084206
ARIMA (-0.793991056084206)
12
Residuos
3
2.5
2
1.5
Residuo
1
0.5
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63
-0.5
-1
-1.5
-2
-2.5
Paso de tiempo
Prueba
Shapiro- Wilk
Anderson Darling
Lilliefors
Jarque-Bara
p-valor
0.449
0.382
0.358
0.987
Tambin se hizo una diferenciacin para ver cmo andaba ese modelo, pero los residuos eran
mayores que 3, lo que provocaba que el modelo fuera peor.
13
0.266
0.440
0.312
0.229
0.429
0.408
0.261
0.411
0.448
0.324
0.369
0.308
0.344
0.297
0.497
0.386
0.291
0.241
0.327
0.217
0.363
Curva de duracin
18
16
14
12
Caudal [l/s]
0.287
0.335
0.339
10
8
Series1
6
4
2
0
0
0.2
0.4
0.6
0.8
1.2
Probabilidad de excedencia
14
0.365
0.409
0.365
5- Conclusiones
Un modelo ARIMA(0,0,0) en realidad no es un modelo ARIMA como tal, ya que este asume que el
pronstico es una funcin lineal de las observaciones pasadas y errores aleatorios. Pero en este
caso no hay una funcin lineal que conecte el pronstico, lo que da a entender que todos los datos
son independientes entre s, lo cual es muy difcil que se d.
Un problema directo que influye en este problema son el nmero de datos de la muestra, ya que
mientras menor sean los datos peor ser el pronstico, ya que pueden haber ciclicidades que no
se hayan presentado en los datos conocidos, o tendencias ms generales y no tan especficas de la
serie histrica. Posiblemente un espectro de 32 aos no es suficiente para arrojar un buen
pronstico mediante un modelo ARIMA.
Como se vio en la tabla 5, si bien andan del orden los caudales asociados al 85% de excedencia,
igual se notan diferencias de hasta un 100% de diferencia, lo que provoca que estos resultados no
sean tan confiables con el mtodo utilizado.
Una ventaja significativa de estos modelos es poder predecir datos con tendencia, ciclicidad y no
normales. Por supuesto esto debe identificarse, procesarse y sacarlas a priori para escoger el
modelo ARIMA adecuado. Pero finalmente el pronstico debe ser consistente, una vez escogido el
modelo correspondiente hay que devolverse a las variables originales, lo que genera un mucho
mejor pronstico con respecto a los mtodos de hidrologa convencional.
15
6- Anexos
Excel Adjunto ARIMA1.xlsx
16