Serie Storiche - Approccio Classico
Serie Storiche - Approccio Classico
Serie Storiche - Approccio Classico
APPROCCIO CLASSICO
Un modello stocastico generale per descrivere il processo generatore dei
dati di una serie storica y1, y2,, yn relativa ad una variabile Y dato da
Yt=f(t)+ut
Si assume che la serie osservata sia il risultato della composizione di:
a) una sequenza completamente deterministica, {f(t)}, che costituisce la
parte sistematica della serie;
b) una sequenza di variabili casuali {ut}, che rappresenta la parte
stocastica della serie ed obbedisce ad una determinata legge di
probabilit.
Le due sequenze non sono individualmente osservabili, ma vanno
determinate sulla base del campione.
Se trattiamo il precedete modello secondo lapproccio classico alle serie
storiche, si suppone che esista una legge di evoluzione temporale del
fenomeno, rappresentata da f(t). La componente casuale ut, viene assunta a
rappresentare linsieme delle circostanze, ciascuna di entit trascurabile,
che non si vogliono o non possiamo considerare in Yt . I residui di Yt
vengono pertanto imputati al caso ed assimilati ad errori accidentali.
Questo equivale ad ipotizzare che la componente stocastica ut sia generata
da un processo white noise, ovvero da una successione di variabili casuali
indipendenti, identicamente distribuite, di media nulla e varianza costante.
In sintesi, nellapproccio classico lattenzione viene concentrata su f(t),
essendo ut considerato un processo a componenti incorrelate e dunque
trascurabile.
Nellapproccio moderno si ipotizza invece che f(t) manchi o sia gi stata
eliminata (mediante stima o altri metodi). Lattenzione viene posta sulla
componente stocastica ut, che si ipotizza essere un processo a componenti
correlate del tipo
ut g (Yt 1 , Yt 2 ,..., t 1 , t 2 ,...) t
descrizione
spiegazione
previsione
filtraggio
controllo
a fasi di
recessione)
Stagionalit: costituita dai movimenti del fenomeno nel corso dellanno
che, per effetto dellinfluenza di fattori climatici e sociali, tendono a
ripetersi in maniera pressoch analoga nel medesimo periodo (mese o
trimestre). (Ex: PIL italiano, nel mese di Agosto tutte le grandi fabbriche
sono chiuse)
Tipi di composizione :
1) additiva
2) moltiplicativa
3) misto
1) ipotesi di indipendenza tra le componenti modello additivo:
Zt Tt Ct St a t
2) non indipendenza tra le componenti, modello moltiplicativo
Zt Tt Ct St a t
Il caso 2) si riduce al caso 1) considerando i logaritmi , cio :
Zt Tt St Ct a t
3
Pregi
-semplicit
-serie anche corte
-prima approssimazione
Difetti
-pluralit di soluzioni
-assunzione modellistica troppo rigida
-visione settorizzata
IL TREND
280
240
200
160
120
80
40
1960
1965
1970
1975
1980
1985
1990
Il trend di una serie storica la tendenza di fondo del fenomeno nel lungo
periodo. Si caratterizza per unevoluzione lenta e regolare nel tempo. In
genere rappresentabile mediante una qualche funzione del tempo da
stimare.
Data una serie storica y t tn1 per la quale ipotizziamo un modello del tipo
Yt f (t ) t
t WN (0, 2 )
(1.)
supponiamo per la nostra analisi che la parte sistematica f(t) della serie sia
composta dal solo trend.
Come si rappresenta f(t)?
f(t)
Lineare nei
parametri
f (t ) 0 1t 2t 2 ... qt q
La (1.) diventa il modello di regressione lineare:
y t 0 1t 2t 2 ... q t q t
t 1,2,..., n
1 ,
q
2
n
e
1 1 12
2
1 2 2
P
1 n n 2
1q
2q
q
n
e stimata con il metodo dei minimi quadrati (OLS), dal quale si ottengono
le stime del vettore
q 0 Yt 0 t
trend costante
q 1 Yt 0 1t t
trend lineare
q 2 Yt 0 1t 2t 2 t
trend parabolico
Come scegliere q?
A. Criterio delle differenze successive
Indichiamo B loperatore ritardo che trasforma la serie yt in
yt-1=B yt.
Per cui
Bh yt=yt-h
f (t ) 0 1t
(I B )f (t ) f (t ) f (t 1)
0 1t 0 1(t 1) 1
9
40
-40
-80
-120
1960
1965
1970
1975
1980
1985
1990
grado r+1, si ha sempre R2r R2r+1. Non invece detto che ci accada per
il coefficiente corretto R 2 .
Dunque in tal senso un criterio di scelta del grado del polinomio : si
sceglie un grado r se R 2r R 2r 1 , altrimenti si procede con la ricerca.
Inoltre utile verificare la significativit del coefficiente associato
allultimo regressore introdotto.
Es.
r
R 2r
0
0
1
0,478
2
0,665
3
0,701
4
0,698
5
0,667
11
- Trend esponenziale
Adatto a fenomeni caratterizzati da una crescita nel tempo esplosiva.
t
f (t ) 0e 1 (2.)
Con 0>0 e landamento dipende da 1
La derivata della 2. rappresenta il tasso di crescita della curva al tempo t .
df (t )
/ f (t ) 1 costante.
Il tasso di crescita relativo
dt
0,1t
Es. f (t ) 0,1e
20
18
16
14
12
10
8
6
4
2
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
-1
-2
12
y t f (t ) t 0e1t t
da cui
log y t log 0 1t log t
0* 1t t*
ATTENZIONE: la stima distorta E(yt)f(t) , anche la previsione risulta
distorta.
Se si utilizza la specificazione del modello additiva
y t 0e1t t
Non lineare e non linearizzabile nei parametri. Utilizzando i minimi
quadrati si ha un sistema non lineare nei parametri e la soluzione
raggiungibile solo per via iterativa.
13
f (t ) 1 et
1,2
1
0,8
=0,1
=0,4
0,6
=0,8
0,4
0,2
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
14
f (t ) 0 1e
2*t
con 0 0 1 0 e 2* k 0
Tale curva differisce da quella esponenziale semplice per la presenza della
costante o asintoto superiore 0.
Non linearizzabile tramite trasformazione logaritmica, tuttavia la
differenza 0-f(t) unesponenziale linearizzabile e, conoscendo il
- La curva logistica
In questo caso tasso di crescita direttamente proporzionale al
prodotto tra il livello raggiunto e lammontare di crescita ancora
da raggiungere (con k>0 fattore di proporzionalit e >0 valore
limite della crescita).
f (t )
con >0
kt
1 e
15
Serie2
Serie3
0,4
0,2
16
13
10
-2
-5
-8
-1
1
-1
4
-1
7
-2
0
1,2
1
0,8
k=4
0,6
k=1
k=1/4
0,4
0,2
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
e
f (t )
f * (t ) * * e kt
16
- La curva di Gompertz
f (t ) exp ekt
con >0
Serie1
Serie2
0,6
Serie3
Serie4
0,4
0,2
24
20
16
12
-4
-8
-1
2
-1
6
-2
0
-2
4
1,2
1
0,8
B=1/8
B=1
0,6
B=8
B=64
0,4
0,2
0
1
11 13
15 17
19 21 23
25 27
17
LA COMPONENTE STAGIONALE
Anche questa componente, come il trend, pu essere stimata con il
modello di regressione. Si rappresenta mediante una funzione periodica
g(t).
g (t ) j d jt
j 1
t=1,2,...,n
0
D
1
0 0 0
1 0 0
0 1 0
0 0 1
0 0 0
1 0 0
0 0 1
1
2
3
4
Al solito
* (D ' D)1D ' y
18
j 1
j j j
j 1, 2,..., s
St Ai cos(
i 1
2 i
t i )
s
Ai ampiezza
i angolo di fase
Ad esempio: per dati mensili s=12, la prima armonica (i=1)
19
1,5
1
0,5
39
36
33
30
27
24
21
18
15
12
0
-0,5
-1
-1,5
y t 0 1t ... q t q Ai cos(i t i ) t
i 1
y P + D +
y P D
dove
20
MEDIE MOBILI
Quando siamo di fronte ad un fenomeno con un andamento molto
irregolare che richiederebbe, dal punto di vista analitico, approssimazioni
con polinomi di grado molto elevato, si pu provare ad individuare la
componente di fondo senza evidenziarne la legge sottostante.
Uno strumento utile a tal fine la media mobile, utilizzata per stimare il
trend, destagionalizzare ed eliminare o ridurre la componente erratica.
Consideriamo la seguente serie mensile
Mese
Anno
1
2
3
1
266.0
194.3
339.7
2
145.9
149.5
440.4
3
183.1
210.1
315.9
4
119.3
273.3
439.3
5
180.3
191.4
401.3
6
168.5
287.0
437.4
7
231.8
226.0
575.5
8
224.5
303.6
407.6
9
192.8
289.9
682.0
10
122.9
421.6
475.3
11
336.5
264.5
581.3
12
185.9
342.3
646.9
Osservati
600.0
MM3
MM7
500.0
400.0
300.0
200.0
100.0
0.0
0
10
15
20
25
30
35
40
La trasformazione della serie Yt una somma pesata dei valori della serie
originale corrispondenti ad istanti temporali intorno a t.
y t* m1 y t m1 m11y t m11 ... m2 y t m2
cio
m2
y t* i y t i
i m1
y t* i B i y t My t
i m1
di potenze
1
m1 m2 1
e se m1 m2 m
y t*
m
1
y t i
2m 1 i m
*
y1999
6 7 14
9
3
..
1 1 1
M 5 ; , , .
5 5 5
22
i 1
i m
r
i i 0
i m
r 1,..., p
per
i t i
i m
E[ t* ]
i E[ t i ] 0
*2 Var[ t* ] 2 i2
i m
la serie trasformata, se
2
i 1,
i m
i m
i2
i m
0.50
0.8
0.40
0.6
0.4
0.30
0.2
0.20
0
-0.2 1
-0.4
-0.6
0.10
3
9 11 13 15 17 19 21 23 25 27 29
0.00
-0.10 1
-0.8
-0.20
-1
-0.30
11 13 15 17 19 21 23 25
1
( y t 2 2y t 1 2y t 2y t 1 y t 2 )
8
ATTENZIONE: si creano effetti di correlazione spuria (effetto di SlutskyYule) che introducono andamenti ciclici spuri.
Stima della componente stagionale
Lo studio della stagionalit presenta due problemi fondamentali:
a) la semplice stima di questa componente;
b) leliminazione, dopo la stima, di tale componente
dallandamento
generale
della
serie
storica
(destagionalizzazione).
Per prima cosa si stimano le componenti trend-ciclo con m.m. centrate e si
ricava la componente stagionale ed erratica, a seconda del modello di
yt
composizione: y t y t**
**
yt
S t ISt
yt
y t**
t m 1,..., n m
j 1,...,12
12
*
S j 1,
j 1
ma questo non
S j
12
12
*
S j
j 1
S j .
m
*2
i2
i m
25
La sua trasformata secondo una media mobile di ordine 2m+1 data da:
0 se t m 1
y t se m t m
0 se t m 1
*
t
Q ((1 B )3i )2
i m
Che misura lo scarto tra una parabola e la curva descritta dai coefficienti.
Q 0 quando tutti i coefficienti descrivono una parabola e cresce per
scostamenti via via maggiori.
Medie mobili di Henderson
Sono m.m. di ordine 2m+1 che conservano i polinomi di grado 2 e
minimizzano Q. I coefficienti si ottengono dalla minimizzazione vincolata:
m 3
3
2
((1 B ) i )
min
i i m
s.v .
m
i 1
i m
m
ii 0
i
m
m
i 2 0
i m i
M0 5; 1,2,2
8
ottenendo:
T 1 M y
t
0 t
3. Stima
di prima approssimazione
della
serie detrendizzata:
S 1t yt Tt1
4. Stima di prima approssimazione componente stagionale: applicando
al 3. la media mobile per 5 anni:
1
M1 17 ; 1,0,0,2,0,0,0,3
9
ottenendo:
1 M (S )1
S
t
(T )1t y t St1
6. Stima di seconda approssimazione del trend:si applica alla 5. la
media mobile di Henderson a 5 termini:
1
M2 5;
21,84,160
286
ottenendo:
T 2 M (T )1
t
M1 25; 1,0,0,0,2,0,0,0,3,0,0,0,3
15
27
p n 2(n 2) / 3
(16n 29) / 90
d n (n 1) / 2
(n 1) / 12
n .
28
IL LISCIAMENTO ESPONENZIALE
(EXPONENTIAL SMOOTHING)
Uno degli scopi dellanalisi delle serie storiche fornire indicazioni
previsive sul fenomeno dinteresse. Per previsione si intende un
descrizione di avvenimenti futuri che si fonda su un insieme coordinato di
ipotesi. La previsione si fonda sul presupposto logico che, in talune
situazioni, ragionevole supporre che le informazioni disponibili per il
passato, adeguatamente trattate, siano in grado di ridurre lincertezza circa
gli accadimenti futuri.
La previsione si distingue in relazione a tre elementi:
a) orizzonte temporale:
- breve o congiunturale (12-18 mesi)
- medio (5 anni)
- lungo termine (non altre 10 anni);
b) obiettivo
- strumentale (unico scopo avvertimento)
- tendenziale (evitare il ripetersi di fenomeni)
- condizionale (ipotesi forti che condizionano le previsione)
- normativa (come possibile conseguire certi obiettivi);
c) metodo impiegato
- informale o previsione naif (soggettivo, saggezza accumulata
dal decisore)
- serie storiche (lisciamento esponenziale)
- regressioni e modelli econometrici.
Il lisciamento esponenziale il metodo pi utilizzato specialmente in
ambito aziendale per le previsioni nel breve periodo. Qualit: flessibilit e
semplicit duso.
Data una serie y t tn1 supponiamo di volere prevedere yn+k con k>1 detto
orizzonte temporale. Si indica con yt k la previsione fatta al tempo t.
Se la serie ha un trend costante alterato da fattori accidentali yt a t ,
la previsione data dalla perequazione di tutte le informazioni disponibili
fino a n con uguale peso:
y n 1
1n
1 n
y t y n j 1
n t 1
n j 1
29
y n 1
w l y n l 1
l 1
wl
con w l 0; w l w l 1 l=2,3,...,n
l 1
scritta anche
n 1
y n 1 c j y n j
j 0
cj
w j 1
n
w
l 1
j 0,1,..., n 1
y t 1 c0 yt c1 yt 1 c2 yt 2 ...
Con pesi definiti dalla successione esponenziale
c j c0 j ,
j 0, 1,..., n 1, 0 1
y n 1 (1 ) j y n j
j 0
yn1 yn (1 )y n
(1.)
Cio come una media ponderata tra la previsione fatta al tempo n-1 e
lultima osservazione yn , il cui peso tanto pi forte quanto pi piccola
la costante.
Appare chiara la logica di aggiornamento sequenziale del metodo (la
previsione viene modificata dallosservazione pi recente) ed il ruolo della
costante di lisciamento
30
Riassumendo:
- per 0 il lisciamento esponenziale attribuisce sempre pi peso ai
nuovi dati e leffetto perequativo quasi nullo, considerando dunque
la serie affidabile e la previsione non fa altro che restituire lultima
osservazione disponibile.
- per 1 il lisciamento esponenziale attribuisce peso pressoch
nullo ai nuovi dati e la nuova previsione tende a coincidere con la
precedente.
La costante esprime la vischiosit del sistema (importanza vecchia
previsione).
Per stimare la funzione (1.) necessario avere un valore iniziale di e di
y1 .
viene posto tra 0,05 e 0,3 oppure stimato mediante algoritmi non lineari.
Ad esempio con i minimi quadrati si cerca quel valore che minimizza:
n 1
2
( y t 1 y t 1 )
t m
y1
usualmente:
y1 y1 se molto piccolo
y1 ( y1 y 2 ) / 2
y1
1 n
y t se pi vicino ad 1
n t 1
31
I metodi di Holt-Winters
Generalizzazione del precedente; cercano la perequazione di yt tramite la
determinazione del livello, del trend e della stagionalit.
- Metodo non stagionale
Hp. che in prossimit di n un aggiustamento mediante una retta di
equazione Ln Tn (t n) sia preferibile alla perequazione fornita da una
costante.
Le stime delle formule di aggiornamento sono:
Ln (Ln 1 Tn 1) (1 )y n 0< <1
T T (1 )(L L ) 0< <1
n
n 1
n 1
32
Si ha:
Valori
previsti pt
p.s.
No p.s.
Tot
Valori realizzati rt
p.s. No p.s. Tot
n11
n12
n1.
n21
n22
n2.
n.1
n.2
n
n12
n1.
n21
n.1
1
Is et
n t 1
EAM
1 n
et
n t 1
1 n
EM et
n t 1
Se i due indici sono molto vicini, c sistematicit negli errori.
Un altro indice la media quadratica degli errori di previsione, ottenuta
ponendo s=2:
MQE
1 n 2
e t
n t 1
( p r )2
Con ES+EV+EC=1
Per confrontare previsioni relative a pi serie storiche si utilizza lindice di
Theil:
U
MQE
1 n 2
r
n t 1 t
Ovvero:
n
( p
t 1
r t ) 2
r
t 1
1
n2
1
n2
t n1 1
n1
e
t 1
2
t
2
t
Assume valore nullo quando a previsioni non tutte esatte nel primo
sottoperiodo corrispondono previsioni perfette nel secondo; viceversa
tende ad infinito.
34