Ebook Curso Analise Series Temporais
Ebook Curso Analise Series Temporais
Ebook Curso Analise Series Temporais
Equipe Executiva
Fátima Sonally Sousa Gondim – Coordenação Geral
Maryane Oliveira Campos Scherer – Coordenação Executiva
Tatiane Leite – Coordenação Pedagógica
Sheyla Leite, Claudia Spinola Leal Costa e Dalila Gonzaga –
Equipe de Execução
Regina Falcão – Apoio Administrativo
GLOSSÁRIO 58
INSTRUMENTO DE AVALIAÇÃO 62
ANEXOS 63
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
INTRODUÇÃO
A perspectiva de antever o futuro sempre en-
cantou o ser humano. Saber o que vai acontecer
antes mesmo que os primeiros sinais se mani-
festem pode propiciar um melhor aproveita-
mento de efeitos benéficos dos eventos futuros,
pode propiciar uma preparação antecipada para
eventuais efeitos adversos.
4
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
5
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
MÓDULO 1
Séries temporais: aspectos
conceituais da organização das
medidas de doenças no tempo
6
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
A primeira pergunta parece instintiva: “qual foi o valor deste coeficiente no ano anterior?” Continu-
ando sua reflexão sobre o tema, o gestor decerto se perguntará: “é justo pensar que o que ocorreu
no passado recente se repita no futuro imediato?” Essa segunda pergunta amplia o escopo de seu
esforço de antever o futuro. Agora, o gestor quer apurar sua previsão levando em consideração
não apenas o que ocorreu no último ano, mas também perguntando sobre a movimentação re-
cente que esta medida sofreu no tempo. Daí a terceira hipotética questão: “como a mortalidade
infantil tem se comportado ao longo dos últimos anos?” O estudo epidemiológico das séries tem-
porais contempla justamente essa preocupação em derivar conhecimentos sobre a movimentação
recente das medidas de interesse em saúde. Há duas finalidades para esse conhecimento: prever
resultados de interesse e identificar fatores que interferem sobre esses resultados.
Séries temporais foram definidas de modo breve e sucinto: “são sequências de dados quantita-
tivos relativos a momentos específicos e estudados segundo sua distribuição no tempo” (Wie-
ner, 1966). Essa definição indica a aplicabilidade desse recurso de análise para fins variados e
diferentes campos de conhecimento. Como aperfeiçoar o fluxo de estoque de um almoxarifado?
Como programar a compra de matéria prima para uma atividade industrial? Como dimensionar
o fluxo de vendas num empreendimento comercial? Estes são apenas alguns exemplos de apli-
cação da análise de séries temporais para finalidades não imediatamente relacionadas à saúde.
Nosso enfoque, no entanto, recairá sobre as medidas de saúde e como aplicar a análise de séries
temporais para os estudos epidemiológicos.
Esse primeiro módulo aborda aspectos conceituais relacionados a essa estratégia de análise
dos estudos epidemiológicos, a qual consiste em organizar no tempo as informações sobre as
doenças e derivar conhecimento desta análise.
7
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Séries temporais e música: Vimos que as séries temporais são uma forma de organizar no
tempo as informações quantitativas sobre aspectos relacionados à saúde. A música também
é uma forma de organizar no tempo um tipo específico de informação: os registros sonoros.
A teoria musical reconhece três elementos da música, os quais podem ser pensados em cor-
respondência com a análise epidemiológica das séries temporais: melodia, harmonia e ritmo.
Os movimentos melódicos em direção às notas mais graves ou mais agudas podem ser projetados
aos movimentos das tendências nas séries temporais. Observe, na Figura 2, a série temporal do
coeficiente de mortalidade geral na cidade de São Paulo, de 1900 a 1994. A imagem da série
deixa claro que, de modo geral, essa medida evoluiu ao longo do século reduzindo a magnitude
de valores; isto é, passando de valores mais elevados na escala vertical para valores menos
elevados. Isto configura uma tendência decrescente.
8
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 2. Coeficiente de mortalidade geral, cidade de São Paulo, 1900-1994. Fonte: Antunes (1998)
Complicando um pouco mais, uma mesma série temporal pode apresentar trechos com diferen-
tes tendências. Observe como isso de fato ocorre na Figura 3, que mostra a série temporal da
mortalidade infantil na cidade de São Paulo, abrangendo o mesmo período. A tendência secular
de declínio dessa medida foi claramente interrompida no período de 1961 a 1973, quando a
mortalidade infantil cresceu de modo consistente. O que teria acontecido nesse período para
justificar esta observação? O que mais de interessante pode ser depreendido da apreciação
visual desta série temporal? Em cada um dos primeiros anos do monitoramento, ocorreram em
torno de 220, 230 óbitos de crianças com menos de um ano de idade, para cada 1000 nascidas
vivas. O que pensar desses valores tão elevados?
Figura 3. Coeficiente de mortalidade infantil, cidade de São Paulo, 1900-1994. Fonte: Antunes (1998)
9
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
No piano, enquanto a mão direita dedilha a melodia, a mão esquerda toca outras notas dos acordes
que compõem a harmonia. Como elementos musicais complementares, a melodia é o desenvolvi-
mento horizontal da música, enquanto a harmonia é seu desenvolvimento vertical, representado
pelos acordes formados por sons concomitantes. De modo análogo, quando estudamos a tendência
e sintonizamos nossa atenção no desenvolvimento horizontal da série no tempo, precisamos atentar
também para a complexidade vertical da série temporal, identificando como suas medidas se har-
monizam, isto é, se associam com informações adicionais sobre os fenômenos relacionados.
Com essa ideia em mente, reveja a série temporal da Figura 2 e identifique o pico de mortalidade
geral que ocorreu na cidade de São Paulo no ano de 1918. Por meio da análise de tendência desta
série temporal, pode-se estimar que o valor observado em 1918 foi quase 50% mais elevado que a
média entre os anos imediatamente anterior e posterior. Esta informação é compreensível por si só;
ela indica que, de fato, algo muito ruim ocorreu naquele ano.
Mas o significado desta informação decerto se amplifica quando procuramos associá-la com o co-
nhecimento sobre o que se passou na cidade de São Paulo. Como se sabe; 1918 foi o ano da “gripe
espanhola”, de triste lembrança. Naquele ano, ocorreu um grave surto de gripe, com enorme impac-
to na mortalidade geral. No mesmo estudo do qual foi reproduzida a Figura 2, foi delineada a série
temporal da esperança de vida ao nascer, mostrando uma forte redução nessa medida. Como muitas
crianças, adolescentes e adultos jovens foram vitimados pela gripe, a duração média da vida foi de
cerca de 50 anos, no ano anterior, para menos de 32 em 1918.
A perspectiva de harmonizar a interpretação das tendências observadas nas séries temporais com
outras informações que estejam disponíveis sobre o fenômeno em questão diz respeito ao estudo
de associação, que é um recurso bastante utilizado na análise epidemiológica. Estas informações
adicionais podem ser qualitativas, auxiliando a interpretação dos motivos que justificam o aumento,
a diminuição ou a estabilidade dos valores de uma medida de interesse para a saúde. Estas informa-
ções adicionais também podem ser quantitativas, dando ensejo à aplicação de técnicas de análise
estatística para estimar sua associação com a série temporal que se tenta explicar.
10
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 4. Séries temporais: (a) mortalidade geral por dia e (b) temperatura média diária na cidade de
São Paulo, 1991-1994. Fonte: Gouveia et al. (2003)
Já a mortalidade geral foi mais elevada nos períodos de inverno que no verão. No estudo que
delineou a Figura 4, os autores concluíram haver uma associação inversa entre os dois fenô-
menos. Isto é, nos períodos em que os dias são mais quentes, a mortalidade geral diária tende
a ser menor, e vice-versa, a mortalidade é tendencialmente mais elevada nos períodos de frio.
11
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Diz-se que há uma associação direta ou positiva entre duas séries temporais, quando os valores
de ambas aumentam ou diminuem concomitantemente. De modo complementar, a associação
é inversa ou negativa se o aumento de uma medida corresponde à diminuição da outra, como
no caso discutido no parágrafo anterior. E se diz que não há associação quando não há corres-
pondência entre as mudanças de valor das duas séries. A associação entre séries temporais não
necessariamente tem origem causal. O aumento de uma variável pode não ser causa do aumen-
to ou declínio da outra, ambas podem ter causas comuns, e sua associação pode ser reflexo de
processos mais complexos.
A percepção de que os fenômenos de interesse para a saúde também podem apresentar repe-
tições de certa forma organizadas no tempo, ou seja, de que há algum ritmo a ser reconhecido
na análise de séries temporais, é muito importante para a epidemiologia. Estamos falando das
variações sazonais e cíclicas que afetam a medida de muitas doenças.
O movimento sazonal da temperatura média diária que foi representado na Figura 4 é bem
conhecido de todos: faz mais frio no inverno que no verão... A originalidade do estudo do qual
foram reproduzidas as imagens da Figura 4 diz respeito justamente à existência de variação
sazonal também no número diário de mortes. Quem recuperar o manuscrito original na página
que a revista mantém na Internet (o acesso é livre) poderá refletir mais detalhadamente sobre
os motivos que justificam esta variação sazonal.
A Figura 5 fornece outro exemplo de construção de conhecimento em saúde com base na análi-
se da variação sazonal das séries temporais. Esta figura reproduz, para as regiões Sul e Nordeste
do Brasil, a mortalidade semanal de pessoas com 65 anos ou mais por pneumonia e influenza.
O período de monitoramento foi de 1996 a 1998, os três anos que antecedem a introdução do
programa nacional de vacinação de idosos contra a gripe.
12
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 5. Séries temporais da mortalidade semanal de idosos (65 anos ou mais) por influenza e
pneumonia nas regiões Sul e Nordeste, 1996 a 1998. Mortalidade observada, mortalidade esperada
e limiar epidêmico previsto. Fonte: Oliveira (2013)
Além da série temporal da mortalidade observada, foi delineada, para cada região, a sequên-
cia da mortalidade esperada para cada semana, se não houvesse variação aleatória na medida
(essa “rugosidade” dos valores observados), e tampouco houvesse surtos de gripe causando um
aumento brusco da mortalidade, como este, que pode ser facilmente identificado na região Sul,
em meados de 1996. Também foi delineada a curva que projeta uma previsão para o limiar epi-
dêmico, o qual, quando ultrapassado, configura a ocorrência de um surto de gripe. Os cálculos
da mortalidade esperada e do limiar epidêmico previsto demandam o uso de técnicas avançadas
de análise estatística, as quais não serão objeto deste módulo.
Exercitando o olhar sobre as duas séries temporais da Figura 5, o que pode ser depreendido de
relevante para o conhecimento em saúde?
Ambas as séries apresentam tendência estacionária com variação sazonal. Notando a diferença
de escala no eixo vertical, percebe-se que a magnitude da mortalidade oscila em torno de va-
lores mais elevados na região Sul que no Nordeste. Também a amplitude da variação sazonal é
mais elevada na região Sul. Estas duas diferenças podem estar relacionadas à maior amplitude
de variação climática na região Sul que no Nordeste.
Uma análise mais detalhada indica que o período de máxima mortalidade anual estimada para a
região Sul variou entre a 28ª e a 31ª semanas epidemiológicas, respectivamente a 2ª semana de
13
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
julho e 4ª semana de julho, o que corresponde ao inverno. A hipótese subjacente é que as pes-
soas passam mais tempo em ambientes fechados nos dias mais frios, propiciando a transmissão
da gripe. Na região Nordeste, o período de máxima mortalidade esperada ocorreu entre a 17ª
e a 22ª semanas epidemiológicas, respectivamente a 4ª semana de abril e 4ª semana de maio.
Como há menos variação de temperatura entre as estações no Nordeste, o período de maior
permanência em ambientes fechados (e, portanto, mais propício à transmissão da gripe) ocorre
no outono, quando chove mais. Estes dados são indicativos de diferenças no perfil epidemioló-
gico da doença em cada região.
Na Figura 4, o registro que permitiu visualizar a variação sazonal utilizou dados diários de
temperatura e mortalidade. Nas séries da Figura 5, a variação sazonal foi apreendida em dados
discriminados por semana. Utilizar a escala mensal é outra estratégia para a percepção visual
de sazonalidade nas séries temporais de interesse para a saúde. Do ponto de vista etimológi-
co, a palavra sazonal é relativa às estações do ano. Quando o ritmo, ou o ciclo de repetição da
série temporal se prolonga por mais de um ano, não se fala em variação sazonal, mas sim em
variação cíclica.
A Figura 6 exemplifica uma série temporal com indicação de variação cíclica. Medidas epidemio-
lógicas do sarampo são emblemáticas para a percepção de variação cíclica, pois a ocorrência de
um surto tende a reduzir o risco de novos surtos em curto prazo. Os sobreviventes da doença
adquirem imunidade e, com menos crianças susceptíveis, a transmissão se torna menos prová-
vel. Isto é, há imunidade individual e imunidade de rebanho interagindo para a redução do risco
da doença. Contudo, nos anos seguintes, as crianças imunes vão crescendo e saindo da faixa
etária de maior risco para a doença, enquanto novas crianças vão nascendo e aumentando o
número de suscetíveis. Esse processo, cíclico, pode facilitar a eclosão de um novo surto e isso
de fato ocorre enquanto o vírus continua circulando. A Figura 6 mostra a variação cíclica na
incidência de sarampo na cidade de São Paulo. Mesmo nos períodos em que não houve surtos
epidêmicos com grande aumento do número de casos da doença, como entre 1975 e 1983, hou-
ve aumento cíclico da incidência mensal. A importância epidemiológica desta variação cíclica
pode ser mais bem apreciada, quando se recorda que no início dos anos 1980, o sarampo foi a
segunda principal causa de morte (em seguida à pneumonia) no grupo etário de um a cinco anos
(Antunes & Waldman, 2002).
14
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 6. Incidência mensal de sarampo na cidade de São Paulo, 1960-1993. Fonte: Waldman & Rosa (1998)
Além da variação cíclica, a Figura 6 também apresenta uma acentuada tendência crescente
na década de 60, com posterior tendência decrescente. O declínio do sarampo na cidade foi
associado a melhorias gerais das condições de vida e à introdução e aumento de cobertura da
vacinação nesse período (Antunes & Waldman, 2002).
Seguindo o paralelo entre música e análise de séries temporais, qual seria o elemento de varia-
ção das medidas epidemiológicas organizadas no tempo que propiciaria tamanha perturbação
na percepção de tendências, associações e variações sazonal e cíclica? A variação aleatória das
medidas é, para as séries temporais, o equivalente ao ruído para a música. A variação aleatória
manifesta-se visualmente na forma de rugosidade nas linhas dos gráficos de séries temporais. Ao
rever as figuras anteriores, pode-se notar que a variação aleatória afeta todas as séries temporais
delineadas, e coexiste com os demais movimentos que foram descritos neste texto.
15
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Não é raro que os surtos epidêmicos ocorram de forma brusca e inesperada. Na análise de uma
série temporal, o que diferencia um surto epidêmico da variação aleatória? Reveja a definição de
variação aleatória no início do parágrafo anterior; surtos epidêmicos não se enquadram nessa
definição. Mesmo quando escapam ao controle, os surtos epidêmicos não ocorrem ao acaso e o
esforço de analisar as séries temporais vem justamente no sentido de os antecipar e prevenir.
Por sua magnitude, os surtos epidêmicos não podem ser reduzidos a variações irregulares e
erráticas. E, seguramente, não são desimportantes.
Conclusão
Tendência; sazonalidade e variação cíclica; estudos de associação e variação aleatória. Conhe-
cemos agora os principais movimentos da análise de séries temporais. A definição desses movi-
mentos foi fortemente apoiada na disposição gráfica das séries temporais. O recurso gráfico é o
primeiro passo para compreender os processos subjacentes às medidas sequenciais ordenadas
temporalmente. Esse primeiro passo é importantíssimo e não deve ser subestimado. Sempre fazer
o gráfico da série temporal é imperativo para viabilizar seu estudo e compreensão. A reflexão so-
bre a disposição visual da série deve usar os conceitos desenvolvidos nesta primeira seção.
Sabendo o que deve ser procurado nas séries temporais, podemos partir para o Módulo 2, na
qual são apresentados e exercitados os métodos práticos para esta análise.
16
MÓDULO 2
Séries temporais: aspectos
metodológicos da organização das
medidas de doenças no tempo
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Vimos que as séries temporais podem ter tendência crescente, decrescente ou estacionária.
Podem também apresentar tendências diferentes em trechos sequenciais. Para dar conta
desta complexidade, uma alternativa consiste em utilizar funções matemáticas que melhor
se ajustem aos pontos observados, seja para a série temporal como um todo, seja para o
segmento que estiver em foco.
Para explorar a disposição gráfica e inspeção visual das séries temporais, e para introduzir os
recursos de análise que permitem determinar quantitativamente suas tendências, consideremos
um exemplo de aplicação, relativo à evolução temporal da aids em alguns países europeus.
É conhecida a associação entre aids e condição socioeconômica (Farias & Cardoso, 2005). De
modo geral, estratos sociais mais afetados pela privação material tendem a ser mais reticen-
tes às medidas de prevenção e proteção individual, o que os submete a risco mais elevado
18
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
para contrair a doença. Quando contraem a doença, as pessoas menos escolarizadas e/ou mais
pauperizadas tendem a ter mais dificuldade para manter a adesão ao protocolo de medicação
antirretroviral, o que as submete a risco mais elevado de óbito. Com base nestas indicações,
poderíamos nos perguntar sobre a evolução temporal dos indicadores epidemiológicos da aids
em alguns países europeus com diferentes perfis socioeconômicos. Como a doença progrediu
em países ricos e com serviços de saúde relativamente bem organizados (como Inglaterra, Ale-
manha e Finlândia)? Como a doença progrediu em um país mais pobre, como a Hungria? E num
país emergente, como a Rússia?
A Figura 7 mostra as séries temporais da incidência de AIDS nesses países, no período para o
qual havia dados disponíveis na European Health for All Database (HFA-DB), que é a base de
dados sobre saúde mantida pela Organização Mundial da Saúde, em seu escritório regional para
a Europa.
Nota-se uma marcante expansão da epidemia nos países mais ricos até meados da década de
1990. Essa expansão foi maior no Reino Unido (Inglaterra, Escócia, Irlanda do Norte e País de
Gales), um pouco menor na Alemanha e ainda menos intensa na Finlândia. Nos países de renda
menos elevada, Rússia e Hungria, sequer se chegou a notar uma expansão da epidemia. O que jus-
tifica o sensível crescimento da incidência de aids no Reino Unido, na Alemanha e na Finlândia até
meados dos anos 1990? Por que a epidemia retrocedeu subsequentemente? Estes países teriam
adotado programas efetivos de prevenção? A introdução da terapêutica antirretroviral em meados
da década de 1990 teria exercido algum efeito sobre a redução de incidência? Seriam confiáveis
os dados de incidência da aids na Rússia e Hungria? Uma busca no PubMed por artigos científicos
que tenham se aplicado a essa temática poderia auxiliar a desdobrar essas questões.
19
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 7. Incidência de aids em alguns países europeus. Fonte: European health for all database.
https://gateway.euro.who.int/en/hfa-explorer/
Figura 8. Mortalidade por aids em mulheres, em alguns países europeus. Fonte: European mortality
database. https://gateway.euro.who.int/en/hfa-explorer/
20
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 9. Mortalidade por aids em homens, em alguns países europeus. Fonte: European mortality
database. https://gateway.euro.who.int/en/hfa-explorer/
Na Figura 9, observa-se uma importante redução da mortalidade de homens por AIDS, na Ale-
manha e no Reino Unido, a partir de meados dos anos 90. Independente da magnitude da
mortalidade ter sido mais elevada na Alemanha, a inspeção visual das séries parece indicar que
o declínio foi equivalente nos dois países. Será que isto de fato ocorreu? É possível comparar
quantitativamente as duas tendências?
21
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Y = b0 + b1X
Considere Y como sendo a medida dos valores da série temporal, e X a medida dos anos, ou de
outra unidade temporal na qual os valores de Y tenham sido monitorados. O valor de ‘b0’ corres-
ponde à interseção entre a reta e o eixo vertical; de fato, quando X = 0, temos, na equação aci-
ma, Y = b0. O valor de ‘b1’ corresponde à inclinação da reta; para cada mudança de uma unidade
na escala de X, o valor de Y é acrescido de ‘b1’ unidades. Naturalmente, se b1 for positivo, a reta
é crescente, e valores mais elevados de b1 indicam retas mais inclinadas no sentido vertical. De
modo complementar, se b1 for negativo, a reta é decrescente, e se b1 não for diferente de zero,
a reta é paralela ao eixo X e qualquer variação de X não modifica os valores de Y, configurando
a condição para a tendência estacionária.
Para mensurar a taxa de variação da reta que ajusta os pontos da série temporal, é preciso foca-
lizar o valor de b1, cuja estimação é feita por meio da análise de regressão linear. Para esse fim,
vamos trabalhar com a transformação logarítmica dos valores de Y, o que propicia vantagens
de ordem estatística para a aplicação da análise de regressão linear, como a redução da hete-
rogeneidade de variância dos resíduos da análise de regressão; isto é, dos valores da diferença
entre os pontos da reta média e os pontos da série temporal. Além disso, essa transformação
favorece o cômputo da razão de incremento anual da série temporal, por meio do procedimento
descrito em seguida.
22
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Consideremos X1, X2, X3, ..., Xi, ..., Xn como sendo os valores dos anos para os quais foram to-
madas as medidas Y1, Y2, Y3, ..., Yi, ..., Yn. Então, para qualquer ano “X(i)” e seu ano subsequente
“X(i+1)”, podemos escrever que:
logY(i) = b0 + b1X(i); e
logY(i+1) = b0 + b1X(i+1)
Como X(i+1) e X(i) são anos subsequentes, sua diferença é sempre igual a um. E, usando proprie-
dades da álgebra de logaritmos, teremos:
Nesta notação, o acento circunflexo corresponde à operação exponencial e deve ser lido como
“elevado a”. Então, subtraindo 1 de ambos os lados da equação, teremos:
Mas [Y(i+1) – Y(i)]/Y(i) é justamente a taxa de crescimento médio anual, pois foi dimensionada
para qualquer ano genérico “i”. Basta, então, estimar o valor de b1 para obtermos a taxa de cres-
cimento médio anual. Observe que esta taxa pode ser apresentada como proporção ou como
porcentagem. Se a taxa for positiva, a série temporal é crescente, se for negativa é decrescente,
e será estacionária se o seu valor não for significantemente diferente de zero. Como o valor de
b0 é calculado por meio de regressão linear, é possível empregar o erro padrão (EP) da estima-
tiva de b1 para construir o intervalo de confiança (IC95%) desta medida. Com isso, teremos uma
expressão sintética para a estimação quantitativa da tendência:
23
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Nesta fórmula, tanto o valor de b, como os valores de b1máximo e b1mínimo são fornecidos por
análise de regressão linear, disponível em muitos softwares de análise estatística. No entanto, é im-
portante notar que a análise de regressão linear simples não se presta à análise de séries temporais,
pois a autocorrelação serial usualmente encontrada em medidas de dados populacionais induz o
rompimento de uma premissa desse método, que é resíduos de regressão com distribuição aleatória.
Para superar essa dificuldade, é preciso recorrer a outras rotinas de análise de regressão linear, que
não sejam a regressão linear simples. As mais utilizadas são as técnicas de Prais-Winsten e Cochrane-
-Orcutt, ambas desenvolvidas para a aplicação em séries temporais e que são facilmente executáveis
em programas de informática para análise estatística que são empregados na área de saúde, como o
pacote R, Stata e SPSS. Sendo dois procedimentos diferentes para a mesma finalidade, seus resultados
não serão exatamente coincidentes. Apesar de alguma diferença em casas decimais dos resultados,
suas interpretações (tendência crescente, decrescente ou estacionária) dificilmente diferirão.
Nas séries temporais da mortalidade por aids (Figuras 8 e 9), foi verificado um impressionante cresci-
mento na Rússia, tanto para homens como para mulheres. Independente de a mortalidade ser maior
em homens que em mulheres, para qual desses grupos o crescimento terá sido mais intenso? Usando
a metodologia acima descrita, encontra-se taxa de crescimento anual de 3,96% (Intervalo de Confian-
ça 95%: 3,59% a 4,33%) para homens e 4,59% (IC95%: 3,77% a 5,43%) para mulheres. Esses valores
são indicativos de tendência crescente para ambas as séries. Como há grande superposição entre os
intervalos de confiança, sugere-se a hipótese de não ser significante a diferença entre as duas taxas
de crescimento anual.
O que poderia justificar tamanho incremento da mortalidade por aids na Rússia, num período em que
houve declínio em vários países? Para testar a hipótese de que esse aumento reflete o aumento da
capacidade de reconhecer a aids como causa básica de morte, poderíamos traçar as séries temporais
da proporção de óbitos por causa básica não determinada ou mal especificada. Se a magnitude desta
proporção for elevada, reforça-se a hipótese de que é ruim a qualidade do registro de informações de
mortalidade naquele país. Se a tendência da série temporal da proporção de óbitos sem identificação
de causa for decrescente nos últimos anos, reforça-se a hipótese de que o aumento recente da mor-
talidade por aids reflete, ao menos em parte, o aumento de capacidade do sistema de informações
em reconhecer os óbitos causados pela aids.
Quando a mesma análise é aplicada para a mortalidade de homens por aids na Alemanha, a partir de
1994, encontra-se taxa de crescimento anual de –9,70% (IC95%: –15,80% a –3,16%). O sinal negativo
indica que a tendência é decrescente, e a magnitude desses números indica a intensidade do declínio
médio anual desta medida. Como o intervalo de confiança não inclui o valor de zero, a hipótese de
tendência estacionária é excluída. Por fim, quando se analisa a mortalidade por AIDS em homens na
Hungria, encontra-se taxa de crescimento anual de –0,15% (IC95%: –6,48% a +6,62%). Esse resulta-
24
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
do é muito pequeno, próximo de zero, e o intervalo de confiança vai de valores negativos a valores
positivos. Essas indicações são compatíveis com a hipótese de que a tendência é estacionária, e que
a epidemia não progrediu com mais intensidade na Hungria. Naturalmente, também esse resultado é
sujeito a restrições de validade relativas à qualidade do registro, naquele país, das causas de óbito em
geral, da mortalidade por aids em particular.
ATIVIDADE 1
Tendência da mortalidade infantil em dois Estados brasileiros
Objetivo: ao final desta atividade os estudantes serão capazes de testar hipóteses quan-
to à tendência crescente, decrescente e estacionária das séries temporais e verificar sua
correspondência para medidas de mortalidade infantil em dois estados brasileiros.
O censo de 2010 levantou dados sobre a renda domiciliar média nos Estados, indican-
do São Paulo como o valor mais elevado no país, e Maranhão como o menor. Conhe-
cendo a associação entre mortalidade infantil e condição socioeconômica, pode-se
perguntar sobre a diferença entre os dois Estados, no que diz respeito à tendência da
mortalidade infantil. Esta atividade visa testar esta hipótese.
Com esses dados, delineie os gráficos das séries temporais da mortalidade infantil
nos dois Estados, tentando reproduzir a Figura 11.
25
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
São Paulo
Mortalidade
Óbitos (menos de Nascidos
Ano infantil (por 1000
um ano de idade) vivos
nascidos vivos)
26
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Maranhão
Mortalidade
Óbitos (menos de Nascidos
Ano infantil (por 1000
um ano de idade) vivos
nascidos vivos)
27
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 11. Coeficiente de mortalidade infantil nos Estados de São Paulo e Maranhão.
Séries temporais, 1996-2010. Fonte: DATASUS
28
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
29
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
30
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
31
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Tela 4. Resultados obtidos para a análise de regressão de Prais-Winsten (dados de São Paulo).
No quadro que se abre (Tela 2), registre a variável dependente intitulada logcmi
(logaritmo do coeficiente de mortalidade infantil) e a variável independente (ano).
Ainda na Tela 2, clique em <Time settings> para definir a sequência de dados como
sendo uma série temporal. Na tela que se abre (Tela 3), registre o nome da variável
que marca o tempo (ano) e clique no tipo de variação temporal (Yearly) como indica-
do na Tela 3. Por fim, a Tela 4 mostra o resultado da análise, com as setas indicando
os valores do coeficiente relativo à variação anual e seu respectivo intervalo de
confiança.
32
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
33
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
ATIVIDADE 2
Tendência da mortalidade infantil em dois municípios brasileiros
Agora repita o procedimento solicitando o número de nascidos vivos a cada ano nos
dois municípios. Em uma planilha do Excel, registre os valores obtidos para cada cida-
de e calcule o coeficiente de mortalidade infantil dividindo o número de óbitos a cada
ano pelo número de nascidos vivos e multiplicando o resultado por 1000.
34
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Com base nas séries temporais obtidas, faça o gráfico no Excel e calcule o valor da ten-
dência nos dois municípios. Compare a magnitude dos valores: qual das duas cidades
teve padrão mais elevado de mortalidade infantil? Qual é a tendência deste índice em
São Caetano do Sul? E em Manari? Verifique que há rugosidade acentuada (variação
aleatória) nas séries temporais delineadas. Esse efeito foi maior para as medidas aferi-
das para cidades nesta atividade, do que para as medidas aferidas para estados, como
na Atividade 1. Observe que a variação aleatória foi maior para a cidade de Manari, o
que pode ter prejudicado a aferição da tendência da mortalidade infantil nesta cidade.
Procure refletir sobre os possíveis motivos do aumento da variação aleatória. Ao foca-
lizar cidades, em vez de estados, o número mais reduzido de eventos pode prejudicar
a análise. Nesse sentido, é importante fazer a crítica da base de dados. O número de
óbitos infantis a cada ano em São Caetano do Sul e Manari pode não ser suficiente-
mente elevado para permitir uma análise estável.
Para identificar se há variação sazonal, é preciso decompor a série temporal, isolando o com-
ponente sazonal e verificando se atende à hipótese de significância estatística. Essa decom-
posição usa a equação de regressão linear com componentes específicos para aferir a tendên-
cia e sazonalidade.
As variações sazonais podem ser aferidas por meio de medidas tomadas mês a mês, semana
a semana ou dia a dia. Vamos estudar uma metodologia prática para determinar se há ou não
há variação sazonal estatisticamente significante. O procedimento descrito a seguir consiste
na forma mais simples de decomposição das séries temporais e foi originalmente proposto por
Serfling (1963). Será preciso isolar o componente sazonal e verificar se ele atende à hipótese de
significância estatística.
35
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Uma primeira consideração diz respeito à forma de registro do tempo nas avaliações de sazona-
lidade. É preciso reconhecer que há alguma irregularidade nesse registro. Se as medidas foram
tomadas mês a mês, são utilizados os meses do calendário, enumerando-os sequencialmente
(1, 2, 3, ..., mês genérico “i”, ..., mês final “n”). Mas sabemos que os meses não são exatamente
iguais entre si. Alguns têm 30 dias, outros têm 31, e fevereiro tem 28 ou 29 dias, dependendo do
ano. Apesar disso, é fácil representar os dados segundo o mês de sua ocorrência no calendário,
mesmo reconhecendo que os meses não são regulares no número de dias.
Uma dificuldade análoga é encontrada quando se trabalha com dados discriminados por sema-
na. O ano não pode ser dividido de modo exato por semanas de sete dias. Para lidar com esta
dificuldade, considera-se que cada ano é dividido em 52 semanas epidemiológicas, o que obriga
uma ou duas semanas a ter oito dias, dependendo se o ano é bissexto ou não. Quando os dados
forem discriminados dia a dia, a solução encontrada para manter a regularidade de 365 dias
ao ano consiste em considerar que o registro relativo ao dia 29 de fevereiro é acrescido ao dia
antecedente, ou são considerados em média.
Estas soluções não são ideais, mas são aproximações plausíveis, factíveis e necessárias. Traba-
lharemos com meses que diferem entre si quanto ao número de dias. Teremos semanas cuja
extensão de sete dias terá pelo menos uma exceção a cada ano. Se os dados forem diários, nos
anos bissextos, o dia 29 de fevereiro deverá ser aritmeticamente integrado ao dia anterior, para
não romper a frequência de 365 dias por ano, que é necessária para a análise estatística.
Para avaliar se a variação existente na série temporal tem ou não tem alguma regularidade
sazonal, será preciso decompor a série temporal em dois componentes, utilizando a equação
de regressão linear, aos moldes do que foi apresentado na Figura 10. Para atender ao requisito
de modelar a variação sazonal, a equação de regressão é escrita como indicado na Fórmula 3:
Nesta equação, Y(i) é a medida da série temporal para cada medida diária, semanal ou men-
sal correspondente ao momento genérico “i” e X(i) é a numeração sequencial dos momentos
de tomada da medida (dia, semana, mês). π é a conhecida constante 3,141592654... e L é uma
constante relativa à forma da medida: 12 se a medida for mensal, 52 para medidas semanais e
365 para medidas diárias. Quanto aos coeficientes de regressão, b0 é a constante ou intercepto,
b1 é o estimador de tendência da série temporal e b2 e b3 são os coeficientes que modelam a
variação sazonal. Esta equação decompõe a série temporal em duas componentes, um para a
tendência, outro para a sazonalidade.
36
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Uma vez calculada a série de valores do termo sazonal, pode-se executar a análise de regressão
linear para estimar os coeficientes de regressão b0, b1, b2 e b3, e seus respectivos intervalos
de confiança 95%. De modo análogo ao que fora informado ao estimar a tendência, reitera-se
a indicação para não utilizar regressão linear simples para análise de séries temporais, pois
um dos requisitos para esta modalidade de análise é que os resíduos da equação de regressão
sejam aleatórios, o que não ocorre com medidas populacionais organizadas no tempo, as quais
frequentemente apresentam autocorrelação serial elevada. A autocorrelação serial tem como
efeito superestimar os indicadores de qualidade de ajuste da equação de regressão, o que, em
muitos casos, implica em inversão das conclusões da análise estatística, fazendo com que varia-
ções pouco expressivas tendam a ser indevidamente indicadas como significantes. Nesse senti-
do, deve-se utilizar os procedimentos de Prais-Winsten ou de Cochrane-Orcutt para a análise de
regressão linear em séries temporais.
Para exercitar a metodologia de detecção de variação sazonal nas séries temporais, vamos con-
siderar um problema prático de pesquisa. A Figura 12 mostra a série temporal da mortalidade
de idosos (65 anos ou mais) por gripe e pneumonia nas regiões Nordeste e Sul do Brasil, do
início de 1999 ao fim de 2009. Para favorecer a comparação visual, as séries temporais da mor-
talidade observada foram acompanhadas pelas séries da mortalidade esperada e pelo limiar
epidêmico em cada região, de modo análogo à Figura 5.
Sabe-se que a mortalidade por gripe e pneumonia é maior nos períodos mais frios do ano (An-
tunes et al., 2007). Mas há pouca variação climática entre o inverno e o verão no Nordeste, o
que justifica avaliar a hipótese de que não seja estatisticamente significante a variação sazonal
observada na mortalidade de idosos por gripe e pneumonia nesta região.
Uma primeira observação diz respeito ao fato de que a série tem tendência estacionária na
região Sul e crescente na região Nordeste. No estudo do qual esta imagem foi reproduzida,
esta diferença foi interpretada como sendo devida ao progressivo aumento da capacidade do
Sistema de Informações sobre Mortalidade em identificar as causas básicas de óbito em idosos
residentes no Nordeste; enquanto, na região Sul, esta capacidade já era elevada desde o início
do monitoramento.
37
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
A magnitude dos coeficientes de mortalidade é menor na região Nordeste que na Sul. Observe,
inclusive, que a escala vertical utilizou valores menos elevados para a região Nordeste. Também
a amplitude de variação entre as estações, a cada ano, é menor na região Nordeste que na região
Sul. Estas observações podem induzir a hipótese de que a variação sazonal da mortalidade de
idosos por gripe e pneumonia na região Nordeste não seja estatisticamente significante. Vamos
empregar a metodologia sintetizada na Fórmula 3 para testar esta hipótese.
Figura 12. Séries temporais da mortalidade semanal de idosos (65 anos ou mais) por influenza e
pneumonia nas regiões Sul e Nordeste, 1999-2009. Mortalidade observada, mortalidade esperada e
limiar epidêmico previsto. Fonte: Oliveira (2013)
Com base na aplicação dos valores observados da série temporal da mortalidade de idosos por
gripe e pneumonia na região Nordeste, a Fórmula 3 permite encontrar os seguintes coeficientes
de regressão: b2 = 0,229 e b3 = –0,221. Os intervalos de confiança das duas medidas incluem o
zero e os valores de p correspondentes são, respectivamente, p = 0,069 para o coeficiente rela-
tivo ao seno (b2) e p = 0,074 para o coeficiente relativo ao cosseno (b3). Com base nesses dados,
concluímos que não houve variação sazonal significante do ponto de vista estatístico (p > 0,05)
na mortalidade de idosos por gripe e pneumonia na região Nordeste.
38
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
ATIVIDADE 3
Avaliação de sazonalidade na incidência de leptospirose
Sabe-se que o período de verão é mais chuvoso no Estado de São Paulo, enquanto o
inverno tem clima mais seco. As chuvas de verão são fortes e intensas, o que propicia
alagamentos nos grandes centros urbanos. Esta condição pode favorecer a transmis-
são da leptospirose. Nesta atividade, vamos testar a hipótese de variação sazonal na
incidência desta doença no Estado de São Paulo.
39
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 13. Série temporal da incidência mensal de leptospirose no Estado de São Paulo,
2001-2006. Fonte: Sistema de Informação de Agravos de Notificação – SINAN
Para esta finalidade, transfira os dados da série temporal para os programas de aná-
lise estatística que efetuam a análise de regressão linear segundo o procedimento
de Prais-Winsten e procure avaliar os valores de b2 e b3 da fórmula 3. Na análise dos
dados que geraram a Figura 13, os valores obtidos foram b2 = 42,393 (erro padrão
5,938) e b3 = 21.921 (erro padrão 5,821). Ambos os resultados resultam em p < 0,001,
indicando a conclusão de que a variação sazonal é estatisticamente significante.
40
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
No entanto, a variação aleatória nas séries temporais, como o ruído na música, pode prejudicar a
percepção dos componentes mais importantes de variação nas séries temporais. Para lidar com
esse problema, apresentamos nesse item um recurso metodológico que tem como objetivos
instrumentar a análise exploratória das séries temporais, favorecer sua visualização gráfica e
evidenciar seus componentes de variação.
Vimos que a variação aleatória das séries temporais consiste em flutuações irregulares e erráti-
cas que não são importantes, e são causadas por fatores que ocorrem ao acaso e não podem ser
antecipados, detectados, identificados ou eliminados. No entanto, assim como a manifestação
de ruído prejudica a percepção da música e de seus componentes (melodia, harmonia e ritmo),
a variação aleatória pode dificultar a análise da série temporal e a detecção de sua tendência,
seus fatores associados e variação sazonal. Nesse sentido, pode ser importante suprimir, ao
menos em parte, a variação aleatória nos gráficos.
O recurso que permite reduzir a variação aleatória é o ‘alisamento’ das séries temporais. Este
termo deriva, por contraste, da percepção de que a variação aleatória representa certa ‘rugo-
sidade’ no delineamento gráfico da série temporal. Isto é, quando a ‘rugosidade’ causada pela
variação aleatória é reduzida, tem-se como resultado uma série temporal ‘alisada’.
Sendo Y(1), Y(2), Y(3), ..., Y(i), ... Y(n) os valores da série original,
Y’(1), Y’(2), Y’(3), ..., Y’(i), ... Y’(n) os valores da série modificada, e
41
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Há diferentes métodos para alisar as séries temporais. Esses métodos consistem em substituir a
série de valores originais por uma série de valores modificados. As equações da Fórmula 4 siste-
matizam o método de médias móveis simples, possivelmente o mais fácil de ser executado.
A série temporal fica tanto mais alisada, quanto maior a ordem do procedimento de médias mó-
veis. Observa-se, no entanto, que a adoção de uma ordem muito elevada resulta em supressão de
variações mais relevantes. Isto é, não apenas a variação aleatória terá sido reduzida, mas também
pode se tornar mais difícil a percepção de tendências e de variação cíclica ou sazonal.
Figura 14. Médias móveis (ordem 3) da mortalidade (por 100 mil habitantes) por câncer de orofarin-
ge na cidade de São Paulo, 1980-2002. Fonte: Biazevic et al. (2006)
Outro exemplo de aplicação pode ser fornecido para o gráfico da mortalidade de idosos por
gripe e pneumonia na região Nordeste. A apresentação de dados semanais resultava uma série
com rugosidade, isto é, com acentuada variação aleatória. A Figura 15 reproduz a série origi-
nal dos valores observados e as séries modificadas com os valores obtidos para o alisamento
de médias móveis de ordem 3 e 5. Observe como, de fato, houve alisamento progressivo, sem
prejuízo da percepção dos demais componentes da série temporal: tendência estacionária na
primeira metade e crescente na segunda, variação sazonal em toda a série.
42
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 15. Série temporal da mortalidade semanal de idosos (65 anos ou mais) por gripe e pneumo-
nia na região Nordeste, 1999-2009. Alisamento por médias móveis (de ordem 3 e 5) para redução
da variação aleatória. Fonte: Oliveira (2013)
43
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
ATIVIDADE 4
Alisamento de séries temporais
A tabela 2 informa o total de óbitos de pessoas com 60 anos ou mais, residentes nos
Estados do Ceará e do Rio Grande do Sul. Como as variações climáticas entre inverno
e verão são mais intensas na região sul que na região nordeste do país, pode-se testar
visualmente a hipótese de haver variação sazonal desta medida no Rio Grande do Sul e
não haver no Ceará. Copie e cole esses dados no Excel e construa o diagrama de linhas
para ambas as séries.
Observe a variação aleatória que aparece nas duas séries sob a forma de rugosidade
da linha. Para reduzir esse efeito e pôr em evidência a variação sazonal, construa o
gráfico das séries modificadas por meio do recurso de alisamento, com médias móveis
de ordem 4. Confira se o resultado obtido coincide com a Figura 16, e responda às
seguintes perguntas: Por que a magnitude dos valores foi sempre mais elevada no Rio
Grande do Sul que no Ceará? Há variação sazonal nos dois Estados? O alisamento por
médias móveis favoreceu a percepção visual da comparação das duas séries quanto à
variação sazonal?
44
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Tabela 2. Número de óbitos por semana, pessoas com 60 anos ou mais, residentes nos
Estados do Ceará e Rio Grande do Sul, 2007-2009. Fonte: DATASUS
CE 491 434 478 479 439 445 448 458 493 490 477 501 520 533 449
RS 979 810 770 824 839 796 846 799 861 826 817 855 868 822 868
CE 487 515 525 541 492 512 485 516 512 496 519 457 463 439 432
RS 859 818 837 909 1002 1003 1180 1205 1164 1149 1221 1287 1335 1306 1379
CE 452 465 437 463 445 504 467 489 431 435 478 451 441 436 474
RS 1318 1292 1165 1113 1136 1085 1001 953 1002 954 887 913 891 840 914
CE 409 501 436 438 493 477 463 553 463 481 469 527 498 565 530
RS 881 860 913 916 826 817 833 1044 840 781 782 802 849 834 858
CE 632 516 498 529 552 583 568 602 570 521 551 560 529 548 558
RS 889 844 824 847 812 833 895 886 831 966 1074 1010 940 1021 1014
CE 594 522 532 541 501 522 499 515 482 521 516 476 486 517 525
RS 1165 1167 1131 1107 1064 1054 994 999 1114 1055 999 1003 1006 1062 1063
CE 524 523 479 524 492 498 472 457 454 501 485 446 511 488 570
RS 1017 939 1022 999 886 935 925 870 909 924 897 869 985 861 1035
CE 480 437 532 476 482 498 505 540 596 629 679 618 678 644 612
RS 857 858 898 918 953 879 809 901 800 813 877 875 877 906 867
CE 595 652 591 629 565 596 519 525 531 582 532 536 499 533 499
RS 896 941 924 958 987 1015 1137 1207 1170 1177 1170 1174 1202 1425 1415
CE 489 510 516 523 499 502 521 506 499 494 475 465 508 499 469
RS 1242 1165 1063 1069 963 985 932 1004 1096 1014 969 1017 1099 964 892
CE 495 487 494 504 460 531
RS 941 937 884 898 1007 960
45
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 16. Número de óbitos por semana, pessoas com 60 anos ou mais, residentes
nos Estados do Ceará e Rio Grande do Sul, 2007-2009: (1) valores observados; (2) série
alisada (médias móveis de ordem 4). Fonte: DATASUS
46
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
MÓDULO 3
Séries temporais
interrompidas e avaliação das
intervenções em saúde
47
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
A análise de séries temporais interrompidas foi considerada o mais efetivo recurso não expe-
rimental para avaliar o efeito longitudinal de intervenções em saúde (Penfold et al., 2013).
Entretanto, sua aplicação não se restringe a isso, servindo também para testar hipóteses sobre
fatores que modificam o comportamento no tempo das medidas de interesse para a saúde.
48
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Fórmula 5
Equação de regressão com dois segmentos: Y = b0 + b1*tempo + b2*degrau + b3*rampa
Equação de regressão com três segmentos:
Y = b0 + b1*tempo + b2*degrau1 + b3*rampa1 + b4*degrau2 + b5*rampa2
Quando nenhuma das duas medidas difere de zero de modo estatisticamente significante,
interpreta-se que a intervenção (ou o fator que está sendo testado) não associou com a série
temporal. Ou, em outras palavras, não impactou, nem de modo imediato, nem de modo
progressivo, nas medidas de interesse para a análise.
No primeiro segmento houve declínio, medido por b1: a cada ano, mudança da mortalidade
infantil foi, em média, -1,92% (IC95%: -2,25%;-1,59%); o sinal negativo indicando redução. Por
meio de b3, identifica-se que houve incremento progressivo na mortalidade infantil no segundo
segmento. Esse incremento foi de 3,96% (IC95%: 1,21%;6,77%) ao ano no. No terceiro segmento,
indicado pelo valor de b5, houve retomada do declínio, com maior intensidade: -7,75% (IC95%:
49
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
ATIVIDADE 5
Análise de séries temporais interrompidas
Como primeiro desafio, procure reproduzir a Figura 17, plotando a série temporal do
desfecho epidemiológico de interesse. Observe, no gráfico, se há indícios de tendência
no número de consultas. Observe se há variação sazonal nessa medida. Por fim, obser-
ve se há modificação de nível (degrau) e/ou tendência (rampa) associada à introdução
da vacina pneumocócica 10-valente em junho de 2010.
50
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
51
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
52
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Figura 17. Taxa de primeiras consultas médicas em crianças de dois a 23 meses de ida-
de (por 100.000) por queixas de otite em Goiânia, de janeiro de 2008 a agosto de 2013.
Fonte: DATASUS
53
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
54
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Considerações finais
Recapitulando o início desse texto, as primeiras frases da Introdução propunham ser a análise
de séries temporais uma perspectiva de antevisão do futuro. Retomemos agora essa ideia, para
refletir como esta capacidade se realiza.
Uma primeira e mais óbvia forma diz respeito à previsão dos valores da série temporal em
momentos futuros. Isto pode ser feito por meio da equação de regressão linear, levando em
consideração a curva de melhor ajuste de seus pontos. Quando se conhece a tendência, é fácil
projetar a série alguns pontos para adiante, baseado na hipótese de que a tendência se mante-
nha, pelo menos no futuro próximo. A previsão dos valores futuros também pode ser feita por
procedimentos estatísticos mais complexos, como a metodologia ARIMA, cuja aplicação deman-
da treinamento especializado adicional.
Para variáveis quantitativas, é sempre possível conhecer efetivamente os valores que foram
medidos no passado, mas não os que serão medidos no futuro. Afora essa diferença óbvia, nada
diferencia, tecnicamente, a previsão do futuro e a previsão do passado. Uma segunda forma de
aplicar o instrumental preditivo da análise de séries temporais se refere à previsão do passado.
Esse tipo de previsão pode parecer estranho e desnecessário. No entanto, esta análise foi van-
tajosamente empregada nas séries temporais das figuras 5 e 12, as quais modelaram, com base
na tendência e sazonalidade, a previsão de como seria a mortalidade esperada por gripe e pneu-
monia em idosos, se não houvesse a intercorrência de variação aleatória e de surtos epidêmicos.
E, com base nesta previsão do passado, foi possível evidenciar os surtos de gripe manifestados
nos momentos em que as medidas observadas ultrapassaram o limiar epidêmico calculado com
base na mortalidade estimada, isto é, a previsão sobre o passado.
São empregadas as expressões latinas “ex ante” e “ex post” para referir, respectivamente, as
modalidades de previsão do futuro e do passado. Do ponto de vista técnico, estas modalidades
55
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
de previsão não são diferentes. Os mesmos instrumentos utilizados para prever valores de vari-
áveis quantitativas no futuro servem para prever os valores do passado. Para exemplificar com
um estudo epidemiológico que aplicou as duas modalidades de previsão no mesmo gráfico, a
Figura 18 mostra a série temporal da mortalidade por tuberculose na cidade de São Paulo, du-
rante praticamente todo o século XX.
Figura 18. Série temporal da mortalidade (por 100 mil habitantes) por tuberculose na cidade de São
Paulo, 1900-1997. Fonte: Antunes & Waldman (1999)
Até meados do século, houve tendência estacionária com magnitude elevada. Nesse período, a
tuberculose foi a causa básica de cerca de 10% de todos os óbitos ocorridos a cada ano (Antunes
& Waldman, 1999). A partir de meados do século, a mortalidade por tuberculose declinou na
cidade, até o início dos anos 80, quando subitamente inflectiu e assumiu tendência crescente,
em função da associação entre a doença e a aids. Além de mostrar a mudança da tendência
nesses diferentes períodos, a figura 17 mostra a previsão para o passado, de como a doença
teria continuado a decrescer até o início dos anos 90, caso não tivesse havido a emergência da
aids. A Figura 18 também mostra a previsão para o futuro, de que a mortalidade por tuberculose
voltaria a declinar lentamente a partir de meados dos anos 90, o que de fato ocorreu; de modo
possivelmente associado à introdução da terapêutica antirretroviral, que modificou o perfil de
mortalidade da aids na cidade de São Paulo.
Existe, ainda, uma terceira forma de se pensar na análise de séries temporais como uma modalidade
de antever o futuro. Em vez de focalizar os valores que as variáveis quantitativas ordenadas
temporalmente assumirão no futuro, esta terceira forma de previsão se refere ao reconhecimento
dos padrões de variação da medida. Caso conheçamos esses padrões, compreenderemos o que
pode interferir favorável ou desfavoravelmente para o incremento ou decréscimo da medida.
56
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Podemos dizer que antevimos o futuro, que conhecemos como determinado processo se
comportará, quando conseguimos caracterizar sua tendência, reconhecer sua variação sazonal
e cíclica, quando dimensionamos sua variação aleatória e identificamos os fatores associados
que causam impacto significante sobre suas medidas.
Este conhecimento sobre a estrutura de variação das séries temporais não deixa de ser uma
forma de antever o futuro. Se fosse possível separar estas duas alternativas e escolher entre ter
uma boa estimativa do valor exato de uma variável de interesse para a saúde ou de conhecer
com precisão os processos que determinam sua variação, possivelmente muitos profissionais de
saúde, em várias ocasiões, optariam pela segunda opção.
57
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
GLOSSÁRIO
Séries temporais – São sequências de dados quantitativos tomados em momentos específi-
cos e ordenados, que podem ser estudados segundo sua distribuição no tempo. Este módulo
descreve a utilidade deste método para os estudos epidemiológicos e sistematiza os procedi-
mentos estatísticos que tornam vantajosa sua aplicação para a saúde coletiva.
Tendência – É a variação de longa duração das séries temporais. Diz-se crescente, quando
seus valores aumentam de modo estatisticamente significante ao longo do tempo, a despeito
de outros componentes de variação (sazonal, cíclica, e aleatória). De modo análogo, diz-se
decrescente quando ocorre o inverso. E, de modo complementar, diz-se estacionária quando
a magnitude das medidas não muda substancialmente ao longo do tempo. A taxa de cresci-
mento (ou de declínio) médio anual pode ser estimada por meio de análise de regressão linear
(modelos de Prais-Winsten).
Associação – Parte do estudo das séries temporais que busca a correspondência entre seus
valores e fatos ocorridos em momentos específicos. Em particular, é útil aferir a associação
da série temporal com outras medidas ordenadas no tempo. A associação pode ser aferida e
analisada estatisticamente, com referência concomitante ou com deslocamento no tempo,
para favorecer o teste de hipóteses conceituais. A verificação estatística de associações signi-
ficantes, por si só, não permite sustentar inferências causais.
58
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Previsão – Com base nos valores conhecidos da série temporal, seus valores futuros podem
ser estimados levando em consideração seus diferentes componentes de variação (tendência,
associação, sazonalidade, variação cíclica e variação aleatória) por meio de diferentes recursos
estatísticos, como equações de regressão linear (modelo de Prais-Winsten) ou técnicas mais
complexas como o procedimento ARIMA. Também pode ser útil estimar seus valores passados,
para comparar os valores estimados com aqueles que foram de fato observados. Quando a
previsão se aplica a valores futuros, é denominada previsão ex-ante (antes de acontecer).
Quando se aplica a valores passados, é denominada previsão ex-post (após acontecer).
Ruído – Forma usual de se referir ao componente de variação aleatória das séries temporais.
Alisamento – Recurso gráfico das séries temporais que consiste em suprimir a variação aleatória
(e, portanto, a rugosidade de sua representação gráfica) para evidenciar os demais componentes
de sua variação (tendência, sazonalidade e variação cíclica).
Série temporal interrompida – Recurso de análise estatística para identificar mudanças de nível
e/ou tendência nos valores observados de uma série temporal. Demanda o monitoramento
continuado dos valores da série temporal e a comparação estatística dos valores de nível e de
tendência antes e depois da possível interrupção. Essa comparação é feita por meio de análise
de regressão segmentada.
59
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
REFERÊNCIAS BIBLIOGRÁFICAS
Antunes JLF. “Grow and multiply”: social development, birth rates and demographic transition in the
Municipality of São Paulo, Brazil, time series for 1901-94. Rev Bras Epidemiol 1998; 1(1): 61-78.
Antunes JLF, Waldman EA. Tuberculosis in the twentieth century: time-series mortality in São Paulo,
Brazil, 1900-97Cad. Saude Publica 1999; 15(3): 463-476.
Antunes JLF, Waldman EA. Trends and spatial distribution of deaths of children aged 12-60 months
in São Paulo, Brazil, 1980-98. Bull World Health Organ. 2002; 80(5): 391-8.
Antunes JLF, Waldman EA, Borrell C. Is it possible to reduce AIDS deaths without reinforcing
socioeconomic inequalities in health? Int J Epidemiol 2005; 34(3): 586-92.
Antunes JLF, Waldman EA, Borrell C, Paiva TM. Effectiveness of influenza vaccination and its
impact on health inequalities. Int J Epidemiol 2007; 36(6): 1319-26.
Bernal JL, Cummins S, Gasparrini A. Interrupted time series regression for the evaluation of public
health interventions: a tutorial. Int J Epidemiol 2017; 46(1): 348-55.
Biazevic MHG, Castellanos RA, Antunes JLF, Michel-Crosato E. Tendências de mortalidade por
câncer de boca e orofaringe no Município de São Paulo, Brasil, 1980/2002. Cad Saude Publica 2006;
22(10): 2105-14.
Farias N, Cardoso MRA. Mortalidade por Aids e indicadores sociais no Município de São Paulo, 1994
a 2002. Rev Saude Publica 2005; 39(2): 198-205.
Gaynor PE, Kirkpatrick RC. Introduction to time series modeling and forecasting in business and
economics. New York: McGraw-Hill; 1994.
Oliveira JFM, Boing AF, Waldman EA, Antunes JLF. Ecological study on mortality from influenza
and pneumonia before and after influenza vaccination in the Northeast and South of Brazil. Cad
Saude Publica 2013; 29(12): 2535-45.
60
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Penfold RB, Zhang F. Use of interrupted time series analysis in evaluating health care quality
improvements. Acad Pediatr 2013; 13(6Suppl): S38-44.
Porta M. A dictionary of epidemiology. 6th Ed. New York: Oxford University Press; 2016.
Sartori AL, Minamisava R, Bierrenbach AL, Toscano CM, Afonso ET, Morais-Neto OL, Antunes
JLF, Cristo EB, Andrade AL. Reduction in all-cause otitis media-related outpatient visits in children
after PCV10 introduction in Brazil. PLoS One 2017; 12(6): e0179222.
Serfling RE. Methods for current statistical analysis of excess pneumonia-influenza deaths. Public
Health Rep 1963; 78(6): 494-506.
van Asten L, van den Wijngaard C, van Pelt W, van de Kassteele J, Meijer A, van der Hoek W,
Kretzschmar M, Koopmans M. Mortality attributable to 9 common infections: significant effect of
influenza a, respiratory syncytial virus, influenza B, norovirus, and parainfluenza in elderly persons. J
Infect Dis 2012; 206(5): 628-39.
Wagner AK, Soumerai SB, Zhang F, Ross-Degnan D. Segmented regression analysis of interrupted
time series studies in medication use research. J Clin Pharm Ther 2002; 27(4): 299-309.
Waldman EA, Rosa TEC. Vigilância em Saúde Pública. Série Saúde & Cidadania. São Paulo: Instituto
para o Desenvolvimento da Saúde; Faculdade de Saúde Pública da Universidade de São Paulo;
Núcleo de Assistência Médico-Hospitalar; Fundação Itaú Social, 1998.
Wiener N. Extrapolation, interpolation and smoothing of stationary time series. Cambridge, MA,
USA: The MIT Press, 1966.
61
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
INSTRUMENTO DE CONCLUSÃO
1ª Questão. Tomando a Base de dados 4 (Anexo), faça a transformação logarítmica da série
temporal da taxa mensal de primeiras consultas médicas ambulatoriais por queixas relacionadas
a otite em crianças de 2 a 23 meses em Goiânia. Faça o gráfico da série temporal resultante e
compare com a Figura 17, que mostra a mesma série temporal sem a transformação logarítmica.
Explique a diferença entre os dois gráficos.
3ª Questão. Utilizando a Base de dados 2 (Anexo), aplique a Fórmula 3 para modelar a variação
sazonal da mortalidade semanal por gripe e pneumonia em idosos (65 anos ou mais) nas regiões
Nordeste e Sul no período antes da vacinação contra a gripe (1996-1998). Compare os resultados
obtidos para as duas séries temporais e explique a diferença entre elas.
4ª Questão. Faça o gráfico das duas séries temporais mencionadas na questão anterior, com
alisamento de médias móveis de ordem 3 (MM3) e 4 (MM4), usando a Fórmula 4. Compare as
séries MM3 e MM4 de cada região (Nordeste e Sul) e descreva como diferem entre si e com as
séries originais não alisadas.
5ª Questão. Com a Base de dados 1 (Anexo), faça a análise de séries temporais interrompidas
para o coeficiente de mortalidade infantil (Fórmula 5) considerando três segmentos, o primeiro
de 1900 a 1960, o segundo de 1961 a 1973 e o terceiro de 1974 a 1994. Descreva os resultados
obtidos.
62
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Coef.
Swaroop- Coef. Mort. Fecundi- Nupciali- Esp. Vida
Ano Padr. Mort. Natimortos
-Uemura Inf. dade dade ao Nascer
63
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
64
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
65
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Base de dados 2. Séries temporais da mortalidade semanal por gripe e pneumonia em idosos
(65 anos ou mais) nas regiões Nordeste e Sul, antes (1996-1998) e depois (1999-2008) do início
da vacinação de idosos contra a gripe no Programa Nacional de Imunizações. Fonte: Oliveira
JFM et al. (2013).
Contagem Semana Reg. Sul Reg. NE Semana Reg. Sul Reg. NE antes
depois depois antes
1 1999 2,606274462 1,580025533 1996 3,588084341 1,723315199
2 2 3,503886977 0,921225734 2 4,747792028 1,441454637
3 3 3,483410767 1,308919646 3 2,462005396 1,118469706
4 4 3,837402852 1,133585532 4 2,851658976 1,074243637
5 5 3,413347483 1,535515658 5 2,797405602 0,907168397
6 6 2,213444438 1,353356316 6 3,078630717 1,244655846
7 7 2,056502157 1,35192631 7 2,581541782 1,070590286
8 8 2,387154977 1,527023034 8 3,160637954 0,836486905
9 9 2,72686532 1,581989173 9 4,009908623 1,635342374
10 10 3,712099013 1,6149915 10 3,181923481 0,845242111
11 11 2,383240702 1,645182939 11 3,199696979 1,314218563
12 12 2,683670779 1,132726524 12 3,024647086 1,316036699
13 13 2,794808528 1,783076776 13 4,405477464 1,051169964
14 14 2,531429464 1,868884087 14 4,346125102 1,424249599
15 15 2,459627392 1,755806343 15 2,396306881 1,259458553
66
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
67
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
68
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
69
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
70
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
71
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
72
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
73
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
74
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
75
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
76
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
77
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
78
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
79
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
80
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
81
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
82
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Base de dados 3. Séries temporais da proporção anual de óbitos por causas mal definidas e não inde-
terminadas em idosos (65 anos ou mais) nas regiões Nordeste e Sul, 1996-2008. Fonte: Oliveira JFM
et al. (2013)
83
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
Base de dados 4. Série temporal da taxa mensal de primeiras consultas médicas ambulatoriais por
queixas relacionadas a otite em crianças de 2 a 23 meses de idade, em Goiânia, GO, antes (01/2008 a
05/2010) e depois (06/2010 a 08/2013) do início da vacinação antipneumocócica 10-valente (PVC10)
em crianças. Fonte: Sartori AL et al. (2017)
Consultas por
Ano Mês Contagem Degrau Rampa Seno Cosseno
otite
2008 1 1 0 0 0 1 21,93022797
2008 2 2 0 0 0,5 0,866025404 30,20743092
2008 3 3 0 0 0,866025404 0,5 42,62762282
2008 4 4 0 0 1 6,12574E-17 42,32861781
2008 5 5 0 0 0,866025404 -0,5 43,30295015
2008 6 6 0 0 0,5 -0,866025404 50,01201576
2008 7 7 0 0 1,22515E-16 -1 45,89161371
2008 8 8 0 0 -0,5 -0,866025404 34,1154218
2008 9 9 0 0 -0,866025404 -0,5 34,44981177
2008 10 10 0 0 -1 -1,83772E-16 43,40084013
2008 11 11 0 0 -0,866025404 0,5 34,80020933
2008 12 12 0 0 -0,5 0,866025404 41,20417272
2009 1 13 0 0 -2,4503E-16 1 19,17338837
2009 2 14 0 0 0,5 0,866025404 19,18204916
2009 3 15 0 0 0,866025404 0,5 38,06158248
2009 4 16 0 0 1 1,19447E-15 42,23864143
2009 5 17 0 0 0,866025404 -0,5 38,41610999
2009 6 18 0 0 0,5 -0,866025404 42,27680917
2009 7 19 0 0 3,67545E-16 -1 45,8205648
2009 8 20 0 0 -0,5 -0,866025404 39,10932871
2009 9 21 0 0 -0,866025404 -0,5 35,27843788
2009 10 22 0 0 -1 -4,28802E-16 42,99496402
2009 11 23 0 0 -0,866025404 0,5 47,18742259
2009 12 24 0 0 -0,5 0,866025404 33,07823108
2010 1 25 0 0 -4,90059E-16 1 26,66731401
2010 2 26 0 0 0,5 0,866025404 24,42929337
84
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
85
profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE
86