Estatistica Questoes

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 42

MAIS DE

100
ENUNCIADOS
DE QUESTÕES ENVOLVENDO ANÁLISE
COMBINATÓRIA, PROBABILIDADE,
INFERÊNCIA, MODELOS DE REGRESSÃO,
PLANEJAMENTO DE EXPERIMENTOS E
SÉRIES TEMPORAIS.

POR VINÍCIUS S. OSTERNE. R.


Banco de Questões

Vinı́cius Silva Osterne Ribeiro


www.osterne.com


Conteúdo
1 Introdução 1

2 Análise Combinatória 1
2.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3 Probabilidade 3
3.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

4 Inferência 7
4.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

5 Modelos de Regressão 7
5.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

6 Planejamento de Experimentos 17
6.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

7 Séries temporais 18
7.1 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
7.2 Questões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

8 Considerações Finais 38
1 Introdução
O objetivo deste material é apresentar, de forma bem objetiva, as mais variadas questões ligadas aos
assuntos das apostilas presentes no site www.osterne.com. Essas questões formam um excelente acervo
para o estudo preparatório para concursos e mestrados realizados pelo Brasil.
Para isso, o material foi dividido em cinco tópicos principais:

• Tópico 2: Análise combinatória

• Tópico 3: Probabilidade
• Tópico 4: Inferência
• Tópico 5: Modelos de Regressão
• Tópico 6: Planejamento de experimentos

• Tópico 7: Séries Temporais

Cada tópico é dividido em duas partes. A primeira trata-se de um breve comentário do tópico em
questão, visto que os detalhes melhor explicados se encontram nas seção de Materiais ou Apostilas do
site Materiais & Apostilas Osterne. A segunda parte é formada por questões (apenas o enunciado ou
enunciado e resolução) de provas de concursos e mestrados. O material finaliza com o tópico composto
pelas considerações finais do autor sobre o material montado.
Faça excelente proveito deste material e bom estudo!

2 Análise Combinatória
2.1 Comentários
O princı́pio das gavetas de Dirichlet, a teoria de Ramsey e o princı́pio da inclusão e exclusão são
tópicos pouco conhecidos de quem só pensa que a o estudo da Análise Combinatória se baseia apenas nos
tópicos de Arranjo, Permutação e Combinação. A disciplina é ofertada no inı́cio dos cursos de Estatı́stica
como estudo base para se iniciar e se aprofundar no cálculo das probabilidades. Os conceitos e tópicos
principais estão melhor explicados nos primeiros capı́tulos da apostila de Probabilidade.

2.2 Questões
1. Numa sala há três mulheres e quatros homens. De quantas maneiras é possı́vel selecionar um casal
homem-mulher?
Solução 1 (Usando o princı́pio aditivo): Para cada homem, temos 4 mulheres, ou seja, o homem H1
pode pegar a mulher M1 ou M2 ou M3 ou M4 , da mesma forma o H2 e o H3 pode ficar com M1
ou M2 ou M3 ou M4 , logo temos 4+4+4 = 12 casais.
Solução 2 (Usando o princı́pio multiplicativo): Assim, seja:

d1 : escolha do homem
d1 : escolha da mulher
Então, basta fazer 3x4 = 12 casais.
2. Para se deslocar de casa até o trabalho, Marcus pode ir de bicicleta, ônibus ou carro. De quantos
modos diferentes Marcus pode escolher para fazer esse trajeto se ele não quer usar na volta o mesmo
transporte da ida.
Existem 3 modos de escolher na ida e 2 dois modos de escolher na volta, logo 3 x 2 = 6 maneiras.
3. Quantos números naturais de três algarismos distintos (na base 10) existem?
Para o primeiro algarismo, temos 9 possibilidades (não podemos usar o zero), para o segundo
algarismo temos 9 possibilidades (agora podemos usar o zero, mas não podemos usar o algarismo
escolhido para ser o primeiro) e para o terceiro número temos 8 possibilidades. Logo 9 x 9 x 8 =
648 números.

1
4. Quantos são os números naturais pares que se escrevem (na base 10) com três algarismos distintos?
Solução 1: Teremos que quebrar o problema em duas partes, pois sempre que se fala que o número é
par costumamos começar pelo último algarismo, temos assim 0,2,4,6,8 como possibilidades. Depois
partimos para a escolha do primeiro algarismo. E é a que esta o problema! Teremos 9 ou 8
possibilidades? Se for 9, é porque o zero nao foi escolhido para ser o último e se for 8, é porque o
zero foi escolhido para ser o último. Veja a solução:
I: O zero é o último algarismo
II: O zero não é o último algarismo

Para I, temos 1 possibilidade para o último algarismo, 9 para o primeiro e 8 para o segundo,
totalizado 72 maneiras. Para II, temos 4 possibilidades para o último algarismo (2,4,6,8), 9 para o
primeiro e 8 para o segundo (agora o zero pode entrar) resultando em 256 maneiras. Assim, 72 +
256 = 328.
Solução 2: Ignore o fato de o zero não poder ser o primeiro número, logo temos 5 possibilidades
para o último algarismo, 9 para o primeiro e 8 para o segundo, que resulta em 360 números.
Retirando agora os números que têm o zero como primeiro algarismo, ficamos com 1 modo de
escolher o primeiro (tem que ser o zero), 4 para escolher o último e 8 para o segundo, ou seja, 32
possibilidades. Logo 360 - 32 = 328.
5. Numa cidade A, os números de telefones têm sete algarismos, sendo os três primeiros constituem o
prefixo da cidade. Os telefones que terminam em 10 são reservados para as farmácias e os que têm
os dois últimos algarismos iguais, para os médicos e hospitais. Especifique a quantidade dos demais
números de telefone disponı́veis na cidade A.
Primeiro vamos saber a quantidade de números para as farmácias:

P.P.P.10.10.1.1

Temos uma opção para o penúltimo e último, porque eles têm que ser 1 e 0, respectivamente, ou
seja, já estão definidos.

Agora vamos saber a quantidade de números para as farmácias:

P.P.P.10.10.10.1

A penúltima opção é 10, pois podemos escolher qualquer número e a últim opção é 1, porque ela
depende da primeira.
Sabendo que o total é dado por
P.P.P.10.10.10.10
Então a resposta fica: 104 − 103 − 102 = 8900

6. Uma pessoa vai retirar dinheiro no caixa eletrônico de um banco, mas, na hora de digitar a senha,
esquece-se do número. Ela lembra que o número tem 5 algarismos, começa com 6, não tem alga-
rismos repetidos e tem o algarismo 7 em alguma posição. O número máximo de tentativas para
acertar a senha é:
Se o número tem 5 algarismos e começa com 6, então só temos um modo de escolher o primeiro
número. Logo, podemos fazer:
1.1.8.7.6
Sendo o segundo ”1”representando o número 7, que já é fixo. Porém, temos um pequeno detalhe,
o algarismo 7 pode está da segunda posição, na terceira posição, na quarta posição ou na quinta
posição, pois apenas foi falada que ele existe, assim temos que multiplicar por 4 (as possbilidades
de o 7 está). Logo, a resposta é (1.1.8.7.6).4 = 1344

2
3 Probabilidade
3.1 Comentários
Partindo para o estudo dos fenômenos aleatórios, mais precisamente para o estudo da probabilidade,
considere a seguinte explanação: quando um experimento é realizado, o resultado é um elemento do
espaço amostral. Dessa forma, se o experimento for realizado algumas vezes, poderão o ocorrer diferentes
resultados a cada vez ou alguns resultados podem se repetir. Essa frequência de ocorrência de um
resultado pode ser considerada como probabilidade de um determinado evento vir a acontecer. A seguir,
são propostas algumas questões sobre probabilidade retiradas de livros (todos citados nas referências),
provas de concurso e mestrado (todos citados no começo de cada questão). Os conceitos e tópicos
principais estão melhor explicados na apostilas de Probabilidade.

3.2 Questões
Nı́vel 1
1. Seja (X, Y ) um vetor aleatório contı́nuo com

fX,Y (x, y) = xe−x(y+1) I(0,∞) (x)I(0,∞) (y).

Mostre que:

a. X∼Exp(1).
b. Y ∼F (2, 2)
c. Y |X∼Exp(x)
d. X|Y ∼Gama(r = 2, λ = y + 1)

2. Seja (X, Y ) um vetor aleatório contı́nuo com

fX,Y (x, y) = cx2 y I(−1,1) (x)I(x2 ,1) (y).

a. Esboce o gráfico da região do plano em que fX,Y (x, y) > 0


b. Qual o valor de c ?
c. Determine P(X > Y ).
d. X|Y ∼Gama(r = 2, λ = y + 1)

3. Três bolas são selecionadas aleatoriamente sem reposição de uma urna contendo N bolas numeradas
de 1 a N , N > 3. Seja X a variável aleatória que denota o maior valor selecionado, determinea
função de distribuição de X.
4. A função de distribuição acumulada de uma variável aleatória contı́nua é dada por:

−x
FX (x) = e−e I( −∞, ∞)(x)
.
Verifique se as propriedades de FX (x) são satisfeitas, encontre a densidade de X e identifique sua
distribuição.

5. Seja X uma variável aleatória contı́nua com função de densidade de probabilidade dada por:

fX (x) = c(1 − x2 ) I( −1, 1)(x)


.

a. Determine o valor de c.
b. Determine a função de distribuição acumulada de X.

3
6. Seja X uma variável aleatória contı́nua com função de densidade de probabilidade fX (x), função
de sobrevivência SX (x) e função de distribuição acumulada FX (x). Calcule:
Z ∞
[FX (x)]4 [SX (x)]3 fX (x)dx.
−∞

7. A função densidade de probabilidade de X é dada por:

fX (x) = (a + bx2 ) I( 0, 1)(x)


.
Se E(X) = 3/5, determine o valor de a e b.
8. Um determinado tipo de componente poder ser comprado novo ou usado. Cinquenta por cento de
todos os componentes novos duram mais do que cinco anos, mas apenas trinta por cento dos com-
ponentes usados duram mais do que cinco anos. É possı́vel que os tempos de vida dos componentes
novos tenham uma distribuição exponencial?

Nı́vel 2
1. Seja X o tempo de vida de uma lâmpada (em mil horas) fabricada por uma certa companhia.
Considera-se que X|Y ∼Exp(y). O parâmetro y vem de uma variável aleatória com distribuição
gama de parãmetros r = 2 e λ = 4, isto é,

fY (y) = 16ye−4y I(0,∞) (y).

a. Encontre a conjunta de (X, Y ).


b. Identifique a condicional Y |X = x

2. Sejam X∼U (0, 2) e Y ∼U (0, 2), independentes. Considere S = X + Y e U = X − Y .

a. Calcule P(X + Y < 3).


b. Calcule P(X < 2Y ).
c. Qual é a função de densidade de probabilidade conjunta de (S, U ) ?
d. S e U são independentes?

3. Sejam X e Y variáveis aleatórias independentes e identicamente distribuı́das, com P(X = 1) =


P(X = −1) = P(Y = 1) = P(Y = −1) = 1/2. Considere Z = XY . As variáveis aleatórias X, Y e
Z são independentes duas a duas?
4. Sejam X e Y variáveis aleatórias discretas cuja função de probabilidade conjunta é dada pela
seguinte tabela

X Y 1 2
0 0,05 0,15
1 0,30 0
2 0,05 0,45

a. Obtenha as funções de probabilidade marginais de X e Y .


b. São X e Y independentes ?
c. Determine as seguintes probabilidades: P(X = 2|Y = 2), P(Y = 2|X < 1) e P(X + Y > 2).
d. Determine as seguintes probabilidades: P(0 < X < 2|Y = 1) e P(XY < 1).
e. Encontre as distribuições conjuta e marginais de U = X + Y e V = máx(X, Y )

5. Um laboratório que faz testes sanguı́neos apresenta eficácia de 95% na detecção de uma certa doença
quando, de fato, a pessoa está doente. Entretanto, o teste também leva a um ”falso positivo”em
1% das pessoas saudáveis testadas, isto é, se uma pessoa saudável é testada, o teste acusa que ela
tem a doença com probabilidade 0, 01. Se 0, 5% da população realmente tem a doença, qual é a
probabilidade de que uma pessoa tenha a doença dado que o tese foi positivo ?

4
6. Em uma sala 2n pessoas estão usando emblemas numerados de 1 até 2n. Quatro pessoas são
escolhidas ao acaso e convidadas a saı́rem da sala simutaneamente. O número de seu emblema é
anotado.

a. Qual a probabilidade de que o menor número do emblema seja n ?


b. Qual a probabilidade de que o maior número do emblema seja n ?

7. Aos números inteiros pares de 2 a 2n são designadas probabilidades proporcionais aos seus valores.
Um número par é sorteado. Determine:

a. p(i) = P(probabilidade de sortear o número i), para i = 2, 4, 6, ..., 2n.


b. P(probabilidade de sortear um número maior que seis e menor que onze).

8. Aos números de 1 a n são designadas probabilidades proporcionais aos seus valores. Um número é
sorteado. Determine:

a. p(i) = P(probabilidade de sortear o número i), para i = 1, 2, 3, ..., n.


b. P(probabilidade de sortear um número maior que dois e menor que seis).

9. Sejam X e Y variáveis aleatórias com função de probabilidade conjunta

x2 + y 2 > 10;

kx(x + y), se x ∈ (1, 2, 3, 4) e y ∈ (2, 3, 4, 5) e
P (X = x, Y = y) =
0, caso contrário.
a. Determine o valor da constante k.
b. X e Y são independentes ?
c. Encontre a distribuição marginal de X.

10. Calcule a função geradora de momentos (fgm) da variável aleatória X quando:


1
a. P(X = x) = 6I(−1,1) (x) + 46 I(0) (x)
x
b. P(X = x) = 61

I(1,2,...) (x)
x−1
c. P(X = x) = (1 − p) p I(1,2,...) (x)

11. (UFRJ - 2004) Suponha que X e Y são variáveis aleatórias com densidade conjunta uniforme na
região do plano limitada pelas retas x = −1, x = 1, y = x + 1 e y = x − 1. Determine:

a. A função densidade conjunta de X e Y .


b. A função densidade marginal de Y .
c. E(X|Y ).

12. (UFRJ - 2005) Considere duas variáveis aleatórias com função de densidade de probabilidade con-
junta dada por

cxy, se 0<x<2 e 0<y<x
fX,Y (x, y) =
0, caso contrário.
a. Ache o valor de c.
b. Encontre as densidades das distribuições marginais de X e Y .
c. X e Y são independentes ? Justifique sua resposta.
d. Ache f1 (x|y) e E(X|Y ).

13. (UFRJ - 2007) Considere duas variáveis aleatórias com função de densidade de probabilidade con-
junta dada por

2(x + y), se 0<x<2 e 0<y<x
fX,Y (x, y) =
0, caso contrário.

a. P(X < 1/2, Y < 1/2).


b. A covariância entre X e Y .

5
Nı́vel 3
1. Suponha que Y |X = x∼P oisson(x) e X∼Exp(1).

a. Qual a distribuição conjunta de (X, Y ) ?


b. Calcule E(Y ), Var(Y ) e Cov(X, Y ) usando condicionais.
c. Calcule a função geradora de probabilidade de Y |X = x.
d. Identifique a distribuição de Y usando G(t) = E(ty ) = E[E(tY |X)] = E[GY |X=x (t)].

2. Mostre que:

a. E(XY |Y = y) = yE(X|Y = y).


b. E(g(X, Y )|Y = y) = E(g(X, y)|Y = y).
c. E(XY ) = E(Y E(X|Y )).

3. Considere dois lançamentos consecutivos de um dado que suporemos equilibrado. Sejam X : número
de vezes em que é obtida uma face menor ou igual a 2 nos dois lançamentos. Y : número de vezes
em que é obtida a face 5 nos dois lançamentos. Z = X + Y : número de vezes em aparece ou uma
face menor ou igual a 2 ou uma face 5 nos dois lançamentos. W = X − Y : a diferença entre o
número de vezes em que aparece ou uma face menor ou igual a 2 e uma face 5 nos dois lançamentos.
Determine:

a. Var(X) e Var(Y ).
b. Var(Z) e Var(W ).
c. É verdade que Var(Z) = Var(X) + Var(Y )?

4. Seja X = (X1 , X2 ) um vetor aleatório contı́nuo cuja função densidade de probabilidade é dada por:

2
1 Y
fX (x) = sen(xi )cos(xi ) I(−π,π) (x1 )quadI(−π,π) (x2 )
4π 2 i=1

a. Mostre que fX (x) é uma densidade de probabilidade.


b. Determine a distribuição de cada componente.
c. Determine a média, variância, desvio padrão, covariância e coeficiente de correlação de cada
componente.
d. Determine as distribuições condicionais.

5. Quando uma corrente I (medida em ampères) passa através de um resistor R (medido em ohms),
a potência gerada é dada por W = I 2 R(medidaemwatts). Suponha que I e R sejam variáveis
aleatórias independentes, tais que I∼Beta(2, 2) e R∼Beta(1, 1). Detemine:

a. A função de distribuição de probabilidade da variável aleatória W .


b. E(X).
c. A probabilidade de que a potência gerada, sob estas suposições seja maior que 50%.

6. A intensidade luminosa em um dado ponto é dada pela expressão I = DC2 , na qual C é o poder
luminoso da fonte e D é a distância dessa fonte até o ponto dado. Suponha que C seja unifor-
memente distribuı́da sobre (1, 2), enquanto D∼Gama(1, 1). Encontre a função de distribuição de
probabilidade da variável aleatória I, admitindo que C e D são independentes.

7. A força magnetizante H no ponto P , distante X unidades de um condutor que conduza uma corrente
I, é dada por H = 2I
X . Suponha que P seja um ponto móvel, isto é, X seja uma variável aleatória
uniformemente distribuı́da sobre (3, 5). Suponha também que a corrente I, da mesma forma que
X, seja uma variável aleatória contı́nua, uniformemente distribuı́da sobre (10, 20). Ademais, su-
ponha que as variáveis aleatória X, Y sejam independentes. Encontre a função de distribuição de
probabilidade da variável aleatória H.

6
4 Inferência
4.1 Comentários
A inferência estatı́stica é definida como o conjunto de técnicas cujo objetivo é estudar a população
de interesse através de evidências fornecidas por uma amostra. Os conceitos e tópicos principais serão
melhor explicados na apostila sobre Inferência que está sendo montada.

4.2 Questões
1. Arqueólogos estudaram uma certa região e estabeleceram

5 Modelos de Regressão
5.1 Comentários
Os conceitos e tópicos principais estão melhor explicados na apostila de Modelos de Regressão.

5.2 Questões
Nı́vel 1
(n−2)σ 2
b2 é um estimador viciado para σ 2 , sendo sua esperança dada por E[b
1. Mostre que σ σ2 ] = n .
Sabemos que, pelo Método de Máxima Verossimilhança, o estimador de σ 2 é
Pn
[Yi − (β
c0 + β
c1 xi )]
b2 =
σ i=1
n
Mas podemos rescrevê-lo usando
n
X
SQres = [Yi − Ybi ]2
i=1
n
X
= [Yi − (β c1 xi )]2
c0 + β
i=1

Portanto
SQres
b2 =
σ
n
Porém, utilizando o Teorema de Cochran, podemos afirmar que
SQres
∼χ2 (n − 2)
σ2
Então
 
SQres
E = n−2
σ2
E [SQres ] = (n − 2)σ 2

Consequentemente
 
 2 SQres
E σ
b = E
n
(n − 2)σ 2
=
n

7
2. Mostre que quando β0 está no modelo, a reta de regressão passa pelas médias amostrais de X e Y .
A reta estimada é dada por
Ybi = β
c0 + β
c1 xi

Na qual, pelo Método dos Mı́nimos Quadrados, a estimativa para β0 é dada por

c0 = Y − β
β c1 X

Substituindo, chegamos em
c1 (xi − X)
Ybi = Y + β
Que é nada mais que a equação da reta que passa pelos pontos X, Y cujo coeficiete angular é β c1 E,
portanto, a reta estimada passará por Y , pois é seu coeficiente linear e por X, pois é seu coeficiente
angular.
3. Mostre que se o coeficiente de determinação é zero, então a melhor previsão para um estimador, é
a sua média.
Ora,
SQreg
R2 =
SQtotal
Então, se R2 é igual a zero, é porque
SQreg = 0
Desenvolvendo, temos

SQreg = 0
n
X
(Ybi − Y )2 = 0
i=1

Ybi = Y

A previsão para o estimador é a sua média.


4. (Exercı́cio 2.1- Hoffmann) É dada uma amostra de 10 pares de valores: X=(-2, -2, -1, -1, 0, 0, 1, 1,
2, 2)
Y=(0, 0, 2, 3, 4, 4, 5, 6, 8, 8)
Admite-se que as variáveis X e Y estão relacionadas de acordo com o modelo Yi = β0 + β1 xi + i ,
onde os i são variáveis aleatórias independentes com distribuição normal de média zero e variância
2.

a. Determine as estimativas dos parâmetros da regressão linear.


Para isso, precisaremos dos seguintes valores:
10
X
xi = 0
i=1
10
X
yi = 40
i=1
10
X
xi yi = 38
i=1
10
X
xi 2 = 20
i=1

8
Agora, substituindo nas estimativas, temos:
P10
xi yi − nxy
β1 = Pi=1
b
10 2
2
i=1 xi − nx
38 − 10 ∗ 0 ∗ 4
βb1 =
20 − 10 ∗ 0
βb1 = 1.9
βb0 = y − βx b
β0 = 4 − 1.9 ∗ 0
b
βb0 = 4

b. Teste H0 : β = 0 ao nı́vel de significância de 5%.


De inı́cio devemos fazer a suposição de que os erros são normal e idependentemente distribuı́dos
com média zero e variância σ 2 .
As hipóteses a serem testadas são:
H0 : β = 0
H0 : β6=0
Com a seguite estatı́stica seguindo uma distribuição t com n-2 graus de liberdade:

βb1 − 0
T =p
σ 2 /Sxx

Sabendo que
SQE
b2
σ =
n−2
SQT − βb1 Sxy
b2
σ =
n−2
P 2
10 10
X i=1 yi
SQT = yi 2 −
i=1
10
SQT = 154
Sxy = 38
Sxx = 20
154 − 1.9 ∗ 38
b2
σ =
10 − 2
b2
σ = 10.225

Logo,

βb − 0
T = p1
σ 2 /Sxx
1.9
T = p
10.225/20
T = 2.657278

E, portanto, encontrando o p-valor no R:


> 1-pt(2.657278, 8, lower.tail = TRUE, log.p = FALSE)
[1] 0.01446367
Podemos rejeitar a hipótese nula.

9
c. Calcule o coeficiente de determinação.
Para calcular o coeficiente de determinação, usaremos:
Pn
2 b( i=1 xy)
r = Pn 2
i=1 y
r2 = 0.308547

d. Determine a estimativa de Y para X = 3.


A estimativa para X = 3 é 9.7.

Nı́vel 2
1. (Exercı́cio 2.3- Hoffmann) Demonstre que numa regressao linear simples o valor de F da análise de
variância da regressão é igual ao quadrado do valor de t(b), relativo à hipótese da nulidade β = 0
(onde β é o coeficiente de regressão).
Sabemos que
n
X
SQRes = eb2
i=1
Xn
SQReg = b xy
i=1
SQRes
Se 2 =
n−2

Logo, para testarmos a hipótese nula β = 0 usamos a estatı́stica


v
u n
b uX
t(b) = t (xi − x)2
Se i=1

Se elevarmos ao quadrado,chegamos em
v  2
u n
2 b uX
[t(b)] =  t (xi − x)2 
Se i=1

2 SQReg
[t(b)] =
Se 2

Que é a estatı́stica F que aparece na tabela ANOVA.


2. (Exercı́cio 2.5- Hoffmann) É dada uma amostra de 5 pares de valores. Admite-se que as variáveis X
e Y estão relacionadas de acordo com o modelo Yi = α + βXi + ui , onde ui são variáveis aleatórias
independentes com distribuição normal de média zero e variância σ 2 .

X Y
1 3
2 7.5
3 7
4 11.5
5 11

a. Determine as estimativas dos parâmetros da regressão linear.

Pn
xy
βb = Pi=1
n 2
= 2.461538
i=1 x
α
b = y − βx
b =5

10
b. Calcule o coeficiente de determinação e faça a análise de variância da regressão.
O coeficiente de determinação é dado por:
S.Q.Reg
r2 =
S.Q.T otal
Xn
SQReg = b xy
i=1
n
X
SQT otal = y2
i=1
r2 = 0.1566265

Tabela 1: Análise da variãncia


Graus de Soma dos Média dos Valor F p-valor
liberdade quadrados quadrados
x 1 64.793 64.793 1.7459e+32 ¡ 0.05
Residuals 3 0 0

c. Teste ao nı́vel de significância de 0.5%, a hipótese:


H0 : β = 0
H1 : β6=0
Usando a estatı́stica:

b−β
t(b) =
s(b)
2.5454 − 0
t(b) = q
q.m.res
P n 2
i=0 xi

2.5454 − 0
t(b) = q
q.m.res
P n 2
i=0 xi

t(b) = 3.000366

Considerando o nı́vel de significância de 0.5% e a distribuição assumindo 3 graus de liberdade,


encontramos o valor crı́tico de 7.453, assim não podemos rejeitar a hipótese nula. Rejeitamos
a hipótese nula.
d. Teste ao nı́vel de significância de 0.5%, a hipótese:
H0 : α = 13
H1 : α<13
Usando a estatı́stica:
a−α
t(a) =
s(a)
5 − 13
t(a) = q
q.m.res
P n 2
i=0 xi

t(a) = −2.786054

Considerando o nı́vel de significância de 0.5% e a distribuição assumindo 3 graus de liberdade,


encontramos o valor crı́tico de 7.453, assim não podemos rejeitar a hipótese nula. Rejeitamos
a hipótese nula.

3. (Exercı́cio 2.7- Hoffmann) Com base em 52 pares de valores das variáveis X e Y foi obtida a equação
de regressão
Ybi = −0.4 + Xi

11
A estimativa do desvio padrão da estimativa do coeficiente de regressão é 0.1. Calcule o coeficiente
de determinação e teste a hipótese de que o coeficiente angular é igual a zer, ao nı́vel de significância
de 1%.
Foi dado na questão que
s(b) = 0.1
Sabemos que a estimativa do desvio padrão da estimativa do coeficiente de regressão é dado por
Pn
y 2 −b n
P
i=1 i=1 xy
2 n−2
s (b) = Pn 2
i=1 x

Desenvolvendo, temos
Pn
y 2 −b n
P
i=1 i=1 xy
2 50
s (b) = Pn 2
i=1 x
n
X n
X Xn
50.0.01. x2 = 2
y −b xy
i=1 i=1 i=1

Pn
Dividindo todos por i=1 y2
Pn Pn Pn
50.0.01. i=1 x2 i=1 y2 − b i=1 xy
Pn 2
= Pn 2
i=1 y i=1 y
n
x2
P
0.5
r2 = 1 − Pn i=1 2
i=1 y

Para o teste de hipótese, temos βb = 1, logo


1−0
t(b) =
0.01
t(b) = 100

Ao nı́vel de significância de 1% temos como ponto crı́tico de 2.67, ou seja, rejeitamos a hipótese de
que o coeficiente de regressão é zero.
4. (Exercı́cio 2.17- Hoffmann) Admitindo que as variáveis X e Y estão relacionadas conforme o modelo:

β
Yi = α + + ui
Xi
onde ui representa erros aleatórios independentes com média zero e variância constante, determine
as estimativas dos parâmetros α e β, com base nos seguintes dados:
x=(12,15,20,30,60) y=(9,8.5,8.5,6.5,5)

Baseando-se no método dos mı́nimos quadrados, temos que minimizar a soma dos quadrados dos
desvios
Xn
L= ui 2
i=1

que é o mesmo que


n
X β 2
L= Yi − α −
i=1
Xi
Temos que fazer:
∂L
= 0
∂α
∂L
= 0
∂β

12
Chegamos nas seguintes estimativas:
Pn Pn 1
i=1 yi − β i=1 xi
α
b =
Pn n P
yi n 1
i=1 xi − y i=1 xi
βb = Pn 1
Pn 1
i=1 xi i=1 xi
1− n

Utilizando o R, temos as estimativas:

#Exercicio 2.17
x=c(12,15,20,30,60)
y=c(9,8.5,8.5,6.5,5)
n=length(x)
a = mean(y) - (b/n)*(sum(1/x))
num = sum(x/y) - mean(y)*sum(1/x)
den = 1 - ((sum(1/x)*sum(1/x))/n)
b = num/den
a;b

1
Dica: Poderı́amos simplesmente usar a anamorfose Vi = Xi

5. (Exercı́cio 2.21- Hoffmann) É dada uma amostra com 4 pares de valores:


x=(2,1,1,4)
y=(6,8,9,13)
Admite-se que as variáveis X e Y estão relacionadas de acordo com o modelo Yi = α + βXi + ui ,
onde os ui são erros independentes, de média zero, variância constante e distribuição normal.
a. Determine as estimativas dos parâmetros da regressão linear.
(Usando o R):
Como já sabemos que as estimativas são feitas pelo Método dos Mı́nimos Quadrados, vamos
a partir de agora utilizar somente o código do R.
> x=c(2,1,1,4)
> y=c(6,8,9,13)
> lm(y~x)

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept) x
6.0 1.5
Utilizaremos o modelo Yi = 6 + 1.5x.
b. Calcule o coeficiente de determinação da regressão.
Para calcular o coeficiente de determinação, usaremos:
Pn
2 b( i=1 xy)
r = Pn 2
i=1 y
r = 0.5891883

c. Teste, ao nı́vel de significância de 5%, a hipótese H0 : β = 5 contra a hipótese alternativa


H0 : β6=5.
Usaremos a estatı́stica:
b−β
t(b) =
s(b)
Que resulta na estatı́stica -3.43, sendo não significativo, pois t0 = 4.3

13
6. (Exercı́cio 2.31- Hoffmann) Em estudos da variaçãoh do consumo
i de certo produtos em função da
β
renda da famı́lia tem sido usada a função Y = exp α − X , onde Y é o dispêndio com o produto
considerado e X é a renda da famı́lia. Mostre as anamorfoses que devem ser feitas para que as
fórmulas de regressão linear simples sejam usadas para ajustar essa função, utilizando dados obtidos
de uma amostra aleatória.
Se aplicarmos o logaritmo em Y, obtemos:
β
logYi = α −
X
Onde:

Zi = logYi
1
Vi = −
Xi

O que nos leva a aplicar o modelo:

Zi = α+Vi β

7. (Exercı́cio 2.34 - Hoffmann - Adaptada) É dada uma amostra de 12 pares de valores. Com base
nela, responda aos itens.

Xi Yi Xi Yi
1 2 4 9
1 4 4 13
1 3 5 11
1 5 5 10
2 8 5 16
2 6 5 9

a. Determine as estimativas de regressão linear.


Sumário:

n = 12
n
X
Xi Yi = 360
i=1
n
X
Xi = 36
i=1
Xn
Xi2 = 144
i=1
n
X
Yi = 96
i=1
n
X
Yi2 = 962
i=1
X = 3
Y = 8

14
Portanto:
Sxy
β
c1 =
Sxx
Pn
i=1 Xi Yi − nXY
= Pn 2
i=1 Xi2 − nX
72
=
36
= 2
β
c0 = Y −β
c1 X
= 2

b. Faça a análise de variância considerando o nı́vel de significância de 5%


Sumário:
n
X
SQreg = (Ybi − Y )2
i=1
2
= β
c1 Sxx
= 144
Xn
SQtotal = (Yi − Y )2
i=1
X 2
= i = 1n Yi2 − nY
= 194
SQres = SQtotal − SQreg
= 194 − 144
= 50
SQreg
QMreg =
1
= 144
SQres
QMres =
n−2
= 5

A estatı́stica para o teste


H0 : β1 = 0
H1 : β1 6=0
É a seguinte:
QMreg
F0 = ∼F (1, n − 1)
QMres
144
F0 =
5
F0 = 28.8

Assim, o p-valor é dado por 2P (F0 < F (1, 10)) < 0.05, pois o valor crı́tico é dado por 6.936728.
O que nos faz rejeitar a hipótese nula, ou seja, a regressão é significativa. Montando a tabela,
temos:
c. Teste a hipótese de que o intercepto é nulo contra a hipótese de não nulidade considerando um
nı́vel de significância de 5%.
H0 : β0 = 0
H1 : β0 6=0

15
Tabela 2: ANOVA
Fonte de variação GL SQ QM F p-valor
Regressão 1 144 144 28.8 < 0.05
Resı́duo 10 50 5
Total 11 194

Sob H0 verdade, têm-se:


Calcular o valor da estatı́stica associada a esse parâmetro:
c0 − β0
β
t0 = q ∼t(n − 2)
QMres n 2
P
i=1 Xi
nSxx
= 1.54
Assim, o p-valor será 2P (t0 < t(10)) > 0.05, pois o valor crı́tico para essa situação vale 2.223.
Chegamos a conclusão de que podemos rejeitar a hipótese nula.
d. Faça o teste bilateral da hipótese nula de que o intercepto vale 3, considerando um nı́vel de
significância de 5%.
H0 : β1 = 3
H1 : β1 6=3
Sob H0 verdade, têm-se:
Calcular o valor da estatı́stica associada a esse parâmetro:
c − β1
β
t0 = q1 ∼t(n − 2)
QMres
Sxx
= −2.73
Assim, o p-valor será 2P (t0 < t(10)) < 0.05, pois o valor crı́tico para essa situação vale 2.223.
Chegamos a conclusão de que não podemos rejeitar a hipótese nula.
e. Determine a estimativa de Y para X = 5 e o intervalo de confiança para E[Y |X = 5], ao nı́vel
de confiança de 95%.
Neste caso trata-se de um intervalo de confiança para a média de determinado valor X, então
usamos:
" s #
2

1 (x 0 − x)
I.C.[β0 + β1 x0 ] = (Ybi |x = x0 )±t1− α2 (n − 2) QMres +
n Sxx
" s #
(5 − 3)2
 
1
= 12±2.223 144 +
12 108
= [5.623725; 18.376275]

g. Determine um intervalo de previsão para [Y |X = 6], ao nı́vel de confiança de 95%.


Neste caso trata-se de um intervalo de previsão para um determinado valor X, e não a média,
então usamos:
" s #
2

1 (x 0 − x)
I.C.[β0 + β1 x0 ] = (Ybi |x = x0 )±t1− α2 (n − 2) QMres 1 + +
n Sxx
" s #
(6 − 3)2
 
1
= 12±2.223 144 1 + +
12 108
= [3.98014; 24.01986]
2
8. (Exercı́cio 2.37- Hoffmann) Considere o modelo Yi = βXi + ui com Xi fixos, E[ui ] = 0, E[u
Pn i
]=0
X Y
e E[ui uj ] = 0 para i6=j. Sabe-se que os estimador de mı́nimos quadrados para β é b = Pn Xii 2i ,
i=1
i=1
2
não-tendecioso, com V (b) = Pn σ 2 . Um estimador alternativo para β βb = Y , que é a inclinação
Xi X
i=1
da reta unindo a origem do sistema de eixos ao ponto Y , X.

16
a. Prove que βb é um estimador linear não-tendecioso.

X
b =
Y
Pn Yi
= Pni=1 Xni
Pni=1 n
(βX + ui )
= Pn i
i=1
Xi
Pi=1
n
ui
= β + Pni=1
X i
i=1
Pn 
i=1 ui
E[b] = β + E Pn
i=1 Xi
E[b] = β

b em função de σ 2 e dos valores de X.


b. Deduza a expressão que dá V (β)
Denotando
b = E[βb − β]2
(β)
Sabemos que no item a: Pn
ui
b − β = Pni=1
i=1 iX
Substituindo Pn
E[ i=1 ui ]2
V (b) = Pn 2
i=1 Xi
Sabemos também que
" n
#2
X
E ui = E[u1 2 + u2 2 + ... + un 2 ] = nσ 2
i=1

Então
nσ 2
V (b) = Pn 2
i=1 Xi

6 Planejamento de Experimentos
6.1 Comentários
Em planejamento de experimentos estuda-se diferentes tipos de modelos para avaliar o efeito de
diferentes tratamentos com a presença ou ausência de blocos e/ou fatores. Dentre os mais conhecidos
têm-se os modelos chamados de Delineamento Inteiramente Casualizado (DIC), que avalia o efeito apenas
de tratamentos, o modelo de Blocos Inteiramente Casualizados (BIC), que estuda o efeito de tratamentos
e blocos, o modelo Fatorial, que estuda o efeitos de diversos fatores sobre os tratamentos utilizando ou
não blocos, entre outros.
Para cada modelo é necessário construir uma tabela denominada ANOVA (Análise de Variância) para
avaliar o efeito das diferentes componentes do modelo. Se um modelo em estudo é o Fatorial, então nesta
análise será estudado o efeito dos tratamentos, o efeito dos blocos o efeito de cada fator e o efeito da
interação dos fatores. Posteriormente a isso, faz-se o estudo da adequação do modelo e, caso a hipótese
de igualdade de média seja rejeitada, será aplicado testes de comparações múltiplas de médias para
verificação de qual média é maior que outra.
As questões aqui expostas fazem parte desta brilhante área da estatı́stica aplicada, denominada de
Estatı́stica Experimental. A maiorias delas são extraı́das de concursos.

6.2 Questões
1. EM BREVE

17
7 Séries temporais
7.1 Comentários
Os conceitos e tópicos principais estão melhor explicados no material sobre Séries Temporais.

Observação:
O banco de dados referentes as séries citadas nas questões a seguir são encontradas no site presente
na página Materiais & Apostilas Osterne, na seção Séries Temporais.

7.2 Questões
Nı́vel 1
1. Defina série temporal. Dê 2 exemplos de séries temporais em:

a. Economia.
b. Medicina
c. Atuária
d. Epidemiologia
e. Meteorologia

2. Classifique as séries a seguir (discreta ou contı́nua, univariada ou multivariada, unidimensional ou


multidimensional). Especifique Z(t), t, r, p :
a. ı́ndices diários da bolsa de valores de São Paulo, de janeiro de 1960 a dezembro de 2001;
b. registro de marés no porto de Santos, através de um aparelho medidor (marégrafo), durante
30 dias;
c. medidas de pressão uterina e pressão sanguı́nea de uma mulher durante o parto;
d. número de ocorrências de meningite po mês e por municı́pio de São Paulo;
e. medidas das três componentes de velocidade de um fluxo turbulento (como o oceano) durante
certo intervalo de tempo.
3. Considere a Série A10 (M-ICV):
a. Faça o gráfico da série; ela é estacionária?
b. Obtenha a primeira diferença da série e faça o gráfico correspondente; a primeira diferença é
estacionária?
c. Mesmas questões de (b) para a segunda diferença.
4. Considere a Série A7 (a) (Temperatura):
a. A série é estacionária?
b. Obtenha ∆Zt e ∆2 Zt ; estas séries são estacionárias?

5. Considere a Série A5 (Energia):


a. A série é estacionária? Tem tendência?
b. Considere a série diferença ∆Zt ; é estacionária?
c. Tome agora log Zt ; é estacionária?
d. Investique se a série ∆ logZt é estacionária ou não?
6. Responda as questões (a) - (d) do problema 4 para a Série A9 (b)(D-PETRO).
7. Responda as questões (a) - (d) do problema 4 para a Série A9 (d)(M-IBV).

8. Considere os log-retornos obtidos da Série A9 (c) (D-BANESPA):

18
a. calcule as estatı́sticas: média, variância, coeficientes de assimetria e curtose, quartis,máximo
e mı́nimo. Use algum programa, como o Minitab. (Pode usar o R ou o SPSS)
b. Obtenha um histograma dos dados e comente sobre a forma da distribuição. Compare com
uma distribuição normal, com média e variância obtidas em (a).
c. Qual é o log-retorno médio anual (um ano igual a 252 dias) sobre o perı́odo de dados?
d. Se você investisse R$10.000,00 em ações do Banespa, no começo de janeiro de 1995, qual seria
o valor do investimento no final de dezembro de 2000?
9. Mesmo problema para os log-retornos diários obtidos da Série A9 (b) (D-PETRO).

Nı́vel 2
1. Suponha que os preços diários da fechamento de uma ação seja

dia 1 2 3 4 5 6 7 8 9 10
preço 47,9 46,0 45,8 48,9 49,4 50,7 50,6 51,2 50,1 51,3

a. Qual é o retorno simples do dia 1 para o dia 2? e do dia 1 para o dia 6?


b. Qual é o log-retorno do dia 4 para o dia 5? do dia 4 para o dia 10 ?
c. Verifique que 1 + R5 (3) = (1 + R3 )(1 + R4 )(1 + R5 ).
d. Verifique que r10 (5) = r6 + r7 + . . . r10 .

2. Note que, se os retornos são dados em porcentagem, teremos:

rt = 100 × ln(1 + Rt /100), Rt = (ert /100 − 1) × 100.

Se os log-retornos mensais de um ativo são 5,2%, 3,8%, -0,5% e 2,6%:


a. Calcule os correspondentes retornos simples;
b. Qual é o log-retorno no trimestre ?
c. Qual é o retorno simples no trimestre ?
Esta questão vai ter que ser mudada para:
Note que , se os retornos são dados em porcentagem, teremos:

rt = 100 × ln(1 + Rt /100), Rt = (ert /100 − 1) × 100.

Se os log-retornos de um ativo nos primeiros quatro meses de um ano foram 5,2%, 3,8%, -0,5% e
2,6%:
a. Calcule os correspondentes retornos simples;
b. Qual é o log-retorno no perı́odo ?
c. Qual é o retorno simples no perı́odo?
3. Dizemos que a variável Y tem distribuição log-normal se X = ln(Y ) tiver distribuição normal.
Pode-se verificar que se X ∼ N (µ, σ 2 ), então Y = eX é log-normal, com

2 2 2
E(Y ) = eµ+σ /2
V ar(Y ) = e2µ+σ (eσ − 1).

Suponha que o log-retorno rt ∼ N (0, 025; (0, 012)2 ).. Então, 1 + Rt tem distribuição log-normal.
Calcule a média e a variância de Rt .
4. (INMETRO- Analista Executivo em Metrologia e Qualidade-CESPE-UNB) O total mensal de re-
clamações recebidas por uma central de atendimento ao consumidor segue um processo na forma
Yt = 0, 6Yt−1 − 0, 09Yt−2 + t − 0, 3t−1 , em que Yt = Rt − µ, e Rt representa o total mensal de
reclamações recebidas no mês t; µ é o total mensal médio de reclamações e t representa um ruı́do
branco no mês t; com média zero e variância σ 2 . Com base nessas informações, julque os itens que
se seguem.

19
[ ] A série temporal {Yt } segue um processo autorregressivo de primeira ordem.
[ ] A autocorrelação entre Yt e Yt−1 é igual a 0,6.
[ ] A autocorrelação parcial entre Yt e Yt−2 é igual a zero.
3(−0, 3)h
[ ] A função de autocorrelação inversa entre Yt e Yt−h é igual a , em que
1 + 0, 6h + 0, 092h
h = 0, 1, 2, . . ..
σ2
[ ] A densidade espectral do processo Yt é igual a f (w) = , em que 0 ≤ w ≤ π.
2π(1 + 0, 6 cos(w))
Texto para as questões de 1 a 4.
Um processo estocástico de tempo discreto forma uma sequência de variáveis aleatórias Wt , t =
1, 2, . . . , n com média nula e função de autocorrelação apresentada a seguir, em que γ > 0 e α 6= 0.
 2
 γ (1 + α2 ) se h = 0
ϕ(h) = γ2 se |h| = 1
0 se |h| > 1

5. Considerando as informações apresentadas no texto , julque os próximos itens.


I. A autocovariância entre Wt+5 e Wt+6 é igual a zero.
1 + α2
II. A autocorrelação entre Wt+3 e Wt+4 é igual a .
α
III. |ϕ(h)| ≤ 1.
A quantidade de itens certos é igual a
A) 0. B) 1. C) 2. D) 3.
6. Dado um número real R e sabendo que i é o número imaginário, a densidade espectral do processo
mencionado no texto pode ser corretamente representada como
γ 2 (1 + α2 )
A) .

γ 2 (αe−iR + αeiR )
B) .

γ 2 αeiR
C) .
π
γ 2 {(1 + α2 ) + αe−iR + αeiR }
D) .

7. A variância do processo Wt , referido no texto, é igual a
A) γ 2 (1 + α2 ).
B) γ 2 α.
C) γ 2 .
D) (1 + α2 ).
8. Acerca do processo {Wt } mencionado no texto, asinale a opção correta.
A) A variância do ruı́do aleatório é igual a (1 + α2 ).
B) O processo {Wt } é auto-regressivo de primeira ordem.
α h
C) A autocorrelação parcial entre Wt e Wt+h é { } .
1+α
D) O processo {Wt } é estacionário.
9. (CHESF-Concurso Público-Questão 20) Dada a seguinte fórmula de auto-correlação:

E[(Xt − µ)(Xt+k − µ)]


R(k) = ,
σ2
onde:

20
– Xt : Variável aleatória discreta estacionária, dependente do tempo.
– µ : Média
– R(k) : Autocorrelação
– E[ ] : Valor médio.
– k : Deslocamento no tempo.
– σ 2 : Variância da variável Xt .
A partir dos dados anteriores podemos afirmar que:
A) O valor 1 significa total ausência de correlação.
B) Correlação perfeita( valor da autocorrelação está próximo de 1).
C) Correlação perfeita( valor da autocorrelação está próximo de -1).
D) Anti-correlação perfeita( valor da autocorrelação está próximo de 1).
E) Anti-correlação perfeita( valor da autocorrelação está próximo de 0).
10. (CHESF-Concurso Público-Questão 22) O modelo ARIMA é um modelo auto-regressivo, integrado
e de média móvel. É um modelo utilizado em:
A) Curva normal.
B) Controle de qualidade apenas.
C) Séries temporais.
D) Amostragem não probabilı́stica
E) Custo de logı́sticos.
11. (CHESF-Concurso Público-Questão 24) Dadas as afirmativas:
I. Uma série temporal é uma coleção de observações feitas sequencialmente ao longo do tempo.
II. Em modelos de regressão linear a ordem das observações é irrelevante para a análise.
III. Em séries temporais a ordem dos dados é irrelevante.
IV. Uma previsão a partir da série temporal procura construir um modelo matemático a partir do
qual seja possı́vel prever valores futuros da série.
Está(ão) correta(s) apenas a(s) afirmativa(s):
A)I, II e III B)I, III e IV C)I, II e IV D) III e IV B)I, II, III e IV.
12. ( Concurso Público- Ceará-Questão 78) Considere o ruı́do branco com média zero e variância σ 2 .
Assinale a opção que corresponde à expressão se sua densidade espectral num ponto w ∈ [−π; π].
σ2
A) .

|w|σ 2
B) .

2
σ
C) (1 − cos(w) + 0, 25)−1 .

σ2
D) (1, 06 + 0, 25cos(w)).

E) 0.
13. ( Concurso Público- Ceará-Questão 80) Considere o processo AR(1) estacionário Xt = φXt−1 + t ,
com t ∈ Z (conjunto dos inteiros). A sequência t é o ruı́do branco com variância unitária e φ = 0, 5.
Assinale a opção que dá o valor da função de autocovariância γ(h) do processo para h = 2.
A) 0,210 B)0,333 C)0,500 D) 1,000 E)1,250.
14. (ANPEC-Prova de Estatı́stica-Ano-2012 - Questão 7 )
Suponha que ∆t pode ser representado pelo seguinte processo:
∆t = t − 0.6 t para t = 1,
∆t = ∆t−1 + t − 0.6 t para t ≥ 2,
em que t , t = 1, 2, . . . é uma sequência de variáveis aleatórias independentes e identicamente
distribuı́das com média igual a 0. Se Yt = 10 , quando t = 0, calcule o valor da E[Y3 ].

21
15. (ANPEC-Prova de Estatı́stica-Ano-2014 - Questão 5 ) Suponha que Yt seja representado pelo se-
guinte processo auto-regressivo de primeira ordem:

Yt = 10 + 0, 6Yt−1 + et ,

em que et é um ruı́do branco que satisfaz as condições: E(et ) = 0 , E(e2t ) = σ 2 e


E(et es ) = 0 para t 6= s. Suponha também que Y0 = 0. Obtenha E(Yt ) para t = 2.
16. (ANPEC-Prova de Estatı́stica-Ano-2014 - Questão 10 ) Considere o seguinte processo:

Yt = ρYt−1 + et , t = 1, 2, . . . ,

em que Y0 = 0 e et é um ruı́do branco que satisfaz as condições:E(et ) = 0 , E(e2t ) = 1 e E(et es ) =


0 para t 6= s.
São corretas as afirmativas:
a. Se ρ = 1, E(Yt ) = 0 para todo t.
b. Se ρ = 1, V (Yt ) = 0 para todo t.
c. Se ρ = 1, E(Yt+h |Yt ) > E(Yt ) para todo h ≥ 1.
d. Se |ρ| < 1, V (Yt ) = 1 para todo t.
e. Se |ρ| < 1, E(Yt+h |Yt ) = ρh Yt para todo h ≥ 1.
17. (ANPEC-Prova de Estatı́stica-Ano-2013 - Questão 5 ) Um pesquisador corretamente postula o
seguinte modelo de regressao:

yt = β1 + β2 t + ut , t = 1, 2, . . . , T, (1)

em que ut e uma variavel aleatoria independente e identicamente distribuida ao longo do tempo,


com media zero e variancia finita.
Julgue as afirmativas:

a. yt é um processo estcionário.
b ∆yt = yt − yt−1 é um processo estcionário de segunda ordem.
c. Mı́nimos quadrados ordinários aplicado à equação (1) produz uma estimativa não viesada de
β2 .
d. Seja
T
X
(yt − yt−1 )2
t=1
βˆ2 = .
T −1
βˆ2 é um estimador consistente de β2 ?
e. Suponha que ut = ρ ut−1 + t , |ρ| < 1 e que t seja uma variavel aleatoria independente e
identicamente distribuida ao longo do tempo, com média zero e variância finita. O estimador
de mı́nimos quadrados ordinários de β2 na equaçãoo (1) é nao viesado.

18. (ANPEC-Prova de Estatı́stica-Ano-2013 - Questão 10 ) Julgue as seguintes afirmativas:


0 O passeio aleatório com drift, yt = c + yt−1 + t , y0 = 0, em que t é um ruı́do branco, com
média zero e variância σ 2 , é um processo estacionário de segunda ordem se c = 0.
1 O processo M A(1), yt = t + θ1 t−1 , em que t é um ruı́do branco, com média zero e variância
σ 2 , estacionário de segunda ordem se e somente se, a raiz do polinômio 1 + θ1 x cair fora do
cı́rculo unitário.
2 O processo M A(1), yt = t − θ1 t−1 , em que t é um ruı́do branco, com média zero e variância
σ 2 , é inversı́vel se e somente se, |θ1 | < 1.
3 O processo AR(2), yt = θ1 yt−1 + θ2 yt−2 + t + t−1 , em que t é um ruı́do branco, com média
zero e variância σ 2 é estacionário de segunda ordem se:

|θ2 | < 1, θ1 + θ2 < 1 e θ2 − θ1 | < 1.

22
4 O passeio aleatório yt = yt−1 + t , y0 = 0, em que t é um ruı́do branco, com média zero e
variância σ 2 , a variância de yt varia com t.
19. (ANPEC-Prova de Estatı́stica-Ano-2013 - Questão 13 ) Considere o seguinte processo xt = µ + et −
α1 et−1 , para t = 1, 2, . . ., no qual et é uma sequência i.i.d. com média zero e variância σe2 .
Julgue as seguintes afirmativas:

0 V ar(xt ) = (1 + α12 ).
1 Cov(xt , xt+h ) = 0, h > 1.
2 E(xt ) = µ + t.
3 O processo descrito é estacionário em covariância.
4 A função de autocorrelação deste processo é:
α1
ρ1 = e ρj = 0, j > 1.
1 + α12

20. (ANPEC-Prova de Estatı́stica-Ano-2012 - Questão 8 ) Suponha que Yt seja descrito por um processo
auto-regressivo de ordem 3, isto é,

Yt = Yt−1 − 0, 5 Yt−3 + ut ,

e que ut |Yt−j ∼ N (µ, σ 2 ), ∀j > 0.


Calcule a correlação entre Yt e Yt−2 . Multiplique o resultado por 100.

21. (ANPEC-Prova de Estatı́stica-Ano-2011 - Questão ) Julgue as afirmativas;


(0) O processo AR(2), yt = ρ1 yt−1 + ρ2 yt−2 + t , em que t é um ruı́do branco com média zero e
variância σ 2 , é estacionário de segunda ordem se e somente as raı́zes do polinômio x2 − ρ1 x + ρ2
estão fora do cı́rculo unitário.
(1) O processo M A(2), yt = t + θ1 t−1 + θ2 t−2 , em que t é um ruı́do branco com média zero e
variância σ 2 , a covariância entre yt e yt−3 é igual a zero.
(2) No passeio aleatório com drift,yt = c + yt−1 + t , em que t é um ruı́do branco com média zero
e variância σ 2 , a média de yt varia com t.
(3) No processo M A(1), yt = t + θ1 t−1 , em que t é um ruı́do branco com média zero e variância
σ 2 , a correlação entre yt e yt−1 é menor ou igual a 0,5 em valor absoluto.
(4) O processo ARM A(1, 1), yt = ρ yt−1 + t + θ t−1 , em que t é um ruı́do branco com média
zero e variância σ 2 , é estacionário de segunda ordem se |ρ| < 1 e |θ| < 1.
22. (ANPEC-Prova de Estatı́stica-Ano-2009 - Questão 15 ) Julgue as proposições:
(0) No processo AR(1), yt = φ0 + φ1 yt−1 + et , em que |φ1 | < 1 e que et é um ruı́do branco com
média nula e variância σ 2 , a média de yt será igual a φ0 .
(1) O processo M A(1), yt = et + θ et−1 , em que t é um ruı́do branco com média zero e variância
constante, será estacionário se |θ| > 1.
(2)Seja a função de autocorrelação do processo AR(1) definido no item (0) dada por ρt . É correto
afirmar que ρt = φt1 .
(3) O processo AR(2), yt = φ0 + φ1 yt−1 + φ2 yt−2 + et , em que et é um ruı́do branco com média
zero e variância σ 2 , será estacionário de segunda ordem se e somente se φ1 < 1 e φ2 < 1.
(4) O processo ARM A(1, 1), yt = φ0 + φ1 yt−1 + et + θ et−1 , em que et é um ruı́do branco com
média zero e variância σ 2 , a variância de yt é dada por
σ 2 (1 + θ2 )
.
1 − φ21
23. (ANPEC-Prova de Estatı́stica-Ano-2008 - Questão 11 ) Julgue as afirmativas;
(0) Toda serie temporal estacionária com variancia finita pode ser escrita como um modelo de media
movel com termo de erro serialmente nao correlacionado.

23
(1) Um modelo de series temporais nao estacionario tem pelo menos uma raiz unitaria.
(2) O teste de Dickey-Fuller é monocaudal.
(3) Um modelo AR(2) dado por Yt = a + φ1 Yt−1 + φ2 Yt−2 + t , t = 1, 2, 3, . . . , em que t é um
ruı́do branco com média zero e variância σ 2 , será estacionário se φ1 < 1e φ2 < 1.
(4) Um passeio aleatório é um processo estacionário.
24. (ANPEC-Prova de Estatı́stica-Ano-2008 - Questão 15 ) Suponha que yt = α + βyt−1 + ut , em que
{ut } é independente e igualmente distribuido, com distribuição normal de média zero e variância
σ 2 . Sabe-se que α = 35, β = 3/5 e σ 2 = 2. Você é informado de que y2 = 50. Determine a melhor
previsão para y4 .
25. (ANPEC-Prova de Estatı́stica-Ano-2007 - Questão 03 ) Considere o modelo autorregressivo de
primeira ordem, AR(1), definido por Yt = a + bYt−1 + ut , em que a e b sao parâmetros e {ut } é
uma sequência de variáveis aleatórias independentes e igualmente distribuidas, com média nula e
variância σ 2 . Suponha que |b| < 1. A previsao n passos-a-frente para a variavel Y convergirá para :
(0) a. (1) a média de ut . (2)b/(1-a) (3)E(Yt ) (4)∞.
26. (ANPEC-Prova de Estatı́stica-Ano-2007 - Questão 09 ) Julgue as proposições:
(0) . A soma de dois processos estocásticos independentes e estacionários de segunda ordem será
estacionária de segunda ordem.
(1) A soma de dois processos estocásticos nao-estacionários será nao-estacionária.
(2) Seja L o operador defasagem tal que LYt = Yt−1 . Se Yt segue um processo AR(1) estacionário
de segunda ordem, entao (1 − L)2Yt é um processo ARMA(2,2).
(3) O processo ARMA(2, 2) definido na forma (1 − L − 0, 25L2 )Yt = (1 − 0, 5L − 0, 06L2 )ut é não
estacionário, em que ut é o erro aleatório com média nula e variância constante.
(4) Todo processo MA é estacionário de segunda ordem.
27. (ANPEC-Prova de Estatı́stica-Ano-2006 - Questão 11 ) Dois economistas usam os modelos abaixo
para a analisar a relação entre a demanda da moeda (m) e a renda nacional (y). As variáveis estão
todas em logaritmos e a peridiocidade é mensal.
Economista A: Economista B:
mt = 1, 099yt + ût (Equação 1) ∆mt = 1, 099δyt + êt (Equação 2)
(0,0086) (0,145)
Os valores entre parênteses são os erros-padrão.
Testes Dickey-Fuller aumentado(ADF), com número apropriado de defasagens maiores que zero em
todos os casos , para as variáveis e para os resı́duos dos dois modelos geram os seguintes resultados:
Variável mt yt ût ∆mt ∆yt êt
Estatı́stica-ADF -2,191 -1,952 -2,993 -5,578 -6,312 -8,456
O valor crı́tico da tabela de Dickey-Fuller a 5% é igual a -2,886. São corretas as afirmativas:
• Tanto a série de demanda de moeda quanto a renda nacional são integradas de primeira ordem.
( )
• As séries de demanda de moeda e de renda nacional não são cointegradas de ao nı́vel de significância
de 5%. ( )
• Se a série de demanda de moeda for estacionária na diferença( difference stationarity) ela não
pode ser estacionária na tendência (trend stationarity) . ( )
• Se as séries de demanda de moeda e de renda nacional forem cointegradas, o economista B deve
incluir o erro defasado ût−1 em seu modelo. ( )
• A série de renda nacional é um passeio aleatório puro.
28. (ANPEC-Prova de Estatı́stica-Ano-2006 - Questão 15 ) Uma série temporal Yt t = 1, 2, . . . T , foi
gerada por um processo da classe ARIM A(p, d, q) e apresenta os seguintes formatos para a Função
de Autocorrelação(FAC) e Função de Autocorrelação Parcial(FACP)
Supondo que a média da série seja 100 e que YT −3 = 35,YT −2 = 28, YT −1 = 38 e YT = 30, calcule
a previsão para YT +1 feita no instante T , isto é E(YT +1 |YT , YT −1 , YT −2 , YT −3 , . . .).

24
29. (ANPEC-Prova de Estatı́stica-Ano-2005 - Questão 07 ) Com respeito à teoria das séries temporais,
são corretas as afirmativas:
(0) Considere uma série temporal auto-regressiva de ordem 1 com parâmetro ρ . No modelo Yt −
Yt−1 = δYt−1 + ut : , em que ut é um ruı́do branco e δ = ρ − 1 , se δ for de fato igual a zero, a série
Yt será não estacionária.
(1) Numa regressão linear simples de duas séries temporais não estacionárias de ordem 1, o teste
usual t de Student ainda é válido.
(2) Numa regressão linear múltipla de séries temporais de ordem 1, mas cointegráveis, não se corre
o risco de os resultados serem espúrios.
(3) Numa regressão linear múltipla de séries temporais de ordem 1, mas cointegráveis, os resı́duos
da regressão são estacionários.
(4) Se uma série temporal tiver que ser diferenciada n vezes antes de se tornar estacionária, a série
original é integrada de ordem (n -1).

30. (ANPEC-Prova de Estatı́stica-Ano-2005 - Questão 09 ) São corretas as afirmativas:


(0) No processo AR(1):yt = φ0 + φ1 yt−1 + et , em que |φ1 | < 1 e et é um ruı́do branco de média
σ2
zero e variância σ 2 , a variância de yt será .
1 − φ21
(1) Seja a função de autocovariância do processo AR(1) definido no quesito anterior γj = E[(yt−j −
µ)(yt − µ)] , em que E(yt ) é a média do processo do processo yt . É correto afirmar que γj =
(φ0 + φ1 )j
?
1 − φ21
(2) O processo AR(2),yt = φ0 + φ1 yt−1 + φ2 yt−2 + et , em que é et um ruı́do branco de média nula
e variância σ 2 , será estacionário de segunda ordem se, e somente se, φ1 < 1 e φ2 < 1.
(3) A média do processo MA(1),yt = et + θet−1 , em que et é um ruı́do branco, é igual a zero.
(4) No modelo ARMA(1,1),yt = φ0 + φ1 yt−1 + et + θet−1 , em que é um ruı́do branco de média
φ0
nula e variância constante, a média de Yt é dada por .
1 − φ1
31. (ANPEC-Prova de Estatı́stica-Ano-2004 - Questão 10 ) Em relação aos modelos de séries temporais,
são corretas as afirmativas:
(0) No processo AR(1), Zt = φZt−1 + at + θ0 , |φ| < 1 ,at é um ruı́do branco, a média de Zt será
θ0
.
1−φ
(1) O processo MA(1), Zt = at − at−1 , em que at é um ruı́do branco, não é estacionário.
(2) O processo AR(1), Zt = 0, 8Zt−1 + at , em que at é um ruı́do branco, é estacionário.
(3) No processo AR(1),Zt = φZt−1 + at , em que at é um ruı́do branco com V ar(at ) = σa2 , a
σa2
variância de Zt é .
1 − φ2
(4) No modelo ARMA(1,1),Zt = φZt−1 + at θat−1 , em que at é um ruı́do branco, a média de Zt é
diferente de zero.

32. (ANPEC-Prova de Estatı́stica-Ano-2003 - Questão 15 )


Considere o modelo ARMA(1,1) definido por: yt = 0, 5yt−1 − 0, 2t−1 + t , t = 1, 2, . . . , T, . . . em
que a variância de t é igual a 1. Encontre a variância de yt . (Multiplique o resultado final por 10.
Marque somente a parte inteira na folha de resposta).
33. (ANPEC-Prova de Estatı́stica-Ano-2002 - Questão 12 ) Em relação aos modelos de Séries de Tempo
pode-se afirmar que:
(0) No modelo autoregressivo de ordem 1 Zt = φZt−1 + ut + θ0 , |φ| < 1, em que ut um ruı́do branco,
o parâmetro θ0 é a média do processo.
(1) O modelo misto Autoregressivo-Média Móveis, ARM A(1, 1),pode ser representado pela ex-
pressão Zt = φZt + ut − θut−1 + θ0 , em φ e θ são parâmetros e ut um ruı́do branco.

25
(2) Se um processo estocástico possui uma tendência determinı́stica , yt = β1 + β2 t + ut , então
este é dito não estacionário e sua não-estacionariedade pode ser detectada por um teste para raiz
unitária.
(3) Em uma regressão com duas séries temporais, se estas são I(1), ou seja,não estacionárias, as são
cointegradas, pode-se empregar a estatı́stica t-Student para testar a significância dos coeficintes de
regressão.
(4) O teste de Engle-Granger para co-integração entre três variáveis consiste em utilizar a estatı́stica
e a tabela de valores crı́ticos Dickey-Fuller nos resı́duos de um regressão entre estas variáveis.

34. (ANPEC-Prova de Estatı́stica-Ano-2001 - Questão 10 ) Seja o processo auto-regressivo yt = φ1 yt−1 +


t . pode-se afirmar que:
• O processo é estacionário para φ1 < 1.
• Se φ1 = 1, o processo é dito um caminho aleatório(random walk).
• O estimador de mı́nimos quadrados ordinários do parâmetro φ1 é não tendencioso.
• A estatı́stica t-Student pode ser usada para testar a presença da raiz unitária.
• O processo pode ser escrito em forma alternativa como ∆yt = δyt−1 + t em que δ = φ1 − 1, ∆yt =
yt − yt−1 .
35. (ANPEC-Prova de Estatı́stica-Ano-2000 - Questão 15 ) Considere um processo AR(1)

Yt = φYt−1 + t , t ∼ N ID(0, σ 2 ), t = 1, 2, . . . , T,

em que , por hipótese, |φ| < 1, a não ser que seja dito o contrário. Considere Y0 fixo e que t seja
muito distante da origem.
(0) A condição |φ| < 1 é necessária para que o processo apresente média e variância incondicionais
independentes do tempo.
(1) A média incondicional do processo é zero.
(2) A função de autocorrelação deste processo é diferente de zero para o ”lag”1 , e é igual a zero
para todos os outros ”lags”.
(3) A previsão dois-passos à frente é dada por: E(Yt+2 |Yt ) = (φ + 1) + φ2 Yt , em que Yt =
{Y1 , Y2 , . . . , YT }.
(4) Se φ = 1, o processo será não estacionário.

36. (ANPEC-Prova de Estatı́stica-Ano-1999 - Questão 1 ) Com relação aos modelos Auto-Regressivo,


Média-Móvel e Misto pode-se afirmar que:
(0) No modelo AR(1), Zt = φZt−1 + at , onde E(at ) = 0,E(a2t ) = σa2 , Cov(at , as ) = 0, t 6= s, a
variância de Zt é finita qualquer que seja o valor de φ.
(1) No modelo MA(1),Zt = µ + at − θat−1 ,onde E(at ) = 0,E(a2t ) = σa2 , então E(Zt ) = µ e
V ar(Zt ) = (1 + θ2 )σa2 .
(2) O processo ARM A(p, q)(Auto-Regressivo Média-Móvel) pode ser escrito na forma Φ(L)Zt =
Θ(L)at , onde Φ(L) = 1 − φ1 L − φ2 L2 − . . . − φp Lp e Θ(L) = 1 − θ1 L − θ2 L2 − . . . − θq Lq
são , respectivamente, os operadores Auto-Regressivo e de Média-Móvel de ordem p e q onde
Ln Zt = Zt−n .
(3) Se o processo gerador de dados pose ser escrito como (1 − L)Zt = µ + at , então a raiz de sua
equação caracterı́stica será diferente de um.
37. (ANPEC-Prova de Estatı́stica-Ano-1999 - Questão 2 ) Uma série temporal mensal de três anos
, de janeiro de 1995 a dezembro de 1997, para o preço de um produto agrı́cola , apresentou a
seguinte tendência linear Y = 3 + 0, 25X. estime o preço do produto Y para o mês de janeiro de
1998, sabendo que as variações sazonais calculadas com base num modelo aditivo para os três anos
considerados foram:
Mês Jan Fev Mar Abr Mai Jun
Variação sazonal -1,25 -0,52 0,84 1,50 3,00 3,85

26
38. (ANPEC-Prova de Estatı́stica-Ano-1998 - Questão 15 ) Com relação aos modelos Auto-Regressivo,
Média-Móvel e Misto pode-se afirmar que:
(0) No modelo Zt = φZt−1 + at + θat−1 + θ0 , onde θ0 é uma constante e at um ruı́do branco, a
média do processo será igual a zero se θ0 = 0.
(1) No modelo Auto-Regressivo de ordem p, Zt = φ1 Zt−1 + φ2 Zt−2 . . . + φp Zt−p + +at , se 1 − φ1 −
φ2 − . . . − φp = 0, o modelo não será estacionário.
(2) O processo ARM A(p, q)(Auto-Regressivo Média-Móvel) será estacionário, se todas as raı́zes dos
operadores Auto-Regressivo e de Média-Móvel caı́rem dentro do cı́rculo unitário.
(3) Se no modelo Auto-Regressivo de ordem 1, Zt = ρZt−1 + at , at um ruı́do branco, o verdadeiro
valor de ρ é um, então Zt = at + at−1 + at−2 + . . . + a1 , desde que Z0 = 0.
39. (Tribunal Superior Eleitoral- Analista Judiciário-14/01/2007) Texto para as questões de 62 a 64
Uma série temporal estacionária {Yt }, t = 1, 2, . . . , n, segue um processo definido pelas equações a
seguir, em que {Zt } é uma sequência de ruı́dos com média nula e variância σ 2 .
 
  αt−1
Yt = A 1
αt
      
αt 0 1 αt−1 0
= +
αt+1 0 B αt Zt+1

40. (QUESTÃO 62) A partir das informações apresentadas no texto, julque os seguintes itens.
I |A| < 1.
II |B| < 1.
III Yt segue um proceso ARM A(1, 1).
A quantidade de itens certos é igual a
A) 0. B) 1. C) 2. D) 3.

41. (QUESTÃO 63) Com base nas informações apresentadas no texto, se A = 0 e B = 0, 5, então, a
correlação entre Yt e Yt+2 será igual a
A) 0. B0 0,25. C) 0,50. D) 1.
42. (QUESTÃO 64) Considerando as informações do texto, se B = 0 , então, a correlação entre Yt e
Yt+2 será igual a
A) 0. B) B 2 . C0 B. D) 1.
43. (QUESTÃO 65) Uma série temporal estacionária {Xt }, t = 1, 2, . . . , n,
é definida por Xt = λXt−1 + at , em qe at representa o ruı́do aleatório observado no instante t,
E(at ) = 0 e variância V ar(at ) = σ 2 . Seja X̂n+1 o melhor preditor linear para a próxima observação
Xn+1 .
Considerando as informações acima , julque os itens que se seguem.
I A variância do processo {Xt } é igual a λ.
II X̂n+1 = λXn .
III E(Xn+1 − X̂n+1 )2 = λ2 .
A quantidade de itens certos é igual a
A) 0. B) 1. C) 2. D) 3.
44. Seja Zt = at − 0, 5at−1 em que at é uma sequência de variáveis aleatórias independentes com média
nula e variância σa2 .Mostre que:

a. E(Zt ) = 0.
b. V ar(Zt ) = γ(0) = 1, 25σa2 .
c. Cov(Zt , Zt−1 ) = −0, 5σa2 .

27
d. Cov(Zt , Zt+1 ) = −0, 5σa2 .
e. Cov(Zt , Zt−2 ) = 0.
f. ρt,s = I{t=s} (t, s) − 0, 4I{|t−s|=1} (t, s).
g. A função de autocorrelação é de um processo estacionário?

45. A tabela 1 mostra uma série temporal de valores trimestrais da variável econômica Y.
Tabela 1
Y 29 18 13 22 27 21 11 11
Trimestre 1 2 3 4 5 6 7 8

a.) Admitindo que a série apresenta variações cı́clicas estacionais, estime os parâmetros
β0 , β1 , β2 do modelo
   
2πt 2πt
Yt = β0 + β1 cos + β2 sin + ut ,
T T
onde t = 1, 2, . . . , 8 indica o tempo (em trimestres) e T é o perı́odo do ciclo.
b.) Coloque a equação estimada na forma Ŷ = b0 + C cos 2πt

T −Ψ ;
c.) Teste a hipótese H0 : β1 = β2 = 0
d.) Teste a hipótese H0 : β2 = 0

46. A tabela 2 mostra uma série de 8 valores trimestrais ( dois anos) da variável Y . Admite-se que essa
variável apresenta variações cı́clicas estacionais.

Tabela 2
Y 37 32 25 30 33 32 25 34
Trimestre 0 1 2 3 4 5 6 7

a. Ajuste aos dados um modelo harmônico completo ( com 3 coeficientes de regressão, além do
termo constante ).
b. Teste, ao nı́vel de significância de 5%, a hipótese de que os 3 coeficientes de regressão são iguais
a zero.
c. Determine o intervalo de previsão para o valor de Y no terceiro trimestre do terceiro ano, ao
nı́vel de confiança de 90%.

47. A tabela 3 mostra uma série temporal de valores bimestrais da variável econômica Y.
Tabela 3
Y 122 93 71 92 119 106 110 99 65 100 113 110
Bimestre 1 2 3 4 5 6 7 8 9 10 11 12

a.) Admitindo que a série apresenta variações cı́clicas estacionais, estime os parâmetros de um
modelo com dois componentes harmônicos (com perı́odos de T1 = 6 e T1 = 3 bimestres);

2   4  
X 2πt X 2πt
Yt = β0 + βi cos + βi sen + ut ,
i=1
Ti i=3
Ti

onde t = 1, 2, . . . , 12 indica o tempo (em bimestres) e Ti é o perı́odo do i-ésimo ciclo.


P2  
b.) Coloque a equação estimada na forma Ŷ = b0 + i=1 Ci cos 2πt Ti + Ψ i , com Ci > 0 e −π ≤
Ψi ≤ π;
c.) Verifique se a contribuição do segundo componente harmônico (com perı́odo de 3 bimestres) é
estatisticamente significativa.
d.) Teste a hipótese H0 : β1 = β2 = β3 = β4 = 0
e.) Determine as estimativas dos desvios padrões dos estimadores de M.Q. dos parâmetros.
f.) Estime o valor de Y e determine o respectivo intervalo de previsão para t = 13 e t = 15, ao
nı́vel de confiança de 95%..

28
48. A tabela 4 mostra uma série de 8 valores trimestrais da variável econômica Y .

Tabela 4
Y 28,5 19,0 12,5 21,0 27,5 21,0 11,5 19,0
Trimestre 1 2 3 4 5 6 7 8
a. Admitindo que a série apresenta variações cı́clicas estacionais, estime os parâmetros β0 , β1 e
β2 do modelo:
   
2π 2π
Yt = β0 + β1 cos t + β2 sen t + ut ,
T T
t = 1, 2, . . . , 8 indica o tempo (em trimestres) e T é o perı́odo do ciclo.
b. Coloque a equação estimada na forma:
 

Ŷt = b0 + Â cos t − Ψ̂
T
c. Teste, ao nı́vel de significância de 1%, a hipótese H0 : β1 = β2 = 0.
d. Estime o valor de Y e determine o respectivo intervalo de previsão para t = 11 , ao nı́vel de
confiança de 90%.

49. Para os dados da questão anterior, estabeleça um modelo onde o efeito das variações estacionais é
captado por variáveis binárias. Estime a equação e calcule a correspondente soma de quadrados dos
desvios. Compare esse modelo com aquele analisado na questão anterior ( regressão harmônica).
Há razão para dar preferência a um dos dois modelos nesse caso? Explique.
50. A tabela 5 mostra uma série de 6 valores da variável econômica Y , observada de 8 em 8 meses
( o intervalo entre duas observações consecutivas é de 8 meses ou 2/3 de ano). Admite-se que Y
apresente variações cı́clicas estacionais

Tabela 5
Y 36 42 12 42 36 18
Tempo 8 16 24 32 40 48
t 0 1 2 3 4 5

T empo − 8
Note que t = .
8
a. Ajuste aos dados um modelo harmônico completo, com 2 coeficientes de regressão (além do
termo constante).
b. Teste, ao nı́vel de significância de 5%, a hipótese de que os dois coeficientes de regressão são
iguais a zero.
c. Coloque a equação estimada na forma:
 

Ŷt = b0 + Â cos t − Ψ̂ .
T
d. Determine o intervalo de previsão para o próximo valor de Y , ao nı́vel de confiança de 90%.

51. A tabela 6 mostra uma série temporal de 12 valores trimestrais da variável econômica Y . Admite-se
que Y apresente variações cı́clicas estacionais.
Tabela 6
Y 57 14 18 55 42 23 12 46 42 26 21 40
Trimestre 1 2 3 4 5 6 7 8 9 10 11 12

a. Obtenha estimativas dos parâmetros do modelo harmônico


 

Yt = α + δ cos t − Ψ + ut ,
T
onde ut é chamado de ruı́do branco.

29
b. Calcule o coeficiente de determinação da regressão ajustada e verifique se é estatisticamente
diferente de zero ao nı́vel de significância de 1%.
c. Determine o intervalo de previsão para para Y no terceiro trimestre do quarto ano,ao nı́vel de
confiança de 90%.
d. O modelo harmônico completo para dados trimestrais teria um termo adicional ficando com
um total de 4 parâmetros. Faça um teste ( t ou F ) para verificar se a contribuição desse termo
adicional é significativa ao nı́vel de 10
e. Descreva um modelo com variáveis binárias que levaria a um coeficiente de determinação igual
ao do modelo harmônico completo. Tendo em vista o resultado obtido no item (d), na análise
dessa série temporal você daria preferência a este modelo com variáveis binárias ou ao modelo
dado no item (a)?. Justifique.

52. A tabela 7 mostra uma série temporal de 8 valores trimestrais da variável econômica Y . Admite-se
que as variações de Y podem ser explicadas pelo modelo.
 

Yt = α + A cos t − Ψ + ut ,
T
com T = 4 trimestres,
Pressupõe-se que os ut são erros aleatórios independentes com distribuição normal de média zero.
Pressupõe-se, também, que a variância dos ut é σ 2 para os dois primeiros trimestres e 2σ 2 para os
dois últimos trimestres de cada ano.

Tabela 7
Y 8 8 16 22 14 2 20 14
t 1 2 3 4 5 6 7 8
a. Após colocar o modelo na forma de um regressão linear múltipla com duas variáveis expla-
natórias, obtenha as estimativas lineares não tendenciosas de variância mı́nima dos seus 3
parâmetros.
b. Estime σ 2 .  

c. Teste, ao nı́vel de significância de 5%, a hipótese de que o coeficiente de cos t é igual a
T
zero.
d. Teste, ao nı́vel de significância de 5%, a hipótese H0 : A = 0 ( que equivale a afirmar que os
dois coeficientes de regressão são iguais a zero).
e. Determine a estimativa de Y no quarto trimestre do terceiro ano.
f. Determine o intervalo de previsão para para Y no quarto trimestre do terceiro ano,ao nı́vel de
confiança de 90%.

53. A tabela 8 mostra uma série temporal de 12 valores trimestrais (3 anos) da variável económica Y .
12
X X12
Verifica-se que Yi = 276 e Yi2 = 6950.
i=1 i=1
Tabela 8
Y 17 18 12 14 25 23 13 25 33 34 28 30
Trimestre 1 2 3 4 5 6 7 8 9 10 11 12

a. Estime os parâmetros do modelo


 

Yt = α + β t + A cos t − Ψ + ut ,
T
onde ut é um ruı́do branco e T + 4 trimestres.
b. Calcule o coeficiente de determinação da regressão
c. Verifique se a contribuição do componente harmônico é estatisticamente significativa a 1%.
d. Determine a estimativa pontual e intervalar a 95% de Y no terceiro semestre do quarto ano.

Dica: Para a solução manual transforme a variável t em x = 2∗(t−6, 5). Justifique tal transformação

30
Nı́vel 3
1. A tabela 9 mostra uma série temporal de valores bimestrais da variável econômica Y.
Tabela 9
Y 103 119 121 105 85 79 83 95 105 101 85 71
Bimestre 1 2 3 4 5 6 7 8 9 10 11 12

a.) Admitindo que a série apresenta variações cı́clicas estacionais, estime os parâmetros
do modelo:
   
2πt 2πt
Yt = α + γt + β1 cos + β2 sen + ut ,
T T
onde t = 1, 2, . . . , 12 indica o tempo (em bimestres) e T = 6 é o perı́odo das variações cı́clicas.
b.) Determine a fase inicial ( −π ≤ Ψ ≤ π) e a amplitude das variações cı́clicas;
c.) Teste a hipótese H0 : γ = 0
d.) Teste a hipótese H0 : β1 = β2 = 0
n
X
Zt
t=1
2. Seja Zt uma série estacionária com facv γk . Seja Z̄ = . Mostrar que :
n
n−1
X |k|
(1 − ) γk
n γ0
n−1
2 X k
k=−n+1
V ar(Z̄) = = + (1 − ) γk .
n n n n
k=1

3. Prove que o passeio aleatório, definido em (2.20), tem facv dada por γ(t1 , t2 ) = σ2 min(t1 , t2 ).
n
X
4. Seja Z(t) = (Aj cosλj t + Bj senλj t), onde t = 0, ±1; ±2, . . . e λ1 , λ2 , . . . , λn são constantes
j=1
positivas e Aj , Bj são variáveis aleatórias independentes entre si com médias 0 e variâncias σj2 =
V ar(Aj ) = V ar(Bj ), j = 1, 2, . . . , n. O processo Z(t) é estacionário? Encontre a média e a facv de
Z(t).
5. Considere o modelo (2.34), com at satisfazendo (2.36) e suponha que
n
X

Z (t) = bk Zt+k , t = n + 1, . . . , N − n.
k=−n

a. Escrevendo Z ∗ (t) = f ∗ (t) + a∗t , dê as expressões para f ∗ (t) e a∗t .


b. Calcule V ar(a∗t ); é possı́vel escolher os bi de modo que V ar(a∗t ) < V ar(at )? Como?
c. Prove que:
n

X
2

 σ
 a
 bk bk−h , h = 0, 1, , . . . , 2n,
Cov(a∗t , a∗t+h ) = k=−n



0 , h = 2n + 1, . . . .

6. Responda as questões do Problema 4 para o caso em que:


1
bk = , para todo k.
2n + 1

7. Considere as observações:

t 1961 1962 1963 1964 1965 1966 1967


Zt 15 19 13 17 22 18 22

31
Calcule ck e rk , k = 0, 1, . . . , 6.
8. Considere o modelo (2.35) com as suposições (2.36) e com f (t) = α + βt. Obtenha os estimadoes
de mı́nimos quadrados de α e β para os dados do Problema 6.

9. Suponha f (t) dada por (2.41), com m = 2. Obtenha ∆2 f (t) e ∆3 f (t). De modo geral, para um d
qualquer, calcular ∆d f (t), isto é, a d-ésima diferença de f (t), d um inteiro qualquer.
10. Obtenha os valores suavizados Zt∗ definidos no Problema 4, para os dados do Problema 6. Faça
um gráfico para Zt e Zt∗ . Use n = 1 e bk = 1/3, para todo k.

11. Para o problema anterior, supondo V ar(at ) = σa2 = 1, obtenha V ar(a∗t ) e Cov(a∗t , a∗t+h ).
12. Considere os dados da Série A10 (M-ICV). Calcule a média amostral Z̄, c0 ,c1 , c2 ,c3 ,c4 ,r0 , r1 ,r2 ,r3 ,r4
e faça o gráfico de rj , j = 0, 1, 2, 3, 4.
13. Considere o processo estocástico Zt = at , onde at é um ruı́do branco, com t = 0, ±1, ±2, . . . e

 +1 , com probabilidade 1/2;
at =
−1 , com probabilidade 1/2.

a. Obtenha a média do processo Zt ;


b. Calcule γ(τ ), τ = 0, ±1, ±2, . . .;
c. Calcule ρ(τ ), τ = 0, ±1, ±2, . . . e faça o seu gráfico.
r  
j r
X
r
14. Prove que ∆ Z(t) = (−1) Zt−j .
j=0
j

15. Suponha {at , t = 1, 2, . . .} uma sequência de variáveis aleatórias e identicamente distribuı́das, com:

P (at = 0) = P (at = 1) = 1/2.

a. O processo a1 + a2 cost é estacionário?


b. O processo a1 + a2 cost + a3 cost + sent é estacionário?

16. Se {Xt , t ∈ T } e {Yt , t ∈ T } são estacionários e independentes, {aXt + bYt , t ∈ T } será estacionário?
17. Seja {Zt } um processo estacionário com média µZ e função de autocovariância γZ . Um novo
processo é definido por Yt = Zt − Zt−1 . Obtenha a média e a função de autocovariância de {Yt }
em termos de µZ e γZ . Mostre que {Yt } é um processo estacionário.

18. Prove que {Z(t), t ∈ R} for Gaussiano e estacionário de segunda ordem, então ele será fracamente
estacionário.
19. Use um programa computacional para calcular:

a. a média amostral;
b. ck e rk , para k = 1, 2, . . . , 36;

das séries A4 (Ozônio) e A5 (Energia). Faça os gráficos da séries e de rk . Comente quanto à presença
de tendências, sazonalidades, ciclos. Comente a natureza dos gráficos de rk para cada série.
20. Use um programa computacional (o EViews, por exemplo) e a série dos log-retornos mensais do
IBOVESPA (Série A9 (d)) para calcular:
a. média e variância amostrais, coeficientes de assimetria e curtose, máximo e mı́nimo, histo-
grama;
b. autocorrelações amostrais.

32
21. Considere {at , t = 1, 2, . . .} obtido de uma sequência ut ∼ N (0, 1) independentes, da seguinte forma:

 ut , t par;
at =
2−1/2 (u2t−1 − 1) , t ı́mpar,

{at } é um processo estacionário?


22. A função γ(τ ) = sen(τ ) é uma possı́vel função de autocovariância? Justifique sua resposta.

23. Quais das seguintes funções definidas em Z são funções de autocovariância de um processo esta-
cionário?

a. 
 1 , se h = 0;
γ(h) =
1
, se h 6= 0,

h

b. γ(h) = (−1)|h| .
c. γ(h) = 1 + cos πh πh
2 + cos 4 .
d. γ(h) = 1 + cos πh πh
2 − cos 4 .
e. 

 1 , se h = 0;



γ(h) = 0, 4 , se h = ±1




0 , se h 6= 0, ±1.

24. Mostre que se uma série estacionária satisfaz a equação de diferenças

Yt − Yt−1 = et , et ∼ N (0, σe2 )

independentes, então V ar(et ) = 0.


25. Seja Zt = at + cat−1 + cat−2 + . . . + ca1 , t ≥ 1, onde c é uma constante e at ∼ RB(0, σa2 ).

a. Encontre a média e a autocovariância de Zt . Ela é estacionária?


b. Encontre a média e a autocovariância de (1 − B)Zt . Ela é estacionária?

26. Suponha que {Xt , t = 0, ±1, . . .} seja uma sequência de variáveis aleatórias independentes, todas
com a mesma distribuição, com E(Xt ) = µ, para todo t, e V ar(Xt ) = σ 2 , para todo t. Considere
o processo {Yt , t = 0, ±1, . . .},
onde Yt = Xt
2 + Xt−1 Xt−2
4 + 8 . O processo {Yt } é estacionário? Calcule E(Yt ), V ar(Yt ) e Cov(Yt , Ys ).

27. Dado o processo Xt , definimos a primeira diferença como ∆Xt = Xt − Xt−1 e, sucessivamente,
∆2 Xt = ∆(∆Xt ), ∆3 Xt = ∆(∆2 Xt ), etc. Suponha que Yt = α + βt + γt2 + Xt , onde α, β e γ são
constantes e Xt é estacionário com função de autocovariância γX (t). Mostre que ∆2 Yt é estacionário
e encontre sua função de autocovariância.
28. Suponha que t seja RB(0, σ2 ). Defina o processo

 0 , t = 0;
Xt =
Xt−1 + t , t = 1, 2 . . . .

O processo Xt é estacionário?

29. Suponha Xt ∼ RB(0, σ 2 ) e seja Yt = Xt + cos(2πf0 t + φ), 0 < f0 < 1/2 fixada.

a. Mostre que, se φ é uma constante, Yt não é estacionário;

33
b. Mostre que, se φ for uma v.a. uniformemente distribuı́da sobre o intervalo [−π , π] e indepen-
dente de Xt , então Yt é um ruı́do branco.

30. As seguintes observações representam os valores Z91 , Z92 , Z93 , Z94 , Z95 , Z96 , Z97 , Z98 , Z99 , Z100 de
uma séries temporal ajustada pelo modelo

Zt − Zt−1 = at − 1.1at−1 + 0.3at−2

166, 172, 172, 169, 164, 168, 171, 167, 168, 172

a. Calcule as previsões Zb100 (h), h = 1, 2, ..., 10 (utilize a90 = 0 e a91 = 0)


Solução:
Dado o modelo
Zt − Zt−1 = at − 1.1at−1 + 0.3at−2
Podemos escrever
Zt = Zt−1 + at − 1.1at−1 + 0.3at−2
E assim, identificar que o modelo é ARMA(1,2).
Para fazermos as previsões de Zt no tempo t e horizonte h, precisamos colocar a série no
seguinte formato:

Zt+h = Zt+h−1 + at+h − 1.1at+h−1 + 0.3at+h−2

Pede-se no item que se calcule Zb100 (h) para h = 1, 2, ..., 10. Isso é bem simples, entretanto, ao
substituir h = 1, por exemplo, precisaremos de a99 e a100 , valor que não temos. Dessa forma,
precisaremos dos valores passados de Zt para encontrar tais resultados de previsão.
Sabendo que podemos escrever o modelo como

Zt+h = Zt+h−1 + at+h − 1.1at+h−1 + 0.3at+h−2

Então, vamos substituir:


– Econtrando a92 :

Z92 = Z91 + a92 − 1.1a91 + 0.3a90


172 = 166 + a92 − 0 + 0
a92 = 6

– Econtrando a93 :

Z93 = Z92 + a93 − 1.1a92 + 0.3a91


172 = 172 + a93 − 1.1 ∗ 6.6 + 0
a93 = 6.6

– Econtrando a94 :

Z94 = Z93 + a94 − 1.1a93 + 0.3a92


169 = 172 + a94 − 1.1 ∗ 6.6 + 0.3 ∗ 6
a94 = 2.46

– Econtrando a95 :

Z95 = Z94 + a95 − 1.1a94 + 0.3a93


164 = 169 + a95 − 1.1 ∗ 2.46 + 0.3 ∗ 6.6
a95 = −3.274

34
– Econtrando a96 :

Z96 = Z95 + a96 − 1.1a95 + 0.3a94


168 = 164 + a96 − 1.1 ∗ (−3.274) + 0.3 ∗ 2.46
a96 = −0.3394

– Econtrando a97 :

Z97 = Z96 + a97 − 1.1a96 + 0.3a95


171 = 168 + a97 − 1.1 ∗ (−0.3394) + 0.3 ∗ (−3.274)
a97 = 3.60886

– Econtrando a98 :

Z98 = Z97 + a98 − 1.1a97 + 0.3a96


167 = 171 + a98 − 1.1 ∗ (3.60886) + 0.3 ∗ (−0.3394)
a98 = 0.071566

– Econtrando a99 :

Z99 = Z98 + a99 − 1.1a98 + 0.3a97


168 = 167 + a98 − 1.1 ∗ (0.071566) + 0.3 ∗ (3.60886)
a99 = −0.003935

– Econtrando a100 :

Z100 = Z99 + a100 − 1.1a99 + 0.3a98


172 = 168 + a98 − 1.1 ∗ (−0.003935) + 0.3 ∗ (0.071566)
a100 = 4.0258

Encontrado a99 = −0.003935 e a100 = 4.0258, podemos fazer a previsão para a séries em
estudo, com h = 1, 2, ..., 10:
– Encontrando Zb101 :

Z100 (1) = Z100 + a101 − 1.1a100 + 0.3a99


Z100 (1) = 172 + 0 − 1.1 ∗ (4.0258) + 0.3 ∗ (−0.003935)
Z100 (1) = 176.4272
Zb101 = 176.4272

– Encontrando Zb102 :

Z100 (2) = Z101 + a102 − 1.1a101 + 0.3a100


Z100 (2) b101 + 0 − 0 + 0.3 ∗ (4.0257983)
= Z
Z100 (2) = 176.4272 + 0.3 ∗ (4.0257983)
Z100 (2) = 177.6349
Zb102 = 177.6349

35
– Encontrando Zb103 :

Z100 (3) = Z102 + a103 − 1.1a102 + 0.3a101


Z100 (3) = Zb102 + 0 − 0 + 0
Z100 (3) = Zb102
Z100 (3) = 177.6349
Zb103 = 177.6349

– Para h > 3, o valor de Z100 (h) é :

Z100 (h) = 177.6349

b. Sabendo que σb2 = 1.1, calcule Vdar(e100 (h)), h = 0, 1, 2, ..., 10 e construa intervalos de confiança
para valores Z100+h .
Solução:
Para calcular a variância do erro de previsão, usamos:

V (h) = (1 + Ψ1 2 + Ψ2 2 + ... + Ψh−1 2 )

Nosso objetivo agora é encontrar os valores de Ψj . Usaremos o artifı́cio o seguinte artifı́cio:

φ(B)Ψ(B) = θ(B)

Aplicando em nosso modelo:

(1 − B)Zt = (1 − 1.1 + 0.3)at


2
(1 − B)(1 + Ψ1 B + Ψ2 B + ...) = (1 − 1.1 + 0.3)at
2
1 + (Ψ1 − 1)B + (Ψ2 − Ψ1 )B + ...) = (1 − 1.1 + 0.3)at
Ψ1 − 1 = −1.1
Ψ1 = −0.1
Ψ1 − Ψ1 = 0.3
Ψ2 = 0.2

Assim, Ψ1 = −0.1 e Ψ2 = 0.2, com Ψh = 0, para h > 2.


Portanto, para os horizontes definidos, temos:
– Variância para horizonte 1:

V (1) = 1.(1.1)
V (1) = 1.1

– Variância para horizonte 2:

V (2) = (1 + Ψ1 2 ).(1.1)
V (2) = 1.221

– Variância para horizonte 3:

V (3) = (1 + Ψ1 2 + Ψ2 2 ).(1.1)
V (3) = 2.75

36
– Variância para horizonte h, com h > 3:
V (h) = 2.75

Para a construção dos intervalos de confiança, devemos fazer algumas suposições adicionais:
– E[at ] = 0
– V ar[at ] = σa 2
– E[at .at ] = 0, t6=s
– at ∼N (0, σa 2 )
Segue-se, portanto, que dados os valores passados e presentes da série, Zt , Zt−1 , ... a distribuição
condicional de Zt+h será N (Zbt (h), V (h)), ou seja,
Zt+h − Zbt (h)
U= p
V (h)
Assim, fixando γ = 95%, temos os seguintes intervalos:
– I.C. para horizonte 1
p p
Z100 (1) − 1.96( V (1))≤Z101 ≤Z100 (1) + 1.96( V (1))
√ √
176.4272 − 1.96( 1.1)≤Z101 ≤176.4272 + 1.96( 1.1)
174.3715≤Z101 ≤178.4829
– I.C. para horizonte 2
p p
Z100 (2) − 1.96( V (2))≤Z102 ≤Z100 (2) + 1.96( V (2))
√ √
177.6349 − 1.96( 1.221)≤Z102 ≤177.6349 + 1.96( 1.221)
175.4691≤Z102 ≤179.8007
– I.C. para horizonte 3
p p
Z100 (3) − 1.96( V (3))≤Z103 ≤Z100 (3) + 1.96( V (3))
√ √
177.6349 − 1.96( 2.75)≤Z103 ≤177.6349 + 1.96( 2.75)
174.3846≤Z103 ≤180.8852
– I.C. para horizonte h, h > 3:
174.3846≤Z100 (h)≤180.8852
c. Determine o coeficientes Ψr e, utilizando a nova observação Z101 = 174, calcule as previsões
atualizadas Zb101 (h), h = 1, 2, ..., 9.
Solução:
Valores de Ψr , ja foram encontrados. Vamos atualizar as previsões:

Zb102 = Zb101 + a102 − 1.1a101 + a100


Zb102 = 174 + 0 − 0 + 0.3(4.0253983)
Zb102 = 175.2076

Z
b103 = Zb102 + a103 − 1.1a102 + a101
Z
b102 = Zb102
Z
b102 = 175.2076

Zbh = 175.2076

Para h > 3.

37
8 Considerações Finais
O objetivo de todo material didático é fornecer ao estudante total apoio no que ele se fomenta a
fazer. E esse material não foge a essa situação. Elaborado com muito cuidado e atenção a presente
apostila tenta aumentar o grau de conhecimento do discente da graduação com o intuito de amadurecer
o conhecimento sobre a Estatı́stica em suas mais diversas áreas. E espero que você tenha alcançado esse
objetivo ou esteja tentando alcançar. Fico muito grato em ter escolhido este material como mais um
apoio ao estudo.
Materiais & Apostilas Osterne

38
Referências
[1] DRAPER, N.; SMITH, H. Applied Regression Analysis. 3rd. ed. New York: Wiley, 1998.
[2] MONTGOMERY, D.C; PECK, E.C.; VINING, G.G. Introduction to linear regression analysis. 3rd.
ed. New York: Wiley, 2001.

[3] NOTAS DE AULA. Notas de aula da ministrante da disciplina de Modelos de Regressão I semestre
2016.1, professora Ana Maria Souza Araújo.
[4] HOFFMANN, R. Análise de Regressão: uma Introdução à Econometria. 4a . edição. São Paulo:
Hucitec, 2006.

39

Você também pode gostar