Introdução Às Probabilidades e Estatística Exercícios

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 47

D EPARTAMENTO DE M ATEMÁTICA - S ECÇÃO DE E STATÍSTICA E A PLICAÇÕES

INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA

EXERCÍCIOS

Os exercícios consistem maioritariamente em adaptações de exercícios de PE, DM-IST, e de testes e exames


de IPE de anos anteriores (incluindo do Prof. João Amaral).
Em Apêndice resume-se a teoria salientado os conceitos principais.

M ESTRADO I NTEGRADO EM A RQUITECTURA


I NSTITUTO S UPERIOR T ÉCNICO
Setembro, 2018

1
Conteúdo

1 Probabilidades 3

2 Variáveis aleatórias discretas 9

3 Variáveis aleatórias contínuas 13

4 Vectores aleatórios, combinações lineares e TLC 16

5 Estimação Pontual 20

6 Intervalos de Confiança 22

7 Testes de Hipóteses 25

8 Regressão Linear Simples 29

A Probabilidade, Variáveis e Vectores Aleatórios, Teorema do Limite Central 32


A.1 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
A.2 Variáveis aleatórias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
A.3 Variáveis aleatórias contínuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.4 Vectores Aleatórios Bivariados Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
A.5 Combinações Lineares de Variáveis Aleatórias Independentes . . . . . . . . . . . . . . . . . . . . . 34
A.6 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
A.7 Processo de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

B Estimação e Testes de Hipóteses 36


B.1 Estimação Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
B.2 Intervalos de confiança (IC) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
B.3 Testes de Hipóteses (TH) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

C Regressão Linear Simples 40

2
Capítulo 1

Probabilidades

Experiência aleatória, espaço de resultados Ω, acontecimentos, probabilidade e cálculo combina-


tório
1. Num lançamento de um dado viciado, a probabilidade de ocorrer cada número ímpar é o dobro da pro-
babilidade de ocorrer cada número par.

(a) Indique qual o espaço de resultados e calcule a probabilidade de cada acontecimento elementar.
(b) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja superior a
3.
(c) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja um qua-
drado perfeito.

2. Admita que um lote contém peças pesando 5, 10, 15, 20 g e que existem pelo menos 2 peças de cada peso.
Retiram-se 2 peças do lote. Seja X o peso da 1a peça retirada e Y o peso da 2a peça retirada. Identifique e
utilizando o plano x y marque:

(a) O espaço de resultados.


(b) O acontecimento A = {(x, y) : x = y}.
(c) O acontecimento B = {(x, y) : y > x}.
(d) O acontecimento C =“A 2a peça é duas vezes mais pesada do que a 1a ”.
(e) O acontecimento D =“A 1a peça pesa menos 10g do que a 2a ”.
(f) O acontecimento E =“O peso médio das duas peças é menor que 15 g”.
(g) Calcule as probabilidades dos acontecimentos em (b)–(f ) supondo a equiprobabilidades de todos
os acontecimentos elementares.

3. Uma lotaria tem 10000 bilhetes numerados de 0000 a 9999. O número do primeiro prémio é o número
do bilhete saído numa extracção ao acaso.

(a) Um jogador comprou um bilhete com o número 6789. Qual a probabilidade de lhe sair o primeiro
prémio?
(b) Se o jogador comprar todos os bilhetes cujos números têm todos os algarismos iguais, qual a pro-
babilidade de lhe sair o primeiro prémio?
(c) Qual a probabilidade do número premiado ter todos os algarismos diferentes?

4. De um grupo de 50 alunos do IST (10 alunos por ano) é escolhida ao acaso uma comissão coordenadora
de 4 pessoas. Qual a probabilidade de:

(a) Ser escolhido um e um só aluno do 1º ano?


(b) Serem escolhidos um aluno (e só um) do 1º ano e um aluno (e só um) do 5º ano?
(c) Serem escolhidos no máximo dois alunos do 1º ano?

3
(d) Serem todos do mesmo ano?

5. Numa fila de espera de autocarro estão 4 homens, 3 mulheres e 2 crianças. Qual a probabilidade de:

(a) As pessoas, dentro de cada um daqueles três grupos, estarem de seguida?


(b) As 2 crianças estarem juntas?

6. Uma urna contém 5 bolas brancas e 5 bolas pretas. Dois jogadores, A e B, tiram alternadamente e um de
cada de vez uma bola da urna. O jogador que tirar a primeira bola branca ganha a partida.

(a) Considere a experiência aleatória associada a este jogo e escreva o correspondente espaço de resul-
tados.
(b) Calcule a probabilidade de cada jogador ganhar a partida sabendo que o jogador A é o primeiro a
tirar a bola de urna.
(c) Responda novamente às alíneas (a) e (b) mas agora considerando que as bolas são extraídas com
reposição.

7. Considere um dado equipamento que é constituído por 10 transístores dos quais dois são defeituosos.
Suponha que dois transístores são seleccionados ao acaso, com reposição.

(a) Escreva o espaço de resultados correspondente a esta experiência aleatória e calcule as respectivas
probabilidades.
(b) Calcule as probabilidades dos seguintes acontecimentos:
A 1 − Sair um transístor defeituoso na 1a tiragem.
A 2 − Sair um transístor defeituoso na 2a tiragem.
A 3 − Sair pelo menos um transístor defeituoso.
A 4 − Sair exactamente um transístor defeituoso.
(c) Responda às mesmas questões de (a) e (b) mas agora considerando que não houve reposição.

8. Uma bolsa contém moedas de prata e cobre em igual número. Extrai-se ao acaso e sem reposição duas
moedas. Calcule a probabilidade de que:

(a) A segunda moeda extraída seja de prata, sabendo que a primeira era de cobre.
(b) Saia uma moeda de prata na 2a tiragem.
(c) Uma e uma só das moedas seja de prata.
(d) Pelo menos uma das moedas seja de cobre.

9. Considere o lançamento de 3 dados perfeitos, sendo um branco, outro preto e outro verde. Determine a
probabilidade de obter uma soma de pontos igual a 10.

10. Um grupo de apostadores do totobola decidiu jogar todas as apostas possíveis contendo 7 vitórias em
casa, 4 empates e 2 vitórias fora. Calcule a probabilidade desse grupo ganhar o totobola.

11. Suponha que uma cidade tem n +1 habitantes e que um deles conta um boato a outro, que por sua vez o
repete a um terceiro, e assim sucessivamente. Em cada passo, a pessoa que ouve o boato é escolhida ao
acaso de entre as n restantes. Determine a probabilidade de que um boato seja contado r vezes:

(a) Sem antes voltar a ser contado à pessoa que lhe deu início.
(b) Sem que ninguém o ouça mais do que uma vez.

4
Probabilidade, propriedades básicas e operações entre acontecimentos

12. Sejam A e B acontecimentos tais que P (A) + P (B ) = x e P (A ∩ B ) = y. Determine em função de x e de y a


probabilidade de:

(a) Não se realizar nenhum dos dois acontecimentos.


(b) Que se realize um e um só dos dois acontecimentos.
(c) Que se realize pelo menos um dos dois acontecimentos.
(d) Que se realize quanto muito um único acontecimento.

13. Uma colecção de 100 programas de computador foi examinada para detectar erros de “sintaxe”, “in-
put/output” e de “outro tipo” diferente dos anteriores. Desses 100 programas, 20 tinham erros de “sin-
taxe”, 10 tinham erros de “input/output” e 5 tinham erros de “outro tipo”, 6 tinham erros de “sintaxe” e
de “input/output", 3 tinham erros de “sintaxe"e de “outro tipo”, 3 tinham erros de “input/output"e de
“outro tipo"e 2 tinham os três tipos de erros considerados. Um programa é seleccionado ao acaso desta
colecção. Determine a probabilidade de que o programa seleccionado tenha:

(a) Exclusivamente erros de “sintaxe”.


(b) Pelo menos um dos três tipos de erros.

14. Numa clinica dentária há 3 gabinetes A, B e C que são usados preferencialmente por cada um dos mé-
dicos que aí trabalham. Admita que durante um determinado período num dia típico as probabilidades
de cada gabinete estar ocupado são 0.5 para o A, 0.4 para o B e 0.3 para o C . Considere ainda que as pro-
babilidades de cada um dos gabinetes B ou C estar ocupado quando A está ocupado são ambas iguais a
0.2 e que a probabilidade de C estar ocupado quando B está ocupado é 0.75. Se a probabilidade de todos
os gabinetes estarem simultaneamente ocupados for 0.15 determine:

(a) A probabilidade de pelo menos um dos gabinetes estar ocupado.


(b) A probabilidade de A estar ocupado sabendo que pelo menos um dos outros gabinetes está ocu-
pado.

15. Num parque natural há três percursos pedonais recomendados com durações e graus de dificuldade dis-
tintos: A, B e C . Admita que 60% dos visitantes optam pelo percurso A, 30% pelo percurso B (podendo
também já ter escolhido o percurso A) e 10% pelo percurso C . Contudo, 10% acabam por fazer os per-
cursos A e B ; e, 30% dos que começaram por fazer o percurso A, 20% dos que inicialmente fizeram o
percurso B e 10% dos que já fizeram os percursos A e B fazem também o percurso C .

(a) Qual é a probabilidade de um visitante fazer pelo menos um dos percursos?


(b) Sabendo que um visitante fez pelo menos um dos percursos A e B , qual é a probabilidade de ele
fazer também o percurso C ?

16. Mostre que:

(a) Se A e B são acontecimentos tais que A ⊂ B então P (A) ≤ P (B ).


(b) Para quaisquer acontecimentos C e D tem-se

P (C ∩ D) ≤ P (C ) ≤ P (C ∪ D).

n
[ n
X
(c) P ( Ai ) ≤ P (A i ), ∀n∈N
i =1 i =1

5
Lei da Probabilidade Total e Teorema de Bayes

17. (a) Em determinado local observaram-se 150 dias de chuva num ano (considere 365 dias). Obtenha
(uma estimativa para) a probabilidade de chover num dia arbitrário do ano.
(b) Sabe-se que 50 destes dias foram durante os meses Março–Setembro. Obtenha a probabilidade de
chover:
i. num dia (arbitrário) de Março–Setembro,
ii. num dia (arbitrário) de Outubro–Fevereiro.
(c) Obtenha a probabilidade de chover num dia arbitrário do ano (i.e. novamente (a)) a partir dos
resultados em (b). [Lei da Probabilidade Total]

18. Suponha que 5% da população portuguesa numa determinada faixa etária sofre de obesidade e que de
entre estes, 75% têm elevado nível de colestrol. De entre os não obesos, 30% têm elevado nível de coles-
trol.

(a) Qual a percentagem de pessoas com elevado nível de colestrol?


(b) Qual a percentagem de pessoas que tendo elevado nível de colestrol são obesos?

19. Num parque de estacionamento subterrâneo de uma superfície comercial com três pisos, um potencial
cliente procura um lugar atendendo a dois critérios: profundidade do piso e proximidade do elevador. A
probabilidade de encontrar um lugar em cada um dos pisos é igual a 0.3 para o piso −1, a 0.5 para o piso
−2 e a 0.2 para o último piso. A probabilidade de esse lugar se encontrar próximo do elevador é 0.05 no
piso −1, 0.1 no piso −2 e 0.2 no último piso.

(a) Qual é a probabilidade desse cliente conseguir um lugar junto ao elevador?


(b) Supondo que esse cliente conseguiu um lugar junto ao elevador, qual é a probabilidade desse lugar
se situar no piso −1?

20. Um teste é constituído por uma pergunta com n alternativas. O indivíduo que o faz ou conhece a resposta
ou responde ao acaso. Seja p a probabilidade de um indivíduo conhecer a resposta. Admitindo que a
probabilidade de um indivíduo responder correctamente à questão dado que conhece a resposta é 1 e
que a probabilidade de responder correctamente dado que responde ao acaso é 1/n:

(a) Verifique que a probabilidade de um indivíduo não ter respondido ao acaso dado que respondeu
correctamente é np/(1 + (n − 1)p).
(b) Calcule a probabilidade de uma pessoa escolhida ao acaso não responder correctamente à questão,
supondo n = 5 e p = 0.2.

21. Registos efectuados levaram a concluir que os motoristas que circulam em determinada estrada podem
cometer dois e só dois tipos de transgressões ditas do tipo I e do tipo II, não se notando nenhum caso em
que o motorista cometa ambas as transgressões. De entre 500 motoristas multados verificou-se serem
100 por transgressões do tipo I. Sabendo que 10% dos motoristas que cometem transgressões do tipo
I são multados; que 1% cometem transgressões do tipo I e que 2% cometem transgressões do tipo II,
calcule a probabilidade de que um motorista que circule nessa estrada e cometa uma transgressão do
tipo II seja multado.

22. Um barco pesqueiro desapareceu e presume-se que o seu desaparecimento se deva a uma das três pos-
síveis causas:

C 1 - afundou-se quando experimentava um sofisticado sistema de pesca para o qual não estava mini-
mamente apetrechado;
C 2 - foi sequestrado por transportar um carregamento de material nuclear;
C 3 - foi destruido por um temporal.

6
Três brigadas de busca e salvamento, B 1 , B 2 e B 3 foram enviadas com a missão de procurar o barco,
investigando cada uma delas uma das causas (i.e. a brigada B i investiga a causa C i ). Suponha que:

i) as três causas do desaparecimento são igualmente prováveis;


ii) a probabilidade da brigada B i ser bem sucedida quando de facto o barco desapareceu devido à
causa C i é αi (α1 = 0.1, α2 = 0.7, α3 = 0.8).

Sabendo que a investigação da brigada B 2 resultou infrutífera, calcule a probabilidade:

(a) Do barco ter sido sequestrado.


(b) Do barco ter sido destruido por um temporal.

Independência

23. Considere A e B tais que: P (A) = 1/4, P (B ) = 1/3, P (A ∩ B ) = 0.

(a) Poderão ser A e B incompatíveis?


(b) São A e B independentes?

24. A execução de um projecto de construção de um edifício no tempo programado está relacionada com os
seguintes acontecimentos:

E = “escavação executada a tempo”


F = “fundações executadas a tempo”
S = “superestrutura executada a tempo”

supostos independentes e com probabilidades iguais a, respectivamente, 0.8, 0.7 e 0.9. Calcule a proba-
bilidade de:

(a) O edifício ser terminado no tempo previsto, devido ao cumprimento dos prazos nas três actividades
referidas.
(b) O prazo de execução ser cumprido para a escavação e não ser cumprido em pelo menos uma das
outras actividades.

25. Um certo tipo de motor eléctrico quando avariado pode apresentar quatro tipos de falhas, denotadas por
F 1 , F 2 , F 3 e F 4 , cujas probabilidades de ocorrência são iguais. Seja A = {F 1 , F 2 }, B = {F 1 , F 3 }, C = {F 1 , F 4 } e
D = {F 2 , F 3 }.

(a) Mostre que os acontecimentos A, B e C são independentes aos pares.


(b) Mostre que P (C |A ∩ B ) é diferente de P (C ).
(c) Comente a afirmação: “Como a ocorrência simultânea de C e D é impossível, C e D são necessaria-
mente dependentes”.

26. Considere o seguinte troço de um circuito eléctrico

1
A r rB
3

7
e designe por F i o acontecimento “o interruptor i está fechado” (i = 1, 2, 3). Suponha que F 1 e F 2 são
independentes, com probabilidades iguais a 1/2 e que F 3 tem uma probabilidade condicional de 1/8
quando os interruptores 1 e 2 estão fechados e uma probabilidade condicional de 1/10 quando apenas o
interruptor 1 está fechado.

(a) Prove que F 1 e F 2 são independentes.


(b) Calcule a probabilidade de o interruptor 2 estar fechado dado que há corrente entre os terminais A
e B.

Exercícios Variados

27. Para um certo tipo de cancro a taxa de prevalência (proporção de doentes na população em geral) é 0.005.
Um teste diagnóstico para esta doença é tal que:

– a probabilidade do teste resultar positivo quando aplicado a um indivíduo com cancro (sensibili-
dade do teste) é 0.99;
– a probabilidade do teste resultar negativo quando o indivíduo não tem cancro (especificidade do
teste) é 0.95.

(a) Calcule o valor preditivo do teste, isto é, a probabilidade de um indivíduo ter cancro sabendo que o
teste resultou positivo.
(b) Supondo que o teste foi aplicado duas vezes consecutivas ao mesmo doente e que das duas vezes
o resultado foi positivo, calcule a probabilidade do doente ter cancro (admita que, dado o estado
do indivíduo, os resultados do teste em sucessivas aplicações, em qualquer indivíduo, são indepen-
dentes).

8
Capítulo 2

Variáveis aleatórias discretas

Funções de probabilidade e distribuição; momentos e outros parâmetros


1. Considere a variável aleatória discreta X com a seguinte função de probabilidade:

ax 2
½
, x = −2, −1, 0, 1, 2
P (X = x) = a ∈ R.
0 caso contrário,

(a) Determine a e desenhe o gráfico da função.


(b) Determine a função de distribuição de X e represente-a graficamente.
(c) Determine a moda, a (classe) mediana, os quartis e o valor esperado de X .
(d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X .

2. Considere a variável aleatória discreta X com a seguinte função de probabilidade:


½
cx , x = 1, 2, 3
P (X = x) =
0 , caso contrário

sendo c uma constante real.

(a) Determine c e desenhe o gráfico da função.


(b) Determine a função de distribuição de X e represente-a graficamente.
(c) Determine a moda, a (classe) mediana e o valor esperado de X .
(d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X .

3. Considere a variável aleatória discreta X com a seguinte função de distribuição:




 0 ,x < 0

 1/6

 ,0 ≤ x < 2
F X (x) = P (X ≤ x) = 1/4 ,2 ≤ x < 4




 1/2 ,4 ≤ x < 6
1 , x ≥ 6.

(a) Determine a função de probabilidade de X .


(b) Calcule:
i. P (X ≤ 1).
ii. P (X > 5).
iii. P (0 < X ≤ 2).
iv. P (2 ≤ X < 6).
v. P (0 ≤ X ≤ 2).
vi. P (2 < X < 6).

9
4. Seja X uma variável aleatória discreta X com a seguinte função de probabilidade:


 (1 + 3c)/4 , x = 1

 (1 − c)/4 , x =2


P (X = x) = (1 + 2c)/4 , x = 3

 (1 − 4c)/4 , x = 4



0 , x 6= 1, 2, 3, 4

(a) Determine o valor de c.


(b) Calcule o valor esperado e a variância de X .

Uniforme Discreta

5. Considere a variável aleatória discreta X cujos resultados possíveis {1, 2, 3, 4} são equiprováveis.

(a) Determine a função de distribuição de X e represente-a graficamente.


(b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X .

6. Considere a variável aleatória discreta X cujos resultados possíveis {1, 2, 3, 4, 5} são equiprováveis.

(a) Determine a função de distribuição de X .


(b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X .

Bernoulli

7. Considere a variável aleatória discreta X com a seguinte função de probabilidade:


½
1−p , x = 0,
P (X = x) = p ∈ [0, 1]
p , x = 1,

(por exemplo com X = 0 a representar insucesso e X = 1 a representar sucesso com probabilidade p).

(a) Determine a função de distribuição de X .


(b) Calcule a moda, a mediana, o valor esperado, a variância e o coeficiente de variação de X . Interprete
estes parâmetros consoante o valor de p.

Hipergeométrica, Binomial e Geométrica

8. Uma caixa contêm 5 lápis dos quais 2 estão partidos. Pretende-se avaliar o número de lápis partidos e,
retiram-se ao acaso e sem reposição 3 lápis da caixa.

(a) Determine:
i. o espaço de resultados associado à experiência aleatória.
ii. a probabilidade de obter quando muito um lápis partido?
iii. se nas 3 extracções apenas houve um lápis partido, qual a probabilidade de ter sido o segundo?
(b) Seja X a v.a. que representa o número de lápis partidos nas 3 extracções.
i. Caracterize a v.a., determine a sua função de probabilidade e represente-a graficamente.
ii. Obtenha a função de distribuição cumulativa de X e represente-a graficamente.
(c) Responda novamente às alíneas (a) e (b), admitindo que as 3 extracções são feitas com reposição.

9. Numa sala existem três lâmpadas "iguais", que funcionam independentemente. A probabilidade de cada
lâmpada fundir num dado espaço de tempo é 0.1. Seja X a v.a. que representa o número de lâmpadas
que findo esse período de tempo estão a funcionar. Determine:

10
(a) A função de probabilidade de X.
(b) A função de distribuição de X.
(c) O valor esperado, moda, mediana e variância de X .

10. No final de uma visita a um parque, os visitantes são convidados a indicar os percursos feitos. Em 30
respostas 20 mencionaram ter completado apenas o percurso A.

(a) Escolhidos ao acaso e sem reposição 2 dessas 30 respostas, qual é a probabilidade de pelo menos
uma referir ter feito apenas o percurso A?
(b) Responda à questão anterior admitindo que a escolha é feita com reposição.

11. Um atirador acerta num alvo com probabilidade 1/3 e considere os sucessivos tiros independentes.

(a) Qual a probabilidade de ele acertar ao fim do 3º tiro?


(b) Quantos tiros são necessários em média para acertar no alvo?

12. Num armazém encontra-se um lote de 5000 janelas para serem distribuídas mas, 100 destas têm defeito.

(a) É efectuada uma inspecção sobre uma amostra de 10 janelas escolhidas ao acaso sem reposição. A
inspecção rejeita o lote se forem encontradas mais do que uma janela com defeito nessa amostra.
i. Caracterize a v.a.
ii. Qual a probabilidade de rejeição do lote?
iii. Qual o número esperado de janelas defeituosas?
(b) Responda às alíneas anteriores admitindo as extracções com reposição. Compare com os resulta-
dos anteriores.
(c) Suponha que as janelas são inspeccionadas sucessivamente e com reposição até ser encontrada
uma defeituosa.
i. Qual a probabilidade de ser necessario inspeccionar 3 ou mais janelas?
ii. Qual o número esperado de janelas inspeccionadas?

13. Num lote de 500 interruptores existem 50 defeituosos. Desse lote retiram-se ao acaso e com reposição
uma amostra. O lote é rejeitado se tal amostra incluir mais do que dois interruptores defeituosos. Cal-
cule:

(a) A probabilidade de rejeição do lote se a amostra tiver dimensão 10.


(b) A dimensão que a amostra deve ter para que a probabilidade de rejeição seja inferior a 0.05.

14. 2000 pessoas de entre as 60000 que constituem a população de uma cidade estão a assistir a um pro-
grama de televisão. Escreva a expressão que lhe permitiria calcular a probabilidade exacta de que, entre
250 pessoas seleccionadas ao acaso e sem reposição da população da cidade, menos de 5 estejam a ver
esse programa.

Poisson

15. O número de partículas emitidas por uma fonte radioactiva, num dado período de tempo, é uma va-
riável aleatória com distribuição de Poisson. Sabendo que a probabilidade de não ser emitida qualquer
partícula nesse período de tempo é 1/3:

(a) Calcule a probabilidade de que nesse período de tempo a fonte emita pelo menos 2 partículas.
(b) Determine o valor esperado do número de partículas emitidas pela fonte radioactiva durante esse
período de tempo.

11
Exercícios Variados

16. Uma máquina electrónica de venda de chocolates e bebidas dá um lucro de 12 dezenas de euros por
semana se não tiver avarias durante a semana. Se a máquina tiver x (x ≥ 1) avarias durante a semana o
custo da reparação é de (x + 1)2 dezenas de euros. Suponha que o número de avarias numa semana, X ,
é uma variável aleatória de Poisson de parâmetro λ = 3/2.

(a) Calcule a probabilidade de numa semana


- não haver avarias.
- haver uma avaria, sabendo que de facto ocorreram avarias nessa semana.
(b) Determine, em dezenas de euros, o lucro esperado por semana.

17. Considere uma variável aleatória Poisson para descrever o número de visitantes não-residentes ao Jar-
dim Guerra Junqueiro durante as 10h-11h num dia de semana, e que a probabilidade de não encontrar
visitantes não-residentes neste horário é de 0.0003.

(a) Calcule a probabilidade de observar no máximo 4 visitantes não-residentes durante aquele horário.
(b) Qual a probabilidade de num total de 5 dias úteis, em pelo menos 1 destes observar-se no máximo
4 visitantes não-residentes durante aquele horário, supondo independência entre número de che-
gadas nos sucessivos dias.

18. Indique uma expressão que lhe permita calcular a probabilidade exacta de que pelo menos 2 pessoas
de um grupo de 500 façam anos no dia de Natal (considere o ano com 365 dias). Obtenha um valor
aproximado para esta probabilidade com base na distribuição de Poisson.

12
Capítulo 3

Variáveis aleatórias contínuas

Funções densidade de probabilidade e distribuição; momentos e outros parâmetros


1. A procura diária de arroz num supermercado, em centenas de quilos, é uma variável aleatória com fun-
ção densidade de probabilidade:

 (2x)/3 ,0≤ x <1
f X (x) = −x/3 + 1 , 1 ≤ x ≤ 3

0 , restantes valores de x

(a) Qual a probabilidade da procura exceder 150 Kg de arroz num dia escolhido ao acaso?
(b) Calcule o valor esperado da procura diária de arroz, assim como uma medida da variabilidade dessa
procura.
(c) Qual a quantidade de arroz que deve ser deixada diariamente à disposição do público para que não
falte arroz em 95% dos dias?

Uniforme Contínua

2. Considere uma variável aleatória a tomar valores no intervalo [0, 1] todos igualmente prováveis.

(a) Indique o espaço de resultados associado e a função densidade de probabilidade e, represente-a


graficamente.
(b) Determine a função de distribuição de X e represente-a graficamente.
(c) Calcule a mediana, o valor esperado e a variância de X .
(d) Repita as alíneas anteriores considerando os intervalos [0, 1/2] e [0, 2].

Exponencial

3. Uma componente electrónica tem uma duração de vida, em centenas de horas, que é uma variável ale-
atória com distribuição exponencial de valor esperado 0.5.

(a) Calcule a função de distribuição da variável aleatória X .


(b) Calcule a probabilidade de que a componente electrónica tenha uma duração de vida superior a
150h, sabendo que já funcionou pelo menos durante 100 h.
(c) Obtenha uma expressão para o quantil de probabilidade p, χp , e indique a mediana e o 1º quartil.

4. O tempo que um doente tem de esperar até ser atendido, em horas, tem distribuição exponencial com
valor esperado igual a 0.20.

(a) Qual a probabilidade de ele ter de esperar mais de 30 minutos?


(b) Sabendo que um doente já esperou mais de 30 minutos, qual é a probabilidade de ainda ter de
esperar pelo menos mais 15 minutos?

13
Normal ou Gaussiana

5. O comprimento das peças produzidas por uma máquina é uma variável aleatória normal com valor es-
perado µ (mm) e variância σ2 (mm2 ). Uma peça é defeituosa se o seu comprimento diferir do valor
esperado mais do que σ. Sabe-se que 50% das peças produzidas têm comprimento inferior a 2.5 mm e
47.5% das peças produzidas têm comprimento entre 2.5 mm e 3.42 mm.

(a) Calcule µ e σ.
(b) Determine a probabilidade de que uma peça seja não defeituosa.

6. O tempo de vida de um laser tem distribuição normal com média igual a 7000 horas e desvio padrão
igual a 600 horas.

(a) Qual é a probabilidade de um desses lasers falhar até 5300 horas?


(b) Qual é a duração que 90% desses lasers excede?
(c) Um produto inclui três lasers e falha se algum deles falhar. Se os tempos de vida dos três lasers
forem independentes, qual é a probabilidade desse produto durar mais do que 7000 horas?

Exercícios Variados

7. Uma empresa vende peças cuja duração em centenas de horas é uma variável aleatória contínua com a
seguinte função de distribuição:

1 − e−λx
½
, x >0
F X (x) =
0 , caso contrário

(a) Determine a função de densidade de probabilidade de X , a sua média, mediana, 1º e 3º quartis e, a


sua variância.
(b) A empresa dispõe de um stock de peças dos tipos A e B . Ao tipo A está associado um parâmetro
λ = 1/2 e ao tipo B um parâmetro λ = 1.
i. Compare o desempenho das peças dos stocks A e B através dos parâmetros obtidos em (a).
ii. De um lote formado por 100 peças do tipo A e 50 peças do tipo B , retirou-se ao acaso uma
peça, cuja duração foi ensaiada. Em relação ao resultado desse ensaio sabe-se apenas que a
duração da peça foi inferior a 90h. Calcule a probabilidade de que a peça escolhida seja do tipo
B.

8. Seja X uma variável aleatória com distribuição normal de valor esperado 10 e variância 4, que representa
o comprimento de uma barra de ferro. Suponha que a barra é considerada não defeituosa se 8 ≤ X ≤ 12
e defeituosa caso contrário.

(a) Qual a probabilidade de que uma barra seja não defeituosa?


(b) Qual a probabilidade de que, em 10 barras escolhidas ao acaso e com reposição do fabrico diário,
pelo menos 2 sejam defeituosas?

9. Suponha que o desvio da medida das peças produzidas por uma máquina em relação à norma especifi-
cada pelo mercado é uma variável aleatória X com a seguinte função de densidade de probabilidade:

 1+k +x , −1 ≤ x < 0
f X (x) = 1+k −x ,0≤x ≤1

0 , restantes valores de x

(a) Calcule o valor de k.


(b) Determine a função de distribuição de X .
(c) Calcule o valor esperado e a variância de X .

14
(d) Calcule a moda, a mediana e o 1o quartil de X .
(e) Calcule a probabilidade de que seja necessário extrair exactamente duas peças da produção da
máquina para que apareça uma peça com um desvio positivo em relação à norma.

10. Seja Y = 100 X a variavel aleatória que representa a percentagem de álcool num certo composto, onde X
é uma variável aleatória com a seguinte função de densidade de probabilidade:

20 x 3 (1 − x) , 0 < x < 1
½
f X (x) =
0 , caso contrário

(a) Determine a função de distribuição de X e esboce o seu gráfico.


(b) Calcule a probabilidade de X ser inferior a 2/3.
(c) Suponha que o preço de venda do composto depende do conteúdo em álcool: se 1/3 < X < 2/3 o
preço é de C 1 euros por litro; caso contrário o preço é de C 2 euros por litro. Supondo o custo de
produção igual a C 3 euros por litro:
i. Calcule a função de distribuição do lucro líquido por litro.
ii. Determine o valor esperado do lucro líquido por litro.

11. Uma certa liga metálica contém uma percentagem de chumbo X , que pode ser considerada como uma
variável aleatória com função de densidade de probabilidade dada por
½ 3 −5
f X (x) = 5 10 x(100 − x) , 0 ≤ x ≤ 100
0 , caso contrário

Suponha que L, o lucro líquido obtido na venda desta liga (por unidade de peso), depende da percenta-
gem de chumbo através da relação:

L = C 1 +C 2 X

Calcule o valor esperado do lucro líquido por unidade de peso.

15
Capítulo 4

Vectores aleatórios, combinações lineares e


TLC

Pares aleatórios discretos


1. Uma loja de decoração vende candeeiros da marca X e da marca Y . A função de probabilidade conjunta
do número de candeeiros vendidos diariamente é a seguinte:

Y \X 0 1 2
0 0.12 0.25 0.13
1 0.05 0.30 0.01
2 0.03 0.10 0.01

(a) Calcule as funções de probabilidade marginais de X e de Y .


(b) Calcule a função de distribuição marginal de X .
(c) Calcule a probabilidade de que num dia a marca Y seja mais vendida do que a marca X .
(d) Determine o valor esperado do número total de candeeiros vendidos diariamente.
(e) As funções de probabilidade e distribuição de X condicionais a Y = 0, Y = 1 e Y = 2.
(f ) Calcule E (X |Y = 0), V ar (X |Y = 0) e a mediana de (X |Y = 0).
(g) Diga, justificando, se X e Y são variáveis aleatórias independentes.
(h) Determine a variância do número total de televisores vendidos diariamente.
(i) Calcule o coeficiente de correlação entre X e Y e interprete o seu resultado.

2. Considere o par aleatório discreto (X , Y ) com função de probabilidade conjunta dada por (Y = X 2 ):

Y \X -1 0 1
0 0 1/3 0
1 1/3 0 1/3

(a) Diga, justificando, se X e Y são variáveis aleatórias independentes.


(b) Calcule C ov(X , Y ) e comente o resultado.

3. Sejam X e Y duas variáveis aleatórias discretas com função de probabilidade conjunta dada por:

Y \X 1 2 3
1 1/9 0 1/18
2 0 1/3 1/9
3 1/9 1/6 1/9

(a) Determine:

16
i. A função de probabilidade marginal de X .
ii. A função de distribuição marginal de Y .
iii. P (X + Y ≤ 4).
iv. As funções de probabilidade de X condicionais a Y = 1 e Y = 3.
v. E (X |Y = 1).
(b) Defina E (X |Y ).
(c) Obtenha:
i. V (X |Y = 1).
ii. P (X × Y ser par).
iii. P (Y = 2|X × Y ≤ 4).
iv. F Y |X =3 (y).
(d) Diga, justificando, se X e Y são variáveis aleatórias independentes.

4. Durante um treino de basquetebol um jogador efectua três lançamentos da linha de lançamento livre.
A probabilidade que ele tem de encestar em cada lançamento é de 0.6 e os lançamentos podem ser
considerados independentes.

(a) Descreva o espaço de resultados.


(b) Seja X a variável aleatória que representa o número de vezes que o jogador encesta nos dois primei-
ros lançamentos e Y a variável aleatória que representa o número de vezes que o jogador encesta
nos dois últimos lançamentos.
i) Determine a função de probabilidade conjunta do par aleatório (X , Y ).
ii) Determine as funções de probabilidade marginais de X e de Y .

Combinações Lineares de v.a.’s

5. O diâmetro interior de um tubo cilíndrico é uma variável aleatória X com distribuição normal de valor
esperado 3 cm e desvio padrão 0.02 cm e a espessura Y do mesmo tubo é uma variável com distribuição
normal de valor esperado 0.3 cm e desvio padrão 0.005 cm, independente de X .

(a) Calcule o valor esperado e o desvio padrão do diâmetro exterior do tubo.


(b) Calcule a probabilidade de que o diâmetro exterior do tubo exceda 3.62 cm.

6. Um posto de transformação permite uma carga total de 2800KW. Sabe-se que esse posto de transforma-
ção alimenta uma fábrica com consumo permanente de 2500KW e além disso o mesmo posto de trans-
formação alimenta 100 consumidores domésticos. Estes gastam em média 2KW em electrodomésticos
(sendo o desvio padrão igual a 0.5KW) e 0.5KW com a iluminação (sendo o desvio padrão de 0.25KW).
Determine a probabilidade do transformador disparar por excesso de carga, admitindo que os vários
tipo de consumos domésticos são independentes e normalmente distribuídos.

Teorema do Limite Central (TLC)

7. Um elevador de acesso a um grupo de galerias de uma mina tem capacidade nominal de 3800kg. Os
mineiros que usam regularmente o elevador têm pesos que seguem uma distribuição com valor espe-
rado 75kg e desvio padrão 8kg. Calcule aproximadamente a probabilidade de ser excedida a capacidade
nominal do elevador quando nele se encontrarem 50 mineiros.

8. Um estudante decidiu amealhar diariamente uma pequena quantia para comprar uma bicicleta. As pro-
babilidades do estudante amealhar 50, 100 e 250 cêntimos em cada dia são respectivamente 0.3, 0.6 e
0.1. Calcule, justificando, a probabilidade do estudante amealhar mais do que 350 euros durante o ano
(365 dias).

17
Aproximação da Binomial à Normal

9. Um atirador acerta num alvo com probabilidade 1/3. Numa sequência de 30 tiros independentes calcule:

(a) a probabilidade do atirador acertar pelo menos 1 vez no alvo.


(b) a probabilidade aproximada de o atirador acertar pelo menos 15 vezes no alvo usando a aproxima-
ção à normal. Calcule o valor exacto e compare-o com o aproximado.

Aproximação da Poisson à Normal

10. O número de itens dum certo tipo procurados num armazém durante uma semana segue uma distribui-
ção de Poisson com λ = 50. Calcule a dimensão mínima do stock a adquirir de modo a que a probabili-
dade de satisfazer a procura seja de 98% (use a aproximação à normal).

Processo de Poisson

11. O número de mensagens electrónicas recebidas por dia (24h) numa pequena empresa de entregas rápi-
das tem distribuição de Poisson com média igual a 10.

(a) Calcule a probabilidade de num dia a empresa não receber mais do que 7 mensagens.
(b) Qual é a probabilidade do intervalo entre duas mensagens consecutivas exceder 1 hora?

12. Um processo de fabrico de placas de vidro produz, em média, 4 bolhas de ar espalhadas aleatoriamente
por 10 m 2 de placa. Sabendo que a distribuição do número de bolhas de ar pode ser modelada por uma
distribuição de Poisson, calcule a probabilidade de:

(a) Uma placa de 2.5m × 2m ter mais de 2 bolhas de ar.


(b) Obter, num lote de 10 placas de vidro com 1m × 2.5m, 6 placas perfeitas.

Exercícios Variados

13. O tempo de produção de uma certa peça de porcelana é uma variável aleatória com distribuição expo-
nencial de valor esperado 2 horas.

(a) Qual a probabilidade duma peça levar pelo menos 1h 45m a ser produzida?
(b) Verificando-se que em certo momento uma peça já está a ser produzida há 45m, qual a proba-
bilidade de ser necessário esperar pelo menos mais 1h 45m para concluir a peça? Compare este
resultado com o da alínea (a) e comente.
(c) Num dia em que a fábrica não tinha qualquer peça em stock foi aceite uma encomenda de 100
peças, tendo a fábrica assumido o compromisso de fornecer as peças no prazo máximo de 30 dias
(o que corresponde a 240 horas de trabalho). Acha que a fábrica tem boas possibilidades de cumprir
o seu compromisso? Justifique.
(d) A fábrica mantém os registos do tempo de execução de cada peça. Seis peças foram escolhidas ao
acaso. Qual a probabilidade de 4 delas terem sido executadas no máximo em 1h 45m cada uma?

14. O número de chegadas ao MAAT durante a primeira hora de abertura tem distribuição de Poisson de
média 6 num dia de semana e média 10 ao fim de semana. Considere as chegadas de dia para dia inde-
pendentes.

(a) Qual a probabilidade de ocorrerem pelo menos 9 chegadas na primeira hora num dia de semana?
(b) Qual o número esperado e a variância do total de chegadas numa semana (7 dias) durante a pri-
meira hora?

18
(c) Em cada dia da semana, se na primeira hora ocorrem 9 ou mais entradas, serão redirecionados 2
vigilantes de outros serviços. Qual a probabilidade de:
i. Em 10 dias úteis, ter de se redirecionar 2 vigilantes em mais de 4 dias?
ii. E em 100 dias úteis?
(d) O tempo total despendido no MAAT tem distribuição normal com duração média de 1 hora e sabe-
se que 30% dos visitantes despende no máximo 40 minutos no museu. Qual a probabilidade da
duração total de uma visita ser superior a 2 horas?

15. Um dos elevadores dum grande edifício público transporta, no máximo, 20 pessoas de cada vez. A carga
máxima transportada pelo elevador é de 1300 Kg. Os utilizadores deste elevador pertencem a um largo
estrato duma população em que se verificou que o peso duma pessoa é aproximadamente normal com
valor esperado 61 Kg e desvio padrão 10 Kg.

(a) Calcule a probabilidade do peso destes 20 utilizadores exceder a carga máxima.


(b) Sabendo que estão 15 pessoas no elevador com um peso de 950 Kg e que se espera a entrada de
mais 5 pessoas para completar a lotação e iniciar a viagem, determine a probabilidade do peso
total destes 20 passageiros exceder a carga máxima.
(c) Qual a probabilidade de haver nas 20 pessoas, que em certo momento viajam no elevador,
i. quando muito 2 com peso superior a 85 Kg?
ii. pelo menos 1 com peso inferior a 40 Kg?
(d) Acha que, em face do tipo de população que utiliza o elevador, a carga máxima indicada é ade-
quada? Explique a sua opinião.

16. O tempo (em horas) que João Pestana dorme por noite é uma variável aleatória com distribuição uni-
forme no intervalo (7,12).

(a) Calcule a probabilidade de João Pestana dormir mais de 11 horas numa noite.
(b) Calcule a probabilidade de, em 20 noites, João Pestana dormir mais de 11 horas em pelo menos 3
dessas noites.
(c) Qual a probabilidade de João Pestana dormir mais de 1100 horas em 100 noites?

17. Um doente é acompanhado regularmente por um médico numa determinada clínica com vários gabi-
netes.

(a) Se a probabilidade de o médico o atender no gabinete A for 0.8, qual é a probabilidade de em 20


consultas pelo menos 10 serem nesse gabinete?
(b) O número de consultas anuais desse doente tem distribuição de Poisson com valor esperado igual
a 3. Qual é a probabilidade de num ano ele ter necessidade de mais 8 consultas?
(c) Ao longo dos últimos anos esse doente foi visto 50 vezes. Se a duração, em minutos, de cada con-
sulta tiver valor esperado igual a 30 e variância igual a 100 e for independente de consulta para
consulta, qual é aproximadamente a probabilidade de a duraccão total das 50 consultas exceder 27
horas?

18. O intervalo de tempo, em minutos, entre a passagem de dois comboios numa estação de metropolitano
tem, em horas de ponta, distribuição uniforme no intervalo de (5, 15).

(a) Determine a probabilidade de se ter de esperar mais de 8 minutos entre dois comboios.
(b) Sabendo que o último comboio passou há oito minutos, qual é a probabilidade de se ter de esperar
pelo menos mais cinco minutos pelo próximo comboio?
(c) Admitindo que os intervalos de tempo entre passagens sucessivas dos comboios são variáveis ale-
atórias independentes, calcule um valor aproximado para a probabilidade da média dos intervalos
de tempo entre 100 passagens exceder 9 minutos.

19
Capítulo 5

Estimação Pontual

1. Seja (X 1 , X 2 , X 3 ) uma amostra aleatória de dimensão 3 extraída de uma população com valor esperado µ
e variância σ2 e, sejam X = (X 1 + X 2 + X 3 )/3 e µ̂ = (X 1 + 2X 2 + X 3 )/4 dois estimadores para µ.

(a) Verifique se algum dos estimadores é centrado.


(b) Obtenha as suas variâncias.
(c) Qual a eficiência de µ̂ relativamente a X ?
(d) Suponha que se observaram os valores (0.4, 0.3, 0.5). Qual dos estimadores escolheria para estimar
a média populacional e obtenha uma estimativa com base na amostra dada.
(e) Indique um estimador centrado para a variância populacional e obtenha uma estimativa com base
na amostra dada na alínea anterior.

2. T1 e T2 são estimadores de um parâmetro θ, tais que:

E (T1 ) = θ, V (T1 ) = 9; E (T2 ) = 3θ, V (T2 ) = 3.

Diga, justificando, qual destes estimadores é melhor estimador de θ.

3. Seja X 1 , a média de uma amostra aleatória de dimensão n extraída de uma população normal de valor
esperado µ e variância σ21 e X 2 a média de uma amostra aleatória de dimensão n, independente da
primeira, extraída de uma população normal de valor esperado µ e variância σ22 . Mostre que:

(a) µ̂ = w X 1 + (1 − w)X 2 ], em que 0 ≤ w ≤ 1, é um estimador centrado de µ.


(b) A variância de µ̂ é mínima quando

σ22
w= .
σ21 + σ22

(c) Qual o Erro Quadrático Médio de µ̂?


(d) Qual a eficiência de X 1 relativamente a µ̂? Comente o resultado.
(e) Obtenha uma estimativa para µ com base nas amostras (2, 4, 1, 3) retirada da população X 1 e (2, 5, 1, 4)
retirada da população X 2 .

4. (a) Mostre que se θ̂ é um estimador centrado do parâmetro θ e V (θ̂) > 0 então (θ̂)2 não é um estimador
centrado de θ 2 .
(b) Se θ̂ é um estimador de θ, o seu enviesamento é dado por b = [E (θ̂) − θ]. Mostre que E [(θ̂ − θ)2 ] =
V (θ̂) + b 2 .

5. Seja (X 1 , . . . , X n ) uma amostra aleatória proveniente de uma população com variância σ2 . Prove que
n (X − X̄ )2
i
n X i2 n
S2 = X̄ 2
X X
= −
i =1 n − 1 i =1 n − 1 n − 1

é um estimador centrado para σ2 .

20
6. Considere uma população X , com função densidade de probabilidade contínua f (x) e valor desconhe-
cido da mediana, me. A mediana da amostra aleatória Xe é um estimador centrado de me e o seu desvio
p
padrão é aproximadamente [2 n f (me)]−1 . Calcule a eficiência relativa da média da amostra aleatória
X em relação à mediana da amostra aleatória Xe , como estimadores do parâmetro µ,

(a) para o caso duma população normal com valor esperado µ e desvio padrão σ.
(b) para o caso da variável aleatória cuja função densidade de probabilidade é:

1 p x−µ
f (x) = p e − 2| σ |

em que µ e σ representam, respectivamente, o valor esperado e o desvio padrão.


(c) O que pode concluir, na sequência dos resultados obtidos em (a) e (b)?

21
Capítulo 6

Intervalos de Confiança

1. Medições do comprimento de 25 peças produzidas por uma máquina conduziram a uma média x = 140
mm. Admita que cada peça tem comprimento aleatório com distribuição normal de valor esperado µ e
desvio padrão σ = 10 mm, e que o comprimento de cada peça é independente das restantes.
Construa intervalos de confiança a 95%, 99% e 90% para o valor esperado da população e compare os
intervalos.

2. Admita que a densidade de construção, X , num projecto de urbanização tem distribuição normal. Uma
amostra aleatória de 50 lotes desse projecto conduziu a

50 50
x i2 = 2242.6
X X
x i = 227.2 ;
i =1 i =1

Assumindo que o desvio padrão de X é igual a 4, construa um intervalo de confiança a 95% para a den-
sidade média de construção. Que dimensão deveria ter a amostra para que a amplitude desse intervalo
fosse reduzida a metade?

3. Foram efectuados estudos em Los Angeles com o objectivo de determinar a concentração de monóxido
de carbono perto de vias rápidas. Para isso recolheram-se amostras de ar, para as quais se determinou a
respectiva concentração (usando um espectrómetro). Os resultados das medições em ppm (partes por
milhão) foram os seguintes (para um período de um ano):

102.2 98.4 104.1 101.0 102.2 100.4 98.6 88.2 78.8 83.0
84.7 94.8 105.1 106.2 111.2 108.3 105.2 103.2 99.0 98.8

Determine um intervalo de confiança a 95% para a concentração esperada de monóxido de carbono,


assim como para a sua variância. Indique as hipóteses consideradas.

4. Suponha que a intensidade da corrente, em amperes, num certo circuito é uma variável aleatória com
distribuição normal. Uma amostra de dimensão 12 desta variável aleatória conduziu aos seguintes re-
sultados:

2.3 1.9 2.1 2.8 2.3 3.6 1.4 1.8 2.1 3.2 2.0 1.9

Construa um intervalo de confiança a 99% para:

(a) O valor esperado da intensidade da corrente.


(b) O desvio padrão da intensidade da corrente.

5. De modo a estudar a média do tempo despendido semanalmente, por família, a ver TV numa grande
cidade do sul dos EUA, um sociólogo recolheu uma amostra de 500 famílias. Tal amostra conduziu a
uma média de 28.4 h/semana e um desvio padrão corrigido (s) de 8.3 h/semana. Calcule um IC a 95%
para o valor esperado.

22
6. Um engenheiro civil, tencionando comparar a resistência a forças compressivas de dois tipos de betão,
seleccionou aleatoriamente 10 elementos de cada tipo de betão e registou as seguintes medições.

Tipo I 3250 3268 4302 3184 3266 3297 3332 3502 3064 3116
Tipo II 3094 3268 4302 3184 3266 3124 3316 3212 3380 3018

Se se assumir que as amostras provêm de populações normais independentes com desvio padrão igual a
353 e 133, respectivamente, determine um intervalo de confiança a 95% para a diferença entre os valores
esperados das duas populações.

7. Para comparar a eficiência de dois métodos de ensino, uma turma de 24 alunos foi dividida aleatoria-
mente em dois grupos. Cada grupo é ensinado de acordo com um método diferente. Os resultados no
fim de semestre, numa escala de 0 a 100, são os seguintes:

1o grupo n 1 = 13 x 1 = 74.5 s 12 = 82.6


2o grupo n 2 = 11 x 2 = 71.8 s 22 = 112.6

Assumindo que as populações são normais e com variâncias iguais e desconhecidas obtenha um inter-
valo de confiança a 95% para a diferença entre os valores esperados das duas populações.

8. Para estimar a diferença de tempos esperados de vida entre fumadores e não fumadores, numa grande
cidade dos E.U.A., foram recolhidos duas amostras independentes de, respectivamente, 36 não fumado-
res e 44 fumadores tendo-se obtido os seguintes resultados:

Dimensão Média Desvio padrão


corrigido
Não fumadores 36 72 9
Fumadores 44 62 11

Calcule um intervalo de confiança a 90% para a diferença dos valores esperados dos tempos de vida.

9. Uma amostra de 100 peças de uma linha de produção revelou 17 peças defeituosas.

(a) Determine um intervalo de confiança a 95% para a verdadeira proporção p de peças defeituosas
produzidas.
(b) Quantas peças adicionais devemos recolher para estarmos confiantes a 95% que o erro de estima-
ção de p seja menor que 2%?
(c) Responda à alínea anterior mas com uma confiança de 98%. Compare os resultados.

10. Num trabalho realizado há já algum tempo concluiu-se que 62% dos passageiros que entram na estação
A do metro tem como destino o centro da cidade. Esse valor tem vindo a ser utilizado em todos os estudos
de transportes realizados deste então.
O Engenheiro Vivaço começou a ter dúvidas sobre a actualidade daquele valor, acreditando que ele tem
vindo a diminuir, acompanhando o declínio do centro. Resolveu, portanto, realizar um inquérito na
estação A, tendo sido inquiridos 240 passageiros dos quais 126 indicaram o centro como destino.

(a) Com base nestes resultados construa um intervalo de confiança a 90% para a percentagem de pas-
sageiros entrados em A e que saiem no centro, e interprete-o, admitindo que tem como interlocutor
um leigo em Estatística.
(b) Quantos passageiros deveriam ser inquiridos caso se pretendesse estimar aquela percentagem com
margem de erro não superior a 2% e com um grau de confiança de pelo menos 90%?

11. A capacidade (em amperes-hora) de um tipo de bateria varia segundo uma distribuição normal. Seleci-
onadas aleatoriamente 10 baterias registaram-se as seguintes capacidades:

23
140 136 150 144 148 152 138 141 143 151

(a) Construa intervalos de confiança a 99% para o valor esperado e o desvio padrão da capacidade de
uma bateria.
(b) Qual o número aproximado de baterias que deveriam ser seleccionadas se se quiser estimar o valor
esperado da capacidade com uma confiança de pelo menos 99% dentro de uma margem de erro
± 1.5 amperes-hora?

12. Considere uma população X com distribuição exponencial com valor esperado α−1 , α > 0, isto é, com
função densidade de probabilidade

αe −αx ,
½
x >0
f (x) =
0, x ≤0

Observada uma amostra de dimensão 100 obteve-se x = 2.5. Deduza, com base nesta amostra, um inter-
valo de confiança a 95% para o parâmetro α.

24
Capítulo 7

Testes de Hipóteses

Testes para µ, µ1 − µ2 e σ2
1. Uma máquina de ensacar açúcar está regulada para encher sacos de 16 quilos. Para controlar o funci-
onamento escolheram-se ao acaso 15 sacos da produção de determinado período, tendo-se obtido os
pesos seguintes:

16.1 15.8 15.9 16.1 15.8 16.2 16.0 15.9


16.0 15.7 15.8 15.7 16.0 16.0 15.8

Admitindo que o peso de cada saco possui distribuição normal:

(a) Que conclusão pode tirar sobre a regulação da máquina?


(b) Que evidência fornece a concretização de S 2 sobre a hipótese H0 : σ2 = 0.25?

2. Da produção diária de determinado fertilizante tiraram-se seis pequenas porções que se analisaram para
calcular a percentagem de nitrogénio. Os resultados foram os seguintes:

6.2 5.7 5.8 5.8 6.1 5.9

Sabe-se, por experiência, que o processo de análise fornece valores com distribuição que se pode consi-
derar normal com σ2 = 0.25.

(a) Suportam as observações a garantia de que a percentagem esperada de nitrogénio, µ, é igual a 6%


ao nível de significância de 10%?
(b) Responda à alínea anterior usando o v al or − p.

3. O departamento de segurança de uma fábrica quer saber se o tempo esperado que o empregado noc-
turno da segurança leva a dar uma volta à fábrica é de 30 minutos. Em 32 voltas a média do tempo foi de
30.7 minutos com um desvio padrão corrigido de s = 1.5 minutos.

(a) Diga se, ao nível de significância de 1%, é de admitir a hipótese considerada.


(b) Responda à alínea anterior usando o v al or − p.
(c) Suponha agora que departamento de segurança quer saber se o tempo esperado que o empregado
nocturno leva a dar uma volta à fábrica é no máximo de 30 minutos. Avalie novamente se, ao nível
de significância de 1%, é de admitir a hipótese considerada.
(d) Responda às alíneas anteriores supondo a população subjacente normal.

4. Seja X uma variável aleatória com distribuição normal de valor esperado µ e desvio padrão σ. A partir
de uma amostra de dimensão 30 dessa variável obtiveram-se os seguintes resultados:
P30 P30 2
i =1 x i = 64.0 i =1 (x i − x) = 84.8

Teste ao nível de significância de 5% a hipótese H0 : µ = 2.0 contra a hipótese alternativa H1 : µ > 2.0.

25
5. A cotação na bolsa de uma dada empresa está sujeita a flutuações em torno de um valor médio (2500)
relativamente estável. Admite-se que a cotação desta empresa pode ser considerada uma variável ale-
atória com distribuição aproximadamente normal. O valor que se admite para a variância é tal que há
95% de probabilidade de a cotação pertencer ao intervalo (2300,2700).

(a) Observou-se durante 16 dias as cotações da empresa e obteve-se a média amostral de 2538 e um
desvio padrão amostral corrigido de 91.5. Que conclusão pode tirar acerca da variabilidade da co-
tação dessa empresa?
(b) E relativamente à média da cotação da empresa?

6. Para confrontar dois tipos de máquina de ceifar (segadeiras) um trigal foi dividido em secções longitudi-
nais e cada duas secções adjacentes tratadas por cada uma das máquinas, sendo a indicação da máquina
obtida lançando uma moeda ao ar. As produtividades foram as seguintes:

Segadeira 1 8.0 8.4 8.0 6.4 8.6 7.7 7.7 5.6 6.2
Segadeira 2 5.6 7.4 7.3 6.4 7.5 6.1 6.6 6.0 5.5

Ao agricultor que experimenta as segadeiras interessa averiguar se a produtividade esperada das duas
máquinas se pode considerar igual ou se existe diferença significativa que o leve a preferir uma delas.
Responda a esta questão admitindo que as produtividades possuem distribuição normal com:

(a) As variâncias conhecidas e iguais a 1.13 e 0.62, respectivamente.


(b) As variâncias iguais com valor comum desconhecido.

7. Um fabricante de pneus pretende comparar, através de ensaios piloto, 2 métodos de produção dos
pneus. Selecionados 10 e 8 pneus produzidos, respectivamente segundo o 1o e 2o métodos, resolve-se
testá-los. Os pneus da 1a amostra foram testados numa zona A, os da 2a numa zona B, com as durações
(em unidades de 100 km):

Amostra 1 61.1 58.2 62.3 64 59.7 66.2 57.8 61.1 62 63.6


Amostra 2 62.2 56.6 66.4 56.2 57.4 58.4 57.6 65.4

Sabe-se de estudo anteriores que a duração de um pneu varia segundo uma distribuição normal, em
que o valor esperado é eventualmente influenciável pelo método de produção, e cujo desvio padrão é
susceptível de ser fortemente afectado pelas características da zona onde se procede a rodagem.

(a) Será que se pode admitir que a duração esperada de um pneu do 1o tipo não excede 6000 km?
(b) Os dados são significativamente compatíveis com a conjectura do desvio padrão da duração de um
pneu do 1o tipo ser igual a 400 km?
(c) Admita que as variâncias da duração dos dois tipos de pneus são iguais. Teste a hipótese de não
haver uma diferença significativa na duração média dos dois tipos de pneus.

8. Dois grupos de 36 estudantes foram seleccionados ao acaso para participarem numa experiência que
consiste em aprender o significado de palavras numa língua que não conhecem.
Durante 30 minutos os estudantes tentaram aprender o maior número de palavras. No grupo I os estu-
dantes trabalharam isoladamente. No grupo II os estudantes trabalharam aos pares procurando certificar-
se mutuamente que iam aprendendo as palavras. Em seguida foi efectuado um teste para determinar o
número de palavras aprendidas por cada aluno, tendo-se obtido os seguintes resultados:

Grupo I 24 14 16 17 18 23 14 15 15 17
18 16 17 19 20 21 20 19 19 18
16 25 18 20 22 16 16 15 25 22
16 20 20 19 25 18
Grupo II 21 22 25 21 20 18 20 17 16 14
17 15 18 23 17 19 15 23 19 20
16 22 15 18 16 16 22 21 17 19
15 18 23 20 20 18

26
Acha que o segundo método de aprendizagem pode considerar-se significativamente superior ao pri-
meiro?

Testes para p em Populações Bernoulli ou Binomial

9. Um laboratório lançou no mercado um novo medicamento para o tratamento de uma alergia, afirmando
que a sua eficácia, num período de 8 horas, é de 90%. A sua aplicação a uma amostra de 200 indivíduos
sofrendo de tal alergia revelou-se eficaz em 160 dos casos. Será a afirmação acima consistente com os
dados obtidos? Indique o valor-p do teste efectuado.

10. Uma empresa fabricante de lâmpadas considera que a sua produção é eficaz se a probabilidade de se
seleccionar ao acaso uma lâmpada não defeituosa for de pelo menos 90%. Para verificar a qualidade
da produção das lâmpadas, foi efectuado um teste a 200 lâmpadas, tendo-se verificado que 24 tinham
defeitos. A que conclusão deve chegar o estatístico da empresa? Justifique.

11. Um comerciante retalhista recebe carregamentos de roupa de homem normalmente com 10% de peças
defeituosas. A fim de se certificar que a qualidade do produto não diminuiu, resolve verificar 100 peças,
determinar a percentagem de peças defeituosas e conduzir um teste de hipóteses com nível de signifi-
cância igual a 8%. Suponha que, nas peças verificadas, foram encontradas 12 defeituosas. O comerciante
deve ou não rejeitar o carregamento?

Testes do Qui-quadrado de Pearson

12. Numa experiência com tubos de vácuo foram observados os tempos de vida (em horas) de 100 tubos,
tendo-se registado as seguintes frequências absolutas (Freq. Abs.):

Intervalo ]0, 30] ]30, 60] ]60, 90] ]90, +∞[


Freq. Abs. 41 31 13 15

(a) Serão os dados consistentes com a hipótese de o tempo de vida de um tubo de vácuo ter distribui-
ção exponenci al com valor esperado igual a 50 horas, a um nível de significância de 5%?
(b) Qual o v al or −p (aproximado) do teste da alínea anterior e interprete-o comparando os resultados.

13. Considerando os atrasos A, em minutos, face à hora marcada em 400 consultas escolhidas aleatoria-
mente, construiu-se a seguinte distribuição de frequências absolutas:

Atraso [0, 15) [15, 30) [30, 45) ≥ 45


No. de consultas 240 100 40 20

Teste ao nível de significância de 5% a hipótese de A ter distribuição exponencial de valor esperado igual
a 16.

14. Suponha que o departamento de defesa acredita que a distribuição de probabilidade do número de ava-
rias, durante uma dada missão, ocorridas numa determinada zona do submarino Polaris segue uma
distribuição de Poisson. Os dados relativos a 500 destas missões são os seguintes:

número de falhas por missão 0 1 2 3 4 ou mais


número de missões 185 180 95 30 10

(a) Teste ao nível de significância de 5% a hipótese da referida variável aleatória possuir uma distribui-
ção de Poisson, com valor esperado igual a 1.
(b) Uma estimativa do valor esperado avaliada numericamente com base na amostra agrupada é igual
a 0.9845. Será que o modelo de Poisson é uma boa escolha para descrever o conjunto de dados?

27
15. A altura, em metros, dos indivíduos de determinada população é uma variável aleatória X . Escolhidos
aleatoriamente 100 desses indivíduos e medidas as suas alturas obtiveram-se os seguintes resultados:

Classes F i0
[1.595, 1.625[ 5
[1.625, 1.655[ 18
[1.655, 1.685[ 42
[1.685, 1.715[ 27
[1.715, 1.745[ 8

(a) Teste o ajustamento da distribuição normal com valor esperado 1.675 e variância 0.0292 .

Exercícios variados

16. O número C de consultas diárias na clínica tem distribuição de Poisson. Sabendo que em 100 dias esco-
lhidos ao acaso foram feitas 2800 consultas:

(a) Determine um intervalo de confiança bilateral aproximado a 99% para o valor esperado de C .
(b) Teste a hipótese valor esperado de C ser igual a 27. Decida com base no v al or − p do teste.

17. Numa empresa recolheu-se uma amostra relativa à produção de energia eléctrica em kW /h de dois tipos
de geradores. Admita que a distribuição de energia segue uma distribuição normal e que aos dois tipos
de geradores está associado uma variância igual. Os resultados obtidos foram os seguintes:

Gerador tipo I 15.01 3.81 2.74 16.82 14.30 13.45 8.75


(n = 27) 9.40 16.84 17.21 2.74 4.91 5.05 9.72
9.02 12.31 14.10 9.64 10.21 10.34 9.04
5.02 10.59 11.91 9.44 7.21 11.07
Gerador tipo II 10.87 8.07 10.31 11.08 10.84 6.34 10.05
(n = 23) 9.37 8.94 8.78 15.01 6.93 15.91 13.45
6.84 9.37 10.04 10.94 2.04 16.89 14.04
4.32 10.71

(a) Teste se a produção média de energia eléctrica segundo os dois geradores é igual.
(b) Construa um intervalo de confiança a 95% para o valor esperado da produção de energia eléctrica.
(c) O fabricante afirma que a variância da produção de energia eléctrica é de 4(kW /h)2 . Comente a
afirmação do fabricante.
(d) Seja p a proporção desconhecida de geradores cuja produção se situa abaixo dos 5kW /h. Estes
são considerados defeituosos e o comprador será indemnizado. Teste a hipótese de a proporção de
geradores defeituosos ser inferior ou igual a 10%.
(e) Verifique a hipótese de a produção de energia eléctrica seguir uma distribuição normal.

28
Capítulo 8

Regressão Linear Simples

1. Interessa estudar a relação entre a resistência de um determinado tipo de plástico (Y ) e o tempo que
decorre a partir da conclusão do processo de moldagem até ao momento de medição da resistência (x
horas). As observações que se seguem foram efectuadas em 12 peças construídas com este plástico,
escolhidas aleatoriamente.

i 1 2 3 4 5 6 7 8 9 10 11 12
xi 32 48 72 64 48 16 40 48 48 24 80 56
yi 230 262 323 298 255 199 248 279 267 214 359 305

(a) Represente graficamente as observações e desenhe a recta que, no seu entender, melhor se ajusta
às observações.
(b) Considere um modelo de regressão linear simples para explicar as observações. Obtenha a estima-
tiva dos mínimos quadrados dos coeficientes da recta de regressão e desenhe-a no gráfico.
(c) Obtenha uma estimativa pontual para o valor esperado da resistência obtida 48 horas depois de
concluída a moldagem. Acha legítimo usar o mesmo procedimento tratando-se de um período de
10 horas em vez de 48 horas? Justifique a sua resposta.
(d) Proceda ao teste da hipótese “O coeficiente angular é nulo”. Qual o interesse desta hipótese?
(e) Calcule o coeficiente de determinação e comente o valor obtido. Relacione-o com o resultado ob-
tido em (d).
(f ) Calcule o intervalo de confiança a 95% para o valor esperado da resistência obtida 50 horas depois
de concluída a moldagem.

2. Um estudo sobre a influência da velocidade do vento (X ), em m/s, na quantidade de água (Y ) que se eva-
pora por dia, em centenas de litros, na albufeira de certa barragem, a temperaturas constantes, conduziu
a:
xi 20 50 30 100 70
yi 3 5 3 10 8

(a) Adoptando um modelo de regressão linear simples, estime a recta de regressão de Y sobre X e
obtenha uma estimativa da quantidade média de água evaporada quando a velocidade do vento é
igual a 90m/s. Faça uso dos seguintes valores:
P 2 P 2 P
x̄ = 54.0 ȳ = 5.8 x i = 18700 y i = 207 x i y i = 1960
i i i
(b) Calcule o coeficiente de determinação do modelo estimado.
(c) Teste a significância da regressão. Indique o valor-p desse teste e comente o resultado face ao valor
obtido na alínea anterior.

3. Da análise do consumo médio de energia por agregado familiar durante 10 dias de um mês de Inverno
numa cidade obtiveram-se os seguintes resultados, representando x a temperatura diária média (o C ) e
Y o consumo médio de energia (kW ):

29
i 1 2 3 4 5 6 7 8 9 10
xi 15 14 12 14 12 11 11 10 12 13
yi 4.3 4.4 5.3 4.6 5.5 5.9 5.7 6.2 5.2 5.0

10
P 10
P 10
P
x i = 124 y i = 52.1 x i y i = 637.1
i =1 i =1 i =1
10 10
x i2 = 1560 y i2 = 275.13
P P
i =1 i =1

O modelo de regressão linear simples foi usado para estudar a relação entre o consumo médio de energia
por agregado familiar e a temperatura diária média.

(a) Escreva a equação da recta de regressão estimada e obtenha um intervalo de confiança a 90% para
o verdadeiro valor do declive da recta de regressão.
(b) Qual o valor predito para o consumo médio num dia de temperatura média igual a 10o C ? Que
responderia se lhe fosse pedida uma predição do consumo médio para um dia com temperatura
média de 20o C ?

4. Uma liga metálica é submetida a várias tensões (x [103 K g f /cm 2 ]), tendo-se registado o tempo decorrido
(T [hor as]) até se atingir a rotura. Alguns dos resultados obtidos nesta experiência foram os seguintes:

i 1 2 3 4
xi 15 20 25 30
ti 2500 600 200 70

Admite-se que as duas variáveis estão relacionadas de acordo com o seguinte modelo de regressão linear:
ln T = β0 + β1 X + ε.

(a) Assumindo as hipóteses que julgar convenientes, obtenha as estimativas dos mínimos quadrados
de β0 e β1 .
(b) O modelo foi utilizado para prever os tempos correspondentes às tensões de 25 × 103 K g f /cm 2 e
50 × 103 K g f /cm 2 . Calcule as estimativas desses tempos. Diga, justificando, se concorda que o
modelo adoptado seja usado para predizer aqueles tempos.

5. O modelo de regressão linear simples foi usado para estudar a relação entre a produção de uma variedade
de trigo (Y ) e a quantidade de adubo usada como fertilizante (x). Foram efectuadas 7 observações:

i 1 2 3 4 5 6 7
xi 100 200 300 400 500 600 700
yi 40 50 50 70 65 65 80

As observações foram tratadas em seguida usando o package estatístico R. Parte do output obtido é o
seguinte:

> x<-seq(100,700,100)
> x
[1] 100 200 300 400 500 600 700
> y<-c(40,50,50,70,65,65,80)
> lm(y~x)

Call:
lm(formula = y ~ x)

Coefficients:
(Intercept) x

30
36.42857 0.05893

> summary(lm(y~x))

Call:
lm(formula = y ~ x)

Residuals:
1 2 3 4 5 6 7
-2.3214 1.7857 -4.1071 10.0000 -0.8929 -6.7857 2.3214

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 36.42857 5.03812 7.231 0.000789 ***
x 0.05893 0.01127 5.231 0.003379 **
---
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’’ 1

Residual standard error: 5.961 on 5 degrees of freedom


Multiple R-squared: 0.8455, Adjusted R-squared: 0.8146
F-statistic: 27.36 on 1 and 5 DF, p-value: 0.003379

(a) Proceda ao teste da hipótese de que a adubação não tem influência na produção.
(b) Acha que o modelo se ajusta adequadamente às observações? Justifique.
(c) Calcule uma estimativa do valor esperado da produção com uma quantidade de adubo à sua esco-
lha e indique uma estimativa da variância associada.

31
Apêndice A

Probabilidade, Variáveis e Vectores Aleatórios,


Teorema do Limite Central

A.1 Probabilidade
Consegue-se definir probabilidade de forma rigorosa e simples através da Axiomática de Kolmogorov, necessi-
tando de um pequeno número de conceitos e muito abrangente: experiência aleatória, espaço de resultados
Ω, acontecimentos elementares ωi ∈ Ω, acontecimentos ou eventos A ⊂ Ω, probabilidade de A ocorrer P (A),
... mas estrutura pouco flexível!
Conceitos fundamentais são: Lei da probabilidade total, Teorema de Bayes e, independência entre acon-
tecimentos.

A.2 Variáveis aleatórias discretas


Seja X uma variável aleatória (v.a.) a tomar valores reais discretos com probabilidade não nula. Define-se a
sua função de probabilidade P (X = x) para qualquer x ∈ R e com a qual se conseguem calcular probabilidade
para eventos, i.e. P (X ∈ B ) com B ⊂ R. Alternativamente define-se a função de distribuição cumulativa (f.d.)
F X (x) = P (X ≤ x), ∀x ∈ R. Casos particulares que permitem descrever bastantes situações de interesse na
prática são:

Bernoulli(p), Binomial(n, p): nº de sucessos em n provas de bernoulli (experiência aleatória só com dois re-
sultados possíveis e.g. sucesso e insucesso) independentes e com probabilidade de sucesso p ∈ (0, 1);
inclui experiências de amostragem com reposição.

Hipergeométrica(N , M , n): nº de sucessos em experiências de amostragem sem reposição sendo N o número


total de indivíduos da população, M o número total de indivíduos da população "com sucesso"e n a
dimensão da amostra.

Geométrica(p): nº de provas Beroulli(p) independentes até ao 1º sucesso.

Uniforme: aplica-se quando todos os resultados possíveis são equiprováveis.

Poisson(λ): aplicações em contagens independentes.

Na caracterização de v.a.’s (discretas ou contínuas) duas classes de medidas a salientar são,

medidas de localização: incluindo a média µ = E [X ], moda m 0 , mediana me, e os quantis de probabili-


dade χp ;

medidas de escala: incluindo a variância σ2 = V ar (X ), desvio padrão σ e o coeficiente de variação σ/|µ|.

32
A.3 Variáveis aleatórias contínuas
Consideremos para definição de v.a. contínua: X com função de distribuição (f.d.) F X (x) = P (X ≤ x) contínua
∀x ∈ R, e função de densidade de probabilidade (f.d.p.) f X (x), respectivamente,
Z x
d F X (x)
Z
F X (x) = f X (u)d u, f X (x) ≥ 0, ∀x ∈ R, e f X (x)d x = 1; f X (x) = .
−∞ R dx

Casos particulares que permitem descrever bastantes situações de interesse na prática são:

Uniforme: todos os resultados possíveis em [a, b], a, b ∈ R, a < b, são equiprováveis.

Exponencial(λ): e.g. na modelação de tempos de vida de componentes elétricas ou tempos entre chegadas.

Gaussiana ou Normal(µ, σ2 ): com grande impacto devido ao Teorema do Limite Central (TLC).

Propriedades a salientar da v.a. normal:

1. Fecho para transformações lineares:

X ∼ N (µ, σ2 ), a, b ∈ R =⇒ Y = aX + b ∼ N (aµ + b, a 2 σ2 ).

consequentemente,

X −µ
X ∼ N (µ, σ2 ) =⇒ Z= ∼ N (0, 1).
σ

2. Uso de tabelas da normal reduzida (Z ∼ N (0, 1) com f.d. φ) no cáculo de probabilidades,

a −µ X −µ b −µ b −µ ³a −µ´
µ ¶ µ ¶
P (a < X < b) = P < < =φ −φ .
σ σ σ σ σ

A.4 Vectores Aleatórios Bivariados Discretos


Vectores aleatórios bivariados discretos são representados por (X , Y ) com espaço de resultados R X ,Y (⊂ R2 ) um
conjunto de valores finito ou infinito numerável, com função de probabilidade conjunta

> 0, (x, y) ∈ R X ,Y
½
X
P (X = x, Y = y) = P (X = x, Y = y) = 1,
0, c.c., (x,y)∈R X ,Y

função de distribuição cumulativa conjunta e valor esperado

F X ,Y (x, y) = P (X ≤ x, Y ≤ y) = P (X = x i , Y = y i ), E [ψ(X , Y )] = ψ(x, y)P (X = x, Y = y),


X X
x i ≤x,y i ≤y x,y

com propriedades naturalmente extensíveis, por exemplo a propriedade da linearidade E [X +Y ] = E [X ]+E [Y ].


As funções de probablidade marginais e momentos marginais podem-se obter por
X X X
P (X = x) = P (X = x, Y = y), P (X ≤ x) = P (X = x i , Y = y), x ∈ R,
y x i ≤x y

ψ(x)P (X = x), µ X = E [X ], σ2 = V ar (X ) = E [(X − µ X )2 ] = E [X 2 ] − µ2X .


X
E [ψ(X )] =
x

Duas v.a.’s X e Y são independentes se

P (X = x, Y = y) = P (X = x) × P (y = y), ∀ (x, y) ∈ R2 .

Definem-se ainda função densidade de probabilidade de X condicional a Y = y,

P (X = x, Y = y)
P (X = x|Y = y) = , se P (Y = y) > 0,
P (Y = y)

33
valor esperado e outros momentos condicionais,

E [ψ(X )|Y = y] = ψ(x)P (X = x|Y = y).


X X
E [X |Y = y] = xP (X = x|Y = y),
x x

A covariância permite obter informação sobre a dependência entre variáveis aleatórias,

C ov(X , Y ) = E [(X − µ X )(Y − µY )] = E [X Y ] − µ X µY .

Propriedades:
1. V ar (a X + bY ) = a 2 v ar (X ) + b 2V ar (y) + 2ab C ov(X , Y )

2. X , Y independentes =⇒ C ov(X , Y ) = 0, logo V ar (X + Y ) = V ar (X ) + V ar (Y )

3. C ov(X , Y ) = C ov(Y , X )

4. C ov(X , X ) = V ar (X )

5. C ov(a X + b, Y ) = a C ov(X , Y )

6. C ov(X + Z , Y ) = C ov(X , Y ) +C ov(Z , Y )


A correlação pretende medir a associação linear entre X e Y ,
C ov(X , Y )
−1 ≤ C or r (X , Y ) = p ≤1
V ar (x)V ar (y)
Sendo Y = a + bX : C or r (X , Y ) = −1 se a < 0, e C or r (X , Y ) = 1 se a > 0.

A.5 Combinações Lineares de Variáveis Aleatórias Independentes


n n n X
i
c i X i , c i ∈ R,
X X X
Xi X̄ =
i =1 i =1 i =1 n
X i ∼ Bi n(n i , p) =⇒ ni=1 X i ∼ Bi n ni=1 n i , p
P ¡P ¢

X i ∼ Poi s(λi ) =⇒ ni=1 X i ∼ Poi s ni=1 λi


P ¡P ¢

Pn
X i − ni=1 c i µi
P
Pn ¡Pn Pn ci
X i ∼ N (µi , σ2i ) =⇒ i =1 c i µi ,
2 2
i =1 c i σi ⇔
¢ i =1q
i =1 c i X i ∼ N Pn 2 2 ∼ N (0, 1)
i =1 c i σi

³ ´
∼ N µ, σn ⇔
Pn Xi 2 X̄−µ
X i ∼ N (µ, σ2 ) =⇒ X̄ = i =1 n
p
σ/ n
∼N (0, 1)

A.6 Teorema do Limite Central


Sendo X i , i = 1, . . . , n, v.a.’s independentes com E [X i ] = µ e v ar (X i ) = σ2 < ∞, pelo TLC,
µ Pn
i =1 X i − nµ X̄ − µ
¶ µ ¶
lim P p ≤ z = lim P p ≤ z = φ(z).
n→∞ σ n n→∞ σ/ n
Consequentemente,
n
Pn
apr ox i =1 X i
− nµ apr ox
N nµ, nσ2
X ¡ ¢
Xi ∼ ⇔ p ∼ N (0, 1)
i =1 nσ2
n X σ2 X̄ − µ aprox
µ ¶
i apr ox
N µ,
X
X̄ = ∼ ⇔ p ∼ N (0, 1)
i =1 n n σ/ n

Aproximações,

X ∼apr ox N np, np(1 − p))


¡ ¢
X ∼ Bi n(n, p), np > 5 e n(1 − p) > 5 =⇒

X ∼ Poi s(λ), λ > 5 =⇒ X ∼apr ox N (λ, λ)

34
A.7 Processo de Poisson
Um Processo de Poisson {N t , t > 0} de taxa λ verifica:

- N t ∼ Poi s(λt ) representa o número de ocorrências em (0, t ],

- ocorrências em intervalos disjuntos são independentes,

- o número de ocorrências em (0, t ] segue a mesma distribuição que número de ocorrências em (s, s + t ],
∀s, t > 0.

Propriedade: o tempo entre ocorrências consecutivas segue uma distribuição exponencial.

35
Apêndice B

Estimação e Testes de Hipóteses

De uma forma geral, interessa estudar uma determinada população representada por uma variável aleatória
(v.a.) X que segue um modelo probabilístico conhecido, por exemplo,

Bi n(n, p), Poi sson(λ), N (µ, σ) ou E xponenci al (λ).

Alguns dos parâmetros populacionais mais comuns são:

µ = E (X ) média populacional

σ2 = V ar (X ) - variância populacional

p = P (sucesso) - probabilidade de sucesso em populações Bernoulli ou Binomial

λ = E (X ) ou λ = 1/E (X ) numa população Poisson ou Exponencial respectivamente.

B.1 Estimação Pontual


Uma amostra aleatória de dimensão n proveniente de uma população X é um conjunto de n variáveis alea-
tórias independentes e identicamente distribuídas (i.i.d.), representada por:

(X 1 , X 2 , . . . , X n ).

No que se segue θ representa um parâmetro desconhecido da população X e θ̂n um seu estimador.


Um estimador θ̂n é uma função exclusiva da amostra aleatória e portanto independente de parâmetros
desconhecidos. Note-se que é uma variável aleatória.
Propriedades desejáveis dos estimadores são:

a) centralidade: E [θ̂n ] = θ e,

b) Var(θ̂n ) mínima.

Dois estimadores a salientar:

a) Estimador Média Amostral


Pn
Xi
X̄ = i =1 .
n

É um estimador centrado para a média populacional µ. Quando concretizada a amostra aleatória - repre-
sentada por (x 1 , . . . , x n ) - obtém-se a estimativa x̄ = n −1 ni=1 x i , i.e. um valor concreto para µ que quase
P

certamente não será o verdadeiro valor de µ mas que deverá aproximar-se deste pelas boas propriedades
do estimador (em particular prova-se que tende para µ quando n → ∞).

36
b) Estimador Variância Amostral (também designado variância amostral corrigida)
Pn
(X i − X̄ )2
S n−1 = i =1
2
.
n −1
É um estimador comum para a variância populacional σ2 . A divisão por (n − 1) garante a centralidade.
O Erro Quadrático Médio (EQM) mede em simultâneo a variânciao e o quadrado do enviesamento (i.e.
quanto e em média o estimador se desvia do parâmetro a estimar),

EQ M (θ̂) = V ar (θ̂) + (E [θ̂] − θ)2 .

A eficiência de um estimador θ̂1 relativamente a outro estimador θ̂2 , compara os estimadores pelos seus
EQM através do quociente:
EQ M (θ̂2 )
,
EQ M (θ̂1 )
θ̂1 diz-se mais eficiente se EQM (θ̂2 )/EQM (θ̂1 ) > 1 e, θ̂2 diz-se mais eficiente se EQ M (θ̂2 )/EQ M (θ̂1 ) < 1 .

B.2 Intervalos de confiança (IC)


Seja X uma v.a. com modelo probabilístico, conhecido ou não, com parâmetro(s) desconhecido(s).
Método da variável fulcral para a obtenção do IC, após a clara identificação da população subjacente (ge-
ralmente caracterizada por uma v.a. X ) e do parâmetro desconhecido para o qual se pretende o IC:
1. Identificar a variável fulcral:

T (X , θ)

função do estimador e do parâmetro desconhecido, e com distribuição conhecida.

2. Estabelecido o nível de confiança, ou α : (1 − α) × 100%, obter os quantis de probabilidade α/2 e 1 − α/2,


i.e. χα/2 e χ1−α/2 tais que,

P χα/2 < T (X , θ) < χ1−α/2 = 1 − α.


¡ ¢

3. Obter os limites inferior e superior do IC aleatório, pela resolução da dupla desigualdade χα/2 < T (X , θ) <
χ1−α/2 em ordem a θ.

4. Concretizar o IC com base na amostra dada.


Distinguem-se os casos:

IC para: população subjacente:


1. µ nor mal (µ, σ2 ), σ2 conhecido
2. µ arbitrária, σ2 conhecido, n elevado
3. µ1 − µ2 nor mal (µ1 , σ21 ), nor mal (µ2 , σ22 ), σ21 e σ22 conhecidos
4. µ1 − µ2 arbitrárias, σ21 e σ22 conhecidos, n 1 e n 2 elevados
5. µ nor mal (µ, σ2 ), σ2 desconhecido
6. µ arbitrária, σ2 desconhecido, n elevado
7. µ1 − µ2 nor mal (µ1 , σ21 ), nor mal (µ2 , σ22 ), σ21 = σ22 desconhecidos
8. µ1 − µ2 arbitrárias, σ21 e σ22 desconhecidos, n 1 e n 2 elevados
9. σ2 nor mal (µ, σ2 ), µ desconhecido
10. p bernoulli ou binomial, n elevado
Note-se que os casos 3., 4., 7. e 8. pressupõem a independência entre as duas populações.

Confianças (1 − α) × 100% mais usuais são: 95%, 99% e 90% correspondendo, respectivamente, a α = 0.05,
α = 0.01 e α = 0.1.

Dois exemplos:

37
1. IC para µ com σ2 conhecido a 95%
Seja X com distribuição normal de média µ desconhecida mas variância σ2 conhecida. Pela variável
fulcral,

X̄ − µ
p ∼ N (0, 1), (B.1)
σ/ n

conseguem-se obter os quantis F N−1(0,1) (0.025) = φ−1 (0.025) = −1.96 e F N−1(0,1) (0.975) = φ−1 (0.975) = 1.96
tais que,

X̄ − µ σ σ
µ ¶ µ ¶
P −1.96 < p < 1.96 = P X̄ − 1.96 p < µ < X̄ + 1.96 p = 0.95.
σ/ n n n

Isto é, pela resolução da dupla desigualdade, obtém-se o IC aleatório a 95% para µ,

σ σ
· ¸
X̄ − 1.96 p , X̄ + 1.96 p
n n

No caso de população arbitrária com n elevado, o argumento anterior repete-se ‘aproximadamente’ jus-
tificado pelo Teorema do Limite Central.

2. IC para µ com σ2 desconhecido e, IC para σ2 , ambos a 95%


Seja X com distribuição normal de média µ e variância σ2 ambos desconhecidos. Prova-se que

X̄ − µ (n − 1)S 2
p ∼ t (n−1) e ∼ χ(n−1) ,
S/ n σ2

sendo t (n−1) a distribuição t −Student com n − 1 graus de liberdade e, χ(n−1) a distribuição Qui-quadrado
com n − 1 graus de liberdade. Escolhendo estas variáveis para variáveis fulcrais, os intervalos de confi-
ança para os parâmetros µ e σ2 obtêm-se de forma semelhante ao caso anterior. Os quantis,

F t−1
n−1
(0.025), F t−1
n−1
(0.975), e F χ−1
n−1
(0.025), F χ−1
n−1
(0.975)

necessários para o cálculo dos intervalos obtêm-se das respectivas tabelas, quantis da função de distri-
buição t −Student e quantis da função de distribuição Qui-quadrado.

A amplitude do IC reflete a precisão do IC e portanto da estimação. O erro de estimação, ou semi-amplitude


do IC, também é uma medida usual para a avaliar a precisão da estimação.

B.3 Testes de Hipóteses (TH)


Duas classes importantes de TH são:

A. a parâmetros populacionais, por exemplo,

H0 : µ = 20 H0 : σ2 = 5
½ ½ ½
H0 : p = .2
ou
H1 : µ 6= 20, H1 : σ2 > 5, H1 : p 6= .2.

B. a distribuições, por exemplo,

H0 : X ∼ N (µ, σ2 )
½ ½
H0 : X ∼ Poi sson(λ)
ou,
H1 : X 6∼ N (µ, σ2 ) H1 : X 6∼ Poi sson(λ).

A. Metodologia para efecturar TH paramétricos, após clara identificação da população subjacente (geral-
mente caracterizada por uma v.a. X ) e do parâmetro desconhecido para o qual se pretende o TH:

1. Especificar as hipóteses H0 e H1 (pondo sempre a igualdade em H0 ).

38
2. Escolha da estatística do teste (semelhante à escolha da variável fulcral na construção do IC e respectiva
distribuição e distinguindo-se os mesmos casos que anteriormente),

T (X , θ)|H0 com distribuição conhecida.

3. Identificar o nível de significância α = P (Re j ei t ar H0 |H0 ) (erro de 1ª espécie), os correspondentes quan-


tis (de acordo com a distribuição conhecida) χα/2 e χ1−α/2 , e a correspondente Região Crítica (de acordo
com H1 ):

(a) RC bilateral: (−∞, χα/2 ) ∪ (χ1−α/2 , −∞)


(b) RC unilateral esquerda: (−∞, χα )
(c) RC unilateral direita: (χ1−α , ∞)

4. Tomar a decisão, a α × 100% de significância, com base na amostra observada:

(a) não rejeitar H0 se t c al 6∈ RC;


(b) rejeitar H0 se t c al ∈ RC.

Níveis de significância α mais usuais são: 0.05, 0.01 e 0.10.


Em alternativa calcula-se o v al or −p, que reflete a probabilidade de obter valores tão ou mais desfavoráveis
a H0 :

 P (T > t c al c |H0 ) se RC = (χ1−α , ∞)
v al or − p = P (T < t c al c |H0 ) se RC = (−∞, χα )
se RC = (−∞, χα/2 ) ∪ (χ1−α/2 , −∞)

P (|T | > |t c al c ||H0 )

e, se v al or − p < α, rejeitar H0 a α × 100% de significância.

B. Testes de Ajustamento do Qui-quadrado de Pearson


Requisitos gerais: o tamanho da amostra n deve ser elevado pois trata-se de um teste assimptótico e, os dados
devem estar agrupados em k classes disjuntas (cada com frequência esperada ≥ 5 ou similar) a cobrir todos
os resultados possíveis. A estatística do teste e correspondente Região Crítica são dadas por, sob a validade da
hipótese nula:

k (O − E )2 µ ¶
i i
∼ χ2k−β−1 , RC : F χ−1 (1 − α), +∞
X
2
i =1 E i k−β−1

sendo:

O i - frequências absolutas observadas,

E i - frequências esperadas de acordo com H0 ,

β - número de parâmetros estimados.


Pk Pk
Note-se que i =1 O i = i =1 E i = n.

39
Apêndice C

Regressão Linear Simples

O modelo de RLS define-se como, Y = β0 + β1 x + ε sendo:

Y - v.a. dependente,

x - variável independente,

β0 - ordenada na origem,

β1 - declive,

ε - erro aleatório: E [ε] = 0 e V ar [ε] = σ2 ; ε ∼ N (0, σ2 ) para obter as distribuições usuais dos estimadores
(úteis para construir IC e TH).

Com base numa amostra (x 1 , y 1 ), (x 2 , y 2 ), . . . , (x n , y n ) de dimensão n pretende-se:

1. Obtêr o ‘melhor’ modelo: uma possibilidade será usar os estimadores dos mínimos quadrados i.e., tais
¢2
que minimizam ni=1 ε2i = ni=1 y i − β0 − β1 x i obtendo-se,
P P ¡

β̂0 = ȳP− βˆ1 x̄


(
n
(x −x̄)(y i − ȳ)
β̂1 = Pn i
i =1
2 .
i =1 (x i −x̄)

2. Avaliar a qualidade do modelo:

(a) Coeficiente de Determinação, interpretado como uma medida da percentagem da variabilidade do


Y que o modelo consegue explicar,
¡Pn ¢2
2 cov 2 (x, y)
2 i =1 (x i − x̄)(y i − ȳ)
R =ρ = = Pn 2 n (y − ȳ)2
P , R 2 × 100% ∈ (0, 100).
v ar (x)v ar (y) i =1 (x i − x̄) i =1 i

(b) Significância de β1 : este coeficiente ser significativamente diferente de zero (que pode ser avaliado
através de um IC ou TH) indica existência de relação entre x e Y .

[Y |x] = β̂0 + β̂1 x.


3. Estimar valores de Y dado x: Eà

40
Soluções

Capítulo 1:
1a Ω = {1, 2, 3, 4, 5, 6}, P ({1}) = P ({3}) = P ({5}) = 2/9, P ({2}) = P ({4}) = P ({6}) = 1/9.
1b 4/9
1c 1/3
3a 0.0001
3b 0.001
3c 0.504
4a 988/2303
4b 435/2303
4c 22529/23030
4d 3/658
5a 1/210
5b 2/9
6a Exp. aleatória: extracção ao acaso de uma bola da urna com as características referidas,
Ω = {B, P B, P P B, P P P B, P P P P B, P P P P P B }.
6b P (A ganhar) = 0.6587, P (B ganhar) = 0.3413.
6c P (A ganhar) = 2/3, P (B ganhar) = 1/3.
7a Sendo D e F acontecimentos a representar equipamento defeituoso e não defeituoso, respectivamente,
Ω = {(D, D), (F, D), (D, F ), (F, F )}; P ({(D, D)}) = 0.04, P ({(F, D)}) = P ({(D, F )}) = 0.16, P ({(F, F )}) = 0.64.
7b P (A 1 ) = P (A 2 ) = 0.2, P (A 3 ) = 0.36, P (A 3 ) = 0.32.
7cP ({(D, D)}) = 2/90, P ({(F, D)}) = P ({(D, F )}) = 16/90, P ({(F, F )}) = 56/90, P (A 1 ) = P (A 2 ) = 0.2, P (A 3 ) = 34/90,
P (A 3 ) = 32/90.
8a n/(2n − 1), sendo n o número de moedas de cada tipo.
8b 1/2
8c n/(2n − 1)
8d (3n − 1)/(4n − 2)
9 27/63 = 0.125
10 25740/313 admitindo equiprobabilidade.
11a [(n − 1)/n]r −1
11b n!/(n r (n − r )!)
12a 1 + y − x
12b x − 2y
12c x − y
12d 1 − y
13a 0.13
13b 0.25
14a 0.85
14b 0.125
15a 0.67
15b 0.258
17a 150/365

41
17(b)i 50/214=0.23
17(b)ii 100/151=0.66
17c 150/365 = (50/214) × (214/365) + (100/151) × (151/365)
18a 0.3225
18b 0.1163
19a 0.3225
19b 0.1162791
20b 0.64
21 0.2
22a 0.13043
22b 0.43478
23a Sim
23b Não
24a 0.504
24b 0.296
26b 10/11
27a 0.0905
27b 0.6633

Capítulo 2:
1a a = 1/10
1b F X (x) = 0, x < −2; 0.4, −2 ≤ x < −1; 0.5, −1 ≤ x < 1; 0.9, 1 ≤ x < 2; 1, x ≥ 2.
1c m 0 = {−2, 2}, classe mediana [-1,1], χ.25 = −2, χ.75 = 2, µ = 0.
p
1d σ2 = V (X ) = 3.4, σ = 3.4 = 1.844, não existe o coeficiente de variação.
2a c = 1/6
2b F X (x) = 0, x < 1; 1/6, 1 ≤ x < 2; 0.5, 2 ≤ x < 3; 1, x ≥ 3.
2c m 0 = 3, classe mediana [2,3[, µ = 7/3.
p
2d σ2 = V (X ) = 0.5(5), σ = 0.5(5) = 0.745356, CV (X ) = 0.3194.
3a P (X = x) = 1/6, x = 0; 1/12, x = 2; 1/4, x = 4; 1/2, x = 6.
3(b)i 1/6
3(b)ii 1/2
3(b)iii 1/12
3(b)iv 1/3
3(b)v 1/4
3(b)vi 1/4
4a −1/3 ≤ c ≤ 1/4
4b E (X ) = (10 − 9c)/4, V (X ) = (20 − 8c − 81c 2 )/16
5a F X (x) = 0, x < 1; 0.25, 1 ≤ x < 2; 0.5, 2 ≤ x < 3; 0.75, 3 ≤ x < 14; 1, x ≥ 4.
5b m 0 = {1, 2, 3, 4}, µ = 2.5, m e = [2, 3], χ.25 = [1, 2], χ.5 = m e , χ.75 = [3, 4], V (X ) = 15/12.
6a F X (x) = 0, x < 1; 0.2, 1 ≤ x < 2; 0.4, 2 ≤ x < 3; 0.6, 3 ≤ x < 4; 0.8, 4 ≤ x < 5; 1, x ≥ 5.
6b m 0 = {1, 2, 3, 4, 5}, µ = 3, m e = 3, χ.25 = 2, χ.5 = m e , χ.75 = 4, V (X ) = 2.
7a F X (x) = 0, x < 0; 1 − p, 0 ≤ x < 1; 1, x ≥ 1
7b m 0 = m e = 1 se p > 0.5; m 0 = m e = 0 se p < 0.5; m 0 = m e = {0, 1} se p = 0.5; µ = p, V (X ) = p(1 − p),
p
CV = (1 − p)/p.
8(a)i Ω = {(B̄ , B̄ , B ), (B̄ , B, B̄ ), (B, B̄ , B̄ ), (B, B, B̄ ), (B, B̄ , B ), (B̄ , B, B ), (B, B, B )}
8(a)ii 0.7
8(a)ii 1/3
8(b)i V.a. Hipergeométrica (5,2,3): P (X = x) = 1/10, x = 0; 6/10, x = 1; 4/10, x = 2.
8(b)ii F X (x) = 0, x < 0; 1/10, 0 ≤ x < 1; 7/10, 1 ≤ x < 2; 1, x ≥ 2.

42
8c (a)i Ω = {(B̄ , B̄ , B̄ ), (B̄ , B̄ , B ), (B̄ , B, B̄ ), (B, B̄ , B̄ ), (B, B, B̄ ), (B, B̄ , B ), (B̄ , B, B ), (B, B, B )}; (a)ii 0.648; (a)iii 1/3; (b)i
V.a. binomial (3,2/5): P (X = x) = 27/125, x = 0; 54/125, x = 1; 36/125, x = 2; 8/125, x = 3; (b)ii
F X (x) = 0, x < 0; 27/125, 0 ≤ x < 1; 81/125, 1 ≤ x < 2; 117/125, 2 ≤ x < 3; 1, x ≥ 3.
9a V.a. binomial (3,0.9): P (X = x) = 0.001, x = 0; 0.027, x = 1; 0.243, x = 2; 0.729, x = 3.
9b F X (x) = 0, x < 0; 0.001, 0 ≤ x < 1; 0.028, 1 ≤ x < 2; 0.271, 2 ≤ x < 3; 1, x ≥ 3.
9c E [X ] = 2.7, m 0 = x̃ = 3, V (X ) = 0.27.
10a V.a. Hipergeométrica (30,20,2): P (X ≥ 1) = 26/29.
10b V.a. binomial (2,2/3): P (X ≥ 1) = 8/9.
11a V.a. geométrica (1/3): P (X = 3) = 4/27.
11b E [X ] = 3.
12(a)i X v.a. Hipergeométrica (5000,100,10).
12(a)ii P (X > 1) = 1 − P (X ≤ 1) = 0.0162.
12(a)iii E [X ] = 0.2.
12b Y v.a. binomial (10,0.02), P (Y > 1) = 0.0160, E [Y ] = 0.2.
12(c)i Z v.a. geométrica (0.02): P (Z ≥ 3) = 0.9412.
12(c)ii E [Z ] = 50.
13a V.a. binomial (10,0.1), 1 − F X (2) = 0.0702.
13b n : 1 − F X (2) < 0.05 ⇔ F X (2) > 0.95 =⇒ n ≤ 8.
14 4x=0 C x2000C 250−x
58000 60000
P
/C 250 .
15a 0.3005.
16a 0.2231.
16a 0.4308.
16b 4.47.
17a X v.a. Poisson (8.1), F X (4) = 0.0996.
17b Y v.a. binomial (5,0.1), 1 − F Y (0) = 1 − 0.5905 = 0.4095.
18 500 500 x 500−x
P
x=2 C x (1/365) (364/365) ≈ 0.3977.

Capítulo 3:
1a 0.375
1b µ = 4/3 = 133.3 Kg, σ = 62.36 kg.
1c 245.23 Kg.
2a Ω X = [0, 1], f X (x) = 1, 0 ≤ x ≤ 1; 0,c.c.
2b F X (x) = 0, x < 0; x, 0 ≤ x < 1; 1, x ≥ 1.
2c x̃ = E [X ] = 1/2, V (X ) = 1/12.
2d Ω X = [0, 1/2], f X (x) = 2, 0 ≤ x ≤ 1/2; 0,c.c.
2b (i) f X (x) = 2, 0 ≤ x ≤ 1/2; 0,c.c., F X (x) = 0, x < 0; 2x, 0 ≤ x < 1/2; 1, x ≥ 1/2., x̃ = µ = 1/4, σ2 = 1/48.
(ii) f X (x) = 1/2, 0 ≤ x ≤ 2; 0,c.c., F X (x) = 0, x < 0; x/2, 0 ≤ x < 2; 1, x ≥ 2, x̃ = µ = 1, σ2 = 1/3.
3a F X (x) = 0, x < 0; 1 − e −2x , x ≥ 0.
3b e −1 = 0.3679
3c χp = −2−1 log(1 − p); x̃ = χ1/2 = 2−1 log 2, χ1/4 = 2−1 log(4/3).
4a P (X > 1/2) = e −5/2 = 0.082085.
4b Pela propriedade da falta de memória da v.a. exponencial,
P (X > 1/2 + 1/4|X > 1/2) = P (X > 1/4) = e −5/4 = 0.2865048.
5a µ = 2.5, σ = 0.469
5b 0.6826
6a 0.0023
6b 6231.04 horas
6c 1/8
7a f X (x) = λe −λx , x > 0; 0,c.c.; µ = 1/λ, x̃ = χ1/2 = (log 2)/λ, χ1/4 = λ−1 log(4/3), χ3/4 = λ−1 log(4), σ2 = 1/λ2 .

43
7(b)i Espera-se que as peças de A tenham um melhor desempenho que B pois E [X A ] = 2 > E [X B ] = 1; note-se
que semelhante conclusão se pode tirar dos quantis pois χpA = 2 log(1/(1 − p)) > χBp = log(1/(1 − p)).
7(b)ii 0.4502.
8a 0.6826
8b 0.8759
9a k = 0
9b F X (x) = 0, x < −1; x 2 /2 + x + 1/2, −1 ≤ x < 0; −x 2 /2 + x + 1/2, 0 ≤ x < 1; 1, x ≥ 1.
9c µ = 0, σ = 1/6. p
9d m 0 = x̃ = 0, χ1/4 = −1 + 2/2.
9e 1/4.
10a F X (x) = 0, x < 0; 5x 4 − 4x 5 , 0 ≤ x < 1; 1, x ≥ 1.
10b 112/243
10(c)i P (L = C 1 −C 3 ) = 101/243,
P (L = C 2 −C 3 ) = 142/243:F L (x) = 0, x < C 2 −C 3 ; 142/243, C 2 −C 3 ≤ x < C 1 −C 3 ; 1, x ≥ C 1 −C 3 .
10(c)ii (142C 1 + 101C 2 − 243C 3 )/243.
11 C 1 + 50C 2 .

Capítulo 4:
1a P (X = x) = 0.2, x = 0; 0.65, x = 1; 0.15, x = 2; 0, x 6= 0, 1, 2;
P (Y = y) = 0.5, y = 0; 0.36, y = 1; 0.14, y = 2; 0, y 6= 0, 1, 2.
1b F X (x) = 0, x < 0; 0.2, 0 ≤ x < 1; 0.85, 1 ≤ x < 2; 1, x ≥ 2.
1c 0.18
1d 1.59
1e P (X = x|Y = 0) = 12/50, x = 0; 25/50, x = 1; 13/50, x = 2; 0, x 6= 0, 1, 2;
F X |Y =0 (x) = 0, x < 0; 12/50, 0 ≤ x < 1; 37/50, 1 ≤ x < 2; 1, x ≥ 2. De forma semelhante obtêm-se
P (X = x|Y = 1), F X |Y =1 (x), P (X = x|Y = 2) e, F X |Y =2 (x), x ∈ R.
1f 51/50=1.02, 0.4996, classe mediana [1, 2[.
1g Não são independentes, por exemplo 0.12 = P (X = 0, Y = 0) 6= 0.10 = P (X = 0) × P (Y = 0).
1h 0.7619
1i -0.114 o que indica uma fraca relação linear negativa.
2a Não são independentes.
2b C ov(X , Y ) = 0 e X , Y não são independentes.
4a Ω X ,Y = {(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)}.
4bP (X = x) = 0.064, (x, y) = (0, 0); 0.096, (x, y) = (0, 1); 0, (x, y) = (0, 2); 0.096, (x, y) = (1, 0); 0.240, (x, y) =
(1, 1); 0.144, (x, y) = (1, 2); 0, (x, y) = (2, 0); 0.144, (x, y) = (2, 1); 0.216, (x, y) = (2, 2);.
4bP (X = x) = 0.16, x = 0; 0.48, x = 1; 0.36, x = 2; 0, x 6= 0, 1, 2;
P (Y = y) = 0.16, y = 0; 0.48, y = 1; 0.36, y = 2; 0, y 6= 0, 1, 2.
5a µ = 3.6 cm, σ = 0.0224 cm.
5b 0.1867
6≈0
7 0.1894
8 0.9236
9a 0.9999948
9b 0.0409
10 ≥ 65
11a 0.2202
11b 0.6592
12a 0.3233
12b 0.0831
13a 0.4169

44
13b 0.4169
13c A probabilidade de cumprir com o compromisso é elevada, aproximadamente igual a 0.9772.
13d 0.3014
14a X v.a. Poisson (6), 1 − F X (8) = 1 − 0.8472 = 0.1528.
14b E [T ] = V ar (T ) = 50 sendo T = 5i =1 X i + 2i =1 Yi .
P P

14(c)i W v.a. binomial (10,0.15), 1 − FW (4) = 1 − 0.9901 = 0.0099.


14(c)ii V v.a. binomial (100,0.15), 1 − FV (4) ≈ 0.999 usando a aproximação da binomial à normal.
14d P (T > 2) = 0.0582, sendo T uma v.a. normal(1, 0.63562 ).
15a 0.0367
15b 0.0222
15(c)i 0.9994
15(c)ii 0.3032
16a 0.2
16b 0.7939
16c ≈ 0
17a 0.9994
17b 0.0038
17c 0.044843
18a 0.7
18b 0.286 e 5.5 m
18c 0.9997

Capítulo 5:
1a E X̄ = E µ̂ = µ logo ambos são centrados.
1b V ar ( X̄ ) = σ2 /3, V ar (µ̂) = 3σ2 /8.
1c E f (µ̂| X̄ ) = EQ M ( X̄ )/EQM (µ̂) = 8/9 < 1 logo µ̂ menos eficiente.
1d Escolhendo X̄ , obtém-se x̄ = 0.4.
1e Escolhendo S 2 , obtém-se s 2 = 0.006(6).
p p
2 T 2 é mais eficiente se θ ∈ (− 3/2, 3/2), caso contrário escolha-se T 1.
3c EQM = V ar = ω2 (σ21 + σ22 )/n + (1 − 2ω)σ22 /n
3d E f ( X̄ 1 |µ̂) = (σ42 + σ21 σ22 )/(σ21 + σ22 ) < 1 logo µ̂ é mais eficiente.
3e µ̂ = 2.67.
6a π/2 > 1 logo média mais eficiente.
6b 1/2 < 1 logo mediana mais eficiente.
6c média mais eficiente na população normal e mediana mais eficiente na população em 6b.

Capítulo 6:
1 A 95%: (136.08,143.92), a 99%: (134.85,145.15), a 90%: (136.71,143.29).
2 (3.435,5.653), n = 200.
3 (94.6,102.7), (43.6,161.0), assumindo independência da amostra e população normal.
4a (1.7226,2.8434)
4b (0.401,1.285)
5 (27.67,29.13) h/semana.
6 (-192.106,275.506)
7 (-5.635,11.035)
8 (6.322,13.678)
9a (0.0964,0.2436)
9b 1256
9b 1810

45
10a (0.4720,0.5780)
10b n ≥ 1688
11a (138.4651,150.1349), (3.5068,12.9310)
11b Pelo menos 152 peças.
12 (0.3216,0.4784)

Capítulo 7:
1a H0 : µ = 16 vs. H1 : µ 6= 16: não rejeitar H0 para α = 0.01 ou α = 0.05, e rejeitar H0 para α = 0.10
(-2.145<-2.037<-1.761).
1b H0 : σ2 = 0.25 vs. H1 : σ2 6= 0.25: rejeitar H0 para os usuais níveis de significância α = 0.01, 0.05 ou 0.10
(1.296<4.075).
2a Sim (-1.645<-0.408<-1.645).
2b V al or − p = 0.6818 > 0.1, logo não rejeitar H0 para α = 0.1.
3a H0 : µ = 30 vs. H1 : µ 6= 30, rejeitar H0 para α = 0.01 (2.64>2.576).
3b V al or − p = 2 × (1 − φ(2.64)) = 0.008 < 0.01, rejeitar H0 para α = 0.01.
3c H0 : µ ≤ 30 vs. H1 : µ > 30, v al or − p = 1 − φ(2.64) = 0.004 < 0.01, rejeitar H0 para α = 0.01.
3d H0 : µ = 30 vs. H1 : µ 6= 30, não rejeitar H0 para α = 0.01 (2.64<2.744, ou v al or − p = 0.013). H0 : µ ≤ 30 vs.
H1 : µ > 30, rejeitar H0 para α = 0.01 (2.64>2.453, ou v al or − p = 0.006).
4 Não rejeitar H0 : (0.427<1.699).
5a Teste sobre σ: 6.262<12.06<27.49, não rejeitar H0 para α = 0.05.
5b Teste sobre µ: -2.131<1.661<2.131, não rejeitar H0 para α = 0.05.
6a H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 : rejeitar H0 para α > 0.0394.
6b H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 : rejeitar H0 para α > 0.1 (1.746<2.088<2.120).
7a H0 : µ1 ≤ 60 vs. H1 : µ1 > 60 (ou H0 : µ1 = 60 vs. H1 : µ1 > 60). Rejeitar H0 para α ≥ 0.05 (t cal = 1.933).
7b H0 : σ2 = 16 vs. H1 : σ2 6= 16. Não rejeitar H0 para os usuais níveis de significância (t cal = 3.855).
7c H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 . Não rejeitar H0 para os usuais níveis de significância (t cal = 0.996).
8 H0 : µ1 = µ2 vs. H1 : µ1 < µ2 ou H0 : µ1 ≥ µ2 vs. H1 : µ1 < µ2 . V al or − p = 0.4522: não rejeitar H0 para os
usuais níveis de significância logo, não se poderá concluir que o segundo método é significativamente
superior ao primeiro.
9 H0 : p = 0.9 vs. H1 : p 6= 0.9. V al or − p = 2.42 × 10−6 : rejeitar H0 para α ≥ 2.42 × 10−6 (consequentemente
para os usuais níveis de significância), logo a afirmação não é consistente com os dados.
10 H0 : p = 0.1 vs. H1 : p > 0.1 (p representa a proporção de lâmpadas com defeitos), não rejeitar H0 para
α ≤ 0.1736, consequentemente para os usuais níveis de significância.
11 H0 : p = 0.1 vs. H1 : p > 0.1 (ou H0 : p ≤ 0.1 vs. H1 : p > 0.1), não rejeitar H0 para α = 0.08 (0.67<1.4051),
consequentemente não deve rejeitar o carregamento.
12 V al or − p ∈ (0.5, 0.6) pelo que não se rejeita H0 para os usuais níveis de significância.
14a A hipótese não é rejeitada (0.2308<9.488).
14b É, aos usuais níveis de significância (0.4214<0.472).
15a Não rejeitar para os usuais níveis de significância (0.4347<0.472).
17a H0 : µ1 = µ2 vs. H1 : µ1 6= µ2 , não se rejeita H0 para os usuais níveis de significância (-0.255<-0.02<0.255).
17b (8.936,11.136).
17c H0 : σ2 = 4 vs. H1 : σ2 6= 4, rejeita-se H0 para os usuais níveis de significância (183.65>89.56).
17d H0 : p = 0.1 vs. H1 : p > 0.1 (ou H0 : p ≤ 0.1 vs. H1 : p > 0.1), não rejeitar H0 para os usuais níveis de
significância.
17e

Capítulo 8:
1b β̂0 = 153.917; β̂1 = 2.417.
1c E [Y |xˆ = 49] = 269.933. Não é legítimo para x = 10 porque 10 ∉ (mini x i , maxi x i ).
1d H0 : β1 = 0 vs. H1 : β1 6= 0, rejeita-se H0 para os usuais níveis de significância (15.35>4.587).

46
1e R 2 = 0.9593. A recta estimada ajusta-se bem: 95.9% da variação de Y é explicada pela relação linear com x.
Esta conclusão é coerente com a da alínea anterior.
1f (268.45, 281.08). 2a β̂0 = 0.6359; β̂1 = 0.0965; E [Y |xˆ = 90] = 9.2427.
2b R 2 = 0.9711.
2c H0 : β1 = 0 vs. H1 : β1 6= 0, rejeita-se H0 para os usuais níveis de significância (t cal c = 9.929).
3a ŷ = β̂0 + β̂1 x = 10.1589 − 0.3991x; (-0.4474;-0.3508).
2b E [Y |xˆ = 10] = 6.17, e não se deve usar para x = 20.
4a β̂0 = 11.2633; β̂1 = −0.23651.
4b E [Y |xˆ = 25] = 210.7 horas, E [Y |xˆ = 50] = 0.57 mas este não deve ser usado pois trata-se de uma
extrapolação sem qualquer fundamento.
5a H0 : β1 = 0 vs. H1 : β1 6= 0, rejeita-se H0 para os usuais níveis de significância (t cal c = 5.23). Os dados
indicam que a adubação influencia significativamente a produção.
5b R 2 = 0.845. O modelo ajusta-se bem às observações.

47

Você também pode gostar