Atividade 4

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 4

Inferência Bayesiana

Atividade 4

1) Em uma pesquisa sobre intenção de voto, os entrevistados devem dizer qual candidato preferem:
A ou B. Se θ representar a proporção da população que prefere A, encontraremos uma amostra de n
participantes. Dado θ, as n respostas são independentes, e a probabilidade de determinado
participante preferir A é θ. A distribuição anterior para θ é uma distribuição beta (a, a), com um
desvio-padrão de 0,25. Ademais, n = 30 eleitores, dos quais 21 preferem o candidato A.
Nesse contexto, a distribuição posterior de θ é:
.(essa)
• .
• .
• .
• .

2) O modelo empírico de Bayes é importante para se reconhecer o risco contido nos dados
denotados pelo parâmetro de interesse θ. O estimador bayesiano empírico utiliza o cálculo médio,
denominado estimador empírico global, por meio da localidade e da taxa global de uma região.
Considerando que existe um estimador empírico local, que determina a realidade e a estimativa
locais, analise as afirmativas a seguir:

I. O modelo Bayesiano empírico tem os hiperparâmetros com valores desconhecidos e usa as


estimativas da verossimilhança para a resolução dos hiperparâmetros; a ideia principal é utilizar os
dados da amostra para descobrir e estimar valores fixos.
II. A abordagem Bayesiana aplicada à estatística é, exatamente, igual à adotada pelo modelo
empírico de Bayes, mas não existem aspectos da Bayesiana que podem ser úteis para outras
abordagens estatísticas.
III. A base de dados multivariados refere-se às medidas de semelhança que avaliam a similaridade
das análises de ordenação e classificação; quanto maior é a semelhança, maior é o número de
componentes comuns.
IV. O modelo empírico de Bayes é uma forma de identificação de grupos de objetos similares e
refere-se à possibilidade de separar diferentes grupos, com base nas medidas disponíveis; o objetivo
é estudar a variação em uma quantidade de variáveis originais. Está correto o que se afirma em:
•I e III, apenas.
•II e III, apenas.
•I e IV, apenas.
•II, III e IV, apenas.
•I e II, apenas.
3) Considere uma amostragem aleatória de tamanho 10 da distribuição Poisson ,
na qual cada é o número de defeitos por de uma chapa de metal. Usando uma priori não

informativa para , dada por , assinale a alternativa que apresenta, corretamente, o


intervalo de credibilidade de 95% para o número médio de defeitos, sabendo que o total observado
de defeitos é 10.

.
• .
• .
• . (essa)
• .

4) O método estatístico de análise multivariada, proposto, em 1877, por Francis Galton, estuda,
sistematicamente, a relação de medida de relacionamento entre duas variáveis simultâneas, em que
todas as variáveis são consideradas importantes. No entanto, no método da análise multivariada,
existem algumas variáveis que são independentes umas das outras.
Considerando o exposto e seus conhecimentos a respeito das análises multivariáveis, analise as
afirmativas a seguir:

I. A análise de componentes principais diz respeito à identificação de grupos de objetos similares.


II. A análise de fatores tem como objetivo estudar a variação em uma quantidade de variáveis
originais.
III. A análise de função discriminante refere-se à possibilidade de separar diferentes grupos com
base nas medidas disponíveis.
IV. A análise de agrupamento é elaborada para reduzir o número de variáveis.

Está correto o que se afirma em:


•I e II, apenas.
•II e III, apenas.
•II, III e IV, apenas.
•I e IV, apenas.
•I, III e IV, apenas.
5) A característica da população de interesse é chamada de parâmetro, e a característica da amostra
correspondente é a estatística da amostra ou a estimativa do parâmetro. Uma variável aleatória tem
uma única distribuição, que depende de parâmetros de interesse, mas, apesar de ter somente uma
distribuição, é mais fácil modelar uma situação considerando-se uma hierarquia. Nesse contexto,
assinale a alternativa que apresenta, corretamente, o teste de razão de verossimilhança.

O teste de razão de verossimilhança verifica se um subconjunto de variáveis pode ser retirado do


modelo de regressão logística múltipla, isto é, testa se um ou mais coeficientes são iguais a zero.
•O teste de razão de verossimilhança envolve um procedimento matemático que transforma um
número de variáveis, possivelmente, correlacionadas em um número menor de variáveis não
correlacionadas, denominadas componentes principais.
•A vantagem do teste de razão de verossimilhança é que processos complicados podem ser
modelados por uma sequência de modelos, relativamente simples, colocados em uma hierarquia.
Além disso, lidar com hierarquia não é mais difícil do que lidar com distribuições condicionais e
marginais.
•No teste de razão de verossimilhança, há a técnica de classificação de um conjunto de observações
em classes predefinidas. O objetivo é determinar a classe de uma observação a partir de um
conjunto de variáveis preditoras, que devem ser contínuas e ter distribuição normal.
•O teste de razão de verossimilhança é um teste estatístico que mede a qualidade de ajuste entre dois
modelos; um modelo estatístico, relativamente mais complexo, é comparado com um modelo mais
simples, para verificar se ele ajusta um conjunto de dados de forma significativamente melhor.

6) Considere que o período de espera, em minutos, para o atendimento de clientes de determinada


empresa segue uma distribuição exponencial com parâmetro θ desconhecido. Considerando que
essa situação hipotética possui uma distribuição a priori gama, com desvio-padrão 1 para θ e média
0.2, o menor número de clientes que precisa ser observado, para que o coeficiente de variação a
posteriori seja reduzido para 0.1, é, aproximadamente:
100.
•25.
•125.
•50.
•75.

7) O número representa o número de casos de uma doença em cada um dos seis distritos de uma
população . Essa é uma variável aleatória de Poisson, com média . Em cada distrito,
o número é independente dos números em outros distritos, dado o valor de λ. A distribuição a
priori para λ é uma distribuição gama, com média 3,0 e desvio-padrão 2,0.

Nesse contexto, assinale a alternativa que apresenta, corretamente, os parâmetros da distribuição a


priori.

e . (essa)
• e .
• e .
• e .
• e .
8) Em uma pesquisa sobre a preferência de esporte transmitidos por um canal televisivo, os
entrevistados devem dizer se preferem atletismo ou basquete. Se θ representar a proporção da
população que prefere atletismo, encontraremos uma amostra de n participantes. Dado θ,
as n respostas são independentes, e a probabilidade de determinado espectador preferir atletismo é
θ. A distribuição anterior para θ é uma distribuição beta (a, a), com um desvio-padrão de 0,25.
Nesse contexto, o desvio-padrão a posteriori é, aproximadamente:
.
• .
• .(essa)
• .
• .

9) Considere que é uma amostra aleatória de tamanho 10 da distribuição Poisson ,


na qual cada é o número de defeitos por de uma placa metálica. Usando uma priori não

informativa para , dada por , assinale a alternativa que apresenta, corretamente, a


distribuição a posteriori de .

• (essa)

10) Em uma pequena pesquisa, uma amostra aleatória de 50 pessoas de uma grande população é
selecionada. Cada pessoa recebe uma pergunta, cuja resposta é “sim” ou “não”. A proporção da
população que responderia “sim” seria θ. Ademais, nossa distribuição a priori para θ é uma
distribuição beta (1,5, 1,5). Diante do exposto, e considerando que, nessa pesquisa, 37 pessoas
responderam “sim”, assinale a alternativa que apresenta, corretamente, a média e o desvio-padrão a
priori de θ.

A variância é , e o desvio-padrão é .

•A variância é , e o desvio-padrão é .

•A variância é , e o desvio-padrão é .

•A variância é , e o desvio-padrão é .

•A variância é , e o desvio-padrão é .

Você também pode gostar