Aula 5-ICs
Aula 5-ICs
Aula 5-ICs
Intervalos de Confiança
2
População vs. Amostra
Podemos inferir (deduzir) determinadas características de uma
população se extraímos uma amostra representativa desta
amostragem
3
Amostragem
Processo pelo qual se extraem dados de uma população
Existem vários tipos de amostragem: Vamos usar apenas este tipo
distribuição conhecida/desconhecida a amostra constitui um conjunto de n v.a.
e/ou parâmetros desconhecidos X1, X2, ..., Xn independentes e identicamente
distribuídas com distribuição FX
Amostra Aleatória
5
Amostra Aleatória
Note que usamos letras minúsculas
pois estamos a definir concretizações
(observações) de variáveis aleatórias
6
Parâmetro vs. Estatística
Parâmetro – Medida usada para descrever a distribuição
da população
a média μ e o desvio padrão σ2 são parâmetros de uma
distribuição Normal - N(μ,σ2)
a probabilidade de sucesso p é um parâmetro da distribuição
Binomial - B(n,p)
2
i 1 ( X i X )
n
Variância amostral: S2 1
n
7
Parâmetro vs. Estatística
Proporção dos
inquiridos de
raça branca
numa população
e numa amostra
p
8
Estimação de Parâmetros
População Amostra
pontual (estatísticas)
Estimação
por intervalo (intervalos de confiança)
9
Estimação do nº de Votos
10
Construindo a Amostra
11
Conclusões
12
Intervalo de Confiança
Um intervalo de confiança para um parâmetro ,
a um grau de confiança 1-,
é um intervalo aleatório (Linf, Lsup) tal que:
13
Intervalo de Confiança (IC)
I. IC para a média com variância conhecida
Caso 1: população Normal
Caso 2: população qualquer (n>>30) aproximada pela Normal
II. IC para a média com variância desconhecida
Caso 1: população Normal
Caso 2: população qualquer (n>>30) aproximada pela Normal
III. IC para a diferença de médias de duas populações Normais
Caso 1: duas amostras independentes, variâncias conhecidas
Caso 2: duas amostras independentes, variâncias desconhecidas
Caso 3: amostras emparelhadas, variâncias desconhecidas
IV. IC para uma proporção
14
IC para com variância conhecida
Caso 1: População Normal
0,14
X ~ N ( , ) 2
desconhecido, mas 2 conhecido N (0,1)
0,12
2
XX ~~N? ( , ) 0,1
n
centrando e reduzindo: 0,08
1
X 0,06
~ ?N (0,1) (Normal Padrão)
0,04
2 2
n 0,02
Z 0
P( z Z z ) 1
- -z z +
0 5
z /2
0
10 15
z1 - /2
X quantil de ordem /2 quantil de ordem 1-/2
P( z z) 1
n
P( z X z ) 1
n n IC para a grau de confiança 1-
P( X z X z ) 1 IC(1 ) ( ) X z1 2 , X z1 2
n n n n
Linf Lsup
acetato adaptado de referencia 3
15
Determinando o Quantil de Ordem 1-/2
Distribuição Normal Padronizada
Tabela 3.a. Normal Distribution Para nível de significância =0.05
grau de confiança 95%
2 2 (z) = P(Z < z) = 1 - /2 z = z 1 - /2
quantil de ordem 1-/2
Grau de Valor z
Confiança
90% 1.65
95% 1.96
99% 2.58
90% grau de confiança – existem 10 possibilidades de 100 que o IC não contenha a média populacional
95% grau de confiança – existem 5 possibilidades de 100 que o IC não contenha a média populacional
99% grau de confiança – existe 1 possibilidade de 100 que o IC não contenha a média populacional
16
Interpretação do IC para
Para uma amostra aleatória de tamanho 50 seguindo uma distribuição
Normal com média = 10 e variância 2 = 4 X ~ N (10, 4) ,
determinamos o IC para com 95% de grau confiança:
2 2
P ( X 1, 96 X 1,96 ) 95%
50 50
P( X 0,5544 X 0,5544) 95% IC95% ( ) X 0.5544, X 0.5544
=10
17
IC para com variância conhecida
Caso 1: População Normal
Exemplo: Uma v.a. qualquer tem uma distribuição Normal com média desconhecida
e variância 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a
média amostral. Construa um IC de 95% para supondo que X 12,7.
IC(1 ) ( ) X z1 2 , X z1 2
n n z0,9750=1,96
IC95% ( ) X z0.9750 , X z0.9750
n n
95%
4 4
12,7 1,96 ,12,7 1.96
25 25
2,5% 2,5%
12,7 1,568, 12,7 1,568
18
IC & Grau de Confiança
Como poderia obter intervalos de confiança mais estreitos,
ou seja, com limites mais próximos a média verdadeira?
Diminuindo o grau de confiança
19
IC & Dimensão da Amostra
Como poderia obter intervalos de confiança mais estreitos,
ou seja, com limites mais próximos a média verdadeira?
20
IC para com variância conhecida
Caso 2: População Genérica aproximada pela Normal
0,1
0,08
0,06
0
2 2
0 5 10 15 20
- -z 0 z +
quantil de ordem 1-/2
z1 - /2
21
IC para com variância conhecida
Resumo
IC para a grau de confiança 1-
desconhecido, mas conhecido
2
1º caso
IC ( ) X z1 2
n
2º
cas
o
IC ( ) X z1 2
n
quanto maior z X z quanto maior n
IC menos preciso n menor o erro padrão
IC mais preciso
22
IC para com variância desconhecida
Se o valor de 2 é desconhecido substituir por uma
estimativa
Estimadores pontuais para o desvio padrão :
desvio padrão amostral não-corrigido desvio padrão amostral corrigido
1 n 1 n
S ( X i X )2
Sc ( X i X )2
n i 1 n 1 i 1
23
IC para com variância desconhecida
Caso 1: População Normal
Exemplo:
Uma v.a. qualquer tem uma distribuição Normal com média e variância 2
desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e
variância amostral . Construa um IC de 95% para supondo que X 12,7 e S2 = 16
Distribuição t de Student com
S 0,14
S 24 graus de liberdade
IC(1 ) ( ) X t1 2 , n 1 , X t0,12 t24
1 2, n 1
n n
0,1
S S
IC95% ( ) X t0.9750 , 24 , X t00,08
.9750 , 24
n 0,06 n 95%
4 0,04 4 2,5% 2,5%
12,7 2,06 , 12,7 2,06
25 0,02 25
12,7 1,648, 12,7 1,6480
- -t t +
0 5
0
10 15
24
Determinando t1-/2, n-1 - quantil de ordem 1-/2 de
uma distribuição t-Student com n-1 graus de liberdade
Tabela 8. Student s t-Distribution Por definição de quantil de ordem 1-/2:
z = z 1 - /2 F(z) = P(Z < z) =1 - /2
Para grau de confiança 95% nível de significância =0.05
F(z) = P(Z < z) = 1- (0.05/ 2) = 0.975 F(z) = 0.9750
Para n=25 24 graus de liberdade
Determinar t0.9750, 24 usando Tabela 8:
t0.9750, 24 = 2.06
25
IC para com variância desconhecida
Caso 1: População Normal
exercício 5, capítulo 4
0,04 0,04
IC99% ( ) 1,2 2,86 , 1,2 2,86
20 20
1,2 2,86 0,044721, 1,2 2,86 0,044721 IC99% ( ) 1.0721, 1.3279
26
IC para com variância desconhecida
Exemplo: População qualquer, amostra grande
3069
cubanos: erro padrão 49.17 IC95% ( ) 16368 1.96 49.17
3985
IC ( 16272, 16464 )
9414
mexicanos: erro padrão 124.41 IC95% ( ) 13342 1.96 124.41
5729
IC ( 13098, 13586 )
8647
porto-riq.: erro padrão 112.5 IC95% ( ) 12587 1.96 112.5
5908
IC ( 12367, 12807 )
27
IC para com variância desconhecida
Exemplo: População qualquer, amostra grande
28
Inferência entre parâmetros
de duas populações
X
P1 P2 Y
E( X ) X E (Y ) Y
29
Intervalo de Confiança para 1 - 2
Duas populações Normais. Amostras independentes
30
Intervalo de Confiança para 1 - 2
Populações Normais. Amostras emparelhadas
Sejam X1,…, Xn e Y1, …, Yn duas amostras provenientes de populações Normais
0,08 1
X
p 0,06
pˆ p n
~ N (0, 1)
0,04
0,02 2 2
Z p (1 p ) n p(1 p) n a
0
0 5 10 15 20
- -z 0 z +
z /2 z1 - /2
quantil de ordem /2 quantil de ordem 1-/2
I.C. para Z com grau de confiança 1-
P( z Z z ) 1 P( pˆ z pˆ (1 pˆ ) n , pˆ z pˆ (1 pˆ ) n ) 1
32
Intervalo de Confiança para Proporção
X
Seja pˆ a proporção de indivíduos com uma certa característica de
n
interesse numa amostra aleatória de dimensão n, e p a proporção de
indivíduos com essa característica na população.
pˆ (1 pˆ ) pˆ (1 pˆ )
IC(1 ) ( p) pˆ z1 2 , pˆ z1 2
n n
33
IC para uma proporção
Exemplo: Proporção de acessos a páginas de Internet nacionais
exercício 16, capítulo 4
X 30 pˆ (1 pˆ ) 0,3 0,7
pˆ 0.3 Sp 0,04582
n 100 n 100
3º. Substituir na fórmula:
IC(95%) ( p ) 0,3 1,96 0,04582, 0,3 1,96 0,04582
IC95% ( p ) 0.2102, 0.3898
0,3 0,089818, 0,3 0,089818
34
Formulário
F
O
R
M
U
L
Á
R
I
O
35
Referências
Livro: Grande Maratona de Estatística no SPSS
Andreia Hall, Cláudia Neves e António Pereira
Capítulo 4.1 Intervalos de Confiança
Estimação
Camilo Daleles Rennó, Instituto Nacional de Pesquisas Espaciais, Brasil
disciplina:Estatística: Aplicação ao Sensoriamento Remoto (2008)
URL: http://www.dpi.inpe.br/~camilo/estatistica/notas.html