Q2 14-2 Aula 02 Um Pouco de Estatistica
Q2 14-2 Aula 02 Um Pouco de Estatistica
Q2 14-2 Aula 02 Um Pouco de Estatistica
de Experimentos
Um Pouco de Estatística
receita: 1 kg de feijão
Quantos grãos existem em 1 kg de feijão?
Populações, Amostras e Distribuições
contar todos os caroços abordagem estatística
caroços/kg
caroços/kg
População
- conjunto de todos os valores possíveis
- conjunto dos pesos individuais de todos
os caroços do pacote
Populações, Amostras e Distribuições
Obter uma estimativa a partir de uma amostra
da população
Amostra
representativa
aleatória
Populações, Amostras e Distribuições
Como deve ser feita a amostragem em um saco
de feijão?
flutuação restrita
maior = 0,3043 g
menor = 0,1188 g
maioria 0,20 g
Populações, Amostras e Distribuições
Ocorrência
número de caroços em um dado intervalo
Frequência/Frequência Relativa
número de caroços em um dado intervalo dividido pelo
número total de caroços.
8,6% dos pesos
medidos estão
entre 0,18 e 0,19 g
Histograma de frequência
• peso x frequência
• facilidade da representação gráfica
• concentração em torno de 0,20 g
• diminuição progressiva quando se
afasta de 0,20 g
• simetria na distribuição.
Populações, Amostras e Distribuições
Média Amostral Variância Amostral
𝑁 𝑁
1 1
𝑥= 𝑥𝑖 = 0,2024 𝑔 𝑉 𝑥 = 𝑑𝑖2 = 0,0132 𝑔2
𝑁−1
𝑁 𝑖
𝑖
essa média calculada está em concordância
com o histograma dos pesos
Um desvio padrão
66 % da área total
0,2024 ± 0,0363 g
[0,1661 g, 0,2387 g]
do histograma
66% da área
96,8% da área
Populações, Amostras e Distribuições
Estimativas Amostrais
𝑥e s
Parâmetros Populacionais
e
Modelo Estatístico
Distribuição Normal: sempre?
Medidas de condutividade realizadas em um poço
d’água em um ano Condutividade (S/cm)
9,43 Bloco Freqüência
49,00 10 1
116,80 33 4
111,80 56 1
Histograma 28,40 79 0
14 120,40 101 0
12 116,80 124 12
10
111,80
Freqüência
28,40
8
120,40
6 116,80
4 111,80
2 28,40
0
120,40
10 33 56 79 101 124 Mais 116,80
Bloco 111,80
28,40
114,20
média 86,77
desv pad 42,91
Distribuição Log-Normal
A sample of data from a log-normal distribution
914.9 1568.3 50.5 94.1 199.5 23.8 70.5 213.1
44.1 331.7 139.3 115.6 38.4 357.1 725.9 253.2
905.6 155.4 138.1 95.2 75.2 275.0 401.1 653.8
390.8 483.5 62.6 128.5 81.5 218.5 308.2 41.2
60.3 506.9 221.8 112.5 93.7 199.3 210.6 39.2
30
25
20
Freqüência
15 Média = 275.0
10
0
244.8 465.8 686.8 907.8 1128.8 1349.8 1570.8 Mais
Distribuição Log-Normal
10
9
8
7 Média = 2.2267
Freqüência
6
5
4
3
2
1
0
Probabilidade de Ocorrência
Distribuição normal da variável aleatória
𝑥 ≈ 𝑁 𝜇, 𝜎 2
𝑧 ≈ 𝑁 0,1
𝑝 𝑎<𝑥<𝑏 =
𝑝 𝑎≤𝑥≤𝑏 =
𝑏
𝑓 𝑥 𝑑𝑥
𝑎
a b
Probabilidade de Ocorrência
Probabilidade de Ocorrência
Probabilidade de Ocorrência
Qual a probabilidade de ocorrência de um evento em um
dado intervalo?
Se uma amostra se distribui normalmente, pode-se utilizar a
Distribuição Normal para fazer inferências
exemplo da feijoada:
66,6% 68,3%
96,8% 95,4%
100% 99,7%
boa concordância
Probabilidade de Ocorrência
Na prática, não é necessário calcular uma integral faz-se
uma padronização da variável aleatória x, de média e
variância 2
x N , 2
z N 0,1
x x z z 2,5
z
x 2,5
Probabilidade de Ocorrência
P(1-q), q = confiança
P()
= 0,05 ou 5%
P(0,05) q = 0,95 = 95 %
P(0,05) representa uma confiança de 95 %
1 em 20
P < 0,05
q incerteza e vice-versa
P(0,05) representa uma confiança menor (incerteza maior)
que P(0,01)
Probabilidade de Ocorrência
z = 1,96 P(0,025)
𝑥1 = 0,18
P x1 x x2 P z1 z z 2
𝑥2 = 0,25
z1 z2 P 0,62 z 1,31
z1 0,62 z2 1,31
Probabilidade de Ocorrência
Área Correspondente a P(-0,62 < z < 1,31)
-0,62 1,31
Probabilidade de Ocorrência
A probabilidade de ocorrência do evento será,
então, toda a área da curva (100%) menos a área
hachuriada
-0,62 1,31
1,0 P 0,62 z 1,31
1,0 0,2676 0,0951
0,6373
Limite de Confiança,
Distribuição Normal
Distribuição t de Student
𝑠
𝜆 = 𝑡𝜈
𝑁
graus de liberdade (df) = 𝑁 − 1
Amostragem Aleatória
Intervalo de Confiança para a média
Distribuição Normal
Distribuição t de Student
𝑠 𝑠
𝑥 − 𝑡𝜈 < 𝜇 < 𝑥 + 𝑡𝜈
𝑁 𝑁
Amostragem Aleatória
Quando o número de graus de liberdade do desvio
padrão é maior do que 30, utiliza-se a distribuição
Normal.
Amostragem Aleatória
Tomando como base o peso de um caroço, escolhido
aleatoriamente, mc = 0,1188 g, e usando a distribuição
normal
N=1
𝑥 = 0,1188
p(0,05) ⇒ z = 1,96
t9 = 2,262 P(0,025)
𝝁 = 𝒙 ± 𝝀 𝟗𝟓% 𝑠
𝜆 = 𝑡𝜈
𝑁
𝜇 =𝑥±𝜆
𝑠
𝜇 = 𝑥 ± 𝑡𝜈
𝑁
?
Uma cauda
1 - 0,05 = 95%
1 - 0,025 = 97,5%
Intervalo de Confiança
Duas caudas
1 – 2*0,05 = 90%
1 – 2*0,025 = 95%
confiança
Teste com Intervalo de confiança
𝑠 𝑥 = 0,461
𝜇 = 𝑥 ± 𝑡𝜈 𝑠 = 0,003
𝑡9 = 2,262
𝑁 𝑁 = 10
0,003
𝜇 = 0,461 ± 2,262
10
𝜇 = 0,461 ± 0,002
Como o intervalo de confiança não inclui a
absorvância conhecida de 0,470, tudo indica que
há um erro sistemático
Tamanho da Amostra
Tamanho da Amostra
Distribuição Normal
𝜎
𝜇±𝑧
𝑁
Distribuição t de Student precisão L
𝑠
𝑥 ± 𝑡𝜈
𝑁
Tamanho da Amostra
z
2
Distribuição Normal
N
L
𝑡𝜈 𝑠 2
𝑁> Distribuição t de Student
𝐿
𝑡𝜈 𝑠 2
𝑁≥
𝐿
Pontos de probabilidade da distribuição t com graus de liberdade
Tamanho da Amostra
2
𝑧𝜎 2 1,96 × 0,5
N≥ ≥ ≥ 24
𝐿 0,2
𝑥 =?
𝑠 =?
Testes de Significância
Média e Desvio padrão (N=3)
𝑥 = 3,843% 𝑠 = 0,2082%
Intervalo de confiança (distribuição t de Student)
𝑠 𝑠
𝑥 − 𝑡𝜈 < 𝜇 < 𝑥 + 𝑡𝜈
𝑁 𝑁
t = t3-1 = t2 = 4,30 com 95% de confiança, ou p(0,05)
𝑥 = 3,818% 𝑠 = 0,1286%
t = t8-1 = t7 = 2,365 com 95% de confiança, ou p(0,05)
•O intervalo de confiança não contém o
3,71% 3,93% valor de referência, 4 %
•O lote está fora da especificação
𝑠𝐴 𝑠𝐵
𝜇𝐴 = 𝑥𝐴 ± 𝑡𝜈𝐴 𝜇𝐵 = 𝑥𝐵 ± 𝑡𝜈𝐵
𝑁𝐴 𝑁𝐵
Testes de Significância
1 1
𝜇𝐴 − 𝜇𝐵 = 𝑥𝐴 − 𝑥𝐵 ± 𝑡𝜈 𝑠 +
𝑁𝐴 𝑁𝐵
s
N A 1s A2 N B 1sB2 nesse caso, admite-se que sA2 e sB2
são estimativas da mesma variância
N A 1 N B 1 populacional
𝜈 = 𝜈𝐴 + 𝜈𝐵 = 𝑁𝐴 − 1 + 𝑁𝐵 − 1 = 𝑁𝐴 + 𝑁𝐵 − 2
Testes de Significância
Dois métodos para a determinação de boro
em plantas apresentam os seguintes
resultados, após 10 determinações de cada
método:
Espectrofotométrico
média = 28,0 g/g; desvio padrão = 0,3 g/g
Flurimétrico
média = 26,25 g/g; desvio padrão = 0,23 g/g
N E 1 N F 1
E F x E x F t s 1
1
NE NF
28,0
26,25 10
= 2 x (N-1) = 2 x (10-1) = 18
𝑡18 =? P(0.05)
𝑡18 = 2.101 𝑃 0.05
Testes de Significância
Intervalo para as
diferenças das médias,
com 95 % de confiança
N A 1 N B 1
d i x Ai xBi
• Desvio Padrão
1 N 2
sd
N 1 i
di
Se não existe diferença analítica
entre o técnico A e o técnico B, a
• Média dos Desvios hipótese nula é verdadeira.
N
1
d
N
d
i
i
Testes de Significância
Teste t pareado
𝑠𝑑
𝜇𝐴 − 𝜇𝐵 = 𝑑 ± 𝑡𝜈
𝑁
0.57
𝜇𝐴 − 𝜇𝐵 = 0.159 ± 2.262
10
= 0.159 ± 0.408
𝑑𝑖 = 1.48; 0.66; 0.24; 0.21; −0.10;
Como o intervalo de confiança
−0.61; −0.10; 0.09; −0.07; −0.21
inclui o zero, as duas médias
𝑑 = 0.159 𝑠𝑑 = 0.57 não diferem significativamente.
𝑡9 =? P(0.05)
𝑡9 = 2.262 𝑃 0.05
Testes de Significância
Comparando Duas Variâncias
Método A
Método B
Teste F 𝑠𝐴2
𝐹= 2
𝑠𝐵
Testes de Significância
Uma ou Duas Caudas?
Teste com duas caudas
diferenças entre médias em ambas direções
diferença entre um valor experimental e um valor
de referência independentemente do sinal da
diferença
Teste com uma cauda
um resultado é maior (ou menor) que o outro
Ficamos por aqui