Estatística II
Estatística II
Estatística II
Cuiabá-MT
2010
Presidência da República Federativa do Brasil
Ministério da Educação
Designer Educacional
Oreste Preti
Diagramação
T. F.Oliveira/UFMT
Revisão
Germano Aleixo Filho
Projeto Gráfico
e-Tec/MEC
Ficha Catalográfica
M171e
Macowski, Diogo Heron.
Estatística II./ Diogo Heron Macowski; Daniela Trentin Nava.
Cuiabá: EduUFMT, 2010.
125 p. : il. ; color.
ISBN 978-85-61819-76-7
CDU 519.22
Apresentação e-Tec Brasil
Referências....................................................................................
.......................................................... 109
Anexos ..........................................................................................
110
Prezado estudante:
Éhora de iniciarmos nossa caminhada pela disciplina. Leia com muita atenção
e reproduza osexemplos antesde tentar resolver osexercícios propostos.
Bom estudo!
1 CONCEITOSFUNDAMENTAIS
Nesta seção serão introduzidos conceitos que servirão de base para a construção
da teoria de probabilidade. É de suma importância que você esteja familiarizado
com eles para podermos continuar os estudos.
1.1 Experimento
Experimento pode ser entendido como qualquer ação a ser desenvolvida, cujo
resultado seja de interesse do pesquisador.
Para exemplificar este tipo de experimento, podemos citar: imagine que você está
no Rio de Janeiro e coloque em um bule exatamente um litro de água pura. O
experimento que se quer quantificar será, anotar a temperatura de ebulição da
água. Se repetir este experimento várias vezes, verá que o resultado obtido, ou
seja, a temperatura de ebulição da água será sempre o mesmo, por volta de
100ºC. Logo, este experimento é dito determinístico. Claro que este não é o tipo
de experimento que iremos enfocar.
b)
b)
2. Espaço amostral
Representado pela letra maiúscula S (ou pelo Omega Ω), é o conjunto formado
por todos os possíveis resultados de um experimento aleatório.
Note que cada parêntese mostra um elemento do espaço amostral. Você já deve
ter percebido que a descrição total seria uma tarefa extremamente árdua. Como
já foi dito, não é necessário descrever o espaço amostral e sim determinar a
quantidade de elementos neste conjunto. Para isso, recorremos ao cálculo de
combinação de 60 elementos agrupados em grupos de tamanho 6.
Cn;p
n!
(n -
Nota: Preste bem atenção a esta fórmula, porque nos encontraremos com ela mais
p)!×p !
adiante.
1.3 Evento
Estamos prontos para iniciar a parte matemática das probabilidades, mas antes,
lembremos de alguns conceitos já enunciados até aqui.
2. DEFINIÇÃO DEPROBABILIDADE
O termo probabilidade tornou-se largamente usado no dia a dia para quantificar
o grau de crença em um evento de interesse. Existem muitos exemplos de seu uso,
n(E)
P(E)
n(S)
Exemplo:
Uma urna tem bolas numeradas de 1 a 10. Sorteando uma bola desta urna, qual a
probabilidade do número sorteado ser:
a) igual a 5
Resolução:
Vamos descrever o espaço amostral associado a este experimento:
S={1;2 ; 3 ;4 ; 5 ;6 ; 7 ;8 ;9 ;10) , logo n(S) =10
O evento E ={número 5}={5},logo n(E) =1
Portanto, a probabilidade do número 5 ser sorteado será:
n(E ) 1
P(E) 0,10
n(S) 10
Agora você!
b) Número par.
0% P(E) 100%
3. TEOREMAS FUNDAMENTAIS
A seguir apresentaremos alguns teoremas importantes referentes à probabilidades.
Este teorema pode ser aplicado a mais que dois eventos, deste que sejam
mutuamente exclusivos. Assim:
Veja que:
A ={a ;b ;c ;d}, n(A) =4
B ={c ;d ;e ;f ;g}, n(B) =5
A B = {c ; d}, n(A B) =2
A B = {a ;b ;c ;d ;e ;f ;g}, n(A B) = n(A) + n(B) – n(A B) =4 +5 –2 =7
Exemplo:
Vamos supor que um dado não viciado será lançado uma única vez. Qual a
probabilidade de face obtida ser:
a) número 3 ou número 5?
Temos que n(S) =6
Seja A ={número 3}, logo n(A) =1
Seja B ={número 5}, logo n( B) =1
Verificamos que A e B são mutuamente exclusivos, uma vez que se um deles ocorrer,
automaticamente o outro não poderá ocorrer. Então, basta utilizar a fórmula:
P (A B) P(A) P(B)
n(A) n(B)
P (A B)
n(S) n(S)
1 1
P (A B)
6 6
2
P (A B) 0,3333
6
Outro exemplo:
Imagine uma urna que contenha bolas numeradas de 1 a 10. Calcule a
probabilidade de que, ao retirarmos uma bola aleatoriamente, o número ser
ímpar ou primo ou maior que 4.
Usando a fórmula:
P(A B C) =0,9
Resolução:
Como a primeira bola retirada da urna será reposta antes do segundo sorteio,
os eventos serão independentes, ou seja, a probabilidade de ocorrência do
segundo evento não será alterada pela ocorrência do primeiro evento, logo,
usaremos a fórmula sem considerar o evento condicional.
Seja B1 ={bola branca no primeiro sorteio) e
B2 ={bola branca no segundo sorteio)
P(B1 B2) =P(B1). P(B2)
5 5
P(B1 B2)
8 8
25
P(B1 B2) 0,390625
64
Dessa forma, a probabilidade de obtermos as duas bolas brancas é igual a 39,06%.
Outro exemplo:
7. – Na mesma situação do experimento anterior, imaginemos agora que a
primeira bola sorteada não será reposta na urna. Calcule a
probabilidade de obtermos:
a) duas bolas brancas
Como a primeira bola sorteada não retornará para a urna, antes do segundo
sorteio, a quantidade de bolas presentes na urna será reduzida em uma
unidade, logo, o espaço amostral para o segundo sorteio não será o mesmo.
Portanto, a ocorrência do primeiro evento altera a probabilidade de
ocorrência do segundo evento. Devemos usar a fórmula para eventos
condicionados.
Seja B1 ={bola branca no primeiro sorteio) e
B2 ={bola branca no segundo sorteio dado que já ocorreu bola
branca no primeiro)
S=espaço amostral inicial
S'=espaço amostral do segundo evento
n( B1) n( B2 B1)
P(B1 B2)
n(S )n(S’) 5
4
P(B1 B2)
8 7
20
P(B1 B2) 0,3571 Observe que, como
56
uma bola branca já havia saído da urna, restaram somente 4 bolas brancas na
urna, logo, n(B2 B1) = 4 . O total de bolas dentro da urna também diminuiu em
uma unidade, logo, n(S’) =7 .
20
P(B1 B2) 0,3571
56
Ou seja, a probabilidade de obtermos duas bolas brancas será igual a 35,71%.
Ec + E = S ou seja:
Ec + E = S desta forma:
P(Ec) = 1 P(E)
Seja C = {chover esta tarde}, então P(C) = 0,22 decimal correspondente a 22%
C ={não chover esta tarde}
Pela fórmula:
a) Uma laranjeira.
b) Uma macieira.
c) uma goiabeira.
d) não ser pitangueira.
11. - Uma urna contém bolas numeradas de 01 a 21. Calcule a probabilidade de:
Qualitativas
Variáveis Discretas
Quantitativas
Contínuas
1. VARIÁVELALEATÓRIA
O que é aleatório?
Uma forma de definir seria aquilo que está sujeito às incertezas do acaso. Poderia
também ser definido como algo que depende de acontecimentos incertos. Note
que nos dois casos podem ser relacionadas facilmente a probabilidades. Veja
então a definição, segundo o Dicionário Priberam da Língua Portuguesa: “Diz-se
duma grandeza que pode tomar um certo número de valores, a cada um dos
quais se liga uma probabilidade”.
S RX
X
e X(e)
Um casal deseja ter dois filhos. Denotemos por A o nascimento de uma menina e
O o nascimento de um menino. Dessa forma, o espaço amostral envolvido neste
experimento será:
S RX
(A,A) 0
(A,O)
1
(O,A)
(O,O) 2
2. VARIÁVEIS ALEATÓRIASDISCRETAS
Uma variável aleatória X é dita discreta, se o número de valores possíveis no
contradomíno for finito ou infinito enumerável.
Por exemplo:
Observe que o número de pinheiros neste terreno pode ser no máximo 6, logo, o
contradomínio é finito.
1. Função de probabilidade
A cada possível xiassociaremos um número p(xi) =P(X =xi), chamado de
probabilidade de xi. A função p é denominada função de probabilidade da
variável X, discreta, em questão.
p(0) =P(X=0) lê-se como a probabilidade da variável X assumir valor zero, ou seja,
nenhum menino no evento.
Da mesma forma:
n(A,0) n(0,A) 1 1 1
p(1) =P(X =1) =P (A,0) (0,A) = + = + = =0,50
n(S) n(S) 4 4 2
n(0,0) n(0,A) 1
p(2) = P(X = 2) = P (0,0) = + = =0,25
n(S) n(S) 4
0,5
P(X =x)
0,25
X
0
0 1 2
Vamos dar uma definição mais apropriada e voltar ao nosso exemplo, para
verificar como é simples!
F(0) =P(X <0) =P(X =0) já que nossa variável não tem valores menores do que zero,
logo:
Poderíamos ter utilizado a tabela de distribuição, que facilitaria nosso trabalho. Veja:
Resolução:
n(X =0) 4
p(0) =P(X =0) = = =0,50
n(S) 8
n(X =1) 2
p(1) =P(X =1) = = =0,25
n(S) 8
n(X =2) 1
p(2) =P(X =2) = = =0,125
n(S) 8
n(X =3) 1
p(3) =P(X =3) = = =0,125
n(S) 8
Resposta:
Se sua resposta foi 25% você já entendeu como interpretar a coluna da função de
probabilidade. Veja, exatamente 1 chamada atendida significa que a variável
aleatória assume valor igual a 1, (X =1), logo, o valor de P(X =1) =0,25, ou 25%
(veja o valor em vermelho na Tabela 2.4 - Distribuição de probabilidade).
Resposta:
Bem... Até 2 chamadas significa que a variável aleatória pode assumir valor 2 ou
menos que 2, ou seja, (X <2). Então basta ler na coluna da distribuição
acumulada (valor em azul). Assim, P(X <2) =0,875 ou 87,5%.
2.3 EsperançaMatemática
Chamada também de valor esperado ou valor médio da variável aleatória, é
definida, no caso discreto, pela expressão:
n
E(X) = = xi . p(xi)
i=1
Utilizando a fórmula:
Então:
E(X2) =02. 0,5 +12. 0,25 +22 0,125 +32 . 0,125
E(X2) =0 . 0,5 +1 . 0,25 +4 0,125 +9 . 0,125 E(X ) =1,875
Dessa forma, estudaremos duas distribuições teóricas muito importantes pela sua
empregabilidade em vários problemas cotidianos.
3.1 Distribuiçãobinomial
Considere:
E(X) = n p e V(X) =n p q
Resolução:
x =2, pois a quantidade exata de vezes que queremos que a coroa apareça no
experimento;
Recordando:
3! =3.2! =3.2.1
2! =2.1
3! 0,52 0,51
p(X =2) =
2! (3 2)!
3!
p(X =2) = 0,25 0,5
2! 1!
3 2!
p(X =2) = 0,125
2! 1
p(X = 2) = 3 0,125 p(X = 2) = 0,375
Veja que legal! Grande parte das calculadoras científicas calculam o número
binomial de forma direta. Verifique se a sua possui um tecla com a sigla nCr,
caso possua, basta digitar o número de tentativas “n”, em seguida acionar a
tecla nCr, depois o valor de “x” e por fim apertar na tecla =. No nosso exemplo,
devemos digitar 3 nCr 2=
Você pode achar que resolver este exemplo sem usar a distribuição binomial foi
mais simples, mas não se engane, utilizando a distribuição binomial não
encontramos problemas com o aumento do número de tentativas, o que se torna
um sério problema para resolver sem a utilização desta ferramenta!
Resolução:
Veja que é um caso de distribuição binomial, pois temos uma quantidade finita de
elementos e em cada verificação, a probabilidade de se verificar a anomalia é
constante. Assumimos que a variável aleatória X seja o número de árvores com
anomalia. Vamos definir, então, os componentes necessários para o uso da
fórmula.
n =20
p =5%=0,05
q =1 –0,05 =0,95
p(X =3) = ( 20
)3 0,05 0,95 3 20 3
Resolução:
No máximo 2, significa que a variável aleatória X pode assumir valor 2 ou qualquer
valor inferior. Assim, queremos calcular P(X <2).
p(X =0) =( 20
0) 0,050 0,95 20 0 =0,3585
p(X =1) =( 1)
20
0,051 0,95 20 1 =0,3774
p(X =2) = ( 20
2) 0,052 0,95 20 2 =0,1887
Como P(X< 2) =P(X =0) +P(X =1) +P(X =2), temos P(X<2) =0,3585 +0,3774 +0,1887
Resolução:
No mínimo 1 significa que a variável X pode assumir valor 1 ou maior. Ou seja,
procuramos P(X >1). Uma solução seria usarmos o mesmo procedimento
executado no itemb.
P(X 1) =P(X =1) +P(X =2) +P(X =3) +... +P(X =19) +P(X =20)
Tem jeito mais simples? Claro! Basta utilizarmos a idéia do evento complementar.
Verificamos que a equação acima nos mostra todos os eventos que “queremos”
(X >1), sendo 20 casos (de X=1 à X=20), mas vamos pensar nos eventos que “não
queremos”, ou seja, (X <1), então basta calcular a probabilidade complementar
do que “não queremos”. Acompanhe!
P(X 1) = 1 P(X< 1)
P(X<1) = P(X = 0)
a) Exatamente 2 lançamentos;
b) No máximo 1lançamento;
c) Pelo menos 2lançamentos.
d) Qual o a quantidade de lançamentos esperado
em que a face 4 ocorrerá?
3.2 DistribuiçãoPoisson
Como assim?
Imagine que se saiba que, em média, a cada hora, 6 veículos passem por uma
ponte em um dia normal. Desejamos saber qual a probabilidade de que em uma
hora qualquer do dia, passe por esta ponte exatamente 14 veículos.
x N/x >0
= E(X) = n p
614. e 6
P(X= 14) = P(X= 14) =0,0022281
14!
V(X) = = n p
Resolução:
Inicialmente, exploraremos as informações. Temos:
n =60
p= 3%=0,03
1,8 0 e-1,8
P( X=0) = =0,1653
0!
Resolução:
P(X <2) =P(X =0) +P(X =1) +P(X =2) 1,80
P(X=2) = 0,730621
Por exemplo:
Seja X =a altura de um pinheiro com idade igual a 3 anos. Assim,
Rx = {x R/x 0}
Rx = {x R/x 0}
b) f(x)dx =1
Rx
A condição (b) mostra que a área total limitada pela curva que descreve a f(x) e
o eixo das abscissas é igual a 1.
4.3 Distribuiçãoexponencial
Por exemplo:
Verificou-se que o tempo de vida de uma válvula eletrônica de distribui
exponencialmente e possui média igual a 500 horas. Determine a probabilidade
de uma destas válvulas, tomada ao acaso, tenha vida útil:
Resolução:
f(x)
400 600 x
Lembre-se da propriedade:
Calculando, separadamente,
0,002.600
F(600)=1 e- =1 e1,2 =0,6988
O resultado acima nos diz a probabilidade da válvula ter vida útil de até 600 horas
(ou seja, entre 0 e 600 horas), o que, no gráfico, representaria a seguinte região
em azul:
f(x)
0 400 600 x
0,002.400
F(400)=1 e- =1 e 0,8 =0,5507
f(x)
0 400 600 x
Dessa forma:
Ou seja, a probabilidade de que a vida útil desta lâmpada esteja entre 400 e 600
horas é de 14,81%.
Resolução:
Desejamos determinar:
0 650
F(650) 1 - (650)
Então:
P(X >650) =1 F(650)
Ou seja, a probabilidade da vida útil da válvula ser superior a 650 horas é igual a
27,25%.
Determine:
a)O tempo médio de reação deste produto;
b)A probabilidade de que o tempo de reação, em determinado
experimento, seja inferior a 80 segundos;
c) A probabilidade de, em determinado experimento, o tempo de
reação ficar entre 90 e 120 segundos.
d)A probabilidade de que o tempo de reação seja superior a 110
segundos, em um experimento.
f(x)
X
+ +
Resolução:
Inicialmente, esboçamos o gráfico e marcamos a região procurada (que
corresponde à probabilidade procurada).
Área procurada!
=900 X =1000
f(x) =
1
e 2( 50
) dx
1 x 900 2
1000
50 2
O problema é que a resolução desta integral não é trivial, o que torna este
problema inviável de ser resolvido à mão, utilizando este método.
Para substituir esta integração indesejável, podemos utilizar uma tabela com
valores das probabilidades referentes a cada intervalo desejado do gráfico.
Sim, uma única tabela a ser utilizada. Esta tabela refere-se à distribuição normal
padrão, em que a média será sempre zero e a variância igual a um. Assim: Z~N(0,1)
A tabela que utilizaremos nos fornece a área que vai do centro até um valor
especifico de Z. Conforme mostra a ilustração a seguir:
=0 Z
Área procurada
=900 X =1000
=0 z =2,0
Se a área que desejmaos não é a mesma que a tabela nos fornece, como
podemos calcular? Lembre-se da propriedade (d) desta curva!
A probabilidade P(0 <Z<2,00) é fornecida pela tabela:
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
Observe que os dois primeiro dígitos de z vem da linha (2,0) e o terceiro dígito vem
da coluna (0,00).
Usando a propriedade (d), temos que o lado direito da curva tem área igual a 0,5,
logo, a região procurada (cinza) será dada por:
Resolução:
Iniciamos com o esboço da curva e a delimitação da área procurada. Como
X=822 encontra-se à esquerda da média, 900, após a padronização, Zterá sinal
negativo, pois estará a esquerda do zero, veja o desenho.
X=822 =900
Z= 1,56 =0
Calculando:
Utilizandoa tabela:
Z= 1,56 e Z =1,56
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
Por fim, vamos calcular a probabilidade de que o lucro diário seja um valor entre
874 e 952reais.
Resolução:
Queremos calcular a seguinte probabilidade:
874 900
z1= = 0,52 e
50
952 900
z2= =1,04
50
Esboçando o gráfico:
Calculando:
P( 0,52 <Z<1,04) =P( 0,52 <Z<0) +P(0 <Z<1,04)
Ou seja, a probabilidade de que o lucro diário seja um valor entre 874 e 952 reais é
igual a 54,93%.
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
a) Entre 17 e 21horas
b) Menos que 23,5 horas
c) Mais que 20,8 horas
11. - Em uma represa, são colocados peixes de uma só espécie com idades
entre 3 e 4 meses. Sabe-se que a média de peso desses peixes é de 600
gramas, com desvio padrão de 50 gramas. Ao pescar um desses peixes,
qual a probabilidade de que o peso seja:
A média é
E(X) = =n p
1 ( x )2
1
f(x) = e 2
2
z =x
Veremos as duas formas usuais: estimação por ponto, em que nada se pode
afirmar sobre o erro desta estimação, e a estimação por intervalos, em que
fixamos a probabilidade máxima aceitável para o erro da estimação, e
construímos um intervalo de valores que contenha o real valor do parâmetro em
estudo. Esse intervalo é conhecido como intervalo de confiança. Veremos os
principais estimadores e a forma de obtenção de seus respectivos intervalos de
confiança.
Iniciaremos agora o estudo desta unidade que trará exemplos que justificarão sua
importância para diversas áreas do conhecimento.
1. TEORIADA ESTIMAÇÃO
Estudamos, na disciplina de Estatística I, os conceitos de população e amostra.
Vimos que a idéia de população não é válida somente para grupos de pessoas,
como intuitivamente se relaciona, e sim com o conjunto formado por todos os
elementos que têm pelo menos uma característica comum. Dessa forma,
população pode referir-se a pessoas, animais, áreas, objetos, etc.. Já o conceito
de uma amostra está relacionado como um subconjunto de uma população, ou
seja, n <N, onde n é o tamanho da amostra e N o tamanho da população.
(xi x)2
s2 i=1
n-1
n
(xi x)2
s i=1
n-1
s
Dado pela expressão: ^ =
n
Com o intuito de verificar média de idade dos frequentadores de uma lan house,
levantamos uma amostra formada por 5 indivíduos que estavam presentes em
determinado horário. As idades, em ordem crescente, foram: 14 , 16 , 16 , 17 e 22
anos. Estime os seguintes parâmetros para a população que frequenta esta lan house:
a) Média populacional
n
i=1xi 14 +16 +16+ 17+ 22
x n =17
5
Logo, como se trata de uma estimação por ponto, dizemos que a média
populacional =17 anos.
b) Variância populacional
n
(xi x)2
s2 i=1
n-1
(14 17)2 +(16 17)2 +(16 17)2 +(17 17)2 +(22 17)2
s2
5 1
( 3)2 +( 1)2 +( 1)2 +(0)2 +(5)2
s2
4
9 + 1 + 1 + 0 + 25 36
s2 9
4 4
Viu como é simples! Lembre-se de que você pode usar o modo estatístico da
sua calculadora para obter a média e o desvio padrão de forma muito rápida!
Reforçando, a estimação por ponto é simples mas não nos informa com que
precisão o parâmetro foi estimado, o que torna este tipo de estimação menos
adequado em muitas situações. Veremos a seguir o segundo método de
estimação de parâmetros.
Ou seja:
P(Li < <Ls) =1
Onde:
1 é a probabilidade conhecida como nível de confiança;
é probabilidade máxima de erro (nível de significância);
é o parâmetro a ser estimado;
P(Li < <Ls) é chamado intervalo de confiança para o parâmetro .
2 1 2
0 +
Veja que o nível de significância é dividido em duas partes de mesma
probabilidade . Dessa forma, basta encontrar na distribuição normal padrão o
valor de .
Vamos a um exemplo.
De uma população com desvio padrão igual a 2 pontos, retirou-se uma amostra
aleatória de 16 elementos. A média desta amostra foi igual a 8 pontos. Construa
um intervalo de confiança, ao nível de 5%de significância, para a média
populacional.
0,475 0,475
0,025 0,025
0,9500
z0,025 0 z0,025 +
Devemos então procurar na tabela o valor de probabilidade igual a 0,4750. Veja:
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050 0,100
2,58 2,33 2,17 2,05 1,96 1,88 1,81 1,75 1,70 1,64 1,28
Probabilidade
(indica a coluna da tabela)
Indica que a distribuição
usada é t-student (2 )
Graus de liberdade
(indica a linha da tabela)
Resolução:
s =3,40cm
n =10, logo =10 1 =9
= 1% =0,01, logo = 0,005
Dessa forma, a média dos diâmetros das toras de pinos recebidas está entre
54,51cm e 61,49cm, com 99% de confiança.
1
2 2
0 +
2 2
(2 ) (1 2 )
Por exemplo:
Em uma fábrica de farinha de mandioca, os pacotes devem apresentar peso
líquido de 1000 gramas. A variação em torno desse valor é algo indesejável pois,
qualquer que seja a diferença, alguém, cliente ou fábrica, terá prejuízo. Uma
amostra aleatória com 9 elementos foi elaborada para verificar a variância dos
pesos líquidos. Os dados estão a seguir:
1003 1005 999 1002 1000 1002 994 995 1006.
Resolução:
Devemos determinar a variância amostral:
x =1000,67g
s2 =17g2
=n 1 =9 1=8
=0,10 então = 0,05 e 1 =0,95
2 2
TABELA DA DISTRIBUIÇÃOQUI-QUADRADO
Os valores tabelados correspondem a P(0 2 2
)
gl P
gl p 0,005 0,010 0,025 0,050 0,010 0,900 0,950 0,975 0,990 0,995
1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 7,779 9,488
11,14 13,277 14,860
3
5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,83 15,086 16,750
3
6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,44 16,812 18,548
9
7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,01 18,475 20,278
3
8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,53 20,090 21,955
5
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,02 21,666 23,589
3
2 2
(0,05 ;8) =2,733 e (0,95 ;8) =15,507
119 2<
119
I.C.: <
15,507 2,733
Dessa forma, a variância no peso das embalagens fica entre 7,67g2 e 43,54g2
(n 1) s2 (n 1) s2
I.C. : 2 2
1 ; ;
2 2
Para o exemplo anterior, vamos verificar qual seria o I.C. para o desvio padrão:
Então, o desvio padrão das embalagens fica entre 2,77g e 6,60g, com 90% de
confiança.
(1 ) (1 )
I.C. : +
n n
uma pesquisa eleitoral ouviu 100 eleitores quanto a sua intenção de votos, dos
quais 54 responderam que votaria no candidato A. Construa um I.C. de 99% de
precisão e responde se o candidato já pode comemorar a eleição.
Resolução:
^ votaram em A 54
= = =0,54
total entrevistados 100
(1 ) (1 )
I.C. : +
n n
Desse modo, temos que a proporção de votos para A estará no intervalo de 41,1%
até 66,9%. Não é possível afirmar, baseado somente nesta amostra que o
candidato A será eleito, pois o intervalo não se encontra totalmente acima de 50%.
Encerramos a parte inicial desta unidade e iniciamos agora a parte referente aos
testes de hipóteses. Vamos lá!
4. TESTESDE HIPÓTESES
São procedimentos comuns dentro de experimentos que permitem aceitar ou
rejeitar, através de dados numéricos, a igualdade entre amostras e parâmetros.
Todo teste de hipótese parte da formulação das hipóteses. São elas:
H0: chamada de hipótese nula, sempre assumirá a igualdade.
H1: chamada de hipótese alternativa, contradiz de alguma forma a
hipótese nula, portanto, pode utilizar os seguintes sinais: =, <, >.
Erro tipo I: ocorre quando a hipótese nula é verdadeira, mas após o teste
decidimos rejeitá-la.
Erro tipo II: ocorre quando a hipótese nula é falsa e decidimos aceitá-la como
verdadeira.
Ambos os tipos de erros são indesejáveis, sendo o tipo Io pior deles. Assim, os testes
são elaborados de modo a controlar a probabilidade máxima de cometer este
tipo de erro. A probabilidade máxima de se cometer este erro é chamada de nível
de significância .
Um teste de hipóteses pode ser elaborado, de maneira que se tenha apenas uma
região de rejeição, com probabilidade chamado teste unilateral ou, tenha
duas regiões de rejeição, com probabilidade em cada uma, chamado teste
bilateral. Veja os exemplos em que RR significa região de rejeição de H0 e RA
significa região de aceitação de H0.
1 1 1
RR RR RA RR RR RA
a) enunciar as hipóteses;
b) fixar o nível de significância ;
c) esboçar as regiões de aceitação e rejeição, com o valor que
separa as duas regiões, advindo de uma tabela de distribuição de
probabilidade;
d) calcular a estatística do teste;
e) elaborar uma conclusão.
z= x
n
x
t= s
n
Resolução
a) {HH ::
0
1
=15
<15
b) =0,05
z= x =
14,2 15
= 4,216
0,6
n
10
0,45 e) Inserindo o valor obtido na estatística do
0,05 gráfico acima, verificamos que se
localiza na região de rejeição; assim,
RR RA rejeitamos H0 e concluímos que a
1,64 afirmação da montadora está
4,216 equivocada, ao nível de 95% de precisão.
2) Uma panificadora afirma que o pão francês tem massa igual a 100g. Uma
amostra com 8 pães mostrou os seguintes resultados: 100, 102, 99, 99, 103, 105,
101 e 96. Ao nível de 10% de significância, testar a hipótese que a massa do
pão seja diferente do valor informado pela padaria.
Resolução
0,90
0,05 0,05
RR RA RR
1,89 1,89
0,638 (resultado da estatística)
d) Cálculo da estatística:
100,625 100
t = xs = =0,638
2,77
n 8
e) Desse modo, verificamos que o valor obtido na estatística encontra-
se dentro da região de aceitação, portanto, aceitamos H0, ou seja,
não podemos rejeitar a afirmação da padaria.
2 (x 1) . s2
=
2
Os passos para a elaboração deste teste são os mesmos utilizados para os demais.
Podemos utilizar teste bilateral e unilateral. Passamos a um exemplo de aplicação
do teste.
Os furos realizados por uma máquina industrial não deve apresentar variância
superior a 0,05mm. Uma amostra com 5 furos foi examinada e os diâmetros são: 8,4
8,1 8,5 8,2 e 7,8. Testar, ao nível de 5%de significância, se a variância é superior
ao limite.
Resolução
s 2= 0,075, n =5 logo =5 1 =4
O teste será unilateral à direita, pois queremos verificar se supera (>) o limite.
a) {
H0: 2 =0,05
H1 :2 >0,05
(neste caso será um teste bilateral)
b) =0,5
c) A distribuição usada é qui-quadrado. O esboço será:
0,95
0,05
RA RR
0 +
9,488
6,00
d) Estatística
2 (n 1) . s2 (5 1) . 0,075
= = =6,00
2
0,05
z=
(1 )
n
Resolução
a) {
H0:
H1 :
=0,05
>0,05
(neste caso será um teste bilateral)
b) =0,01
c) O esboço será:
RA RR
2,33
0,80
d) Cálculo da estatística:
0,54 0,5
z= = =0,80
(1 ) 0,5 (1 0,5 )
n 100
1. ANÁLISE DE VARIÂNCIA(ANOVA)
{H0:1 = 2 =... = n
H1 :existe pelo menos uma diferença
Dessa maneira, assim como nos testes que já estudamos, a hipótese nula sugere a
igualdade, neste caso, entre as médias das n populações estudadas. Já a
hipótese alternativa contradiz a hipótese nula e, para que H0 seja rejeitada, basta
que duas populações difiram entre si. Ainda voltaremos a discutir esse detalhe.
x1 As linhas horizontais
representam o eixo dos valores
reais. Cada linha vertical preta
Amostra 1 mostra um valor obtido na
x2
amostra, e a linha vermelha
representa a média amostral.
Amostra 2 Veja: em cada amostra,
x3
verificamos que a variação dos
valores é pequena, ou seja,
Amostra 3 baixa variância dentro dos
grupos, indicando que a média
amostral é consistente.Por
outro lado, quando analisamos a variância dos valores médios (x1, x2 , x3 ),
verificamos um valor alto. Assim, os valores estão dispersos, indicando que as
médias são diferentes. Por isso, a decisão de aceitação ou rejeição de H0
depende da estrutura das variâncias, logo da análise de variância!
A análise de variância é um teste que exige certo empenho para a resolução sem
a utilização de um software, pois a quantidade de “continhas” a serem realizadas
é grande, porém, não complicada. Para exemplos pequenos (didáticos) é viável a
resolução “à mão”; já para exemplos grandes, devemos procurar um software
estatístico que realize os cálculos, deixando para o pesquisador apenas o trabalho
da interpretação.
k ( n
i =1x
ij )2 ( k
j=1
n
i =1xi j)2
SQE =
j=1 nj N
k n k ( n
i =1x
ij )2
SQR = xi2j
j =1 i =1 j =1 nj
Ou seja,
j=1 i=1 xij )
k n
( k n 2
SQT = x2ij
j=1i=1 N
X1 X1 X1
Exemplo
Resolução
Semente 1: x1 =105,5
Semente 2: x2 =108
Semente 3: x3 =114,25
Semente 4: x4 =115
a) {
H0:1 =2 =3 = 4
H1 :existe pelo menos uma diferença
N
- esta parte diz para elevar todos os elementos da pesquisa ao quadrado
e emseguida somá-los.
k nj 2
xij
j1 i 1
Desse modo, a maneira mais prática é completar a tabela original dos dados com
alguns novos campos. Veja:
Sem. 1 (Sem. 1)2 Sem. 2 (Sem. 2)2 Sem. 3 (Sem. 3)2 Sem. 4 (Sem. 4)2
103 10609 110 12100 114 12996 115 13225
105 11025 108 11664 114 12996 117 13689
108 11664 107 11449 113 12769 113 12769
106 11236 107 11449 116 13456 115 13225
soma 422 44534 432 46662 457 52217 460 52908
nj 2
k
xij =
(422)2 (432)2 (457)2 (460)2
+ + + =196289,25
i =1
j-1 4 4 4 4
nj
k nj 2
2
xij =(422 +432 +457 +460) =196027,5625
j1 i 1
16
N
k nj
xij2=44534 +46662 +52217 +52908 =196321
j 1i 1
nj 2
k nj k xij
i=1
SQR = xij2 =196321 196289,25 =31,75
j=1i=1 nj
R =N K
QMR = SQR
N K
Residua
SQR =31,75 4
l R =16
QMR =31,75
(dentro 12
)
R =12 QMR =2,646
T=N 1
Total SQT =293,4375 T=16 1
T=15
Dessa forma, o valor da estatística é F =32,97.
d) Esboço do gráfico.
5% GL 1
GL 2 1 2 3 4 5 6 7 8 9 10
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67
F( ) =F(0,05)3;12 =3,49
ER
0,95
0,05
RA RR
0 F=3,49 +
e) Conclusão: verificamos que o valor obtido na estatística, F =32,97,
excede o valor tabelado, 3,49, desta forma, a estatística situa-se na
região de rejeição de H0 ou seja, rejeitamos a igualdade das
médias, logo, existe pelo menos uma diferença entre as sementes.
Veja: rejeitamos a igualdade no exemplo, porém, isso não significa que todas as
sementes sejam diferentes entre si; a hipótese aceita é que existe pelo menos uma
diferença. Para localizarmos as diferenças, usamos um teste complementar.
2. TESTEDE SCHEFFÈ
1 1
d.m.s. = QMR .Ftab..(k 1). +
ni nj
Xi Xj >d.m.s.
Exemplo:
Calculando a diferença mínima significativa:
1 1
d.m.s. = QMR .Ftab..(k 1). +
ni nj
1 1
d.m.s. = 2,646 .3,49.(4 1). + =3,72
4 4
Comparações diferença
d.m.s. Conclusão
grupo i grupo j |X i -Xj|
Sem.1 Sem.2 |105,5 - 108|= 2,5 3,72 2,5 <3,72, logo Sem.1 =Sem.2
Sem.1 Sem.3 |105,5 - 114,5|= 9,0 3,72 9,0 >3,72, logo Sem.1 =Sem.3
Sem.1 Sem.4 |105,5 - 115|= 9,5 3,72 9,5 >3,72, logo Sem.1 =Sem.4
Sem.2 Sem.3 |108 - 114,5|= 6,5 3,72 6,5 >3,72, logo Sem.2 =Sem.3
Sem.2 Sem.4 |108- 115|= 7,0 3,72 7,0 >3,72, logo Sem.2 =Sem.4
Sem.3 Sem.4 |114,5 - 115|= 0,5 3,72 0,5 <3,72, logo Sem.3 =Sem.4
Caso haja rejeição da hipótese nula, conclui-se que existe pelo menos uma
das médias que difere das demais e para identificar quais são diferentes
estudamos o teste de Scheffè.
São questões como estas que estaremos aprendendo a responder nesta unidade.
A correlação pode ser entendida como a relação existente entre duas ou mais
variáveis aleatórias. Se a correlação existe, então podemos dizer que quando uma
das variáveis assume um valor, favorece o acontecimento de um conjunto de
valores na(s) outra(s) variável(eis).
X
Correlação inexistente
As variáveis não possuem correlação de tipo algum, pois o gráfico mostra que os
pontos estão dispersos, não se aproximando da reta assinalada.
X
Correlação linear
X
Correlação não linear
1. CORRELAÇÃO LINEAR
Como já foi dito, a correlação é simples quando envolve apenas duas variáveis e,
pela ilustração anterior, podemos concluir que uma correlação é linear quando os
pontos (x,y) aproximam-se de uma reta.
Variável X Variável Y
Variável X Variável Y
n Xi2 Xi n Yi2 Yi
i=1 i=1 i=1 i=1
n (X Y ) X Y
r
2 2
n X2 X n Y2 Y
Exemplo
Um parque aquático deseja comprovar que a temperatura influência no
movimento. A tabela abaixo registra o número médio de clientes em
determinadas temperaturas:
Temp (°C) Clientes (unid.) Verificar se existe uma relação significativa entre
10 70 a temperatura e número de clientes.
15 80
20 98 Resolução:
Vamos assumir que a temperatura seja a variável
25 130
X, controlada, e que o número de clientes seja a
30 145 variável Y, observada.
O gráfico pode,
150
conforme discutido
anteriormente, nos 100
fornecer uma boa idéia 50
sobre a existência ou
0
não de correlação.
10 15 20 25 30 31
Temperatura (ºC)
n =5 (número de pontos)
n (X Y ) X Y
r
2 2
n X2 X n Y2 Y
5000
r
[1250 ].[20616 ]
5000
r
25770000
5000 5000
r =0,9849
25770000 5076,4161
2. REGRESSÃO LINEARSIMPLES
Y = a + b .X
onde:
Y e4
y2
}
e2
Y2 e3
Y1 valor do modelo
y1 }e1
valor real
X1 X2 X3 X4
e = yi Yi
Onde Yi =a +b . Xi , então:
n
M [yi (a +b .xi)]2
i=1
{ Y= n . a +b . X
X Y =a .
. X +b . X2
Y X
a= b.
n n
Resolução
Da tabela construída anteriormente, retiramos os elementos necessários para a
aplicação da fórmula (observe que a primeira fórmula é muito parecida com a
fórmula da correlação, podendo ser utilizados os valores já calculados).
523 100
a = 4. = 104,6 80 =24,6
5 5
Y = 24,6 + 4 . X
Como se trata de pessoas, logo, variável discreta, podemos assumir que o número
de clientes esteja estimado em 169 clientes, utilizando arredondamento.
110 =24,6 +4 . X
110 24,6 =4 .X
85,4
=X
4
X = 21,35ºC
Além da regressão linear, existem outros modelos de regressão que podem ser
utilizados, entre eles, destacamos a regressão polinomial, a regressão exponencial
e a logarítmica. Todas essas equações podem ser determinadas com o auxílio de
softwares estatísticos simples.
Esperamos que tenham gostado dos temas estudados e que possam eles ser-lhes úteis
muitoem breve!
MORETTIN, Luiz Gonzaga. Estatística Básica: Inferência. 4.ed. São Paulo: Makron
Books, 2000.
BIBLIOGRAFIACOMPLEMENTAR
Para você que é curioso ou que deseja se aprofundar mais nos temas abordados
neste fascículo, sugerimos estas bibliografias:
gl p 0,005 0,01 0,025 0,050 0,010 0,900 0,950 0,975 0,990 0,995
0
1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,833 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796
23 9,260 10,19 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181
6
24 9,886 10,85 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559
6
25 10,520 11,52 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928
4
26 11,160 12,19 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290
8
27 11,808 12,87 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645
9
28 12,461 13,56 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993
5
112 29 13,121 14,25 16,047 17,708Estatística
19,768 II-Diogo
39,087Heron
42,557 45,722
Macowski 49,588 52,336
e DanielaTrentin Nava
6
30 13,787 14,95 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672
3
TABELA DA DISTRIBUIÇÃOF-SNEDECOR ( =1%)
Tabela F referida à cauda direita: P(F0 > F)
1% GL 1
GL 2 1 2 3 4 5 6 7 8 9 10
1 4052,18 4999,50 5403,35 5624,58 5763,65 5858,99 5928,36 5981,07 6022,47 6055,85
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98
5% GL 1
GL 2 1 2 3 4 5 6 7 8 9 10
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16
10% GL 1
GL 2 1 2 3 4 5 6 7 8 9 10
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82
UNIDADE I
Atividade 1.1
a) temperatura de fusão do manganês puro.
b) contagem da quantidade de dias do mês de janeiro.
Atividade 1.2
a) anotar a altura atingida pela maré em 10 dias consecutivos.
b) lançar um dado equilibrado e verificar os pontos da face.
Atividade 1.3
5
a) P(par) = =0,5
10
4
b) P(> 6) = =0,4
10
Atividade 1.4
C
A
d g
e
a
c
b
f
S B
Atividade 1.5
4 2
a) P( 18) 2 =0,10 2
P( 18) =0,10 P[(5) (18)]= + =0,30
20 20 20 20
Note que são eventos mutuamente exclusivos.
7
P[(> 5) e (ímpar )]= =0,35. Logo: P[(>5) (ímpar) = 0,75 + 0,50 0,35 =0,90
20
Atividade 1.6
b) P(P1 33 9
P 2) = = =0,140625
8 8 64
Atividade 1.7
32 6
b) P(P1 P 2) = = =0,1071
8 7 56
Atividade 1.8
P(não haver queimadas) =30%
Atividade 1.9
S={(ca ,ca) ;(ca, co) ;(co , ca) ;(co , co)}
Atividade 1.10
a) P(L) =0,3
b) P(M) =0,4
c) P(G)= 0,2
d) P(Pc) =1 -0,1 =0,9
Atividade 1.11
11 11 6
a) P[(ímpar) (>10)] = + =0,7619
21 21 21
10 9
b) P[(par ) (par)] = =0,2143
21 20
Atividade 1.12
10 9 30 29 20 19
a) P [(M M) (A A) (H H)] = = 0,3785
60 59 60 59 60 59
b) P(não ser do mesmo sabor) =1 0,3785 =0,6215
Atividade 1.12
P(4 \ par) =1
3
UNIDADE II
Atividade 2.1
Mudariam somente as flechas, ou seja, (A,A) estaria relacionada com o número 2,
enquanto (O,O) estaria relacionado com o número 0.
Atividade 2.2
X p(X) F(X) a) P(X=3)=0,10ou 10%
0 0,25 0,25
1 0,15 0,40 b) P(X<2)=0,70ou 70%
2 0,30 0,70 c) P(X>3)=0,30ou 30%
3 0,10 0,80
d)E(X) =1,9
4 0,15 0,95
5 0,05 1,00 e) V(X) =2,29 e σ(X)=1,5133
Atividade 2.3
X p(X) F(X) a) P(X =2) =0,375 ou 37,5%
0 0,125 0,125
1 0,375 0,500 b) P(X =0) +P(X =3) =0,125 +0,125 =0,25
2 0,375 0,875
3 0,125 1,000 c) P(X <2) =0,875
Atividade 2.4
1 5
Dados do exercício: n = 6 p= e q =
6 6
a) P(X= 2) =6 1 25 4
=0,2009
2 6 6
b) P(X 1) P(X 0) P(X 1) 0,3349 0,4019 0,7368
Atividade 2.5
Dados do exercício: n =10 p = 0,03 e q =0,97
Atividade 2.6
a) P(X =0) =0,1609
b) P(X 2) P(X 0) P(X 1) P(X 2) 0,1609 +0,2984 +0,2726 =0,7319
Atividade 2.7
A média do exercício para o trecho de 50km será: E(X) = =5
58 e-5
a) P(X =8) = =0,0653
8!
b) P(X 2) P(X 0) P(X 1) P(X 2) 0,0067 +0,0337 +0,0842 =0,1246
Atividade 2.8
Dados do exercício: n =80 p =0,05
a) E(X) np 80 0,05 4
Atividade 2.9
1 1
a) E(X) 100
0,01
0,01 80
b) P(X 80) F(80) 1 e 0,5507
c) P(90 X 120) F(120) F(90) 0,9688 0,5934 =0,3754
Atividade 2.10
Dados do exercício: =20 e =4
a) P(17 X 21) P( 0,75 Z 0,25) 0,2734 +0,0987 =0,3721
b) P(X 23,4) P(Z 0,85) 0,50 +0,3106 =0,8106
c) P(X 20,8) P(Z 0,20) 0,50 0,0793 =0,4207
Atividade 2.11
Dados do exercício: =600 e =50
a) P(X 500) P(Z 2,00) 0,50 0,4772 =0,0228
UNIDADEIII
Atividade 3.1
5 5
I.C .:161,56 1,64 161,56 +1,64 158,83 164,29
9 9
Atividade 3.2
2,38 2,38
I.C. :31,1 1,83 31,1 1,83 29,72 32,48
10 10
Atividade 3.3
(10 1) (10 1)
I.C. : 2
3,01 15,32
16,919 3,325
Atividade 3.4
Atividade 3.5
1 1
a) I.C.: 11,1 1,64 11,1 1,64 10,58 11,62
10 10
H0 : 10 11,1 10
b) ztab =1,64 z= 3,43
H1 : 10 1
10
Como z =3,43 >1,64 , rejeita-se H0, logo a resistência média é superior a
10MPa.
Atividade 3.6
0,0583
a) I.C.:4,34 2,36 0,0583 4,34 2,36 4,29 4,39
8 8
8 1 0,0034 2
(8 1) 0,0034
b) 0,00149 2
0,0141
16,013 1,690
H0 : 5 4,34 5
c) ttab = 2,998 t= 32,02
H1 : 5 0,0583
8
Como z =- 32,02 <- 2,998, rejeita-se H0, logo o pH médio é inferior a 5.
Atividade 3.8
a) A estimação de parâmetros permite determinar valores para uma
população utilizando amostras aleatórias, cuja probabilidade de
erro para este parâmetro é arbitrária.
b) Os estimadores são operadores matemáticos, ou seja, fórmulas. As
estimativas são os valores obtidos na utilização dos estimadores, ou
seja, são números reais.
c) É a probabilidade de se cometer o erro do tipo I, ou seja, a
probabilidade de rejeitar Ho quando esta é, na realidade,
verdadeira.
Atividade 3.9
H0: 2
5 2 2
(7 1) 4,81
tab 2,833 5,772
H1 : 2 5 5
Como 5,772 >2,833, aceita-se H0, desse modo, não podemos afirmar
que a variância populacional é inferior a 5.
UNIDADE IV
Atividade 4.1
H0 : F1 F2 F3
H1 : existe pelo menos uma diferença
ANOVA
Fonte da variação SQ gl MQ F
Tratamentos 198,9333 2 99,46667 7,367901
Residuo 162 12 13,5
Total 360,9333 14
Atividade 4.2
H0 : baixo eutrófico sobre
H1 : existe pelo menos uma diferença
ANOVA
UNIDADEV
Atividade 5.1
4 124 20 35 204
a) r = 0,9984
4 134 202 ] 4 383 352 ] 136] 307]
4 124 20 35 204
c) r = 1,5
4 134 202 136
35 (
a 1,5) 20 16,25
4 4
Y =16,25 1,5 X
151,48 39
a 0,78 30,265
4 4
Y 30,265 0,78 X
Estatística II - Diogo Heron Macowski e Daniela Trentin Nava 125 e-Tec Brasil
ISBN: 978-85-61819-76-7