Probabilidade Condicionada

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 37

Graciano Paulo André

Probabilidade condicionada

Licenciatura em ensino de matemática com habilitações em informática

Universidade Pedagógica

Lichinga

2016
2

Graciano Paulo André

Probabilidade condicionada

Trabalho de pesquisa científico apresentado


ao Curso de Ensino Matemática, delegação do
Niassa, para fins avaliativos desenvolvido na
cadeira de Inferência Estatística. Leccionado
pelo docente:

Mestre: Abdul Remane Chafim

Universidade Pedagógica

Lichinga

2016

Contacto: [email protected]
3

Índice
Índice das figuras ............................................................................................................ 4
Introdução........................................................................................................................ 5

Probabilidade condicionada ............................................................................................ 6


Correlação e regressão linear .......................................................................................... 8

Diagrama de dispersão .................................................................................................... 9

Regressão - recta de regressão ........................................................................................ 9

Coeficiente de Correlação Linear (r) ............................................................................... 9

Distribuição normal ....................................................................................................... 15

Principais características ............................................................................................... 15

Teorema da aditividade ................................................................................................. 16

Distribuições amostrais ................................................................................................. 18

Distribuição da média amostral ..................................................................................... 18

Quando a variância é conhecida .................................................................................... 18


Quando a variância é desconhecida .............................................................................. 18
Teorema do Limite Central ........................................................................................... 19

Teorema de Moivre-Laplace: ........................................................................................ 21


Intervalos de confiança.................................................................................................. 25
Intervalo de confiança para media populacional quando a variância é conhecida ........ 25

Intervalo de confiança para media populacional quando a variância é desconhecida .. 26


Intervalo de confiança para variâncias .......................................................................... 27

Intervalo de confiança para proporção .......................................................................... 29


Teste de hipótese ........................................................................................................... 30
Erro nos testes de hipóteses ........................................................................................... 31

Nível de significância .................................................................................................... 32


Etapas de testes de hipóteses ......................................................................................... 33

Conclusão ...................................................................................................................... 36
Bibliografia.................................................................................................................... 37

Contacto: [email protected]
4

Índice das figuras pág.


Tab.1 Urna de bolas……………………………………………………….5

Graf.1 Diagrama de dispersão……………………………………………..7

Graf.2 Correlação linear…………………………………………………...8

Graf.3 Correlação linear…………………….……………………………10

Graf.4 Correlação linear………………………………………………….11

Graf.5 Correlação linear………………………………………………….11

Graf.6 Função densidade…………………………………………………13

Graf.7 Função densidade…………………………………………………13

Graf.8 Função densidade…………………………………………………14

Graf.9 Tamanho de amostra……………………………………….……...17

Graf.10 Tamanho de amostra………………………………………....….18

Graf.11 Intervalo de confiança…………………………………...………23


Graf.12 Intervalo de confiança para media…………………..…………..24
Graf.13 Intervalo de confiança para media……………………………….25
Graf.14 Intervalo de confiança para variância…………………………...26
Graf.15 Intervalo de confiança para proporção……………….…………..27
Graf.16 Tipos de testes……………………………………….…………..29
Graf.17 Tipos de erro……………………………………………………..30
Graf.18 Região critica…………………………………….………………32

Contacto: [email protected]
5

Introdução

O presente trabalho com o tema probabilidade condicional, cingindo nos conteúdos da


cadeira de estatística descritiva tem como finalidade fazer uma abordagem em torno da
estatística básica em geral.

Os itens que o trabalho aborda são:

 Probabilidade condicionada;
 Correlação e regressão linear;
 Distribuição Normal;
 Distribuição amostral;
 Intervalos de confiança; e
 Teste de hipótese.

Com vista a uma boa abordagem dos temas propostos, para cada item foram resolvidas três
exemplos que serviram como exercícios resolvidos e também foram propostos três
exercícios não resolvidos.

O objectivo geral deste trabalho prende-se no âmbito de fazer trabalho convista a obtenção
de uma nota de admissão aos exames da mesma cadeira e posteriormente a sua realização.
Para se realizar o trabalho usou-se o método de leitura de fontes bibliográficas, consultas e
resolução de exercícios.

Contacto: [email protected]
6

Probabilidade condicionada

Definição:

Dados os acontecimentos A e B, a probabilidade de A se realizar sabendo que B se realizou,


ou a probabilidade de A condicionada por B, é definida por:

𝑃(𝐴∩𝐵)
𝑃(𝐴/𝐵) = se 𝑃(𝐵) > 0.
𝑃(𝐵)

Invertendo a expressão acima, obtém a importante relação:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵) × 𝑃(𝐵) = 𝑃(𝐵/𝐴) × 𝑃(𝐴)

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:

Consideremos 250 alunos que cursam o primeiro ano de faculdade da UP-Niassa. Destes
100 são homens (H) e 150 são mulheres (M), 110 cursam matemática (MAT) e 140
frequentam o curso de Química (Q). a distribuição dos alunos é a seguinte tabela:

Disciplina
MAT Q TOTAL
Sexo
H 40 60 100
M 70 80 150
TOTAL 110 140 250
Um aluno é sorteado ao acaso. Qual é a probabilidade de que esteja cursando química, dado
que é mulher?

Resolução:

80
Pelo quadro vemos que esta probabilidade é de 150 e representamos:

80
𝑃(𝐴/𝐵) = 150 (Probabilidade de que o aluno curse química, condicionado ao facto de ser

mulher)

80 150
Observamos, porem que 𝑃(𝑀 ∩ 𝑄) = 250 e 𝑃(𝑀) = 250. Para obtermos o resultado do

problema basta considerar que:

𝑃(𝑀 ∩ 𝑄)
𝑃(𝑄/𝑀) =
𝑃(𝑀)

Contacto: [email protected]
7

80
250 80
𝑃(𝑄/𝑀) = =
150 150
250

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:

1 3 11
2. Sendo 𝑃(𝐴) = 3, 𝑃(𝐵) = 4, e 𝑃(𝐴 ∪ 𝐵) = 12, calcular 𝑃(𝐴/𝐵).

Resolução:

𝑃(𝐴∩𝐵)
Como 𝑃(𝐴/𝐵) = , Devemos calcular 𝑃(𝐴 ∩ 𝐵).
𝑃(𝐵)

Como 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵), temos:

11 1 3 2 1
= + − 𝑃(𝐴 ∩ 𝐵) → 𝑃(𝐴 ∩ 𝐵) = =
12 3 4 12 6
1
6 2
Logo, 𝑃(𝐴/𝐵) = 11 =9
12

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:

3. Duas bolas vão ser retiradas de uma urna que contem 12 bolas brancas, 3 pretas e 4
verdes. Qual a probabilidade de que ambas

a) Sejam verdes?
b) Sejam da mesma cor?

Resolução:

Urna de bolas. Fonte: apontamentos de introdução a estatística e a


probabilidade vol. I
4 3 1
a) 𝑃(𝑉 ∩ 𝑉) = 𝑃(𝐴). 𝑃(𝑉/𝑉) = 9 . 8 = 6

b) 𝑃(𝑀𝐶) = 𝑃(𝐵 ∩ 𝐵) + 𝑃(𝑃 ∩ 𝑃) + 𝑃(𝑉 ∩ 𝑉)

2 1 3 2 4 3
𝑃(𝑀𝐶) = . + . + .
9 8 9 8 9 8

Contacto: [email protected]
8

20 5
𝑃(𝑀𝐶) = =
72 18

Exercícios propostos.

1. Numa fábrica, um certo tipo de chocolates é embalado em caixas e por uma das 3
linha de produção diferentes: M1, M2, e M3. Os registos mostram que uma pequena
percentagem das caixas são embaladas em condições próprias para venda: 0,5%
provem de M1, 0,8% de M2 e 1% de M3. Sabe-se que o volume diário de caixas
embaladas por cada uma das linhas de produção é de 500, 100, 2000 unidades,
respectivamente.
a) Qual a probabilidade de uma caixa, escolhida ao acaso, não estar em condições para
venda?
b) Sabendo que uma caixa não esta em condições para venda, qual a probabilidade de
ser proveniente de produção M2?
2. A urna A conte 3 fichas vermelhas e 2 azuis, e a urna B contem 2 vermelhas e 8
azuis. Joga-se uma moeda «honesta». Se a moeda der cara, extrai-se uma ficha da
urna A; se der coroa, extrai-se uma ficha da urna B. uma ficha vermelha é extraída.
Qual a probabilidade de ter saído cara no lançamento?
3. A caixa A tem 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas de 1
a 5. Uma caixa é escolhida ao acaso e uma carta é retirada. Se o numero é par. Qual
a probabilidade de que a carta sorteada tenha vindo de A?

Correlação e regressão linear

Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição
de pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também,
uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da
linha.

Contacto: [email protected]
9

Diagrama de dispersão

O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde


às variáveis correlacionadas.

Gráfico 1. Diagrama de dispersão Fonte: apontamentos de introdução a estatística e a probabilidade vol. I


Regressão - recta de regressão

Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da
recta; essa recta é chamada de recta de regressão e a equação que a representa é a equação
de regressão. A equação de recta de regressão é dada pela expressão:
𝑦 = 𝑎𝑥 + 𝑏
Onde: x é a variável independente; e y é a variável dependente;
Sendo 𝑎 𝑒 𝑏 os parâmetros da equação da recta, esses podem ser calculados por meio das
fórmulas:
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∗ ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
𝑦 = 𝑦̅ − 𝑎𝑥̅
Coeficiente de Correlação Linear (r)

O coeficiente de correlação linear pode ser apresentado como uma medida de correlação,
pois tem como objectivo indicar o nível de intensidade que ocorre na correlação entre as
variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.

Contacto: [email protected]
10

Temos
r = o coeficiente de Pearson
n = o número de observações
xi = variável independente
yi =variável dependente
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado
entre os valores do Intervalo[-1,+1].
 r = +1 (correlação positiva entre as variáveis);
 r = - 1 (correlação perfeita negativa entre as variáveis);
 r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso
exista).
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:

Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo
descartado, por dia, numa empresa com o peso do papel contido nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10

Peso 10,47 19,85 21,25 24,36 27,38 58,09 33,61 35,75 38,33 49,1
Total 4
Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,4
papel 3

De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o


diagrama de dispersão.

Gráfico 2. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

Contacto: [email protected]
11

Para se verificar o grau de correlação entre as duas variáveis, calcula-se o coeficiente de


correlação linear pela formula do coeficiente de correlação de Person:

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:

2. Seja dado as notas e o tempo de estudo (em horas) referente a turma de matemática do
2º Ano da Up-Niassa. Represente os dados no diagrama de dispersão e encontre o valor do
coeficiente de correlação.
Resolução:
X: tempo de estudo em horas;
Y: nota da prova

Contacto: [email protected]
12

Tempo (x) 3,0 7,0 2,0 1,5 12,0


Nota (y) 4,5 6,5 3,7 4,0 9,3

Representado no diagrama de dispersão, temos:

Gráfico 3. Fonte: Apontamentos de introdução a


estatística e a probabilidade vol. I
Assim o coeficiente de correlação pode ser calculada por:
Tempo (x) Nota (y) (𝑥 − 𝑥̅ ) (𝑦 − 𝑦̅) (𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)
3,0 4,5 -2,1 -1,1 2,31
7,0 6,5 1,9 0,9 1,71
2,0 3,7 -3,1 -1,9 5,89
1,5 4,0 -3,6 -1,6 5,76
12,0 9,3 6,9 3,7 25,53
25,5 28,0 0 0 41,2

𝑥̅ = 5,1 e 𝑦̅ = 5,6
𝑆𝑥2 = 19,55 e 𝑆𝑥 = 4,42
𝑆𝑦2 = 5,47 e 𝑆𝑦 = 2,34
Então,
41,2
𝑟= = 0,9959
4.4,42.2,34
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
Uma pesquisa foi feita acerca do consumo de cerveja e a temperatura. As vereáveis foram
observadas em nove localidades com as mesmas características demográficas e
socioeconómicas. A tabela seguinte mostra os resultados.
a) Represente os dados num diagrama de dispersão e interprete.
b) Encontre a recta de regressão para os dados.

Contacto: [email protected]
13

Localidade Temperatura (x) Consumo


(y)
1 16 290
2 31 374
3 38 393
4 39 425
5 37 406
6 36 370
7 36 365
8 22 320
9 10 269
Resolução:
a) O diagrama para estes dados será:

Gráfico 4. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I

b) A correlação entre x e y é 𝑟 = 0,962


A recta de regressão é 𝑦 = 217,37 + 4,74𝑥

Gráfico 5. Fonte: Apontamentos de introdução a estatística e a probabilidade vol. I


Interpretação: aumentando-se um grau de temperatura (x), o consumo de cerveja (y)
aumenta, em media 4,74 litros por habitante.

Contacto: [email protected]
14

Exercícios propostos
1. No quadro seguinte, indicam-se os preços (x) dum bem alimentar (em unidades
monetários) praticados durante 12 meses consecutivos e as suas quantidades
vendidas (y).
X 110 90 80 76 74 71 70 65 63 60 55 50
y 55 70 90 100 90 105 80 110 125 115 130 131
a) Represente graficamente a informação disponibilizada;
b) Através da análise gráfica, parece-lhe existir uma correlação linear entre as duas
variáveis?
c) Calcule e interprete o valor do coeficiente de correlação linear .
2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objectos. Com
o peso real e a media dos pesos aparentes, dados pelo grupo, obteve-se a tabela:
Peso real 18 30 42 62 73 97 120
Peso aparente 10 23 33 60 91 98 159
a) Represente no diagrama de dispersão e calcule o índice de correlação.

3. Considere os resultados de dois testes x, y obtidos por um grupo de alunos da escola


A:

Xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a. Verifique, pelo diagrama, se existe correlação linear;
b. Em caso afirmativo, calcule o coeficiente de correlação;
c. Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre essas
variáveis.

Contacto: [email protected]
15

Distribuição normal

Definição:
A variável aleatória 𝑋 segue uma distribuição normal com media 𝜇 e desvio-padrão
𝜎 𝑖. 𝑒. 𝑋 ∩ 𝑁(𝜇, 𝜎), se a função densidade de probabilidade é:
1 𝑥−𝜇 2
1
𝑓(𝑥) = 𝜎√2𝜋 𝑥𝑒 −2( )
𝜎 , −∞ < 𝑥 < ∞ 𝜇 e 𝜎 são os parâmetros caracterizadores desta

distribuição.
Principais características

 A função densidade de probabilidade de uma variável aleatória com a distribuição


normal tem a forma de sino, é simétrica em torno de 𝜇 e tem pontos de inflexão em
𝑋 =𝜇±𝜎.
 A media 𝜇 localiza o centro da distribuição e o mede a variabilidade de 𝑋 em torno
de 𝜇.
Se 𝑋 ∩ 𝑁(𝜇, 𝜎), então 𝜇𝑥 = 𝐸(𝑥) = 𝜇 e 𝜎𝑥2 = 𝑉𝑎𝑟(𝑋) = 𝜎 2

Gráfico 6. Função densidade de probabilidade da normal para diferentes valores de 𝜇 𝑒 𝜎. Fonte:


Apontamentos de introdução a estatística e a probabilidade vol I.

Gráfico 7. Função densidade de probabilidade da normal para diferentes valores de 𝜎 e 𝜇 = 7. Fonte:


Apontamentos de introdução a estatística e a probabilidade vol I.

Contacto: [email protected]
16

Resultados importantes:
𝑥−𝜇
 Se 𝑋 ∩ 𝑁(𝜇, 𝜎), então a variável aleatória estandardizada 𝑍 = ∩ 𝑁(0, 1);
𝜎

 A função de distribuição 𝐹(𝑧) da variável aleatória 𝑍 ∩ 𝑁(0, 1) é representada por


𝜙(𝑍) e esta tabulada;
 𝜙(−𝑍) = 1 − 𝜙(𝑍) ;
 𝜙(𝑍) =∝ → 𝜙1 (∝)
Teorema da aditividade

Se 𝑥𝑖 i = 1,2, … , n são variáveis aleatórias independentes e 𝑋𝑖 ∩ 𝑁(𝜇𝑖, 𝜎𝑖), então

𝑛 𝑛 𝑛

∑ 𝑎𝑖 𝑥𝑖 ∩ 𝑁 (∑ 𝑎𝑖 𝜇𝑖 √∑ 𝑎𝑖2 𝜎𝑖2 )
𝑖=1 𝑖=1 𝑖=1

Corolários:
Se i = 1,2, … , n são variáveis aleatórias e independentes 𝑋𝑖 ∩ 𝑁(𝜇, 𝜎), então:
 ∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇, 𝜎√𝑛);
1 𝜎
 𝑥̅ = 2 ∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇, ).
√𝑛

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:

1. Determine a probabilidade: 𝑃(−1,25 < 𝑍 < 0)


A probabilidade procurada corresponde a parte hachurada da figura:

Gráfico 8. Função densidade de probabilidade da normal para


𝑃(−1,25 < 𝑍 < 0). Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.
Sabemos que:
𝑃(0 < 𝑍 < 1,25) = 0,3944
Pela simetria da curva, temos:
𝑃(−1,25 < 𝑍 < 0) = 𝑃(0 < 𝑍 < 1,25) = 0,3944
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:

2. Uma empresa, monopolista no mercado de determinado produto, tem produção


constante de 90 toneladas por mês. Sabe-se que a procura é uma variável aleatória

Contacto: [email protected]
17

com distribuição normal, com media 𝜇 = 80 𝑡𝑜𝑛. E desvio-padrão 𝜎 = 10 𝑡𝑜𝑛.


Qual a probabilidade da média ser inferior a 78 toneladas?

Resolução:
X – variável aleatória que representa a procura do produto da empresa 𝑋 ∩ 𝑁(𝜇 = 80 ,
𝜎 = 10)
Valor esperado: 𝐸(𝑥) = 80; Variância: 𝑉𝑎𝑟(𝑥) = 102 = 100
P(da procura ser inferior a 78 toneladas):
𝑥 − 𝜇 78 − 80
𝑃(𝑋 < 78) = 𝑃 ( < ) = 𝑃(𝑍 < −0,2) = 𝜙(−0,2) = 1 − 𝜙(0,2)
𝜎 10
= 1 − 0,5793 = 0,4207
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:

Usando os dados do exercício anterior, determine qual a produção mensal de forma que a
probabilidade de ocorrer a procura execetaria seja 0,025?
𝑘−80
𝑃(𝑋 > 𝑘) = 0,025 → 1 − 𝑃(𝑋 ≤ 𝑘) = 0,025 → 𝑃(𝑋 ≤ 𝑘) = 0,975 → 𝑃 (𝑍 ≤ )=
10
𝑘−80 𝑘−80
0,975 → 𝜙 ( ) = 0,975 → = 1,96 → 𝑘 = 99,6
10 10

Portanto, a empresa deve produzir 99,6 tonelada por mês.


Exercícios propostos:
1. A percentagem de alunos de matemática que procuram resolver exercícios das aulas
práticas de Estatística é de 15%.
i. Qual a probabilidade de numa turma com 20 alunos, pelo menos 2 alunos terem
tentado resolver os exercícios?
ii. Numa turma de 40 alunos, em media quantos deles tentaram resolver os exercícios?
2. Numa experiencia biológica, para a qual a escolha das cobaias é bastante
dispendioso, verifica-se, que a experiencia é bem-sucedida em 40% dos casos.
i. Se tiver 10 cobaias, qual a probabilidade de ter pelo menos duas experiencias bem-
sucedidas?
3. Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e
desvio-padrão 5,5 kg. Determine os números que pesam:
I. Entre 60 e 70 kg;
II. Mais que 63,2 kg;
III. Menos que 68 kg.

Contacto: [email protected]
18

Distribuições amostrais

Definição:

A variável aleatória (X1, X2,…,Xn) diz-se amostra aleatória (a, a) retirada de uma
determinada população, se a sua função (densidade) de probabilidade conjunta dada por:
𝑛

𝑓(𝑋1, 𝑋2, … , 𝑋𝑛) = 𝑓(𝑋1). 𝑓(𝑋2) … . 𝑓(𝑋𝑛) = ∏ 𝑓(𝑋𝑖)


𝑖=1

Ou seja, X1, X2,…,Xn são independentes e identicamente distribuídas (i.i.d).

Distribuição da média amostral

Definição:

Seja 𝑋1 , 𝑋2 … , 𝑋𝑛 uma amostra aleatória duma população com media 𝜇𝑥 e variância 𝜎𝑥2 .
A media amostral é definida por:
𝑛
𝑋𝑖
𝑋̅ = ∑
𝑛
𝑖=1

Quando a variância é conhecida

Se a distribuição da população é Normal, então 𝑋𝑖 ∩ 𝑁(𝜇, 𝜎), ou seja,

𝑥−𝜇
𝑍= ∩ 𝑁(0, 1)
𝜎

Se a distribuição da população não for normal, mas é de grande dimensão (𝑛 > 30), então,
pelo teorema-Laplace, 𝑋𝑖 ∩ 𝑁(0, 1), ou seja, 𝑍 ∩ 𝑁(0, 1)

Quando a variância é desconhecida

Seja, X1, X2,…,Xn uma amostra aleatória de dimensão n duma população Normal, com
media 𝜇 e desvio-padrao 𝜎 desconhecido, e aceitando a hipótese de independência das
distribuições da media amostral e da variância corrigida da amostra, então, pelo teorema
da distribuição T-Student, tem-se que

Contacto: [email protected]
19

𝑥−𝜇
𝑇= ∩ 𝑡(𝑛−1)
𝑆
√𝑛

Teorema do Limite Central

Seja 𝑋1 , 𝑋2 … , 𝑋𝑛 , uma amostra aleatória de demissão n, com E[𝑋𝑖 ] = 𝜇 e Var[𝑋𝑖 ] = 𝜎 2


para i= 1,2,…,n.

Considere-se 𝑆𝑛 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 . Para valores grandes de n tem-se que:

𝑆𝑛 − 𝐸[𝑆𝑛 ] 𝑆𝑛 − 𝑛𝜇
= ~̇𝑁(0,1)
√𝑉𝑎𝑟[𝑆𝑛 ] √𝑛𝜎

Nota B: Assume-se que n é grande quando n>30.

Suponha que uma amostra aleatória simples (X1, . . . Xn) é retirada de uma
população com média μ e variância σ2 . Então, temos que
𝑋̅ −𝜇
≈ 𝑁(0,1), Quando 𝑛 → ∞
𝜎ǀ√𝑛

 Em palavras o TLC garante que para n grande a distribuição da média amostral,


devidamente padronizada, se comporta segundo um modelo
Normal padronizado (Z).
 Em casos onde a verdadeira distribuição dos dados é simétrica, boas aproximações
são obtidas para n ao redor de 30.
̅ para
 Um estudo de simulação descreve graficamente o comportamento de X
diferentes situações. X~U(0,1), X~Bin(10,0,3)e X~Exp(1).
Efeito do tamanho de amostra sobre a distribuição de ̅
X

Gráfico 9. Tamanho de amostra. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Contacto: [email protected]
20

Gráfico 10 Tamanho de amostra. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.


𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:

Numa certa cidade, a duracao de conversas telefonicas em minutos, segue um modelo


exponencial com parametro 3. Observando se uma amostra aleatoria dessas chamadas, qual
sera a probabilidade de em media, a duracao de conversas telefonicas não ultrapassarem 4
minutos.

Seja X: a duracao das chamadas, X~Exp(3). Logo E(x) = 3 e Var(x) = 9

Admitindo que n é o suficiente, podemos calcular a probabilidade desejada da seguinte


forma:

𝑋̅ − 3 4−3
ℙ(𝑋̅ ≤ 4) = ℙ( ≤ ≈ ℙ(𝑍 ≤ 2,36) = 0,99,09
√9 ̸50 √9 ̸50

̂)
O caso da proporção amostral (𝐩

Colectamos uma aa (X1, . . . Xn) deX~Bernoulli(p), com o objectivo de estimarp.


Definimos a proporção amostral (estimador de p) como sendo a fracção de indivíduos com
a característica X , i.e.,

𝑁𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑣𝑒𝑖𝑠 𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎


𝑝̇ =
𝑛

Contacto: [email protected]
21

Note que podemos escrever

𝑋1 + 𝑋2 +, … , 𝑋𝑛 1, 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
𝑝̇ = = 𝑋̅, 𝑋𝑖 = {
𝑛 0, 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜

Assim, temos que

𝐸(𝑋1 ) + 𝐸(𝑋2 )+, … , +𝐸(𝑋𝑛 ) 𝑛𝑝


𝐸(𝑝̇ ) = = =𝑝
𝑛 𝑛

𝑋1 + 𝑋2 +, . . . , +𝑋𝑛 𝑛𝑝(1 − 𝑝 𝑝(1 − 𝑝)


𝑉𝑎𝑟(𝑝) − 𝑉𝑎𝑟( − −
𝑛 𝑛2 𝑛

Pelo TLC

𝑋̅ − 𝐸(𝑋̅) 𝑋̅ − 𝑝 𝑝̇ − 𝑝
= = ≈ 𝑁(0,1)
𝑉𝑎𝑟(𝑋̅) √𝑝(1 − 𝑃) ̸𝑛 √𝑝(1 − 𝑝) ̸𝑛

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:

A proporção de peças fora de especificação num lote é de 0,4. Numa amostra de tamanho
30, calcule a probabilidade de que a proporção de peças defeituosas seja menor do que 0,5.

Seja p̂: a proporção de pecas defeituosas na amostra (proporção amostral). Então, como
consequência do teorema do limite central, temos que:

𝑝̇ −𝑝 𝑝̇
= ≈ 𝑁(0,1), quando n→ ∞
√𝑉𝑎𝑟(𝑝̇ ) √𝑝(1−𝑝) ̸𝑛

0,40(0,6)
𝑝̇ ~𝑁 (0,40, ), assim,
30

𝑝̇ −0,4 0,5−0,4
P(𝑝̇ < 0,5)= 𝑃( < ) ≈ 𝑃(𝑍 ≤ 1,12) = 0,8686
√0,40(0,6) √0,40(0,6)
30 30

Teorema de Moivre-Laplace:

Seja 𝑋1 , 𝑋2 , … , 𝑋𝑛 , uma amostra aleatória de demissão n, com E[𝑋𝑖 ] = 𝜇 e Var[𝑋𝑖 ] = 𝜎 2


para i= 1,2,…, n.

𝑆𝑛 𝑋1 +𝑋2 +⋯+𝑋𝑛
Considere-se 𝑋̅ = = . Para valores grandes de n tem-se que:
𝑛 𝑛

𝑋̅ − 𝐸[𝑋̅] 𝑋̅
= 𝜎 ~̇𝑁(0,1)
√𝑉𝑎𝑟[𝑋̅]
√𝑛

Contacto: [email protected]
22

𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
Alguns casais preferem ter filhos do sexo feminino, porque as mães são portadoras de um
distúrbio recessivo que é herdado por 50 % dos filhos, mas por nenhuma das filhas. O
método Ericsson se selecção de sexo tem uma taxa admitida de 75% de sucesso. Suponha
que 100 casais utilizam o método Ericsson com o resultado de que, dentre 100 recém
nascido, há 75 meninas.
a) Supondo que o método Ericsson não produza efeito e admitindo que menino e menina
sejam igualmente prováveis, determine a média e o desvio padrão do número de meninas
num grupo de 100 crianças.
Resolução:
X- número de meninas em 100 nascimentos. Supondo que o método não produza efeito e
que as meninas e meninos sejam igualmente prováveis, tendo n = 100; p = 0,5 q = 0,5⇒μ
= np = 50 σ = √𝑛𝑝𝑞 = 5
Resposta: Para grupos de 100 casais com um filho cada, o número médio de meninas é 50
com um desvio de 5.
b) Interprete os resultados de a) para determinar se o resultado de 75 meninas em 100
bebés confirma a alegação de eficiência do método.
Resolução:
mínimo ≈ 𝑋 − 2σ = 50 − 2 × 5 = 40 máximo ≈ 𝑋 + 2σ = 50 + 2× 5 = 60 . Neste caso os
resultados típicos estão entre 40 e 60.
Resposta: 75 meninas não parece um resultado devido unicamente ao acaso ou
𝑥−µ 75−50
𝑧= = = 5 , logo o resultado de 75 meninas não é usual. Pode-se concluir que o
𝜎 5

método Ericsson é eficiente.


1. As maternidades do hospital Central A e do Hospital B, estão interessadas em
controlar o absentismo ao serviço das senhoras grávidas. Abriu-se um ficheiro que
continha vários dados referentes a dias de abstenção ao serviço para consultas com
o ginecologista, o que produziu os dados constantes nas tabelas abaixo.

Contacto: [email protected]
23

Hospital A Hospital B
25 28 63 70 42 33 46 79 85 15 18 43 92 74 73 61 63 84
14 89 98 56 75 28 56 48 91 75 76 94 82 76 84 83 91 87
85 76 42 81 93 45 41 86 98 87 79 78 96 94 92 83 84 54
78 95 84 20 53 40 80 60 70 56 58 59 52 57 53 55 84 61
75 43 51 61 81 72 94 83 54 60 63 68 69 62 67 64 85 71
86 75 43 61 68 59 72 47 41 73 74 77 76 84 79 81 80 82
78 45 76 84 73 51 48 92 85 91 90 80 70 75 76 84 73 94
76 87 92 43 57 86 75 84 91 84 71 84 71 24 28 27 39 37
73 84 91 42 86 75 10 14 11 29 34 81 46 48 47 45 41 90

Para as alíneas c) e d) devia-se calcular antes, as seguintes medidas:


Hospital.

Hospital
A B
𝑁 81 81

∑ 𝑋𝑖 5228 5527

∑(𝑋𝑖 − 𝑋̅)2 42772,10 31238,54

𝜇 64,54 390,48
𝜎2 534,65 68,23
𝜎 23,12 19,76

a) Retire das duas populações amostras aleatórias de tamanho 14, usando a tabela de
números aleatórios.
Resolução:
Hospital A: 92; 45; 86; 25; 75; 73; 28; 89; 98; 84; 84; 91; 86; 86.
Hospital B: 84; 92; 28; 15; 47; 75; 84; 76; 94; 70; 34; 81; 73; 84.
Diga qual é o hospital com maior variância em faltas?
Resposta: É o hospital B.
∑(𝑋𝑖 −𝑋̅) 7403,43 ∑(𝑋𝑖 −𝑋̅) 8320,93
𝑆 2 𝐻𝐶𝑀 = 𝑛−1
= 13
= 569,49 𝑆 2 𝑀𝐴𝐶𝐴𝑀𝑂 = 𝑛−1
= 13
= 640,07

Contacto: [email protected]
24

b) Determine a média de cada amostra


Resolução:
∑ 𝑋𝑖 1024 ∑ 𝑋𝑖 937
𝑋̅𝐴 = 𝑛 = 14 = 74,4 𝑋̅𝐵 = 𝑛 = 14 = 66,9

c) Qual é a probabilidade de que uma senhora escolhida ao acaso tenha faltado mais de 61
dias relativamente aos dados do B
Resolução:
61 − 𝜇
𝑃(𝑋 > 6) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0,366) = 0(0,366) = 0,6428
𝜎
d) Qual é a probabilidade de que o número de faltas esteja ente 25 e 50 para uma doente
do Hospital A
Resposta
25 − 64,54 50 − 64,54
𝑃(25 < 𝑋 < 50) = 𝑃 ( <𝑍< ) = 𝑃(−1,71 < 𝑍 < −0,629)
23,12 23,12
= 0(−0,629) − 0(−1,71) = 0(1,71) − 0(0,629) = 0,9564 − 07353
= 0,2211
Exercícios propostos

1. Um fabricante de automóveis defende que o novo modelo que vai ser lançado no
próximo mês gasta aos 100 km, em circuito urbano, em media 9,7 litros com desvio-
padrão de 1 litro. Admita que o consumo segue uma distribuição Normal.
a. Qual a probabilidade de uma amostra aleatória de 20 automóveis o gasto médio ser
superior a 10 litros.
b. Qual devera ser a dimensão da amostra para obter, com pelo menos 90%
probabilidade, um gasto médio inferior a 10 litros.
2. Numa universidade, a altura dos alunos do sexo masculino segue uma distribuição
Normal com media 165cm e desvio-padrão 7,5cm.
a. Qual a probabilidade de, numa amostra aleatória de 10 alunos do sexo masculino,
a altura media amostral:
I. Ser no mínimo 170 cm?
II. Estar entre 150 cm e 160 cm?
3. Num determinado pais a temperatura media em ºC, registada nos meses deverão,
pode/se considerar que segue uma distribuição Normal com media 30 ºC e desvio-
padrão 3º C.
a) Numa amostra aleatória de 28 dias:

Contacto: [email protected]
25

i. Qual a probabilidade da temperatura media destes dias ser inferior a 31 ºC.

Intervalos de confiança

Intervalo de confiança para media populacional quando a variância é conhecida

Suponha que 𝑋1, … , 𝑋𝑛 uma amostra aleatória de tamanho n, de uma população normal
com media 𝜇 (desconhecida) e variância 𝜎 2 (conhecida). Vimos que a media amostral 𝑋̅,
2
tem distribuição normal com media 𝜇 e variancia 𝜎 ⁄𝑛. Isto e

𝑥−𝜇
𝑍= ∩ 𝑁(0, 1)
𝜎

Logo, fixando um nível de confiança (1−∝), pode-se determinar 𝑍∝ de tal forma que:
2

𝜎 𝜎
𝑃 (𝑋̅ − 𝑍∝ < 𝜇 < 𝑋̅ + 𝑍∝ ) = (1−∝)
2 √𝑛 2 √𝑛

Gráfico 11 Intervalo de confiança para media amostral.


Fonte: Apontamentos de introdução a estatística e a probabilidade vol I

Exemplo:

Em uma indústria de cerveja, a quantidade de cerveja inserida em latas tem-se comportado


como uma distribuição normal com media 350 ml e desvio-padrão 3 ml. Apos alguns
problemas na linha de produção, suspeita-se que houve alteração na média. Uma amostra
de 20 latas acusou uma media 346 ml. Obtenha um intervalo de confiança de 95% para a
quantidade media 𝜇 de cerveja inserida em latas, supondo que não tenha ocorrido alteração
na variabilidade.

Resolução:

Já que (1−∝) = 0,95, temos da tabela normal padrao 𝑍0,975 = ±1,96.

Contacto: [email protected]
26

Gráfico 12 Intervalo de confiança para media amostral. Fonte:


Apontamentos de introdução a estatística e a probabilidade vol I

Podemos calcular o intervalo de confiança por:

𝜎 𝜎
𝑃 (𝑋̅ − 𝑍∝ < 𝜇 < 𝑋̅ + 𝑍∝ ) = (1−∝)
2 √𝑛 2 √𝑛

3 3
𝑃 (346 − 1,96 < 𝜇 < 346 + 1,96 ) = 0,95
√20 √20

𝑃(346 − 1,31 < 𝜇 < 346 + 1,31) = 0,95

𝐼𝐶 =]344,69; 347,31[

Interpretação: com 95% de confiança a media da produção da cerveja situa-se entre


]344,69; 347,31[ sem alteração da variabilidade.

Intervalo de confiança para media populacional quando a variância é desconhecida

Se a distribuição da população é normal com desvio-padrão populacional desconhecido


então a variável a usar é:

𝑥̅ − 𝜇
𝑇= ∩ 𝑡(𝑛−1)
𝑆
√𝑛

Portanto, quando a população é normal com variância, desconhecida o intervalo de


confiança para media populacional com 100(1−∝), de confiança é dado por:

𝑆 𝑆
𝑃 (𝑋̅ − 𝑡∝ < 𝜇 < 𝑋̅ + 𝑡∝ ) = (1−∝)
2 √𝑛 2 √𝑛

Contacto: [email protected]
27

Gráfico 13 Intervalo de confiança para media


amostral com 𝜎 2 Desconhecida. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Exemplo:

Deseja-se avaliar a dureza esperada 𝜇 do aço produzido sob um novo processo de têmpera.
Uma amostra de 10 corpos de prova de aço produziu os seguintes resultados, em HRc:

36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiança para 𝜇, com nível de confiança de 95%.

Resolução:

10
∑ (𝑥𝑖−𝑋) ̅ 2 𝑆
𝑋̅ = 36,5; 𝑆 = √ 𝑖=1𝑛−1 = 0,7352; = 0,2325
√𝑛

Já que n=10, (1−∝) = 0,95, →∝= 0,05, temos: 𝑡0,975;9 = 2,26

O intervalo de confiança será dado por:

𝑆 𝑆
𝑃 (𝑋̅ − 𝑡∝ < 𝜇 < 𝑋̅ + 𝑡∝ ) = (1−∝)
2 √𝑛 2 √𝑛

𝑃(36,5 − 0,53 < 𝜇 < 36,5 + 0,53) = 0,95

𝐼𝐶 =]35,97; 37,03[

Interpretação: com 95% de confiança a media do aço produzido situa-se entre


]35,97; 37,03[ da sua dureza.

Intervalo de confiança para variâncias

Se a distribuição da população for normal, então a variável estatística a usar é:

(𝑛 − 1)𝑆 2
𝑥2 = ~𝑥 2 𝑛−1
𝜎2

Contacto: [email protected]
28

O intervalo de confiança é construído da seguinte forma:

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃( <𝜎 < ) = (1−∝)
𝑥 2 𝑠𝑢𝑝 𝑥 2 𝑖𝑛𝑓

Exemplo:

Pretende-se avaliar a variabilidade associada ao resultado de um determinado método de


análise química. Com esse objectivo, efectuaram-se 24 análises a uma determinada
substancia em que se segui o referido método, em condições perfeitamente estabilizadas.
A variância amostral dos resultados (expressados numa determinada unidade) foi de 4,58.
Admitindo que o resultado das análises segue uma distribuição normal. Obtenha um
intervalo de 90% de confiança para variância.

Resolução:

Para 1−∝= 0,90 →∝= 0,10 da distribuição qui-quadrado com 𝑛 − 1 = 24 − 1 = 23


graus de liberdade temos:

Gráfico 14 Intervalo de confiança para


variância. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Assim o intervalo de confiança será:

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃( < 𝜎 < ) = 1−∝
𝑥 2 𝑠𝑢𝑝 𝑥 2 𝑖𝑛𝑓

(24 − 1)(4,58) (24 − 1)(4,58)


𝑃( < 𝜎2 < ) = 0,90
35,17 13,09

Contacto: [email protected]
29

𝐼𝐶 =]2,995; 8,047[

Interpretação: com 90% de confiança, a variância em condições perfeitamente


estabilizadas situa-se entre ]2,995; 8,047[.

Intervalo de confiança para proporção

Quando n é maior numa amostra de Bernoulli com parâmetro p, então a variável estatística
a usar será:

𝑝̂ − 𝑝
𝑍= ~𝑁(0,1)
√𝑝(1 − 𝑝)
𝑛

Assim o intervalo de confiança é obtido a partir de:

𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (𝑝̂ − 𝑍∝ √ < 𝑝̂ < 𝑝̂ + 𝑍∝ √ ) = (1−∝)
2 𝑛 2 𝑛

Exemplo:

Um estudo foi feito para determinar a proporção de famílias em uma comunidade que tem
telefone (p). uma amostra de 200 famílias é seleccionada, ao acaso, e 160 afirmam ter
telefone. Que dizer de p com 95% de confiança?

Resolução:

160
Uma estimativa pontual de p é 𝑝̂ = 200 = 0,8 (08%)

Já que 1−∝= 0,95, temos da tabela normal padrão 𝑍0,975 = ±1,96 e a sua curva pode ser
dada por:

Gráfico 15 Intervalo de confiança para proporção. Fonte: Apontamentos


de introdução a estatística e a probabilidade vol I.

Contacto: [email protected]
30

Assim o intervalo de confiança será:

𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (𝑝̂ − 𝑍∝ √ < 𝑝̂ < 𝑝̂ + 𝑍∝ √ ) = (1−∝)
2 𝑛 2 𝑛

0,8(1 − 0,8) 0,8(1 − 0,8)


𝑃 (0,8 − 1,96√ < 𝑝̂ < 0,8 + 1,96√ ) = 0,95
200 200

𝐼𝐶 =]0,745; 0,855[

Exercícios propostos

1. Foram retiradas 24 pecas da produção diária de uma máquina, encontrando-se para


uma medida uns media de 5,2mm. Sabendo que as medidas têm uma distribuição
normal com desvio-padrão populacional de 1,2mm.
a) Construir intervalo de confiança aos níveis de 90%, 95%, 98% e 99%.
2. De uma distribuição normal com variância populacional 𝜎 2 = 1,96, obteve a
seguinte amostra:

25,2 26,0 26,4 27,7 28,2 28,4


a) Determine o intervalo de confiança para a media da população sendo ∝= 0,05 e ∝
= 0,10.
3. Uma firma construtora deseja estimar a resistência média das barras do aço
utilizadas na construção de casas. Qual o tamanho amostral necessário para garantir
que haja um risco de 0,001 de ultrapassar um erro de 5kg ou mais na estimação? O
desvio-padrão da resistência para este tipo de barra é de 25 kg.

Teste de hipótese

Nos testes de hipótese o objectivo é validar ou não determinadas afirmações sobre a


população com base na informação amostrada.

No caso particular dos testes de hipótese paramétricos a validação diz apenas respeito aos
parâmetros da população.

Hipótese a testar:

I. Hipótese nula (Ho): (contem sempre uma igualdade) o que se assume como
correcto ate provar o contrário;

Contacto: [email protected]
31

II. Hipótese alternativa (H1): (contem sempre uma desigualdade <, >, ≠).

A hipótese nula Ho representa o status quo, ou seja, a circunstância que esta sendo testada,
e o objectivo dos testes de hipótese é sempre tentar rejeitar a hipótese nula.

A hipótese alternativa H1 representa o que se deseja provar ou estabelecer, sendo formulada


para contradizer a hipótese nula.

Os testes classificam-se em:

 Bilaterais: se a hipótese alternativa estiver a desigualdade;


 Unilaterais (esquerdo ou direito): se a hipótese alternativa estiver a desigualdade;

Gráfico 16: Tipos de testes. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Erro nos testes de hipóteses

A decisão está sempre associada a um risco de errar. No caso particular dos testes de
hipóteses a tomada de decisão para população é baseada na informação amostra pelo que
se pode cometer erros.

Uma das vantagens dos testes de hipóteses é permitir, controlar ou minimizar o risco as
decisões erradas.

Existem dois tipos de erros que podem ser cometidos:

Erro do tipo I: Consiste em rejeitar a hipótese nula, quando ela de facto deveria ser
mantida;

Erro do tipo II: Consiste em aceitar a hipótese nula, quando de facto ela deveria ser
rejeitada.

Contacto: [email protected]
32

Tabela 17: Tipos de erro. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Exemplo1:

A eficiência de certa vacina apos um ano é de 25% (isto é, o efeito imunológico se prolonga
por mais de um ano em apenas 25% das pessoas que a tomam). Desenvolve-se uma nova
vacina, mais cara, e deseja-se saber se esta é, de facto, melhor.

Sendo p a proporção de imunizados por mais de um ano com a nova vacina…

a) Quais hipóteses devem ser formuladas?


b) Que erros podem cometer?

Resolução:

Hipótese nula: Ho: p=0,25

Hipótese alternativa: H1: p>0,25

Erro tipo I: aprovar a vacina quando, na verdade, ela não tem nenhum efeito superior ao da
vacina em uso.

Erro tipo II: rejeitar a nova vacina quando ela é, de facto, melhor que a vacina em uso.

Nível de significância

A probabilidade de se cometer um erro tipo I depende dos valores dos parâmetros da


população e é designada por ∝(nível de significância);

Dizemos, então, que o nível de significância ∝ de um teste é a probabilidade máxima com


que desejamos correr o risco de um erro do tipo I;

O valor de ∝ é tipicamente predeterminado; são comuns as escolhas ∝= 0,05 e ∝= 0,01

Contacto: [email protected]
33

Etapas de testes de hipóteses

1. Formular a hipótese nula e a hipótese alternativa;


2. Escolher a distribuição amostral adequada;
3. Escolher um nível de significância ∝ com base na gravidade do erro tipo I;
4. Calcular a estatística de teste, os valores críticos e a região critica (esboçar um
gráfico é sempre uma boa opção);
5. Compara a estatística de teste com os valores críticos:
 Rejeitar a hipótese nula se a estatística de teste excede o(s) valor(s) critico(s), ou
seja esta na região critica;
 Não rejeitar a hipótese nula, caso contrário.

Exemplo3:

Uma máquina automática enche pacotes de café segundo uma distribuição normal com
media 𝜇 e desvio-padrão 20g. a maquina foi regulada para 𝜇 = 500𝑔. De meia em meia
hora tiramos uma amostra de 16 pacotes para verificar se o empacotamento esta sob
controlo, isto é, se 𝜇 = 500𝑔.

Se uma dessas amostras apresenta-se 𝑥 = 492g, você pararia ou não o empacotamento para
verificar se o ajuste da maquina esta correcto?

Resolução:

Passo 1: Indicamos por X o peso de cada pacote, então X é uma normal com media 𝜇 e o
desvio-padrão=20. As hipóteses que nos interessam são:

Hipótese nula: Ho: 𝜇 = 500g

Hipótese alternativa: H1: 𝜇 ≠ 500g. Teste Bilateral pois uma máquina pode desregular
para mais ou para menos.

Passo 2: Escolher a distribuição amostral

Se o desvio-padrão populacional é conhecido: usamos distribuição normal (z padronizado);

Se o desvio-padrão é desconhecido e a amostral é pequena (n<30): distribuição t-student.

Passo 3: Escolher o nível de significância

Pela situação descrita no problema, podemos fazer ∝= 0,01

Contacto: [email protected]
34

Passo 4: Calcular a estatística de teste, valores e região critica

𝑚𝑒𝑑𝑖𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙 − 𝑚𝑒𝑑𝑖𝑎 𝑎𝑙𝑒𝑔𝑎𝑑𝑎


𝐸𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑡𝑒𝑠𝑡𝑒 =
𝑑𝑒𝑠𝑣𝑖𝑜 − 𝑝𝑎𝑑𝑟𝑎𝑜 𝑑𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖𝑐𝑎𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙

𝑥̅ − 𝜇
𝑍𝑡𝑒𝑠𝑡𝑒 = 𝜎
√𝑛

Ou

𝑥̅ − 𝜇
𝑡𝑡𝑒𝑠𝑡𝑒 =
𝑆
√𝑛

𝑝̂ − 𝑝
𝑍𝑡𝑒𝑠𝑡𝑒 =
√𝑝(1 − 𝑝)
𝑛

𝑥̅
Onde: 𝑛= número de provas; 𝑝 proporção populacional (hipótese nula); 𝑝̂ = 𝑛 (proporção

amostral)

𝑥̅ − 𝜇 492 − 500 −8
𝑍𝑡𝑒𝑠𝑡𝑒 = 𝜎 = = = −1,6
20 5
√𝑛 √16

Gráfico
18 Região critica. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.

Passo 5: A informação da amostra é que x=492g (o que z=-1,6). Como 𝑥 ∉ região critica,
nossa conclusão será não rejeitar a Ho.

Contacto: [email protected]
35

Exercícios propostos

1. O operador de telemóveis Pessimus pretende controlar o tempo médio de


conversações telefónicas no período das 22h as 24h. Para tal seleccionou ao acaso
130 utentes tendo observado o seguinte:

𝟏𝟑𝟎

∑ 𝒙𝒊 = 𝟏𝟖𝟎 𝒎𝒊𝒏
𝒊=𝟏

onde xi representa o tempo de conversações telefónicas do utente i no referido período.

Suponha que o tempo de atis conversações segue uma distribuição normal com desvio-
padrão de 1 minuto.

a) Teste ao nível de significância de 1%, a hipótese do tempo médio de conversações


ser:
i. Diferente de 1 minuto;
ii. Superior a 1 minuto;
iii. Inferior a 1 minuto.
2. Os dados seguintes representam os ganhos em quilogramas, nos primeiros 6 meses
de vida de um grupo de crianças do sexo masculino escolhido ao acaso:

4,1 4,5 3,6 2,8 3,6 3,2 4,1


Admita que se pode considerar que os ganhos em peso seguem uma distribuição normal.

a) Poderá afirmar-se (∝= 0,05) que o ganho médio em peso das crianças do sexo
masculino é significativamente:
i. Diferente de 3,1 kg;
ii. Superior a 3,1 kg;
iii. Inferior a 3,1 kg.
3. Um exame de leitura numa escola primária do primeiro grau revelou uns media de
75 para as 25 meninas e 72 para os 28 meninos. Os desvios-padrão foram
respectivamente 8 e 6. Teste ao nível de significância de 1% de que as meninas são
melhores em leitura do que os homens supor distribuição normal.

Contacto: [email protected]
36

Conclusão

Feita a pesquisa em torno das probabilidades condicionadas, conclui-se que: dados os


acontecimentos A e B, a probabilidade de A se realizar sabendo que B se realizou, ou a
probabilidade de A condicionada por B.

Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. O coeficiente de correlação linear pode ser apresentado como uma medida de
correlação, pois tem como objectivo indicar o nível de intensidade que ocorre na correlação
entre as variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.
Se a distribuição da população é normal com desvio-padrão populacional desconhecido
então usa-se a função z padronizada para obter o seu intervalo de confiança.

Portanto, quando a população é normal com variância, desconhecida o intervalo de


confiança para media populacional usa-se a distribuição t-student.

Nos testes de hipótese o objectivo é validar ou não determinadas afirmações sobre a


população com base na informação amostrada.
A decisão está sempre associada a um risco de errar. No caso particular dos testes de
hipóteses a tomada de decisão para população é baseada na informação da amostra pelo
que se pode cometer erros.

Contacto: [email protected]
37

Bibliografia

AFONSO Anabela; Carla Nunes; Apontamentos de Introdução as probabilidades e a


estatística volume I; S/ed. Manuais da universidade de Évora, editora; Évora. 2005.

CRESPO, António Arnot; Estatística Facial; 18ª edição. Saraiva, editora; Brazil. 2002.

MORETTIN, Luís Gonzaga; Estatística e Probabilidade volume I; 7ª edição. MAKRON


Books. São Paulo. 1999.

Contacto: [email protected]

Você também pode gostar