Probabilidade Condicionada
Probabilidade Condicionada
Probabilidade Condicionada
Probabilidade condicionada
Universidade Pedagógica
Lichinga
2016
2
Probabilidade condicionada
Universidade Pedagógica
Lichinga
2016
Contacto: [email protected]
3
Índice
Índice das figuras ............................................................................................................ 4
Introdução........................................................................................................................ 5
Conclusão ...................................................................................................................... 36
Bibliografia.................................................................................................................... 37
Contacto: [email protected]
4
Contacto: [email protected]
5
Introdução
Probabilidade condicionada;
Correlação e regressão linear;
Distribuição Normal;
Distribuição amostral;
Intervalos de confiança; e
Teste de hipótese.
Com vista a uma boa abordagem dos temas propostos, para cada item foram resolvidas três
exemplos que serviram como exercícios resolvidos e também foram propostos três
exercícios não resolvidos.
O objectivo geral deste trabalho prende-se no âmbito de fazer trabalho convista a obtenção
de uma nota de admissão aos exames da mesma cadeira e posteriormente a sua realização.
Para se realizar o trabalho usou-se o método de leitura de fontes bibliográficas, consultas e
resolução de exercícios.
Contacto: [email protected]
6
Probabilidade condicionada
Definição:
𝑃(𝐴∩𝐵)
𝑃(𝐴/𝐵) = se 𝑃(𝐵) > 0.
𝑃(𝐵)
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:
Consideremos 250 alunos que cursam o primeiro ano de faculdade da UP-Niassa. Destes
100 são homens (H) e 150 são mulheres (M), 110 cursam matemática (MAT) e 140
frequentam o curso de Química (Q). a distribuição dos alunos é a seguinte tabela:
Disciplina
MAT Q TOTAL
Sexo
H 40 60 100
M 70 80 150
TOTAL 110 140 250
Um aluno é sorteado ao acaso. Qual é a probabilidade de que esteja cursando química, dado
que é mulher?
Resolução:
80
Pelo quadro vemos que esta probabilidade é de 150 e representamos:
80
𝑃(𝐴/𝐵) = 150 (Probabilidade de que o aluno curse química, condicionado ao facto de ser
mulher)
80 150
Observamos, porem que 𝑃(𝑀 ∩ 𝑄) = 250 e 𝑃(𝑀) = 250. Para obtermos o resultado do
𝑃(𝑀 ∩ 𝑄)
𝑃(𝑄/𝑀) =
𝑃(𝑀)
Contacto: [email protected]
7
80
250 80
𝑃(𝑄/𝑀) = =
150 150
250
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:
1 3 11
2. Sendo 𝑃(𝐴) = 3, 𝑃(𝐵) = 4, e 𝑃(𝐴 ∪ 𝐵) = 12, calcular 𝑃(𝐴/𝐵).
Resolução:
𝑃(𝐴∩𝐵)
Como 𝑃(𝐴/𝐵) = , Devemos calcular 𝑃(𝐴 ∩ 𝐵).
𝑃(𝐵)
11 1 3 2 1
= + − 𝑃(𝐴 ∩ 𝐵) → 𝑃(𝐴 ∩ 𝐵) = =
12 3 4 12 6
1
6 2
Logo, 𝑃(𝐴/𝐵) = 11 =9
12
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
3. Duas bolas vão ser retiradas de uma urna que contem 12 bolas brancas, 3 pretas e 4
verdes. Qual a probabilidade de que ambas
a) Sejam verdes?
b) Sejam da mesma cor?
Resolução:
2 1 3 2 4 3
𝑃(𝑀𝐶) = . + . + .
9 8 9 8 9 8
Contacto: [email protected]
8
20 5
𝑃(𝑀𝐶) = =
72 18
Exercícios propostos.
1. Numa fábrica, um certo tipo de chocolates é embalado em caixas e por uma das 3
linha de produção diferentes: M1, M2, e M3. Os registos mostram que uma pequena
percentagem das caixas são embaladas em condições próprias para venda: 0,5%
provem de M1, 0,8% de M2 e 1% de M3. Sabe-se que o volume diário de caixas
embaladas por cada uma das linhas de produção é de 500, 100, 2000 unidades,
respectivamente.
a) Qual a probabilidade de uma caixa, escolhida ao acaso, não estar em condições para
venda?
b) Sabendo que uma caixa não esta em condições para venda, qual a probabilidade de
ser proveniente de produção M2?
2. A urna A conte 3 fichas vermelhas e 2 azuis, e a urna B contem 2 vermelhas e 8
azuis. Joga-se uma moeda «honesta». Se a moeda der cara, extrai-se uma ficha da
urna A; se der coroa, extrai-se uma ficha da urna B. uma ficha vermelha é extraída.
Qual a probabilidade de ter saído cara no lançamento?
3. A caixa A tem 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas de 1
a 5. Uma caixa é escolhida ao acaso e uma carta é retirada. Se o numero é par. Qual
a probabilidade de que a carta sorteada tenha vindo de A?
Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição
de pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também,
uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da
linha.
Contacto: [email protected]
9
Diagrama de dispersão
Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da
recta; essa recta é chamada de recta de regressão e a equação que a representa é a equação
de regressão. A equação de recta de regressão é dada pela expressão:
𝑦 = 𝑎𝑥 + 𝑏
Onde: x é a variável independente; e y é a variável dependente;
Sendo 𝑎 𝑒 𝑏 os parâmetros da equação da recta, esses podem ser calculados por meio das
fórmulas:
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∗ ∑ 𝑦𝑖
𝑎=
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2
𝑦 = 𝑦̅ − 𝑎𝑥̅
Coeficiente de Correlação Linear (r)
O coeficiente de correlação linear pode ser apresentado como uma medida de correlação,
pois tem como objectivo indicar o nível de intensidade que ocorre na correlação entre as
variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.
Contacto: [email protected]
10
Temos
r = o coeficiente de Pearson
n = o número de observações
xi = variável independente
yi =variável dependente
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado
entre os valores do Intervalo[-1,+1].
r = +1 (correlação positiva entre as variáveis);
r = - 1 (correlação perfeita negativa entre as variáveis);
r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso
exista).
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:
Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo
descartado, por dia, numa empresa com o peso do papel contido nesse lixo.
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso 10,47 19,85 21,25 24,36 27,38 58,09 33,61 35,75 38,33 49,1
Total 4
Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,4
papel 3
Contacto: [email protected]
11
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:
2. Seja dado as notas e o tempo de estudo (em horas) referente a turma de matemática do
2º Ano da Up-Niassa. Represente os dados no diagrama de dispersão e encontre o valor do
coeficiente de correlação.
Resolução:
X: tempo de estudo em horas;
Y: nota da prova
Contacto: [email protected]
12
𝑥̅ = 5,1 e 𝑦̅ = 5,6
𝑆𝑥2 = 19,55 e 𝑆𝑥 = 4,42
𝑆𝑦2 = 5,47 e 𝑆𝑦 = 2,34
Então,
41,2
𝑟= = 0,9959
4.4,42.2,34
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
Uma pesquisa foi feita acerca do consumo de cerveja e a temperatura. As vereáveis foram
observadas em nove localidades com as mesmas características demográficas e
socioeconómicas. A tabela seguinte mostra os resultados.
a) Represente os dados num diagrama de dispersão e interprete.
b) Encontre a recta de regressão para os dados.
Contacto: [email protected]
13
Contacto: [email protected]
14
Exercícios propostos
1. No quadro seguinte, indicam-se os preços (x) dum bem alimentar (em unidades
monetários) praticados durante 12 meses consecutivos e as suas quantidades
vendidas (y).
X 110 90 80 76 74 71 70 65 63 60 55 50
y 55 70 90 100 90 105 80 110 125 115 130 131
a) Represente graficamente a informação disponibilizada;
b) Através da análise gráfica, parece-lhe existir uma correlação linear entre as duas
variáveis?
c) Calcule e interprete o valor do coeficiente de correlação linear .
2. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objectos. Com
o peso real e a media dos pesos aparentes, dados pelo grupo, obteve-se a tabela:
Peso real 18 30 42 62 73 97 120
Peso aparente 10 23 33 60 91 98 159
a) Represente no diagrama de dispersão e calcule o índice de correlação.
Xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a. Verifique, pelo diagrama, se existe correlação linear;
b. Em caso afirmativo, calcule o coeficiente de correlação;
c. Escreva, em poucas linhas, as conclusões a que chegou sobre a relação entre essas
variáveis.
Contacto: [email protected]
15
Distribuição normal
Definição:
A variável aleatória 𝑋 segue uma distribuição normal com media 𝜇 e desvio-padrão
𝜎 𝑖. 𝑒. 𝑋 ∩ 𝑁(𝜇, 𝜎), se a função densidade de probabilidade é:
1 𝑥−𝜇 2
1
𝑓(𝑥) = 𝜎√2𝜋 𝑥𝑒 −2( )
𝜎 , −∞ < 𝑥 < ∞ 𝜇 e 𝜎 são os parâmetros caracterizadores desta
distribuição.
Principais características
Contacto: [email protected]
16
Resultados importantes:
𝑥−𝜇
Se 𝑋 ∩ 𝑁(𝜇, 𝜎), então a variável aleatória estandardizada 𝑍 = ∩ 𝑁(0, 1);
𝜎
𝑛 𝑛 𝑛
∑ 𝑎𝑖 𝑥𝑖 ∩ 𝑁 (∑ 𝑎𝑖 𝜇𝑖 √∑ 𝑎𝑖2 𝜎𝑖2 )
𝑖=1 𝑖=1 𝑖=1
Corolários:
Se i = 1,2, … , n são variáveis aleatórias e independentes 𝑋𝑖 ∩ 𝑁(𝜇, 𝜎), então:
∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇, 𝜎√𝑛);
1 𝜎
𝑥̅ = 2 ∑𝑛𝑖=1 𝑥𝑖 ∩ 𝑁(𝑛𝜇, ).
√𝑛
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟏:
Contacto: [email protected]
17
Resolução:
X – variável aleatória que representa a procura do produto da empresa 𝑋 ∩ 𝑁(𝜇 = 80 ,
𝜎 = 10)
Valor esperado: 𝐸(𝑥) = 80; Variância: 𝑉𝑎𝑟(𝑥) = 102 = 100
P(da procura ser inferior a 78 toneladas):
𝑥 − 𝜇 78 − 80
𝑃(𝑋 < 78) = 𝑃 ( < ) = 𝑃(𝑍 < −0,2) = 𝜙(−0,2) = 1 − 𝜙(0,2)
𝜎 10
= 1 − 0,5793 = 0,4207
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
Usando os dados do exercício anterior, determine qual a produção mensal de forma que a
probabilidade de ocorrer a procura execetaria seja 0,025?
𝑘−80
𝑃(𝑋 > 𝑘) = 0,025 → 1 − 𝑃(𝑋 ≤ 𝑘) = 0,025 → 𝑃(𝑋 ≤ 𝑘) = 0,975 → 𝑃 (𝑍 ≤ )=
10
𝑘−80 𝑘−80
0,975 → 𝜙 ( ) = 0,975 → = 1,96 → 𝑘 = 99,6
10 10
Contacto: [email protected]
18
Distribuições amostrais
Definição:
A variável aleatória (X1, X2,…,Xn) diz-se amostra aleatória (a, a) retirada de uma
determinada população, se a sua função (densidade) de probabilidade conjunta dada por:
𝑛
Definição:
Seja 𝑋1 , 𝑋2 … , 𝑋𝑛 uma amostra aleatória duma população com media 𝜇𝑥 e variância 𝜎𝑥2 .
A media amostral é definida por:
𝑛
𝑋𝑖
𝑋̅ = ∑
𝑛
𝑖=1
𝑥−𝜇
𝑍= ∩ 𝑁(0, 1)
𝜎
Se a distribuição da população não for normal, mas é de grande dimensão (𝑛 > 30), então,
pelo teorema-Laplace, 𝑋𝑖 ∩ 𝑁(0, 1), ou seja, 𝑍 ∩ 𝑁(0, 1)
Seja, X1, X2,…,Xn uma amostra aleatória de dimensão n duma população Normal, com
media 𝜇 e desvio-padrao 𝜎 desconhecido, e aceitando a hipótese de independência das
distribuições da media amostral e da variância corrigida da amostra, então, pelo teorema
da distribuição T-Student, tem-se que
Contacto: [email protected]
19
𝑥−𝜇
𝑇= ∩ 𝑡(𝑛−1)
𝑆
√𝑛
𝑆𝑛 − 𝐸[𝑆𝑛 ] 𝑆𝑛 − 𝑛𝜇
= ~̇𝑁(0,1)
√𝑉𝑎𝑟[𝑆𝑛 ] √𝑛𝜎
Suponha que uma amostra aleatória simples (X1, . . . Xn) é retirada de uma
população com média μ e variância σ2 . Então, temos que
𝑋̅ −𝜇
≈ 𝑁(0,1), Quando 𝑛 → ∞
𝜎ǀ√𝑛
Contacto: [email protected]
20
𝑋̅ − 3 4−3
ℙ(𝑋̅ ≤ 4) = ℙ( ≤ ≈ ℙ(𝑍 ≤ 2,36) = 0,99,09
√9 ̸50 √9 ̸50
̂)
O caso da proporção amostral (𝐩
Contacto: [email protected]
21
𝑋1 + 𝑋2 +, … , 𝑋𝑛 1, 𝑠𝑢𝑐𝑒𝑠𝑠𝑜
𝑝̇ = = 𝑋̅, 𝑋𝑖 = {
𝑛 0, 𝑓𝑟𝑎𝑐𝑎𝑠𝑠𝑜
Pelo TLC
𝑋̅ − 𝐸(𝑋̅) 𝑋̅ − 𝑝 𝑝̇ − 𝑝
= = ≈ 𝑁(0,1)
𝑉𝑎𝑟(𝑋̅) √𝑝(1 − 𝑃) ̸𝑛 √𝑝(1 − 𝑝) ̸𝑛
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟐:
A proporção de peças fora de especificação num lote é de 0,4. Numa amostra de tamanho
30, calcule a probabilidade de que a proporção de peças defeituosas seja menor do que 0,5.
Seja p̂: a proporção de pecas defeituosas na amostra (proporção amostral). Então, como
consequência do teorema do limite central, temos que:
𝑝̇ −𝑝 𝑝̇
= ≈ 𝑁(0,1), quando n→ ∞
√𝑉𝑎𝑟(𝑝̇ ) √𝑝(1−𝑝) ̸𝑛
0,40(0,6)
𝑝̇ ~𝑁 (0,40, ), assim,
30
𝑝̇ −0,4 0,5−0,4
P(𝑝̇ < 0,5)= 𝑃( < ) ≈ 𝑃(𝑍 ≤ 1,12) = 0,8686
√0,40(0,6) √0,40(0,6)
30 30
Teorema de Moivre-Laplace:
𝑆𝑛 𝑋1 +𝑋2 +⋯+𝑋𝑛
Considere-se 𝑋̅ = = . Para valores grandes de n tem-se que:
𝑛 𝑛
𝑋̅ − 𝐸[𝑋̅] 𝑋̅
= 𝜎 ~̇𝑁(0,1)
√𝑉𝑎𝑟[𝑋̅]
√𝑛
Contacto: [email protected]
22
𝑬𝒙𝒆𝒎𝒑𝒍𝒐𝟑:
Alguns casais preferem ter filhos do sexo feminino, porque as mães são portadoras de um
distúrbio recessivo que é herdado por 50 % dos filhos, mas por nenhuma das filhas. O
método Ericsson se selecção de sexo tem uma taxa admitida de 75% de sucesso. Suponha
que 100 casais utilizam o método Ericsson com o resultado de que, dentre 100 recém
nascido, há 75 meninas.
a) Supondo que o método Ericsson não produza efeito e admitindo que menino e menina
sejam igualmente prováveis, determine a média e o desvio padrão do número de meninas
num grupo de 100 crianças.
Resolução:
X- número de meninas em 100 nascimentos. Supondo que o método não produza efeito e
que as meninas e meninos sejam igualmente prováveis, tendo n = 100; p = 0,5 q = 0,5⇒μ
= np = 50 σ = √𝑛𝑝𝑞 = 5
Resposta: Para grupos de 100 casais com um filho cada, o número médio de meninas é 50
com um desvio de 5.
b) Interprete os resultados de a) para determinar se o resultado de 75 meninas em 100
bebés confirma a alegação de eficiência do método.
Resolução:
mínimo ≈ 𝑋 − 2σ = 50 − 2 × 5 = 40 máximo ≈ 𝑋 + 2σ = 50 + 2× 5 = 60 . Neste caso os
resultados típicos estão entre 40 e 60.
Resposta: 75 meninas não parece um resultado devido unicamente ao acaso ou
𝑥−µ 75−50
𝑧= = = 5 , logo o resultado de 75 meninas não é usual. Pode-se concluir que o
𝜎 5
Contacto: [email protected]
23
Hospital A Hospital B
25 28 63 70 42 33 46 79 85 15 18 43 92 74 73 61 63 84
14 89 98 56 75 28 56 48 91 75 76 94 82 76 84 83 91 87
85 76 42 81 93 45 41 86 98 87 79 78 96 94 92 83 84 54
78 95 84 20 53 40 80 60 70 56 58 59 52 57 53 55 84 61
75 43 51 61 81 72 94 83 54 60 63 68 69 62 67 64 85 71
86 75 43 61 68 59 72 47 41 73 74 77 76 84 79 81 80 82
78 45 76 84 73 51 48 92 85 91 90 80 70 75 76 84 73 94
76 87 92 43 57 86 75 84 91 84 71 84 71 24 28 27 39 37
73 84 91 42 86 75 10 14 11 29 34 81 46 48 47 45 41 90
Hospital
A B
𝑁 81 81
∑ 𝑋𝑖 5228 5527
𝜇 64,54 390,48
𝜎2 534,65 68,23
𝜎 23,12 19,76
a) Retire das duas populações amostras aleatórias de tamanho 14, usando a tabela de
números aleatórios.
Resolução:
Hospital A: 92; 45; 86; 25; 75; 73; 28; 89; 98; 84; 84; 91; 86; 86.
Hospital B: 84; 92; 28; 15; 47; 75; 84; 76; 94; 70; 34; 81; 73; 84.
Diga qual é o hospital com maior variância em faltas?
Resposta: É o hospital B.
∑(𝑋𝑖 −𝑋̅) 7403,43 ∑(𝑋𝑖 −𝑋̅) 8320,93
𝑆 2 𝐻𝐶𝑀 = 𝑛−1
= 13
= 569,49 𝑆 2 𝑀𝐴𝐶𝐴𝑀𝑂 = 𝑛−1
= 13
= 640,07
Contacto: [email protected]
24
c) Qual é a probabilidade de que uma senhora escolhida ao acaso tenha faltado mais de 61
dias relativamente aos dados do B
Resolução:
61 − 𝜇
𝑃(𝑋 > 6) = 𝑃 (𝑍 > ) = 𝑃(𝑍 > −0,366) = 0(0,366) = 0,6428
𝜎
d) Qual é a probabilidade de que o número de faltas esteja ente 25 e 50 para uma doente
do Hospital A
Resposta
25 − 64,54 50 − 64,54
𝑃(25 < 𝑋 < 50) = 𝑃 ( <𝑍< ) = 𝑃(−1,71 < 𝑍 < −0,629)
23,12 23,12
= 0(−0,629) − 0(−1,71) = 0(1,71) − 0(0,629) = 0,9564 − 07353
= 0,2211
Exercícios propostos
1. Um fabricante de automóveis defende que o novo modelo que vai ser lançado no
próximo mês gasta aos 100 km, em circuito urbano, em media 9,7 litros com desvio-
padrão de 1 litro. Admita que o consumo segue uma distribuição Normal.
a. Qual a probabilidade de uma amostra aleatória de 20 automóveis o gasto médio ser
superior a 10 litros.
b. Qual devera ser a dimensão da amostra para obter, com pelo menos 90%
probabilidade, um gasto médio inferior a 10 litros.
2. Numa universidade, a altura dos alunos do sexo masculino segue uma distribuição
Normal com media 165cm e desvio-padrão 7,5cm.
a. Qual a probabilidade de, numa amostra aleatória de 10 alunos do sexo masculino,
a altura media amostral:
I. Ser no mínimo 170 cm?
II. Estar entre 150 cm e 160 cm?
3. Num determinado pais a temperatura media em ºC, registada nos meses deverão,
pode/se considerar que segue uma distribuição Normal com media 30 ºC e desvio-
padrão 3º C.
a) Numa amostra aleatória de 28 dias:
Contacto: [email protected]
25
Intervalos de confiança
Suponha que 𝑋1, … , 𝑋𝑛 uma amostra aleatória de tamanho n, de uma população normal
com media 𝜇 (desconhecida) e variância 𝜎 2 (conhecida). Vimos que a media amostral 𝑋̅,
2
tem distribuição normal com media 𝜇 e variancia 𝜎 ⁄𝑛. Isto e
𝑥−𝜇
𝑍= ∩ 𝑁(0, 1)
𝜎
Logo, fixando um nível de confiança (1−∝), pode-se determinar 𝑍∝ de tal forma que:
2
𝜎 𝜎
𝑃 (𝑋̅ − 𝑍∝ < 𝜇 < 𝑋̅ + 𝑍∝ ) = (1−∝)
2 √𝑛 2 √𝑛
Exemplo:
Resolução:
Contacto: [email protected]
26
𝜎 𝜎
𝑃 (𝑋̅ − 𝑍∝ < 𝜇 < 𝑋̅ + 𝑍∝ ) = (1−∝)
2 √𝑛 2 √𝑛
3 3
𝑃 (346 − 1,96 < 𝜇 < 346 + 1,96 ) = 0,95
√20 √20
𝐼𝐶 =]344,69; 347,31[
𝑥̅ − 𝜇
𝑇= ∩ 𝑡(𝑛−1)
𝑆
√𝑛
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡∝ < 𝜇 < 𝑋̅ + 𝑡∝ ) = (1−∝)
2 √𝑛 2 √𝑛
Contacto: [email protected]
27
Exemplo:
Deseja-se avaliar a dureza esperada 𝜇 do aço produzido sob um novo processo de têmpera.
Uma amostra de 10 corpos de prova de aço produziu os seguintes resultados, em HRc:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiança para 𝜇, com nível de confiança de 95%.
Resolução:
10
∑ (𝑥𝑖−𝑋) ̅ 2 𝑆
𝑋̅ = 36,5; 𝑆 = √ 𝑖=1𝑛−1 = 0,7352; = 0,2325
√𝑛
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡∝ < 𝜇 < 𝑋̅ + 𝑡∝ ) = (1−∝)
2 √𝑛 2 √𝑛
𝐼𝐶 =]35,97; 37,03[
(𝑛 − 1)𝑆 2
𝑥2 = ~𝑥 2 𝑛−1
𝜎2
Contacto: [email protected]
28
(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃( <𝜎 < ) = (1−∝)
𝑥 2 𝑠𝑢𝑝 𝑥 2 𝑖𝑛𝑓
Exemplo:
Resolução:
(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃( < 𝜎 < ) = 1−∝
𝑥 2 𝑠𝑢𝑝 𝑥 2 𝑖𝑛𝑓
Contacto: [email protected]
29
𝐼𝐶 =]2,995; 8,047[
Quando n é maior numa amostra de Bernoulli com parâmetro p, então a variável estatística
a usar será:
𝑝̂ − 𝑝
𝑍= ~𝑁(0,1)
√𝑝(1 − 𝑝)
𝑛
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (𝑝̂ − 𝑍∝ √ < 𝑝̂ < 𝑝̂ + 𝑍∝ √ ) = (1−∝)
2 𝑛 2 𝑛
Exemplo:
Um estudo foi feito para determinar a proporção de famílias em uma comunidade que tem
telefone (p). uma amostra de 200 famílias é seleccionada, ao acaso, e 160 afirmam ter
telefone. Que dizer de p com 95% de confiança?
Resolução:
160
Uma estimativa pontual de p é 𝑝̂ = 200 = 0,8 (08%)
Já que 1−∝= 0,95, temos da tabela normal padrão 𝑍0,975 = ±1,96 e a sua curva pode ser
dada por:
Contacto: [email protected]
30
𝑝(1 − 𝑝) 𝑝(1 − 𝑝)
𝑃 (𝑝̂ − 𝑍∝ √ < 𝑝̂ < 𝑝̂ + 𝑍∝ √ ) = (1−∝)
2 𝑛 2 𝑛
𝐼𝐶 =]0,745; 0,855[
Exercícios propostos
Teste de hipótese
No caso particular dos testes de hipótese paramétricos a validação diz apenas respeito aos
parâmetros da população.
Hipótese a testar:
I. Hipótese nula (Ho): (contem sempre uma igualdade) o que se assume como
correcto ate provar o contrário;
Contacto: [email protected]
31
II. Hipótese alternativa (H1): (contem sempre uma desigualdade <, >, ≠).
A hipótese nula Ho representa o status quo, ou seja, a circunstância que esta sendo testada,
e o objectivo dos testes de hipótese é sempre tentar rejeitar a hipótese nula.
Gráfico 16: Tipos de testes. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.
A decisão está sempre associada a um risco de errar. No caso particular dos testes de
hipóteses a tomada de decisão para população é baseada na informação amostra pelo que
se pode cometer erros.
Uma das vantagens dos testes de hipóteses é permitir, controlar ou minimizar o risco as
decisões erradas.
Erro do tipo I: Consiste em rejeitar a hipótese nula, quando ela de facto deveria ser
mantida;
Erro do tipo II: Consiste em aceitar a hipótese nula, quando de facto ela deveria ser
rejeitada.
Contacto: [email protected]
32
Tabela 17: Tipos de erro. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.
Exemplo1:
A eficiência de certa vacina apos um ano é de 25% (isto é, o efeito imunológico se prolonga
por mais de um ano em apenas 25% das pessoas que a tomam). Desenvolve-se uma nova
vacina, mais cara, e deseja-se saber se esta é, de facto, melhor.
Resolução:
Erro tipo I: aprovar a vacina quando, na verdade, ela não tem nenhum efeito superior ao da
vacina em uso.
Erro tipo II: rejeitar a nova vacina quando ela é, de facto, melhor que a vacina em uso.
Nível de significância
Contacto: [email protected]
33
Exemplo3:
Uma máquina automática enche pacotes de café segundo uma distribuição normal com
media 𝜇 e desvio-padrão 20g. a maquina foi regulada para 𝜇 = 500𝑔. De meia em meia
hora tiramos uma amostra de 16 pacotes para verificar se o empacotamento esta sob
controlo, isto é, se 𝜇 = 500𝑔.
Se uma dessas amostras apresenta-se 𝑥 = 492g, você pararia ou não o empacotamento para
verificar se o ajuste da maquina esta correcto?
Resolução:
Passo 1: Indicamos por X o peso de cada pacote, então X é uma normal com media 𝜇 e o
desvio-padrão=20. As hipóteses que nos interessam são:
Hipótese alternativa: H1: 𝜇 ≠ 500g. Teste Bilateral pois uma máquina pode desregular
para mais ou para menos.
Contacto: [email protected]
34
𝑥̅ − 𝜇
𝑍𝑡𝑒𝑠𝑡𝑒 = 𝜎
√𝑛
Ou
𝑥̅ − 𝜇
𝑡𝑡𝑒𝑠𝑡𝑒 =
𝑆
√𝑛
𝑝̂ − 𝑝
𝑍𝑡𝑒𝑠𝑡𝑒 =
√𝑝(1 − 𝑝)
𝑛
𝑥̅
Onde: 𝑛= número de provas; 𝑝 proporção populacional (hipótese nula); 𝑝̂ = 𝑛 (proporção
amostral)
𝑥̅ − 𝜇 492 − 500 −8
𝑍𝑡𝑒𝑠𝑡𝑒 = 𝜎 = = = −1,6
20 5
√𝑛 √16
Gráfico
18 Região critica. Fonte: Apontamentos de introdução a estatística e a probabilidade vol I.
Passo 5: A informação da amostra é que x=492g (o que z=-1,6). Como 𝑥 ∉ região critica,
nossa conclusão será não rejeitar a Ho.
Contacto: [email protected]
35
Exercícios propostos
𝟏𝟑𝟎
∑ 𝒙𝒊 = 𝟏𝟖𝟎 𝒎𝒊𝒏
𝒊=𝟏
Suponha que o tempo de atis conversações segue uma distribuição normal com desvio-
padrão de 1 minuto.
a) Poderá afirmar-se (∝= 0,05) que o ganho médio em peso das crianças do sexo
masculino é significativamente:
i. Diferente de 3,1 kg;
ii. Superior a 3,1 kg;
iii. Inferior a 3,1 kg.
3. Um exame de leitura numa escola primária do primeiro grau revelou uns media de
75 para as 25 meninas e 72 para os 28 meninos. Os desvios-padrão foram
respectivamente 8 e 6. Teste ao nível de significância de 1% de que as meninas são
melhores em leitura do que os homens supor distribuição normal.
Contacto: [email protected]
36
Conclusão
Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma
linha. O coeficiente de correlação linear pode ser apresentado como uma medida de
correlação, pois tem como objectivo indicar o nível de intensidade que ocorre na correlação
entre as variáveis. O coeficiente de correlação linear pode ser positivo ou negativo.
Se a distribuição da população é normal com desvio-padrão populacional desconhecido
então usa-se a função z padronizada para obter o seu intervalo de confiança.
Contacto: [email protected]
37
Bibliografia
CRESPO, António Arnot; Estatística Facial; 18ª edição. Saraiva, editora; Brazil. 2002.
Contacto: [email protected]