Teste de Hipóteses

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 22

Teste de Hipteses

Nesta aula estudaremos outro aspecto de inferncia estatstica: o Teste de Hipteses.


Objetivo: Decidir se uma conjectura sobre determinada caracterstica de uma ou mais
populaes , ou no, apoiada pela evidncia obtida dos dados amostrais. Tal
conjectura o que se chama hiptese estatstica, e a regra usada para decidir se ela
verdadeira ou no o teste de hiptese.
Exemplo: Com base na produtividade de uma hortalia cultivada em uma rea onde
foi usado um novo fertilizante, e em outra rea onde se utiliza o fertilizante padro,
temos de decidir se o novo fertilizante , ou no, melhor. A dificuldade aqui e da a
necessidade de mtodos estatsticos que a produtividade varia de planta para
planta.
Os testes de hipteses permitem-nos tomar decises em presena da variabilidade,
ou seja, verificar se estamos diante de uma diferena real (significativa) ou de uma
diferena devida simplesmente flutuao aleatria ao processo.
Hiptese estatstica: Uma hiptese estatstica, que denotaremos por H, qualquer
afirmao sobre a populao em estudo.
Na formulao de um teste de hipteses, duas hipteses so definidas. A hiptese de
investigao, Ha, denominada hiptese alternativa e a hiptese nula, H0, que consiste
na negao de Ha. Ento, o teste de hipteses consiste numa regra de deciso entre
H0 e Ha. Nesta regra de deciso so utilizadas as informaes obtidas na amostra.

Exemplos:
1) Um pesquisador deseja estudar o efeito de certa substncia no tempo de reao de
seres vivos a um certo tipo de estmulo. Um experimento desenvolvido com cobaias
que so inoculadas com a substncia e submetidas a um estmulo eltrico, com seus
tempos de reao (em segundos) anotados. Admite-se que o tempo de reao segue,
em geral, o modelo N(8 seg; 2 seg). O pesquisador desconfia, entretanto, que o
tempo mdio sofre alterao por influncia da substncia.
Neste caso, as hipteses de interesse so:
H0: as cobaias apresentam tempo de reao padro
Ha: as cobaias apresentam tempo de reao alterado
Em termos estatsticos, tais hipteses envolvem o parmetro e podem ser escritas
como
H0: = 8,0 seg
Ha: 8,0 seg
2) Suponha que entre pessoas sadias a concentrao de certa substncia no sangue
se comporta segundo um modelo Normal com mdia 14 unidades/ml e desvio padro
6 unidades/ml. Pessoas sofrendo de uma doena especfica tm a concentrao
mdia da substncia alterada para 18 unidades/ml. Admitimos que o modelo Normal,
com desvio padro 6 unidades/ml, contnua representando de forma adequada a
concentrao da substncia em pessoas com a doena.

A figura a seguir ilustra a situao descrita.


Sadio

Doente

Note que as curvas, representando as concentraes, se cruzaram, fazendo com que


uma certa proporo de indivduos na populao sadia possa apresentar valores de
concentrao to altos quanto aqueles observados para pessoas doentes, ainda que
este evento ocorra com baixa probabilidade.
Desejamos verificar se um certo tratamento, proposto para combater a doena,
eficaz.
Uma amostra aleatria de tamanho n selecionada entre os indivduos doentes que
foram submetidos ao tratamento.
Representamos as concentraes dos indivduos da amostra por X1, ..., Xn.
Xi ~N( , 6), para i = 1, ..., n, sendo = 14 ou = 18 dependendo do tratamento ser
eficiente ou no.

Caso a amostra de n indivduos fornea valor mdio de concentrao alto e prximo


de 18, teremos evidncias de que o tratamento no eficaz, ao passo que um valor
baixo e prximo de 14 unidades/ml nos revelaria crer que o tratamento apresenta
resultados satisfatrios. Isto , se o tratamento for eficaz, ento os n indivduos
podem ser vistos como sendo da populao com concentrao modelada por uma
N(14; 6), caso contrrio, eles pertencero populao N(18; 6).
Neste caso, as hipteses de interesse so:
H0: o tratamento no eficaz
Ha: o tratamento eficaz
No caso do tratamento ser eficaz, razovel assumirmos que ele foi capaz de fazer
com que os indivduos da amostra mudassem para uma populao cuja mdia
inferior a 18 unidades/ml, caso contrrio, se o tratamento ineficaz, no se alteraria.
Assim, as hipteses de interesse seriam:
H0: = 18 versus Ha: < 18
A caracterizao do que significa ser prximo depende, entre outros fatores, da
variabilidade da concentrao na populao.
Como a amostra de n indivduos aleatria, precisaremos estudar probabilisticamente
o problema, o que ser feito, mais a frente, atravs da tcnica estatstica denominada
teste de hipteses para a mdia com varincia conhecida.

Por convenincia tcnica, sempre, deixamos a igualdade na hiptese nula.


Queremos decidir entre H0 e Ha.
Em todo processo de deciso existe a chance de uma deciso errada. Neste processo
de deciso dois tipos de erro so possveis, como mostra o quadrado seguinte.
Erros possveis associados a teste de hipteses
Situao Real
Deciso
Rejeitar H0
No rejeitar H0

H0 verdadeira

H0 falsa

deciso incorreta
(Erro tipo I)

deciso correta

deciso correta

deciso incorreta
(Erro tipo II)

Podemos rejeitar H0 quando H0 verdadeira, que consiste no erro tipo I e podemos


no rejeitar H0 quando H0 falsa, que consiste no erro tipo II.
No exemplo anterior, estes dois erros so:
Erro tipo I: concluir que o tratamento eficaz quando na verdade ele no concluir
que <18 quando na verdade = 18.
Erro tipo II: concluir que o tratamento no eficaz quando na verdade ele
concluir que = 18 quando na verdade < 18.

As probabilidades do erro tipo I e do erro tipo II serem cometidos so,


respectivamente:
= P(erro tipo I) = P(rejeitar H0 | H0 verdadeira) = nvel de significncia do teste
= P(erro tipo II) = P(no rejeitar H0 | H0 falsa)
Os dois tipos de erro so indesejveis.
Para um tamanho de amostra fixo, isto , coletados os dados, no possvel controlar
os dois erros simultaneamente.
Nos testes que iremos apresentar, o erro tipo I considerado mais grave e vamos
controlar este erro.
O erro tipo II pode ser controlado no planejamento do estudo, determinando um
tamanho de amostra adequado.
Ento, queremos encontrar uma regra de deciso entre H0 e Ha tal que o erro tipo I
seja controlado.
Vamos controlar este erro pr-fixando a probabilidade de sua ocorrncia em um valor
pequeno.
O valor de estabelecido pelo pesquisador. usual trabalhar com valores de
menores ou iguais a 5%, sendo que o mais comum o de 5% ( = 0,05).

A capacidade de um teste identificar diferenas que realmente existem, ou seja, de


rejeitar H0 quando realmente falsa, denominada poder do teste e definida
como 1 . Poder do teste = P(rejeitar H0 | H0 falsa) = 1 .
Etapas para Testar uma Hiptese Estatstica
1. Definir a hiptese nula H0 e a hiptese alternativa Ha.
2. Escolher a estatstica de teste adequada.
3. Escolher o nvel de significncia e estabelecer a regio crtica.
4. Calcular o valor da estatstica de teste com base em uma amostra de tamanho n
extrada da populao.
5. Rejeitar H0 se o valor calculado da estatstica est na regio crtica. No rejeitar H0
em caso contrrio.
Uma forma alternativa de testar uma hiptese estatstica atualmente mais usada
atravs da probabilidade de significncia ou p-valor.
O p-valor nos fornece a probabilidade, calculada supondo H0 verdadeira, de que
ocorram valores to ou mais extremos que o observado para a estatstica de teste.
Se p-valor for menor do que o limite tolervel, a, para a probabilidade do erro tipo I,
decide-se por rejeitar H0. Ou seja, se p-valor < rejeitar Ho.

1.Teste de Hipteses para uma mdia populacional


1.1 - Populao Normal, conhecido
Populao X ~ N (

Estatstica de teste:

sob Ho verdadeira Z ~ N (0 ; 1)

Teste unilateral esquerdo:


H0 : 0

ou

H0:

Ha : < 0

ou

Ha : < 0

p-valor: p = P(Z < Zobs) , rejeita-se H0 se p <


Teste unilateral direito:
H0 : = 0
ou
H0: 0
Ha : > 0
ou
Ha : > 0

Regio crtica: RC:. Zobs < -z

-z
RC

Regio crtica: RC:. Zobs > za

p-valor: p = P(Z > Zobs) , rejeita-se H0 se p <

RC

Teste bilateral:

Regio crtica: RC:. Zobs < -z ou Zobs > z

H0 : = 0
Ha : 0

p-valor: p = 2P(Z > | Zobs| ) , rejeita-se H0 se p <

RC
RC
Exemplo: Suspeita-se de que um medicamento vasodilatador (Nifedipina) para
hipertenso arterial, amplamente receitado, esteja aumentando a freqncia cardaca
dos pacientes. sabido que a freqncia cardaca na populao de pacientes com
hipertenso arterial tem distribuio normal com mdia 69,8 bat/min e desvio-padro
de 1,86 bat/min. Para verificar essa suspeita colheu-se uma amostra aleatria de 50
pacientes que recebem Nifedipina e mediu-se a freqncia cardaca de cada um,
obtendo-se os seguintes resultados:
71,47
67,95
68,89
71,44
70,59

71,67
68,84
69,45
69,21
72,46

68,26
72,45
73,18
71,54
72,13

69,19
72,44
72,89
71,29
70,88

72,53
70,54
71,02
72,15
72,11

70,85
70,70
69,89
69,99
72,66

71,64
74,47
68,29
67,10
71,21

67,93
68,38
71,00
68,56
70,02

73,52
71,38
70,69
67,65
69,40

67,22
69,70
69,95
72,17
70,55

Por analogia a estudos anteriores, o desvio padro da freqncia cardaca de


pacientes que fazem uso do vasodilatador pode ser considerado igual ao dos
pacientes que no fazem uso do medicamento.

Deseja-se testar se a freqncia cardaca de pacientes com hipertenso arterial que


fazem uso do vasodilatador superior freqncia cardaca de pacientes normais.
Isto , queremos testar se: H0 : = 69,8 versus Ha : > 69,8 (teste unilateral
direito).
50

Temos que: = 1,86, n = 50 e X


i 1

xi
70,590
n

Como os dados so de uma distribuio normal com s conhecido usamos a


estatstica de teste Z.

X
70,590 69,80
Z obs
3,00

1,86
n
50

RC

Como Zobs > 1,64, conclui-se que existem evidncias amostrais para se rejeitar Ho
ao nvel de significncia = 5%.
Logo, h evidncias de que a freqncia cardaca mdia de pacientes que tomam o
remdio maior que a dos pacientes que no fazem uso do medicamento, com de
5%.
p-valor = P(Z>3,00) = 0,5 - P(0<Z<3,00) = 0,5 - 0,4987 = 0,0013
0,0013 < 0,05 rejeita-se H0

1.2 - Populao Normal, desconhecido


Se o desvio padro desconhecido, ele precisa ser estimado. Supondo que a
amostra aleatria seja de uma populao X ~ N ( utilizamos o melhor
estimador que conhecemos para 2 que, como visto, dado por

S2

n 1

n 1

Estatstica de teste:

X
s
n

A varivel padronizada T segue uma distribuio t-Student com n-1 graus de


liberdade.

Teste unilateral esquerdo:


H0 : 0

ou

H0:

Ha : < 0

ou

Ha : < 0

Regio crtica: RC:. Tobs < -tn1,

-tn-1,

p-valor: p = P(T < Tobs) , rejeita-se H0 se p <

RC

Teste unilateral direito:


H0 : = 0
ou
H0: 0
Ha : > 0
ou
Ha : > 0

Regio crtica: RC:. Tobs > tn-1,

p-valor: p = P(T > Tobs) , rejeita-se H0 se p <

tn-1,
RC

Teste bilateral:

Regio crtica: RC:. Tobs < -tn-1, ou Tobs > tn-1,

H0 : = 0
Ha : 0
p-valor: p = 2P(T > | Tobs | ) , rejeita-se H0 se p <

-tn-1,

RC

tn-1,
RC

Exemplo: Deseja-se investigar se uma molstia que ataca o rim altera o consumo de
oxignio desse rgo. Para indivduos sadios, admite-se que esse consumo tem
distribuio Normal com mdia 12 cm3/min. Os valores medidos em 16 pacientes com
a molstia foram: 14,4; 12,9; 15,0; 13,7; 13,5; 14,6; 13,0; 13,7; 14,5; 14,8; 13,9; 14,0;
14,3; 15,0; 13,3 e 12,9. Qual seria concluso, ao nvel de 1% de significncia?
O teste de interesse :
H0 : A molstia no altera a mdia de consumo renal de oxignio
Ha : Indivduos portadores da molstia tm mdia de consumo renal de oxignio
alterada
Isto ,
H0 : = 12

versus

Ha : 12.

Sendo 2 desconhecido usaremos o estimador S2.

S2

n 1

n 1

Assumindo que a amostra de 16 pacientes de uma populao N( ; ), usaremos a


estatstica de teste T.

xi
X
S

i 1

14,4 12,9 15,0 ... 12,9


13,969
16

xi x 2 0,723
n 1

Estatstica de teste:

Tobs

X
s
n

13,969 12
10,893
0,723 16

RC.: Tobs < -tn-1, ou Tobs > tn-1,


Para = 0,01 e = n-1 = 16 - 1 =15 graus de liberdade t15, 0,005 = 2,947 (valor
encontrado na tabela da distribuio t.
RC.: Tobs < -2,947 ou Tobs > 2,947
Portanto, como Tobs pertence RC, decidimos pela
rejeio da hiptese nula, ou seja, a molstia tem
influncia no consumo mdio de

oxignio ao nvel de significncia de 1%.


-2,947

RC

2,947

RC

1.3 - Populao no segue uma distribuio Normal, grandes amostras

Pelo Teorema Central do Limite: X N ;

O que nos permitir usar a estatstica de teste: Z

Teste unilateral esquerdo:


H0 : = 0
ou
H0: 0
Ha : < 0
ou
Ha : < 0
p-valor: p = P(Z < Zobs) , rejeita-se H0 se p <

X
s
n

Regio crtica: RC:. Zobs < -z

RC

-Z

____________________________________________________________________
Teste unilateral direito:
Regio crtica: RC:. Zobs > z
H0 : = 0
ou
H0 : 0
Ha : > 0
ou
Ha : > 0

p-valor: p = P(Z > Zobs) , rejeita-se H0 se p <

RC

Teste bilateral:

Regio crtica: RC:. Zobs < -z ou Zobs > z

H0 : = 0
Ha : 0

p-valor: p = 2P(Z > | Zobs | ) , rejeita-se H0 se p <

-z
RC

z
RC

Exemplo: Um laboratrio farmacutico introduz no mercado um novo comprimido


contra dor de cabea, retirando de circulao o antigo, com a justificativa de que o
novo produto tem ao mais rpida. O remdio que estava no mercado tem um tempo
mdio de 37 minutos para o incio do efeito. Em uma amostra de 34 pessoas que
tomaram o novo comprimido, obteve-se um tempo mdio de 36 minutos, com desvio
padro de 4 minutos. Ao nvel de significncia de 5% podemos afirmar que o novo
comprimido tem ao mais rpida?
Soluo:
H0 : = 37 (o novo comprimido no melhor que o antigo)
Ha : < 37 ( o novo comprimido tem ao mais rpida que o antigo)
Estamos diante de uma situao em que no conhecemos a distribuio, mas o
tamanho da amostra, n = 34, pode ser considerada grande. Devemos, pois, usar o
Teorema Central do Limite.

Estatstica de teste: Z

X
s
n

Z obs

36 37
1,46
4
34

Pela tabela da distribuio Normal, z0,05 = -1,64. Ento, a RC dada por: Z < -1,64.
O valor de Z calculado, Zobs, com base na amostra no est na regio
de rejeio, RC. Logo, no rejeitamos H0 e conclumos que o tempo
mdio de ao do novo comprimido no inferior ao tempo
mdio de ao do comprimido que estava no mercado,
ao nvel = 0,05.
RC

Utilizando o p valor, teramos: p = P(Z < -1,46) = 0,5 - 0,4279 = 0,00721. Como p >
0,05, no rejeitamos H0.

2.Teste de Hipteses para uma proporo populacional, grandes amostras

p(1 p )
Z
p N p;

Estatstica de teste: Z

p p
N (0;1)
p (1 p)
n

p p0
p(1 p0 )
n

Teste unilateral esquerdo:


H0 : p = p0

ou

H0: p p0

Ha : p < p0

ou

Ha : p < p0

p-valor: p = P(Z < Zobs) , rejeita-se H0 se p <

Regio crtica: RC:. Zobs < -za

Teste unilateral direito:

Regio crtica: RC:. Zobs > za

H0 : p = p0

ou

H0: p p0

Ha : p > p0

ou

Ha : p > p0

p-valor: p = P(Z > Zobs) , rejeita-se H0 se p <

Teste bilateral:

Regio crtica: RC:. Zobs < -z ou Zobs > z

H0 : p = p0
Ha : p p0
p-valor: p = 2P(Z > | Zobs| ) , rejeita-se H0 se p <

Exemplo: Um modelo gentico sugere que 80% das plantas oriundas do cruzamento de
dois tipos de sementes sero da variedade an. Aps observar o crescimento de 200
destas plantas, constatou-se que 144 eram ans. Os dados contradizem o modelo
gentico?
Soluo:
Sejam p a proporo de plantas da variedade an e p0 a proporo sugerida pelo
modelo gentico. As hiptese so:
H0: p = p0

isto H0: p = 0,80

Ha : p p0 isto Ha: p 0,80


Estatstica de teste: Z obs

RC.: Zobs < - Z

0,72 0,80

0,80.0, 20
200
ou Zobs > Z

144
0,72
200

2,83

Para = 0,05, temos, pela tabela, Z = 1,96 RC.: Zobs < -1,96 ou Zobs > 1,96.
Como Zobs < -1,96, ao nvel de significncia de 5% rejeitamos a hiptese nula, ou seja,
os dados contradizem o modelo gentico.
p-valor = 2P(Z<-2,83) = 2.(0,5 0,4977) = 2.0,0023) = 0,0046
Como p-valor < 0,05, rejeita-se H0 ao nvel de significncia de 5%

Você também pode gostar