Teste Hipotes

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 54

Teste de Hipóteses

Silvia Regina

Universidade Federal da Bahia


Instituto de Matemática
Departamento de Estatística

2023.2
Inferência Estatística

Objetivo: fazer armações sobre características de uma população,


com base nos dados de uma amostra. Existem dois problemas básicos
nesse processo:

▶ Estimação;

▶ Teste de hipóteses.

A teoria da estimação visa identicar quais as estatísticas indicadas


para se fazer estimativas para alguns parâmetros populacionais.

O teste de hipóteses visa decidir se determinada armação sobre um


parâmetro populacional é, ou não, apoiada pela evidência obtida de
dados amostrais.
Teste de Hipóteses

Em geral, experimentos são realizados com o objetivo de tomar de-


cisões sobre uma população ou um processo.

E as decisões serão tomadas com base em dados coletados do exper-


imento (dados amostrais).

Baseados em experiências anteriores, em teoria cientíca ou na própria


intuição estabelece-se uma hipótese, a qual será submetida a um teste.

Obs.: Antes de iniciar o experimento deve-se denir, de forma bem


clara, as questões objeto do experimento.
Conceito

A teoria de Inferência Estatística fornece procedimentos sistemáticos


para testar se uma suposição (opinião com fundamento incerto) sobre
determinada característica de uma ou mais populações é apoiada ou
não pela evidência obtida com os dados amostrais.

Suposição ⇒ hipótese estatística

Regra de decisão ⇒ teste de hipóteses


Alguns exemplos

Testar a hipótese da média do crescimento da renda familiar em


uma região ter sido diferente de zero.

Testar a armação de um fabricante de lâmpadas que alega que


seus produtos duram em média 400 horas.

Novo método de fabricação de lâmpadas aumentará o tempo


de vida das lâmpadas.

Testar se o faturamento médio de todas as empresas do setor


metal-mecânico localizadas na Bahia neste ano será superior a
R$200 milhões.

Determinar qual de dois tratamentos é mais eciente (problema


de duas amostras).
Noções de testes de hipóteses

Objetivo:
Testar o novo processo de fabricação.

Informação anterior:
Tempo de vida médio das lâmpadas fabricadas pelo processo
padrão é de 1.400 horas.

Pergunta:
O tempo de vida médio das lâmpadas fabricadas pelo novo
processo é maior que 1.400 horas?

Estabelecer as hipóteses:
- o novo processo não é melhor que o padrão;
- o novo processo é melhor que o padrão.
Em geral devemos decidir entre duas hipóteses complementares. De-
nominaremos essas hipóteses de

H0 → Hipótese nula

H1 → Hipótese alternativa

No exemplo das lâmpadas se µ representa a média do tempo de vida das


lâmpadas fabricadas pelo novo processo, então,

H0 : µ ≤ 1.400 (ou µ = 1.400)


H1 : µ > 1.400

A decisão de rejeitar H0 é equivalente à opinião  H0 é falsa. A decisão

de aceitar H0 não é equivalente à opinião  H0 é verdadeira. Neste

caso a opinião adequada é a de que os dados não contêm evidência

sucientemente forte contra H0 .


Exemplo: Suponha que um indivíduo está sendo julgado por determi-
nado delito cometido.

Com base em evidências (fatos, depoimentos, etc.), o juri terá que


decidir pela culpa ou inocência do individuo acusado.

As hipóteses estabelecidas pelo juri são:

H0 : O indivíduo é inocente.

H1 : O indivíduo é culpado.

Com base nas evidências apresentados durante o julgamento, o juri


terá que decidir por H0 ou H1 .
Tabela : Tipos de erros cometidos ao ser tomada uma decisão pelo
juri.
Critério de decisão

É preciso estabelecer um critério de decisão para que a hipótese H0 seja


julgada.

O critério de decisão, fundamentado pela Teoria Estatística, é baseado


na ESTATÍSTICA DE TESTE.

De forma bem genérica e intuitiva, a estatística do teste mede a


discrepância entre o que foi observado na amostra e o que seria
esperado se a hipótese nula fosse verdadeira.

Uma grande distância ou discrepância medida pela distribuição de prob-


abilidade é indicação de que H0 não é verdadeira, devendo, portanto ser
rejeitada.
Qualquer que seja a decisão a ser tomada em um teste de hipóteses,
existe a possibilidade de se cometer erros, devido à presença da in-
certeza.
Tabela : Tipos de erros em testes de hipóteses.

Conclusão Situação real (na população)


do teste H0 verdadeira H0 falsa
Não rejeitar H0 Correto Erro tipo II
Rejeitar H0 Erro tipo I Correto

As probabilidades dos tipos de erros serão designadas por:

α = P (Erro tipo I)= P (Rejeitar H0 , sendo H0 verdadeira)


= P (Rejeitar H0 |H0 verdadeira)
β = P (Erro tipo II)= P (Não rejeitar H0 , sendo H0 falsa)
= P (Não rejeitar H0 |H0 falsa)
O valor de α é xado e recebe o nome de nível de signicância do
teste.
Exemplicando os tipos de erros
No caso das lâmpadas,

Erro tipo I → Aprovar o novo processo de fabricação quando na


realidade ele não é superior;

Erro tipo II → Rejeitar o novo processo de fabricação quando é,


de fato, o melhor.

O erro tipo I é mais grave, pois acarretaria em um Investimento


sem retorno para a indústria.

É fundamental que, em cada caso, se saiba qual são os erros pos-


síveis e que se decida a priori qual é o mais sério. Não é possível
controlar ambos os erros ao mesmo tempo. Quando diminuímos
muito a probabilidade de erro tipo I, aumentamos a probabilidade
do erro tipo II e vice-versa.
Nível de signicância e Poder de Teste

Nível de signicância do teste


α
Valores usuais: 1%, 5%, 10%

Poder do teste (capacidade de


1 −β
detectar que a hipótese nula é falsa)

O procedimento geral para testes de hipóteses é especicar o valor da prob-

abilidade do erro tipo I (α) e, então, planejar um procedimento de teste de

forma a obter uma pequena probabilidade de erro do tipo II (β). O risco β


é geralmente função do tamanho da amostra e é controlado indiretamente.

Quanto maior o tamanho da amostra usada no teste menor o risco β.


Estatística de Teste, Região Crítica e Nível Descritivo (valor de p)

Existem duas opções para expressar a conclusão nal de um teste de


hipótese:

Comparar o valor da estatística de teste com o valor obtido a


partir da distribuição teórica, especíca para o teste e xando um
nível de signicância (Procedimento Clássico);

Quanticar a probabilidade do resultado observado ou resultados


mais extremos, supondo a hipótese nula verdadeira (Valor de p ).
Estatística de Teste

É um valor baseado nos dados amostrais, sendo utilizado para tomar


uma decisão sobre a rejeição da hipótese nula.

No exemplo das lâmpadas suspeita-se que o tempo de vida médio das


lâmpadas fabricadas pelo novo processo seja superior a 1.400 horas.

Ao selecionarmos uma amostra aleatória de 100 lâmpadas, por exem-


plo, pode-se utilizar o valor do tempo de vida médio amostral para
comprovar ou refutar a hipótese nula através de uma regra de de-
cisão, por exemplo:

Rejeita-se H0 se X ≥ 1.800 horas.

Neste caso, estamos utilizando o valor de X como estatística de teste.


Região Crítica e Valor Crítico
Região crítica é o conjunto de todos os valores da estatística de teste
que levam à rejeição da hipótese nula. Enquanto que o valor crítico
ou valores críticos separam a região crítica dos valores que não levam
à rejeição da hipótese nula.

Observação: Os valores críticos dependem da natureza da hipótese nula, da

distribuição amostral principal e do nível de signicância α.


Testes de Hipóteses para a Média (µ)
Passos para a construção de um Teste de Hipóteses para a
Média (µ):

i) Estabelecer a hipótese nula H0 e a hipótese alternativa H1 ;


ii) Identicar a estatística de teste a ser usada (T ou Z ) para testar
as hipóteses formuladas;

iii) Use as observações da amostra para calcular o valor da estatís-


tica de teste;

iv) Construir a região crítica, com base na hipótese alternativa e o


nível α.
v) Se o valor da estatística de teste calculado com os dados da
amostra não estiver dentro da região crítica, não rejeite H0 ;
caso contrário, rejeite H0 .
v) Concluir o teste de hipóteses.
Testes de Hipóteses para a Média

Feita um armação sobre a média µ populacional, desejamos estabe-


lecer um critério para rejeitá-la ou não, com base nos dados de uma
amostra aleatória.

Para Testes de Hipóteses para a média serão considerados os casos


a seguir:
2
População Normal e variância conhecida (σ0 )

População Normal e variância desconhecida (σ0 )


2

População não Normal (grandes amostras)


Testes de hipóteses para a média com variância conhecida (σ )
2

Hipóteses do Tipo Bilateral

Suponha que o interesse seja testar as seguintes hipóteses do tipo


bilateral

H0 : µ = µ0 versus H1 : µ ̸= µ0
Se a hipótese nula é verdadeira, a estatística de teste é dada por:

X − µ0
Z0 = σ , com Z ∼ N (0, 1).
√0
n
Rejeita H0 ao nível de signicância α se

X − µ0
|Z0 | = √ > zα .
σ0 / n 2
2
Testes de hipóteses para a média com variância conhecida (σ )

Teste Bilateral

H 0 : µ = µ0 versus H1 : µ ̸= µ0
Exemplo

Uma indústria adquire de um certo fabricante pinos cuja resistência


média à ruptura é especicada em 60 unidades. Em um determinado
dia a indústria recebeu um grande lote de pinos e a equipe técnica
da indústria deseja vericar se o lote atende às especicações. De
experiências anteriores, sabe-se que a resistência tem distribuição nor-
mal com desvio padrão igual a 2 unidades.

1 Estabeleça as hipóteses estatísticas.

2 Suponha que um tamanho de amostra de 15 pinos apresentou


uma média amostral de 58,73 unidades. Usando um α = 0, 05,
qual a sua conclusão?
Análise Descritiva - Saída do Software RStudio
Teste de hipóteses - Saída do Software RStudio

#Realizar o teste de hipoteses


#Instalar o pacote "BSDA" para usar a funcao z.test ()
install.packages("BSDA")
require(BSDA)

> TesteMediaResistencia= z.test(Resistencia, mu =60, sigma.x= 2,


alternative = c("two.sided"), conf.level = 0.95)
> TesteMediaResistencia

One-sample z-Test

data: Resistencia
z = -2.4658, p-value = 0.01367
alternative hypothesis: true mean is not equal to 60
95 percent confidence interval:
57.71455 59.73879
sample estimates:
mean of x
58.72667
Exemplo

Uma linha de produção opera com um peso médio de preenchimento


de 453g por recipiente. Preencher com um peso maior ou menor
constitui um sério problema e, quando é detectado, exige que o op-
erador interrompa a linha de produção para reajustar o mecanismo
de enchimento. Um inspetor de controle de qualidade seleciona uma
amostra aleatória de 30 itens a cada hora e, nesse momento, toma a
decisão de interromper ou não a linha de produção para fazer o rea-
juste. Suponha que a população de estudo tenha distribuição Normal
com desvio padrão igual a 22,67g.

a) Formule esse problema como um teste de hipóteses.

b) Se a amostra obtida forneceu uma média de 450,8 g. Realize o


teste e apresente qual a conclusão do inspetor, ao nível de
signicância de 10%.
Análise Descritiva - Saída do Software RStudio
Teste de hipóteses - Saída do Software RStudio

#Realizar o teste de hipoteses


#Instalar o pacote "BSDA" para usar a funcao z.test ()
install.packages("BSDA")
require(BSDA)

> TesteMediaPesoProduto= z.test(PesoProduto, mu =453, sigma.x= 22.67,


alternative = c("two.sided"), conf.level = 0.90)
> TesteMediaPesoProduto

One-sample z-Test

data: PesoProduto
z = -0.53717, p-value = 0.5911
alternative hypothesis: true mean is not equal to 453
90 percent confidence interval:
443.9687 457.5846
sample estimates:
mean of x
450.7767
2
Testes de hipóteses para a média com variância conhecida (σ )

1. Teste Unilateral à Direita

H0 : µ = µ0 (ou µ ≤ µ0 ) versus H1 : µ > µ0

Rejeita H0 ao nível de signicância α se

X − µ0
Z0 = √ > zα .
σ0 / n 2
2
Testes de hipóteses para a média com variância conhecida (σ )

1. Teste Unilateral à Direita

H0 : µ = µ0 (ou µ ≤ µ0 ) versus H1 : µ > µ0


2
Testes de hipóteses para a média com variância conhecida (σ )

2. Teste Unilateral à Esquerda

H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0

Rejeita H0 ao nível de signicância α se

X − µ0
Z0 = √ < −z α .
σ0 / n 2
2
Testes de hipóteses para a média com variância conhecida (σ )

2. Teste Unilateral à Esquerda

H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0


Resumo - TH para µ com população normal e variância conhecida (σ 2 )
Estatística de teste

X − µ0
Z0 = √
σ/ n
1 Para o Teste bilateral
H0 : µ = µ0 × H1 : µ ̸= µ0 ⇒ Rejeita H0 : |Z0 | > z α2 .

2 Para o Teste unilateral à esquerda

H0 : µ ≥ µ0 (ou µ = µ0 ) × H1 : µ < µ0
Rejeita H0 : Z0 < −zα
3 Para o Teste unilateral à direita

H0 : µ ≤ µ0 (ou µ = µ0 ) × H1 : µ > µ0
Rejeita H0 : Z 0 > z α
2
Testes de hipóteses para a média com variância desconhecida (σ )

A estatística a ser usada para o teste de hipóteses é dada por:

X − µ0
T0 = ,
S

n

em que T0 tem distribuição t de Student com (n-1) graus de liberdade.


Testes de hipóteses para a média com variância desconhecida (σ )
2

1. Teste Bilateral

H0 : µ = µ0 versus H1 : µ ̸= µ0
Rejeita H0 ao nível de signicância α se

X − µ0
|T0 | = √ > t( α ;n−1) .
S/ n 2
2
Testes de hipóteses para a média com variância desconhecida (σ )

2. Teste Unilateral à Direita

H0 : µ = µ0 (ou µ ≤ µ0 ) versus H1 : µ > µ0

Rejeita H0 ao nível de signicância α se

X − µ0
T0 = √ > t(α;n−1) .
S/ n
3. Teste Unilateral à Esquerda

H0 : µ = µ0 (ou µ ≥ µ0 ) versus H1 : µ < µ0


Rejeita H0 ao nível de signicância α se

X − µ0
T0 = √ < −t(α;n−1) .
S/ n
Resumo - TH para média com população normal e variância desconhecida

Estatística de teste

X − µ0
T0 = √
S/ n
1 Para o Teste bilateral
H0 : µ = µ0 × H1 : µ ̸= µ0 ⇒ Rejeita H0 : |T0 | > t( α ;n−1)
2

2 Para o Teste unilateral à esquerda

H0 : µ ≥ µ0 (ou µ = µ0 ) × H1 : µ < µ0
Rejeita H0 : T0 < −t(α;n−1)
3 Para o Teste unilateral à direita

H0 : µ ≤ µ0 (ou µ = µ0 ) × H1 : µ > µ0
Rejeita H0 : T0 > t(α;n−1)
Exemplo

Um comprador de tijolos suspeita de uma diminuição na resistên-


cia. De experiências anteriores, sabe-se que a resistência média ao
desmoronamento de tais tijolos é igual a 200 kg. Uma amostra de 25
tijolos, escolhidos ao acaso, forneceu uma média de 189,9 kg. A um
nível de signicância de 5%, pode-se armar que a resistência média
ao desmoronamento diminuiu?
Análise Descritiva - Saída do Software RStudio
Teste de hipóteses - Saída do Software RStudio

> #Teste de Normalidade de Shapiro Wilk


> #H0: Os dados sobre as resistência dos tijolos
> #seguem distribuicao normal
> #H1: Os dados sobre as resistência dos tijolos
> #não seguem distribuicao normal

> shapiro.test(Tijolos)

Shapiro-Wilk normality test

data: Tijolos
W = 0.97671, p-value = 0.8133
Teste de hipóteses - Saída do Software RStudio

#Realizar o teste de hipoteses


#Instalar o pacote "DescTools" para usar a funcao TTestA()
install.packages("DescTools")
require(DescTools)

> TesteMediaTijolo=TTestA(mx= mean(Tijolos), sx=sd(Tijolos), nx= 25,


alternative= "less", mu = 200 , conf.level= 0.95)

> TesteMediaTijolo

One Sample t-test

data: x
t = -5.8405, df = 24, p-value = 2.525e-06
alternative hypothesis: true mean is less than 200
95 percent confidence interval:
-Inf 192.8473
sample estimates:
mean of x
189.884
TH para média com população não normal e grandes amostras

A estatística a ser usada para o teste de hipóteses é dada por:

X −µ X −µ
ZX = √ ou ZX = √ e ZX ∼ N(0, 1)
s/ n σ/ n

em que ZX tem distribuição aproximadamente normal com média 0 e


variância 1, supondo que a hipótese nula seja verdadeira.

A distribuição de ZX é devida ao Teorema Central do Limite que


garante que se a amostra for sucientemente grande (n > 30), temos
que

X ∼ N(µ, σ 2 /n).
TH para média com população não normal e grandes amostras
Estatística de teste

X − µ0 X − µ0
Z0 = √ ou Z0 = √
σ/ n S/ n

1 Para o Teste bilateral


H0 : µ = µ0 × H1 : µ ̸= µ0 ⇒ Rejeita H0 : |Z0 | > z α2

2 Para o Teste unilateral à esquerda

H0 : µ ≥ µ0 (ou µ = µ0 ) × H1 : µ < µ0
Rejeita H0 : Z0 < −zα
3 Para o Teste unilateral à direita

H0 : µ ≤ µ0 (ou µ = µ0 ) × H1 : µ > µ0
Rejeita H0 : Z 0 > z α
Exemplo

Um comprador de tijolos suspeita de uma diminuição na resistên-


cia. De experiências anteriores, sabe-se que a resistência média ao
desmoronamento de tais tijolos é igual a 200 kg. Uma amostra de
100 tijolos, escolhidos ao acaso, forneceu uma média de 195,8 kg e
um desvio padarão de 9,6 kg. A um nível de signicância de 5%, pode-
se armar que a resistência média ao desmoronamento diminuiu?
Análise Descritiva - Saída do Software RStudio
Teste de hipóteses - Saída do Software RStudio

> #Realizar o teste de hipoteses


> #Instalar o pacote "BSDA" para usar a funcao z.test ()
> #install.packages("BSDA")
> require(BSDA)
> TesteMediaPesoProduto= z.test(Tijolos2, mu =200, sigma.x= sd(Tijolos2)
> TesteMediaPesoProduto

One-sample z-Test

data: Tijolos2
z = -4.3384, p-value = 7.176e-06
alternative hypothesis: true mean is less than 200
95 percent confidence interval:
NA 197.411
sample estimates:
mean of x
195.83
Testes de Hipóteses para uma Proporção

Vimos anteriormente que de acordo com o Teorema Central do Limite,


para um n sucientemente grande a distribuição amostral da proporção
será aproximadamente Normal. A estatística de teste é dada por:

p̂ − p
Zp̂ = q e Zp̂ ∼ N(0, 1)
p(1−p)
n

Zp̂ segue distribuição aproximadamente Normal com média 0 e var-


iância 1. Na prática, se min{nP0 , n(1 − P0 )} ≥ 5} a aproximação
para a distribuição Normal é considerada satisfatória.
TH para uma proporção
Estatística de teste

p̂ − p0
Z0 = r
p0 · (1 − p0 )
n

1 Para o Teste bilateral


H0 : p = p 0 × H1 : p ̸= p0 ⇒ Rejeita H0 : |Z0 | > z α2

2 Para o Teste unilateral à esquerda

H0 : p ≥ p 0 × H1 : p < p 0 ⇒ Rejeita H0 : Z0 < −zα


3 Para o Teste unilateral à direita

H0 : p ≤ p 0 × H1 : p > p 0 ⇒ Rejeita H0 : Z 0 > z α


Exemplo

Um estudo é realizado para determinar a presença de pequenas anoma-


lias em chapas metálicas de uma certa dimensão. Segundo o fabri-
cante, a proporção de chapas com anomalias é inferior a 25%. Foram
inspecionadas 50 chapas escolhidas ao acaso e sete delas apresentaram
algum tipo de anomalia. Estes dados justicam a armação do fabri-
cante? Adote um nível de signicância igual a 0,05.

a) Identique as hipóteses a serem testadas.

b) Qual a conclusão do teste ao nível de 6% de signicância?


Teste de hipóteses - Saída do Software RStudio
#Realizar o teste de hipoteses
#Instalar o pacote "interpretCI" para usar a funcao propCI()
install.packages("interpretCI")
require(interpretCI)

>TesteProp=propCI(n =50, p =7/50, P=0.25, alpha= 0.05,


alternative="less")$result
> TesteProp
alpha n df p P se critical
1 0.05 50 49 0.14 0.25 0.06123724 1.644854
ME lower upper
1 0.1007263 0.0392737 0.2407263
CI z pvalue
1 0.14 [95CI 0.04; 0.24] -1.796292 0.03622401
alternative
1 less
Nível Descritivo ou P-valor do Teste
Uma outra forma de realizar um teste de hipóteses é através cálculo
da probabilidade de se obter um valor igual ou mais extremo do que
obtido na amostra selecionada, dado que a hipótese nula é verdadeira.
Tal probabilidade é denominada de nível descritivo ou P-valor do Teste.
Caso o P-valor seja pequeno isso evidencia que a hipótese nula é falsa.

Para efeito de ilustração vamos considerar um caso em que o teste


de hipótese é unilateral. Para H0 : µ = µ0 versus H1 : µ < µ0 , a
expressão para o p-valor é dado por:

p − valor = P(X < x obs |H0 é verdadeira)

A regra de decisão baseada no P-valor é válida tanto para os testes


unilaterais quanto para bilaterais.
Exemplo

Utilizando o exemplo das lâmpadas, vamos supor que na amostra de


100 lâmpadas, a média amostral foi de 1.550 horas. Lembre que no
exemplo das lâmpadas utilizamos as hipóteses

H0 : µ = 1.400 contra H1 : µ > 1.400.

Assim, o cálculo do p-valor seria:


p -valor = P X ≥ 1.800 | µ = 1.400 ,

que representa a probabilidade de uma população com média de 1.400


horas gerar uma amostra de tamanho 100 que tenha média igual ou
maior que o resultado observado.
Regra de decisão
Caso o valor de p seja muito pequeno devemos suspeitar da veraci-
dade de H0 . Ou seja, quanto menor o valor de p maior evidência
para se rejeitar H0 .

Procedimento para decisão com base no valor de p


1 Escolhe-se um valor tolerável para a probabilidade de erro
tipo I (α ) - xando-o;

2 Se o valor p for menor ou igual a α, temos forte evidência


para rejeitar H0 , indicando que o resultado é estatisticamente
signicante.
Interpretação gráca - valor p

Observação: Em geral a probabilidade representada pelo valor p


é calculada nos softwares estatísticos. Assim a ideia é comparar
esse valor calculado com a probabilidade de erro tipo I (α) xado
previamente.
Além da conclusão do tipo rejeita/não rejeita, os p -valores dão o grau
de conança ao rejeitarmos uma hipótese nula.

Por exemplo, para α = 5% :

p-valor Interpretação
Elevada signicância estatística ou
Inferior a 0,01
Evidência muito forte contra a hipótese nula (H0 )

Estatisticamente signicante ou
Entre 0,01 a 0,05
Evidência adequada contra a hipótese nula (H0 )

Superior a 0,05 Evidência insuciente contra a hipótese nula (H0 )

Você também pode gostar