Função de Função Geradora e Teste de Aderência

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 25

PROBABILIDADES CONJUNTAS

FUNÇÃO GERADORA E TESTE DE


ADERÊNCIA
Autor(a): Dra. Mariza Akiko Utida

Revisor: Fábio Santiago

Tempo de leitura do conteúdo estimado em 56 minutos.


Introdução
Caro(a) estudante!

Neste material, você irá estudar as funções geradoras e o teste de aderência. Tratam-se de técnicas
muito importante para solucionar problemas complexos de contagem, como a combinação do
sorteio de loteria e a combinação das placas de veículos, por exemplo. Por isso, uma função
geradora serve para interpretar os coeficientes combinatórios e expandir os expoentes em séries.

Neste material, você também irá estudar o teste de aderência, que tem como objetivo avaliar o quão
adequado é um modelo probabilístico para um conjunto de dados observados. E, por fim, você
conhecerá o modelo proposto para aplicar no teste de aderência em exemplos simples, que é o
teste do qui-quadrado associado à tabela da curva de densidade.

Bons estudos!

Função Geradora de
Distribuições de
Probabilidade

A análise combinatória tem como objetivo tratar situações-problema, das mais simples às mais
complexas, e aplicar os modelos probabilísticos e a combinatória em fenômenos naturais, tornando
suas aplicações cada vez mais necessárias no dia a dia. O raciocínio e os métodos estatísticos e
probabilísticos são inquestionavelmente muito utilizados pelas ciências da natureza, assim como
pelas ciências humanas.
A geradora de momento define a
distribuição de probabilidade , sendo esta
definida por uma soma de variáveis
aleatórias independentes , como o produto
das funções de cada elemento da soma. A
determinação da função geradora de
momentos requer que eles sejam finitos
em uma vizinhança de zero.

Introdução das Funções Geradoras


Neste tópico, será apresentada uma introdução sobre as funções geradoras , seu estudo e suas
definições e aplicações em problemas de contagem. Para tanto, resolveremos alguns exemplos,
para facilitar a compreensão sobre o conteúdo proposto.

Um prerrequisito para facilitar o estudo de alguns exemplos da função geradora é revisar alguns dos
principais resultados para séries de potência . Nesse sentido, considere a variável x e os
coeficientes a0 , a1 , a2 , … , an a qualquer série determinada por:
, ou seja ∑ n=0 an x .
2 n ∞ n
a0 + a1 x + a2 x + … + an x + …


A série geométrica ∑
n=1
an x
n−1
= a + a x + a x
2
+ … é convergente se −1 < x < 1 e

sua soma é ∑ n=1
an x
n−1
=
a

1−x
, |x| < 1 .

Essa definição será necessária neste estudo para calcular os coeficientes e os problemas de
funções geradoras envolvendo a definição da série de potência. No box a seguir, você poderá
conhecer mais sobre desenvolvimento de probabilidade.

SAIBA MAIS

“A ferramenta matemática chamada de função geradora foi amplamente aplicada pelo matemático
norueguês Leonhard Euler, na obra “ Introduction in analysis infinitorum ”. Outros matemáticos importantes
fizeram o uso deste, como N. Bernoulli e S. Laplace. As funções geradoras encontram aplicações no
campo de análise matemática, probabilidade, combinatória, mecânica estatística e teoria da informação
quântica”.
Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :

https://ri.ufs.br/bitstream/riufs/6486/1/JOHN_WILLIAM_SANTOS_MACHADO.pdf

Fonte: Machado (2015, p. 19).

Calcular e Aplicar Modelos de Função Geradora


Segundo Meyer (1984, p. 246, grifos nossos), “a Função Geratriz de Momentos MX (t) da variável
aleatória X é definida para todos os valores de t ∈ R como:

tx
⎧ ∑ e p (x)
⎪ x


⎪ ~
⎪ se X é vaviável aleató ria discreta com funa o de probabilidade p (x)
tX
MX (t) = E (e ) = ⎨ +∞ tx
⎪ ∫ e f (x) dx


−∞



~ ′′
se X é vaviável aleató ria cont í nua com funao de densidade f (x) .

Denomina-se função geratriz de momentos quando todos os momentos de X podem ser obtidos
pelo cálculo sucessivo da derivada de MX (t). A definição da função é independente do tipo de
variável aleatória, mas a maneira de determinar depende se X é discreta ou contínua. A função só
precisa estar definida em uma vizinhança do ponto zero , pois os momentos serão obtidos por meio
de sucessivas diferenciações aplicadas em zero, temos, então, uma proposição sobre
transformação linear a seguir.

Segundo Machado (2015, p. 20), “seja a sequência de números reais dada por

a0 , a1 , a2 , , a serie f (x) = ∑ n=0 an x é denominado de função geradora e os
… , an
n

coeficientes da função geradora nos fornecem a solução de um problema de contagem”.

Um exemplo de função geradora: dada uma equação de números inteiros: x1 + x2 + x3 = 6, seja


x1 ϵ {1, 2} ; x2 ∈ {1, 2, 3} e x3 ∈ {2, 3, 4}. O problema pede que se determine o número de

soluções inteiras.

Solução:

A cada variável xi , associa-se um polinômio p (xi ) , tal que os expoentes representem as


possibilidades dos resultados.

Logo, os polinômios são:

p (x1 ) = x
1
+ x
2
, para x1 ϵ {1, 2}

p (x2 ) = x
1
+ x
2
+ x
3
, para x2 ∈ {1, 2, 3}

p (x3 ) = x
2
+ x
3
+ x
4
, para x3 ∈ {2, 3, 4}

Fazendo o produto das probabilidades, temos:


2 2 3 2 3 4
p (x1 ) . p (x2 ) . p (x3 ) = (x + x ) . (x + x + x ) . (x + x + x ) =

4 5 6 7 8 9 4 2 3 4 5
x + 3x + 5x + 5x + 3x + x = x . (3x + 5x + 5x + 3x + x ),

o coeficiente de termo x6 é o resultado do problema.

Portanto, temos cinco soluções inteiras da equação x1 + x2 + x3 = 6 . Esse método é conhecido


como função geradora, determinado por: f (x) = x . (3x + 5x
4 2
+ 5x
3
+ 3x
4
+ x )
5

(MACHADO, 2015, p. 19).

Outro exemplo para calcular a função geradora: “dada a equação: x + y + z + w = 25, em que
cada variável é no mínimo 3 e no máximo 8. Pede-se para determinar a função geradora para
solução de números inteiros” (MACHADO, 2015, p. 21).

Solução:

Temos:

p (x) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.

p (y) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.

p (z) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.

p (w) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.

4
3 4 5 6 7 8 3 2 3 4 5
p (x) . p (y) . p (z) . p (w) = (x + x + x + x + x + x ) = [x (1 + x + x + x + x + x )]

4
12 2 3 4 5
x (1 + x + x + x + x + x ) .“

4
Portanto, a função geradora é f (x) = x
12
(1 + x + x
2
+ x
3
+ x
4
+ x )
5
. O conceito de função
geradora de momento é muito importante para a análise de processos estocásticos .

A função geradora de uma soma de variáveis aleatórias independentes é o produto de cada


elemento da soma. São apresentadas, a seguir, as características com seus teoremas e
proposições sobre a função geradora, com suas respectivas demonstrações.

Teorema , segundo Machado, (2015, p. 31), são: “as soluções de números inteiros e não negativos
(inteiros positivos) para a equação x1 + x2 + x3 + … + xn = p , sendo igual a combinação
p
linear definida por Cn+p−1 ”.

Demonstração: fazendo xi = ai − 1 , com ai ≥ 1 e substituindo na equação


x1 + x2 + x3 + … + xn = p . Temos, assim, a cada valor da variável x:

(a1 − 1) + (a2 − 1) + (a3 − 1) + … + (an − 1) = p

Como foram retirados n fatores iguais a 1, escrevemos o número n + p como soma de números 1,
seguindo em 1 + 1 + 1 + … + 1 = n + p , então, temos:

a1 + a2 + a3 + … + an = n + p

Note que, nos fatores (n + p − 1) , há sinais de soma (+), e, como temos n variáveis, temos
(n − 1) espaços para serem escolhidos entre os fatores (n + p − 1) sinais de +. Portanto, o
número de soluções, em inteiros não negativos, da x1 + x2 + x3 + … + xn = p , sendo
p
C
m−1
n+p−1
= C
n+p−1
, pois são combinações complementares .

Para que você possa entender melhor a demonstração do teorema anterior, apresentamos um
exemplo para determinar a solução da equação x1 + x2 + x3 + … + xn = p e associá-la à
combinação linear. Sendo assim, temos um número finito de soluções e devemos restringir os
possíveis valores que as variáveis podem assumir. Veja o exemplo:

Qual o número de soluções inteiras e positivas da equação x1 + x2 + x3 + x4 = 9.


As soluções inteiras e positivas são quadruplas ordenadas e, para encontrarmos o
número de soluções, podemos escrever 9 como soma de nove 1’s, ou seja:
1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 = 9. Como queremos separar 9 em quatro
parcelas inteiras e positivas, basta introduzirmos 3 barras entre os 1’s. conforme o
exemplo: 1 + 1 + 1 + 1 |+1 | + 1 + 1| + 1 + 1, que corresponde a
x1 = 4; x2 = 1; x3 = 2; x4 = 2. Assim, cada maneira que inserir as barras dentre
os 8 sinais de mais (+) teremos o número total de soluções inteiras e positivas é igual ao
número de maneiras de inserir as 3 barras entre os 8 sinais de mais (+), e isto pode ser
feito usando combinação simples . Portanto e o
3 8! 8 . 7 .6 3
c = = = 56 c
8 3!(8−3)! 3 . 2 . 1 8

número de combinações de 8 elementos tomados 3 a 3, ou seja, o número de soluções


inteiras positivas de uma equação linear (TEIXEIRA, 2004, p. 8, grifos nossos).

n n −n
Teorema: o coeficiente de xp na expressão (1 + x + x2 + x
3
+ …) = (
1

1−x
) = (1 − x)

n + p − 1
é igual a ( ) .
p

u ∞ u
Demonstração: sabemos que (1 − x) = ∑
p=0
( )x
p
. Substituindo, nessa expressão, x
p

por −x e u por −n, temos:

−n ∞ −n p ∞ p −n p
(1 − x) = ∑ ( ) (−x) = ∑ (−1) ( ) (x)
p=0 p=0
p p

Utilizando a definição do coeficiente binomial generalizado, o coeficiente de xp é igual a:


p
−n p
(−n)! (−1)
( ) (−1) = =
p (−n − p)! p!

p
(−n) . (−n − 1) . (−n − 2) … (−n − p + 1) . (−n − p) ! (−1)
=
(−n − p)! p!

p
(−n) . (−n − 1) . (−n − 2) … (−n − p + 1) . (−1)
=
p!

p p
(−1) . n (n + 1) . (n + 2) … (n + p − 1) . (−1)
=
p!

2p
(−1) . n (n + 1) . (n + 2) … (n + p − 1)
=
p!

Multiplicando e dividindo a igualdade por (n − 1) !


n . (n + 1) (n + 2) … (n + p − 1) (n − 1) ! (n + p − 1) ! n + p − 1
= = ( )
p ! (n − 1)! p ! (n − 1)! p

Esse valor é o total de formas de selecionarmos p objetos dentre n objetos distintos, em que cada
objeto pode ser tomado até p vezes.

Vamos a mais um exemplo para você compreender melhor:

Maria tem 10 anéis e quer distribuí-los pelos 10 dedos de suas mãos. De quantas maneiras
diferentes ela pode fazer isso? Suponha que é possível colocar todos os anéis em qualquer um
dos dedos (MACHADO, 2015).

Solução: Note que o problema é solucionado quando resolvemos a equação


x 1 + x 2 + x 3 + … + x 10 = 10 , com 0 ≤ x i ≤ 10 . A função geradora do problema é
10
f (x) = (1 + x + x
2
+ x
3
+ … + x
10
) . Calculamos o coeficiente do termo x10 .

n+p−1 n + p − 1
Encontra-se, por meio do teorema anterior: Cp = ( ) , temos:
p

p = 10 e n = 10 (pois temos dez dedos).

19! 19 . 18 . 17 . 16 . 15 . 14 . 13 . 12 . 11 . 10!
10+10−1
c = = = 92378
10
10! (19 − 10)! 10! 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1

Portanto, Maria pode distribuir os 10 anéis de 92378 maneiras diferentes com o uso das
funções geradoras em problemas mais complexos.

Fonte: bee32 / 123RF.

Outro exemplo: de quantas maneiras podemos escolher 12 latas de refrigerante se existem 4


marcas diferentes? Determine a função geradora que controla o número de latas.

Solução:

Nesse problema, não há restrição quanto ao número de latas de uma determinada marca, logo, a
função geradora que controla o número de latas de uma certa marca seria:
1 + 1 + x + x
2
+ x
3
+ … + x
12
.

Mas como são 4 marcas diferentes, então, a equação da função geradora seria:

4
2 3 12
f (x) = (1 + x + x + x + … + x )

Calculamos o coeficiente do termo x10 .

n+p−1 n + p − 1
Encontra-se, por meio do teorema anterior: Cp = ( ) , temos p = 12 e n = 4 .
p

15! 15 . 14 . 13 . 12!
4+12−1
c = = = 455
12
12! (15 − 12)! 12! 3 . 2 . 1
Portanto, podemos escolher as 12 latas de refrigerante de 455 maneiras diferentes e de função
4
geradora f (x) = (1 + x + x
2
+ x
3 12
+ … + x ) .

A função geradora de probabilidade é utilizada apenas para variáveis aleatórias inteiras não
negativas, porém, na verdade, essa é apenas uma reformulação da função geradora de momento.

A função geradora representa um importante método de resolução e estudo de diversas aplicações


das distribuições de probabilidades. A aplicação da função geradora é muito útil no estudo de
somas de variáveis aleatórias independentes e identicamente distribuídas e na obtenção de várias
regras aditivas.

praticar
Vamos Praticar
Utilizando o produto das probabilidades p (a) . p (b) . p (c), determinar a função geradora f (x)
que permite calcular o número de soluções inteiras da equação a + b + c = 6. Para cada
variável, os intervalos são dados por −1 ≤ a ≤ 2, 1 ≤ b ≤ 4 e 1 ≤ c ≤ 4. (MACHADO,
2015, p. 29).

Deve-se simplificar o produto das probabilidades, para determinar a função geradora, e calcular o
número de soluções inteiras da equação a + b + c = 6 .

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Uma bolsa contém 8 moedas no valor de 1 real, 7 moedas no valor de 50 centavos, 4 moedas no
valor de 25 centavos e 3 moedas no valor de 10 centavos. Esse problema pode ser resolvido
usando o princípio da inclusão-exclusão, porém fica mais simples resolvê-lo usando as funções
geradoras.

Definimos:

x1 : Número de moedas de 1 real;


x2 : Número de moedas de 50 centavos;

x3 : Número de moedas de 25 centavos;

x4 : Número de moedas de 10 centavos.

MACHADO, J. W. S. Função geradora : uma ferramenta de contagem. Dissertação (Mestrado


Profissional em Matemática) – Universidade Federal de Sergipe, Sergipe, 2015. Disponível em:
https://ri.ufs.br/bitstream/riufs/6486/1/JOHN_WILLIAM_SANTOS_MACHADO.pdf . Acesso em: 04
jul. 2021.

Pede-se, então, que se determine a função geradora que modela o problema.

a) A função geradora é:
2 3 4 5 6 2 3 4 2 3
f (x) = (1 + x + x + x + x + x + x ) . (1 + x + x + x + x ) . (x + x + x + x

b) A função geradora é:
2
2 3 4 2 3 4 2 3
f (x) = (1 + x + x + x + x ) . (x + x + x + x ) . (1 + x + x + x ).

c) A função geradora é:
2
2 3 4 5 6 2 3 4 2 3
f (x) = (1 + x + x + x + x + x + x ) . (1 + x + x + x + x ) . (1 + x + x + x

e podemos retirar 6 moedas de 70 maneiras diferentes.


d) A função geradora é:
f (x) = (1 + x + x
2 3
+ x + x
4
+ x
5 6
+ x ). (1 + x + x
2
+ x
3 4
+ x ) e podemos
retirar 6 moedas de 60 maneiras diferentes.
e) A função geradora é: f (x) = (1 + x + x + x + x e
2 2 3
2 3 4
) . (1 + x + x + x )

podemos retirar 6 moedas de 74 maneiras diferentes.

Teste de Aderência

Neste tópico, você vai aprender sobre os testes de aderência que são aplicados para testar a
adequabilidade de um modelo probabilístico a um conjunto de dados observados .

Para determinar se a proporção P de sucesso em uma amostra de tamanho n, extraída de uma


população binomial , difere significativamente da proporção da população p de sucessos,
utilizamos a estatística dada por teste de aderência qui-quadrado . Como a decisão será tomada
pela comparação do valor calculado no teste estatístico com o valor crítico da distribuição qui-
quadrado, o procedimento é chamado teste de aderência qui-quadrado.

Tipos de Teste de Aderência


O teste de aderência mais simples é utilizado quando o problema possui um número finito de
categorias, como o tipo sanguíneo humano, por exemplo, assim parte-se para a escolha do
processo de decidir sobre o teste estatístico com o valor crítico da distribuição. Neste tópico, você
irá estudar o teste de aderência e o teste qui-quadrado.

Os testes qui-quadrado para duas situações diferentes serão apresentados nesta


unidade. Na primeira, a hipótese nula define que as probabilidades são os mesmos para
várias populações diferentes. No segundo tipo de situação envolve obter uma amostra a
partir de uma única população e classificar cada indivíduo em relação a dois fatores de
categorias diferentes, como por exemplo: tais como preferência religiosa a filiação ao
partido político (DEVORE, 2011, p. 550, grifos nossos).

Estimação de Parâmetros
Os testes de aderência são aplicados quando as probabilidades das categorias são completamente
especificadas, como um experimento binomial , que consiste em uma sequência de testes
independentes, nos quais cada um pode produzir um de dois possíveis resultados .

Mas antes de definir com mais detalhes o teste de aderência qui-quadrado, iremos discutir um tipo
de distribuição de probabilidade denominada distribuição qui-quadrado.

Segundo Devore (2011, p. 156), a definição da distribuição qui-quadrado é:

[...] seja n um número inteiro positivo, diz-se que uma variável aleatória X possui uma
distribuição qui-quadrado com parâmetro n se a função densidade de probabilidade
denotada por Xn2 for uma distribuição gama com α = 1 /2 e β = n /2 . A função
densidade de probabilidade de uma variável aleatória qui-quadrado será:
(n/2)−1 −x/2

f (x) =
x
n/2
e
para x .
> 0
2 Γ(n/2)

Veja, no elemento a seguir, a definição da função gama:

Fonte: bee32 / 123RF.


“Definição Função Gama: para α > 0 , a função gama Γ(α) é definida por:

Γ(α) = ∫
α−1
x
−x
e dx ”.
0

Fonte: Devore (2011, p. 152).

A distribuição qui-quadrada é importante por ser a base de diversos procedimentos de inferência estatística.
A distribuição qui-quadrado desempenha um papel importante na inferência estatística, em especial, nas situações que
calculam variações e variâncias .

Uma das distribuições de variável aleatória da teoria de probabilidade e estatística mais utilizadas é
a distribuição de variável aleatória de Poisson. Definida por:

[...] uma variável aleatória X que pode assumir qualquer um dos valores 0, 1, 2, … é
chamada de variavel aleatória de Poisson com parâmetro λ se, para algum λ > 0,
−λ k
e .λ
p (k) = P {X = k} = k = 0, 1, 2, …
k!

Logo, a equação da função de probabilidade da variável aleatória de Poisson é:


−λ k k
∞ ∞ e .λ −λ ∞ λ −λ λ
∑ p (k) = ∑ = e ∑ = e e = 1
k=0 k=0 k! k=0 k!

A variável aleatória de Poisson pode ser utilizada como uma aproximação para a variável
aleatória binomial, isto é, por causa da aproximação de Poisson para a distribuição
binomial (ROSS, 2010, p. 181).

Para que você possa compreender melhor, vamos a um exemplo : suponha que uma caixa de banco
atende clientes em um tempo que segue uma distribuição exponencial de valor esperado de 1
minuto. Qual será a probabilidade de a caixa atender 10 clientes em um tempo não superior a 8
minutos?

Solução: temos que a probabilidade P (X ≤ 8) .

E(X) = 1/α = 1 ⇒ α = 1; β = 10; λ = 8

De acordo com a definição da equação de probabilidade da variável aleatória de Poisson, temos:

∞ ∞ −λ k
e .λ
p (k) = ∑ p (k) = ∑
k!
k=0 k=0

P (x ≥ 8) = 1 − P (x < 8) = 1 − {P (x = 0) + P (x = 1) + … + P (x = 7)} = f (x)


−8 k
7
p (8) = 1 − ∑
k=0
e

k!
8
= 0, 2834 .

Portanto, a probabilidade de a caixa atender 10 clientes em um tempo não superior a 8 minutos é de


p (8) = 0, 2834, ou 28,34%.

O problema de testar a aderência das distribuições teóricas a distribuições amostrais é


essencialmente o mesmo de decidir se existem diferenças significativas entre valores da população
e da amostra. Um teste de significância importante para testar a aderência a distribuições teóricas é
o teste qui-quadrado.
REFLITA

A distribuição de probabilidades de Poisson foi introduzida por


Siméon Denis Poisson em um livro que escreveu a respeito da
aplicação da teoria da probabilidade a processos, julgamentos
criminais e similares. O título do livro, publicado em 1837, era “
Recherches sur la probabilité de jugements en matière criminelle et
en matière civile ” (Investigações sobre a probabilidade de
veredictos em matérias criminal e civil).
Fonte: Ross (2010, p. 181).

Teste qui-quadrado
Existem muitas situações em que podemos aplicar testes qui-quadrados mutuamente baseados,
considerando k resultados mutuamente excludentes e exaustivos A1 , A2 , … , Ak , com suas
respectivas probabilidades de ocorrência p1 , p2 , … , pk . Suponha n experimentos independentes
realizados, isto é, denotados por ni o número de experimentos que resultaram em Ai , então, as
variáveis aleatórias n1 , n2 , … , nk .

nk k
, em que ∑ .
n! n1 n2
P (n = p p …p ni = n
1, n2 , …, nk ) 1 2 k i=1
n1 ! n2 !… nk !

Inicialmente, é necessário obter k probabilidades da distribuição teórica, denotadas por


p 10 , p 20 , … , p k0 . Se a distribuição teórica é discreta e finita com k valores, basta calcular

diretamente pi0 = P (X = i) . Se for discreta com infinitos valores, agrupam-se as somas infinitas
de probabilidades de menores valores.

A soma de duas variáveis independentes com distribuição do qui-quadrado com ϕ1 e ϕ2 graus de


liberdade , respectivamente, terá também distribuição do qui-quadrado com ϕ1 + ϕ2 graus de
liberdade, que é chamada de propriedade aditiva do qui-quadrado.

“Dependendo do grau de liberdade, a distribuição do qui-quadrado assume as seguintes


representações gráficas” COSTA (2012, p. 64).

Para compreender melhor o que é o grau de liberdade, observe a imagem a seguir:


Figura 3.1 – Representação gráfica do grau de liberdade da distribuição qui-quadrado
Fonte: Adaptada de Costa (2012, p. 64).

#PraCegoVer : a imagem representa uma distribuição x2 do qui-quadrado constituído de uma família de


curvas (quatro curvas), cada qual caracterizada pelos graus de liberdade de
ϕ = 1, ϕ = 3, ϕ = 6 e ϕ = 10 .

A distribuição do qui-quadrado constitui uma família de curvas , cada qual caracterizada pelos seus
graus de liberdade ϕ.

Os testes de aderência a uma distribuição consistem em uma maneira de tentar verificar


se um dado modelo probabilístico se ajusta aos dados amostrais, através da
comparação entre as frequências amostrais e as frequências teóricas esperadas pelo
modelo probabilístico que se está julgando valido para descrever os dados observados.
Existem testes que servem para testar hipóteses mais gerais sobre a distribuição dos
dados.
Dada uma amostra aleatória de uma variável aleatória X em uma população e um
modelo probabilístico de testes M, o objetivo é testar: Seja o teste de hipótese:
~ ~ ~
H0 : X tem distribuiçao M × H1 : X nao tem distribuiçao M
A metodologia tem como base a construção de uma função com os dados amostrais,
comparando-a com a distribuição teórica de acordo com alguma métrica. Os métodos
variam de acordo com a função amostral construída e a métrica utilizada para
comparação (LOESCH, 2012, p. 154).
REFLITA

O método de estimação dos parâmetros foi uma das grandes


contribuições de Pearson na inferência estatística. Uma
contribuição de K Pearson à inferência estatística foi o uso do x
2

como significância para comprovar o ajustamento das curvas de


frequência. Para isso, Pearson (1900) usou a distribuição do qui-
quadrado.
Entretanto, nas aplicações do teste do qui-quadrado tanto no teste
de aderência das curvas de frequência, como na existência de
associação nas tabelas de contingência, usou o número errado de
graus de liberdade, por não ter percebido corretamente as
restrições impostas e a perda de um grau de liberdade para cada
parâmetro estimado. Assim, é no teste de significância, em uma
tabela 2x2, Pearson usou o teste com 3 graus de liberdade, em vez
de um. Restando, para Yule e Fisher, fazê-la em 1922.
Fonte: Memória (2004, p. 29).

Na tabela a seguir, temos os limites inferiores e superiores para cada variável aleatória, na análise
da curva do método qui-quadrado:
gl
0,995 0,990 0,975 0,950 0,900 0,5 0,100 0,05 0,025 0,01 0,005
n

1 0 0 0,001 0,004 0,016 0,455 2,706 3,841 5,024 6,635 7,879

2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,210 10,597

3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838

4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,860

5 0,412 0,554 0,831 1,145 1,610 4,351 9,236 11,070 12,833 15,086 16,750

6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548

7 0,989 1,239 1,690 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278

8 1,344 1,646 2,180 2,733 3,490 7,344 13,362 15,507 17,535 20,090 21,955

9 1,735 2,088 2,700 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589

10 2,156 2,558 3,247 3,940 4,865 9,342 15,987 18,307 20,483 23,209 25,188

11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,920 24,725 26,757

12 3,074 3,571 4,404 5,226 6,304 11,340 18,549 21,026 23,337 26,217 28,300

13 3,565 4,107 5,009 5,892 7,042 12,340 19,812 22,362 24,736 27,688 29,819

14 4,075 4,660 5,629 6,571 7,790 13,339 21,064 23,685 26,119 29,141 31,319

15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801

Tabela 3.1 – Limites das áreas da curva do método qui-quadrado


Fonte: Adaptada de Devore (2011, p. 657).

#PraCegoVer : a tabela apresenta os valores críticos de cada gráfico para o método qui-
quadrado. Com valores v das variáveis aleatórias entre 1 a 10 elementos na primeira coluna. E
os valores de alfa variando de 0,995 a 0,005, e cada elemento representa o limite máximo da
curva de densidade de cada gráfico do método qui-quadrado, apresentados na primeira linha
tabela. Na segunda linha, temos os valores para o grau de liberdade e os valores de alfa:
(gl = 1; α = 0, 995) = 0 ; (gl = 1; α = 0, 990) = 0 ;

(gl = 1; α = 0, 975) = 0, 001 ; (gl = 1; α = 0, 950) = 0, 004 ;

(gl = 1; α = 0, 900) = 0, 016 ; (gl = 1; α = 0, 5) = 0, 455 ;

(gl = 1; α = 0, 1) = 2, 706 ; (gl = 1; α = 0, 05) = 3, 841 ;

(gl = 1; α = 0, 025) = 5, 024 ; (gl = 1; α = 0, 010) = 6, 635 ;

(gl = 1; α = 0, 005) = 7, 879 .


Na terceira linha tem-se os valores para o grau de liberdade e os valores de alfa:
(gl = 2; α = 0, 995) = 0, 010 ; (gl = 1; α = 0, 990) = 0, 020 ;

(gl = 1; α = 0, 975) = 0, 051 ; (gl = 1; α = 0, 950) = 0, 103 ;

(gl = 1; α = 0, 010) = 0, 211 ; (gl = 1; α = 0, 5) = 1, 386 ;

(gl = 1; α = 0, 1) = 4, 605 ; (gl = 1; α = 0, 05) = 5, 991 ;

(gl = 1; α = 0, 025) = 7, 378 ; (gl = 1; α = 0, 010) = 9, 210 ;

(gl = 1; α = 0, 005) = 10, 597, e assim por diante.

Para facilitar seu entendimento sobre a resolução do teste qui-quadrado, veja, no elemento a seguir,
uma breve descrição antes de resolver o exemplo apresentado na sequência.

Procedimento teste de x²

Fonte: Adaptadade bloomua / 123RF.

#PraCegoVer : o infográfico apresenta uma imagem colorida com uma lupa ao centro e vários gráficos ao
redor da lupa, assim como calculadoras, sinais de matemáticos e sinais de localização. Ao lado direito da
imagem, há cinco botões vermelhos, com numeração de 1 a 5. Ao clicar no botão “1”, é apresentado o
texto: “Enunciar as hipóteses nula (H0 ) agá zero e alternativa (H1 ) agá um”. Ao clicar no botão “2”, é
apresentado o texto: “Fixar nível significância (α ) alfa, utilizar a tabela (x2 ) x elevado ao quadrado”. Ao
clicar no botão “3”, é apresentado o texto: “Determinar o valor crítico de (x2c )x de c elevado ao quadrado,
que define a região de rejeição com o grau de liberdade (gl = (k − 1), ) em que k é o número de
categorias do problema”. Ao clicar no botão “4”, é apresentado o texto: “Determinar as estatísticas, ou
2
k (O i −Ei )
seja, o valor crítico teste: ( x2t = ∑
i=1 Ei
) x de t elevado ao quadrado igual ao somatório de i
igual a 1 até k, do quadrado do valor observado menos o valor esperado, tudo dividido pelo valor esperado.
Ao clicar no botão “5”, é apresentado o texto: “Se ( x2c ≥ x
2
t
) x de c elevado ao quadrado maior ou igual a
x de t elevado ao quadrado, então, rejeita a hipótese ( H0 ) agá zero. Caso contrário, aceita-se a hipótese”.

Segundo Loesch (2012, p. 126), “para teste unilateral, dado um número real μ
0
, o teste verifica se
esse valor pode ser aceito como a média populacional. As hipóteses são:

H0 : μ = μ
0

H1 : μ ≠ μ
0
(bilateral) ou μ < μ
0
(unilateral) ou μ > μ
0
(unilateral)”.

Para detalhar cada caso, consideremos uma amostra independente de variáveis


(x1 , x2 , … , xn ) que provém de uma distribuição X, tal que sob a suposição de H0 verdadeiro
se, após o procedimento do teste de x2 , chegar ao passo 5 e o teste H1 for:

Teste unilateral H1 : μ > μ0 . O teste rejeita a hipótese H0 , a região de rejeição situa-se no lado
direito da curva. A rejeição de H0 pelo critério de comparação ocorre quando z > zα , o que
equivale a p < −α .

Teste unilateral H1 : μ < μ


0
. O teste rejeita a hipótese H0 , a região de rejeição situa-se no lado
esquerdo da curva. A rejeição de H0 pelo critério de comparação ocorre quando z < zα , o que
equivale a p < α .

¯
X −μ 0
Resumindo, o critério, segundo Loesch (2012, p. 128), “calcula-se z =
σ√ n
e, caso:

Teste unilateral H1 : μ > μ


0
. Calcula-se p = P (Z > z) .

Teste unilateral H1 : μ < μ


0
. Calcula-se p = P (Z < z) .

Se p < α , rejeita-se H0 ”.

Agora, para o teste bilateral , H1 : μ ≠ μ


0
. A aceitação de H0 ocorre se a média amostral situa-se
entre dois valores críticos, estabelecendo dois valores críticos de teste.

Vamos ver um exemplo, para que você possa visualizar a aplicação: em uma pesquisa científica
sobre genética, um estatístico analisou os dados do resultado do cruzamento de ervilhas de jardim.
Os alelos dominantes no experimento foram Y : cor amarela e R = formato redondo,
resultando no dominante conjunto Y R, sendo examinados um total de 269 vagens com quatro
sementes resultantes de um cruzamento híbrido. Seja
X = quantidade de Y Rs em uma vagem selecionada aleatoriamente , os valores de X
possíveis são de 0 a 4, que se identifica com as células de 1 a 5, descritas na tabela a seguir. Uma
vagem com x = 4 produz um número observado na célula 5. Acompanhe melhor os dados na
tabela a seguir:
C é lula i 1 2 3 4 5

Ervilha/V agens Y R 0 1 2 3 4

Observada 16 45 100 82 26

Esperada 9,86 50,68 97,75 83,78 26,93

Tabela 3.2 – Número de vagens a serem analisadas


Fonte: Devore (2011, p. 554).

#PraCegoVer : na tabela, são apresentados os dados da ervilha híbrida com as características


da cor amarela e do formato redondo, modificado geneticamente em laboratório. Na primeira
linha, apresenta-se a quantidade de células de 1 a 5 utilizadas para manipulação genética. Na
segunda linha, a numeração de 0 a 4 dos tipos de ervilhas modificados. Na terceira linha, são
indicadas as quantidades de sementes em cada célula observadas no experimento, sendo para
a célula 1 e a ervilha 0 o valor de 16, para a célula 2 e ervilha 1 o valor de 45, para a célula 3 e
ervilha 2 o valor observado de 100, para a célula 4 e ervilha 3 o valor observado de 82 e, por fim,
para a célula 5 e a ervilha 4 o valor observado é de 26. Na quarta e última linha, a quantidade de
semente esperada (desejada ideal) para cada célula, sendo para a célula 1 e a ervilha 0 o valor
esperado de 19,86, para a célula 2 e ervilha 1 o valor esperado de 50,68, para a célula 3 e ervilha
2 o valor esperado é de 97,75, para a célula 4 e ervilha 3 o valor esperado é de 83,78 e, por fim,
para a célula 5 e a ervilha 4 o valor esperado é de 26,93.

Pede-se para determinar o teste de aderência de acordo com a hipótese.

Solução:

1) Enunciar as hipóteses nulas H0 : genótipos individuais dentro de uma vagem e alternativa H1 :


genótipos individuais dentro de uma vagem.

Seja a hipótese X como as sementes de genótipos individuais dentro de uma vagem, sendo uma
distribuição independente com n = 4 e θ =
9

16
.

2) Nesse caso, deseja-se determinar o nível significância α , para as sementes de genótipos


individuais dentro de uma vagem, deve-se, assim, determinar se a região de rejeição situa-se no lado
esquerdo da curva.

3) Determinar as estatísticas, ou seja, o valor crítico do teste:

Logo, o teste de aderência é calculado como:

5 2
(V alor Observado − V alor Esperado)
2
x = ∑
V alor Esperado
i=1
2 2 2 2 2
(16 − 9, 86) (45 − 50, 68) (100 − 97, 75) (82 − 83, 78) (26 − 26, 93)
2
x = + + + + =
9, 86 50, 68 97, 75 83, 78 26, 93

3, 823 + 0, 637 + 0, 052 + 0, 038 + 0, 032 = 4, 523

4) De acordo com o limite superior definido pelo teste de aderência, pelo método qui-quadrado, para
n = 4 , temos que 0, 100 < 4, 523 < 7, 77, logo, H0 não deve ser rejeitada em qualquer nível de
significância, ou seja, para que H0 seja rejeitada, o valor de alfa deve ser menor que 0,100, para os
valores de ∝= 0, 100, ∝= 0, 05, ∝= 0, 025, ∝ 0, 01 e ∝= 0, 005 .

Que tal fixar o conteúdo visto até aqui por meio de uma atividade? Vamos lá?

Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)

Deseja-se fazer a realização do censo demográfico em todos os bairros residenciais de uma


pequena cidade, em um determinado período, tendo por objetivo o recenseamento da população.
Dessa maneira, decidiu-se verificar o desempenho dos recenseadores, a fim de analisar a
qualidade do estudo aplicado, como o nível de satisfação dos entrevistados quanto à pesquisa
(variando de 1 a 5, como 1 péssimo e 5 como ótimo) e dado que o nível de significância é
α = 0, 05. A partir desse trabalho, foram coletados os dados apresentados na tabela a seguir:
1-
Satisfação 2-Ruim 3-Regular 4-Bom 5-Ótimo Total
Péssimo

Observados 9 11 25 20 15 80

Esperados 16 16 16 16 16 80

Fonte: Elaborado pela autora.

#PraCegoVer : no quadro, são apresentados os dados de satisfação de uma


entrevista feita com 80 pessoas. Na primeira linha, consta o nível de satisfação do
pesquisado dividido em cinco partes, em que 1 é péssimo, 2 é ruim, 3 é regular, 4 é
bom e 5 é ótimo, na segunda linha, os resultados das pessoas entrevistadas estão
distribuídos em péssimos, com 9 pessoas, ruim, com 11 pessoas, regular, com 25
pessoas, bom, com 20 pessoas, e ótimo, com 15 pessoas, num total de 80 pessoas
entrevistadas. Na terceira linha, seria o valor esperado dos 80 dados do problema,
com o padrão fixado em 16 pessoas que acharam péssimo, ruim, regular, bom e
ótimo, totalizando 80 pessoas pesquisadas.

Elabore o teste qui-quadrado, utilizando a tabela dada. Temos que considerar nesse
~
problema que: H0 : nao há diferenças significativas entre os bairros.

H1 : ç
há diferen as significativas entre os bairros . Verifique o valor de x
2
ea
análise do teste qui-quadrado H0 em relação a H1 .

a) x = 10, 75. Pelo teste qui-quadrado, o valor 10,75 é maior que 9,49, rejeita-se H em
2
0

prol de H . 1

b) x = 2, 15. Pelo teste qui-quadrado, o valor 2,15 é menor que 9,49, H não deve ser
2
0

rejeitada em prol de H . 1

c) x = 2, 75. Pelo teste qui-quadrado, o valor 2,75 é menor que 9,49, que se rejeita H
2
0

em prol de H . 1

d) x = 12, 76. Pelo teste qui-quadrado, o valor 12,76 é menor que 16, H não deve ser
2
0

rejeitada em prol de H . 1

e) x = 11, 75. Pelo teste qui-quadrado, o valor 11,75 é maior que 9,49, não se rejeita
2

H em prol de H .
0 1
Material
Complementar

WEB

O princípio da inclusão-exclusão
Ano: 2019

Comentário: O “Princípio da inclusão-exclusão” abordou o tema conjuntos.


Nesse vídeo, foi apresentada uma aula mais teórica, que aborda o princípio
da inclusão-exclusão. Esse princípio fornece fórmulas para expressar a
quantidade de elementos da união de dois conjuntos A e B por meio da
quantidade de elementos existentes em A, em B e na interseção de A com B.

Para saber mais, acesse o vídeo disponível em:

ACESSAR
WEB

Teste qui-quadrado da tabela de contingência.


Ano: 2014

Comentário: Nesse vídeo, utiliza-se o teste qui-quadrado em uma tabela de


contingência para saber se um par de ervas diferentes impede que as
pessoas fiquem doentes. Criado por Sal Khan, Khan Academy é um canal no
Youtube de uma empresa sem fins lucrativos que disponibiliza aulas, com
excelente qualidade, de todas as áreas para qualquer pessoa e em qualquer
local. Este é o canal oficial do YouTube em português.

Para conhecer mais sobre o canal, acesse o link disponível em:

ACESSAR

LIVRO

Probabilidade e estatística
Editora: LTC

Autor: Claudio Loesch

ISBN: 978-85-216-2100-3

Comentário: “Probabilidade e Estatística” é um livro com sólidos


conhecimentos da área mais especificamente tratada nesta unidade: a
distribuição qui-quadrada e o teste qui-quadrado, que permitem obter
resultados de pesquisa por meio de aspectos teóricos, que incluem o rigor
matemático e o raciocínio indutivo. Apresentando, também, os conceitos
mais básicos da introdução à estatística, teoria das probabilidades,
distribuições amostrais, além de outros tópicos importantes, utilizando os
fundamentos matemáticos necessários, como teoria elementar dos
conjuntos, cálculos, análise combinatória e álgebra linear, para você,
estudante, que sentir mais dificuldade com os conceitos mais básicos da
probabilidade é uma leitura indispensável.
Conclusão
Nesta unidade, você estudou a função geratriz de momentos como outra maneira de representação de
uma variável aleatória, sendo a função geratriz única para uma variável aleatória.

O método de função geradora de distribuição de probabilidade é mais complexo do que as distribuições


de probabilidade teóricas, pois o processo gerador requer apenas que o analista introduza os parâmetros
apropriados a cada tipo de distribuição, tornando o problema muito específico e demandando uma análise
caso a caso.

Você estudou também o teste de aderência qui-quadrado, com base nas diferenças entre os valores
observados e esperados de dados agrupados em classes e podendo ser aplicado a qualquer distribuição
de teste. No teste qui quadrado, foram estudados os dados de medida e suas respectivas distribuições
hipotéticas, determinando a região de rejeição de hipótese, calculando o grau de liberdade e encontrando
o maior valor do qui-quadrado tabelado.

Referências
COSTA, G. G. O. Curso de estatística inferencial e
probabilidades : teoria e prática. São Paulo: Atlas, 2012.

CYMBALISTA, M.; NETO, P. L. O. C. Probabilidades. São Paulo:


Editora Edgard Blucher, 2005

DEVORE J. L. Probabilidade e estatística para engenharias e


ciências . 6. ed. São Paulo: Cengage Learning, 2011.

LOECSH, C. Probabilidade e estatística . Rio de Janeiro: LTC, 2012.

MACHADO, J. W. S. Função geradora: uma ferramenta de contagem. Dissertação (Mestrado Profissional


em Matemática) – Universidade Federal de Sergipe, Sergipe, 2015. Disponível em:
https://ri.ufs.br/bitstream/riufs/6486/1/JOHN_WILLIAM_SANTOS_MACHADO.pdf . Acesso em: 04 jul.
2021.

MEMÓRIA, J. M. P. Breve história da estatística . Brasília: Embrapa Informação Tecnológica, 2004.

MEYER, P. L. Probabilidade : aplicações à estatística. Rio de Janeiro: LTC, 1984.

O PRINCÍPIO da inclusão-exclusão - probabilidade e estatística – Obmep. [ S. l.: s. n. ], 2019. 1 vídeo (18


min). Publicado pelo canal OBMEP Portal da Matemática, a Olimpíada Brasileira de Matemática das
Escolas Públicas. Disponível em: https://www.youtube.com/watch?v=e54wdE8V8m0 . Acesso em: 14 jun.
2021.

ROSS, S. Probabilidade : um curso moderno com aplicações. 8. ed. Porto Alegre: Bookman, 2010.

TEIXEIRA, C. S. Um estudo sobre funções geradoras. Trabalho de Conclusão de Curso (Matemática -


Habilitação Licenciatura) – Universidade Federal de Santa Catarina, Florianópolis, 2004. Disponível em:
https://repositorio.ufsc.br/bitstream/handle/123456789/96722/Cleidemar.pdf?sequence=1&isAllowed=y .
Acesso em: 04 jul. 2021.

TESTE qui-quadrado da tabela de contingência - Probabilidade e Estatística - Khan Academy. [ S. l.: s. n. ],


2014. 1 vídeo (18 min). Publicado pelo canal Khan Academy Brasil. Disponível em:
https://www.youtube.com/watch?v=snUTmyRrbG4 . Acesso em: 14 jun. 2021.

Você também pode gostar