Função de Função Geradora e Teste de Aderência
Função de Função Geradora e Teste de Aderência
Função de Função Geradora e Teste de Aderência
Neste material, você irá estudar as funções geradoras e o teste de aderência. Tratam-se de técnicas
muito importante para solucionar problemas complexos de contagem, como a combinação do
sorteio de loteria e a combinação das placas de veículos, por exemplo. Por isso, uma função
geradora serve para interpretar os coeficientes combinatórios e expandir os expoentes em séries.
Neste material, você também irá estudar o teste de aderência, que tem como objetivo avaliar o quão
adequado é um modelo probabilístico para um conjunto de dados observados. E, por fim, você
conhecerá o modelo proposto para aplicar no teste de aderência em exemplos simples, que é o
teste do qui-quadrado associado à tabela da curva de densidade.
Bons estudos!
Função Geradora de
Distribuições de
Probabilidade
A análise combinatória tem como objetivo tratar situações-problema, das mais simples às mais
complexas, e aplicar os modelos probabilísticos e a combinatória em fenômenos naturais, tornando
suas aplicações cada vez mais necessárias no dia a dia. O raciocínio e os métodos estatísticos e
probabilísticos são inquestionavelmente muito utilizados pelas ciências da natureza, assim como
pelas ciências humanas.
A geradora de momento define a
distribuição de probabilidade , sendo esta
definida por uma soma de variáveis
aleatórias independentes , como o produto
das funções de cada elemento da soma. A
determinação da função geradora de
momentos requer que eles sejam finitos
em uma vizinhança de zero.
Um prerrequisito para facilitar o estudo de alguns exemplos da função geradora é revisar alguns dos
principais resultados para séries de potência . Nesse sentido, considere a variável x e os
coeficientes a0 , a1 , a2 , … , an a qualquer série determinada por:
, ou seja ∑ n=0 an x .
2 n ∞ n
a0 + a1 x + a2 x + … + an x + …
∞
A série geométrica ∑
n=1
an x
n−1
= a + a x + a x
2
+ … é convergente se −1 < x < 1 e
∞
sua soma é ∑ n=1
an x
n−1
=
a
1−x
, |x| < 1 .
Essa definição será necessária neste estudo para calcular os coeficientes e os problemas de
funções geradoras envolvendo a definição da série de potência. No box a seguir, você poderá
conhecer mais sobre desenvolvimento de probabilidade.
SAIBA MAIS
“A ferramenta matemática chamada de função geradora foi amplamente aplicada pelo matemático
norueguês Leonhard Euler, na obra “ Introduction in analysis infinitorum ”. Outros matemáticos importantes
fizeram o uso deste, como N. Bernoulli e S. Laplace. As funções geradoras encontram aplicações no
campo de análise matemática, probabilidade, combinatória, mecânica estatística e teoria da informação
quântica”.
Para saber mais sobre o desenvolvimento da probabilidade, acesse o link :
https://ri.ufs.br/bitstream/riufs/6486/1/JOHN_WILLIAM_SANTOS_MACHADO.pdf
tx
⎧ ∑ e p (x)
⎪ x
⎪
⎪
⎪ ~
⎪ se X é vaviável aleató ria discreta com funa o de probabilidade p (x)
tX
MX (t) = E (e ) = ⎨ +∞ tx
⎪ ∫ e f (x) dx
⎪
⎪
−∞
⎪
⎩
⎪
~ ′′
se X é vaviável aleató ria cont í nua com funao de densidade f (x) .
Denomina-se função geratriz de momentos quando todos os momentos de X podem ser obtidos
pelo cálculo sucessivo da derivada de MX (t). A definição da função é independente do tipo de
variável aleatória, mas a maneira de determinar depende se X é discreta ou contínua. A função só
precisa estar definida em uma vizinhança do ponto zero , pois os momentos serão obtidos por meio
de sucessivas diferenciações aplicadas em zero, temos, então, uma proposição sobre
transformação linear a seguir.
Segundo Machado (2015, p. 20), “seja a sequência de números reais dada por
∞
a0 , a1 , a2 , , a serie f (x) = ∑ n=0 an x é denominado de função geradora e os
… , an
n
soluções inteiras.
Solução:
p (x1 ) = x
1
+ x
2
, para x1 ϵ {1, 2}
p (x2 ) = x
1
+ x
2
+ x
3
, para x2 ∈ {1, 2, 3}
p (x3 ) = x
2
+ x
3
+ x
4
, para x3 ∈ {2, 3, 4}
4 5 6 7 8 9 4 2 3 4 5
x + 3x + 5x + 5x + 3x + x = x . (3x + 5x + 5x + 3x + x ),
Outro exemplo para calcular a função geradora: “dada a equação: x + y + z + w = 25, em que
cada variável é no mínimo 3 e no máximo 8. Pede-se para determinar a função geradora para
solução de números inteiros” (MACHADO, 2015, p. 21).
Solução:
Temos:
p (x) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.
p (y) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.
p (z) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.
p (w) = x
3
+ x
4
+ x
5
+ x
6
+ x
7
+ x
8
, para cada variável é no mínimo 3 e no máximo 8.
4
3 4 5 6 7 8 3 2 3 4 5
p (x) . p (y) . p (z) . p (w) = (x + x + x + x + x + x ) = [x (1 + x + x + x + x + x )]
4
12 2 3 4 5
x (1 + x + x + x + x + x ) .“
4
Portanto, a função geradora é f (x) = x
12
(1 + x + x
2
+ x
3
+ x
4
+ x )
5
. O conceito de função
geradora de momento é muito importante para a análise de processos estocásticos .
Teorema , segundo Machado, (2015, p. 31), são: “as soluções de números inteiros e não negativos
(inteiros positivos) para a equação x1 + x2 + x3 + … + xn = p , sendo igual a combinação
p
linear definida por Cn+p−1 ”.
Como foram retirados n fatores iguais a 1, escrevemos o número n + p como soma de números 1,
seguindo em 1 + 1 + 1 + … + 1 = n + p , então, temos:
a1 + a2 + a3 + … + an = n + p
Note que, nos fatores (n + p − 1) , há sinais de soma (+), e, como temos n variáveis, temos
(n − 1) espaços para serem escolhidos entre os fatores (n + p − 1) sinais de +. Portanto, o
número de soluções, em inteiros não negativos, da x1 + x2 + x3 + … + xn = p , sendo
p
C
m−1
n+p−1
= C
n+p−1
, pois são combinações complementares .
Para que você possa entender melhor a demonstração do teorema anterior, apresentamos um
exemplo para determinar a solução da equação x1 + x2 + x3 + … + xn = p e associá-la à
combinação linear. Sendo assim, temos um número finito de soluções e devemos restringir os
possíveis valores que as variáveis podem assumir. Veja o exemplo:
n n −n
Teorema: o coeficiente de xp na expressão (1 + x + x2 + x
3
+ …) = (
1
1−x
) = (1 − x)
n + p − 1
é igual a ( ) .
p
u ∞ u
Demonstração: sabemos que (1 − x) = ∑
p=0
( )x
p
. Substituindo, nessa expressão, x
p
−n ∞ −n p ∞ p −n p
(1 − x) = ∑ ( ) (−x) = ∑ (−1) ( ) (x)
p=0 p=0
p p
p
(−n) . (−n − 1) . (−n − 2) … (−n − p + 1) . (−n − p) ! (−1)
=
(−n − p)! p!
p
(−n) . (−n − 1) . (−n − 2) … (−n − p + 1) . (−1)
=
p!
p p
(−1) . n (n + 1) . (n + 2) … (n + p − 1) . (−1)
=
p!
2p
(−1) . n (n + 1) . (n + 2) … (n + p − 1)
=
p!
Esse valor é o total de formas de selecionarmos p objetos dentre n objetos distintos, em que cada
objeto pode ser tomado até p vezes.
Maria tem 10 anéis e quer distribuí-los pelos 10 dedos de suas mãos. De quantas maneiras
diferentes ela pode fazer isso? Suponha que é possível colocar todos os anéis em qualquer um
dos dedos (MACHADO, 2015).
n+p−1 n + p − 1
Encontra-se, por meio do teorema anterior: Cp = ( ) , temos:
p
19! 19 . 18 . 17 . 16 . 15 . 14 . 13 . 12 . 11 . 10!
10+10−1
c = = = 92378
10
10! (19 − 10)! 10! 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1
Portanto, Maria pode distribuir os 10 anéis de 92378 maneiras diferentes com o uso das
funções geradoras em problemas mais complexos.
Solução:
Nesse problema, não há restrição quanto ao número de latas de uma determinada marca, logo, a
função geradora que controla o número de latas de uma certa marca seria:
1 + 1 + x + x
2
+ x
3
+ … + x
12
.
Mas como são 4 marcas diferentes, então, a equação da função geradora seria:
4
2 3 12
f (x) = (1 + x + x + x + … + x )
n+p−1 n + p − 1
Encontra-se, por meio do teorema anterior: Cp = ( ) , temos p = 12 e n = 4 .
p
15! 15 . 14 . 13 . 12!
4+12−1
c = = = 455
12
12! (15 − 12)! 12! 3 . 2 . 1
Portanto, podemos escolher as 12 latas de refrigerante de 455 maneiras diferentes e de função
4
geradora f (x) = (1 + x + x
2
+ x
3 12
+ … + x ) .
A função geradora de probabilidade é utilizada apenas para variáveis aleatórias inteiras não
negativas, porém, na verdade, essa é apenas uma reformulação da função geradora de momento.
praticar
Vamos Praticar
Utilizando o produto das probabilidades p (a) . p (b) . p (c), determinar a função geradora f (x)
que permite calcular o número de soluções inteiras da equação a + b + c = 6. Para cada
variável, os intervalos são dados por −1 ≤ a ≤ 2, 1 ≤ b ≤ 4 e 1 ≤ c ≤ 4. (MACHADO,
2015, p. 29).
Deve-se simplificar o produto das probabilidades, para determinar a função geradora, e calcular o
número de soluções inteiras da equação a + b + c = 6 .
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Uma bolsa contém 8 moedas no valor de 1 real, 7 moedas no valor de 50 centavos, 4 moedas no
valor de 25 centavos e 3 moedas no valor de 10 centavos. Esse problema pode ser resolvido
usando o princípio da inclusão-exclusão, porém fica mais simples resolvê-lo usando as funções
geradoras.
Definimos:
a) A função geradora é:
2 3 4 5 6 2 3 4 2 3
f (x) = (1 + x + x + x + x + x + x ) . (1 + x + x + x + x ) . (x + x + x + x
b) A função geradora é:
2
2 3 4 2 3 4 2 3
f (x) = (1 + x + x + x + x ) . (x + x + x + x ) . (1 + x + x + x ).
c) A função geradora é:
2
2 3 4 5 6 2 3 4 2 3
f (x) = (1 + x + x + x + x + x + x ) . (1 + x + x + x + x ) . (1 + x + x + x
Teste de Aderência
Neste tópico, você vai aprender sobre os testes de aderência que são aplicados para testar a
adequabilidade de um modelo probabilístico a um conjunto de dados observados .
Estimação de Parâmetros
Os testes de aderência são aplicados quando as probabilidades das categorias são completamente
especificadas, como um experimento binomial , que consiste em uma sequência de testes
independentes, nos quais cada um pode produzir um de dois possíveis resultados .
Mas antes de definir com mais detalhes o teste de aderência qui-quadrado, iremos discutir um tipo
de distribuição de probabilidade denominada distribuição qui-quadrado.
[...] seja n um número inteiro positivo, diz-se que uma variável aleatória X possui uma
distribuição qui-quadrado com parâmetro n se a função densidade de probabilidade
denotada por Xn2 for uma distribuição gama com α = 1 /2 e β = n /2 . A função
densidade de probabilidade de uma variável aleatória qui-quadrado será:
(n/2)−1 −x/2
f (x) =
x
n/2
e
para x .
> 0
2 Γ(n/2)
Γ(α) = ∫
α−1
x
−x
e dx ”.
0
A distribuição qui-quadrada é importante por ser a base de diversos procedimentos de inferência estatística.
A distribuição qui-quadrado desempenha um papel importante na inferência estatística, em especial, nas situações que
calculam variações e variâncias .
Uma das distribuições de variável aleatória da teoria de probabilidade e estatística mais utilizadas é
a distribuição de variável aleatória de Poisson. Definida por:
[...] uma variável aleatória X que pode assumir qualquer um dos valores 0, 1, 2, … é
chamada de variavel aleatória de Poisson com parâmetro λ se, para algum λ > 0,
−λ k
e .λ
p (k) = P {X = k} = k = 0, 1, 2, …
k!
A variável aleatória de Poisson pode ser utilizada como uma aproximação para a variável
aleatória binomial, isto é, por causa da aproximação de Poisson para a distribuição
binomial (ROSS, 2010, p. 181).
Para que você possa compreender melhor, vamos a um exemplo : suponha que uma caixa de banco
atende clientes em um tempo que segue uma distribuição exponencial de valor esperado de 1
minuto. Qual será a probabilidade de a caixa atender 10 clientes em um tempo não superior a 8
minutos?
∞ ∞ −λ k
e .λ
p (k) = ∑ p (k) = ∑
k!
k=0 k=0
k!
8
= 0, 2834 .
Teste qui-quadrado
Existem muitas situações em que podemos aplicar testes qui-quadrados mutuamente baseados,
considerando k resultados mutuamente excludentes e exaustivos A1 , A2 , … , Ak , com suas
respectivas probabilidades de ocorrência p1 , p2 , … , pk . Suponha n experimentos independentes
realizados, isto é, denotados por ni o número de experimentos que resultaram em Ai , então, as
variáveis aleatórias n1 , n2 , … , nk .
nk k
, em que ∑ .
n! n1 n2
P (n = p p …p ni = n
1, n2 , …, nk ) 1 2 k i=1
n1 ! n2 !… nk !
diretamente pi0 = P (X = i) . Se for discreta com infinitos valores, agrupam-se as somas infinitas
de probabilidades de menores valores.
A distribuição do qui-quadrado constitui uma família de curvas , cada qual caracterizada pelos seus
graus de liberdade ϕ.
Na tabela a seguir, temos os limites inferiores e superiores para cada variável aleatória, na análise
da curva do método qui-quadrado:
gl
0,995 0,990 0,975 0,950 0,900 0,5 0,100 0,05 0,025 0,01 0,005
n
2 0,010 0,020 0,051 0,103 0,211 1,386 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 2,366 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 3,357 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 4,351 9,236 11,070 12,833 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 5,348 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 6,346 12,017 14,067 16,013 18,475 20,278
8 1,344 1,646 2,180 2,733 3,490 7,344 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 8,343 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 9,342 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 10,341 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 11,340 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 12,340 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 13,339 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 14,339 22,307 24,996 27,488 30,578 32,801
#PraCegoVer : a tabela apresenta os valores críticos de cada gráfico para o método qui-
quadrado. Com valores v das variáveis aleatórias entre 1 a 10 elementos na primeira coluna. E
os valores de alfa variando de 0,995 a 0,005, e cada elemento representa o limite máximo da
curva de densidade de cada gráfico do método qui-quadrado, apresentados na primeira linha
tabela. Na segunda linha, temos os valores para o grau de liberdade e os valores de alfa:
(gl = 1; α = 0, 995) = 0 ; (gl = 1; α = 0, 990) = 0 ;
Para facilitar seu entendimento sobre a resolução do teste qui-quadrado, veja, no elemento a seguir,
uma breve descrição antes de resolver o exemplo apresentado na sequência.
Procedimento teste de x²
#PraCegoVer : o infográfico apresenta uma imagem colorida com uma lupa ao centro e vários gráficos ao
redor da lupa, assim como calculadoras, sinais de matemáticos e sinais de localização. Ao lado direito da
imagem, há cinco botões vermelhos, com numeração de 1 a 5. Ao clicar no botão “1”, é apresentado o
texto: “Enunciar as hipóteses nula (H0 ) agá zero e alternativa (H1 ) agá um”. Ao clicar no botão “2”, é
apresentado o texto: “Fixar nível significância (α ) alfa, utilizar a tabela (x2 ) x elevado ao quadrado”. Ao
clicar no botão “3”, é apresentado o texto: “Determinar o valor crítico de (x2c )x de c elevado ao quadrado,
que define a região de rejeição com o grau de liberdade (gl = (k − 1), ) em que k é o número de
categorias do problema”. Ao clicar no botão “4”, é apresentado o texto: “Determinar as estatísticas, ou
2
k (O i −Ei )
seja, o valor crítico teste: ( x2t = ∑
i=1 Ei
) x de t elevado ao quadrado igual ao somatório de i
igual a 1 até k, do quadrado do valor observado menos o valor esperado, tudo dividido pelo valor esperado.
Ao clicar no botão “5”, é apresentado o texto: “Se ( x2c ≥ x
2
t
) x de c elevado ao quadrado maior ou igual a
x de t elevado ao quadrado, então, rejeita a hipótese ( H0 ) agá zero. Caso contrário, aceita-se a hipótese”.
Segundo Loesch (2012, p. 126), “para teste unilateral, dado um número real μ
0
, o teste verifica se
esse valor pode ser aceito como a média populacional. As hipóteses são:
H0 : μ = μ
0
H1 : μ ≠ μ
0
(bilateral) ou μ < μ
0
(unilateral) ou μ > μ
0
(unilateral)”.
Teste unilateral H1 : μ > μ0 . O teste rejeita a hipótese H0 , a região de rejeição situa-se no lado
direito da curva. A rejeição de H0 pelo critério de comparação ocorre quando z > zα , o que
equivale a p < −α .
¯
X −μ 0
Resumindo, o critério, segundo Loesch (2012, p. 128), “calcula-se z =
σ√ n
e, caso:
Se p < α , rejeita-se H0 ”.
Vamos ver um exemplo, para que você possa visualizar a aplicação: em uma pesquisa científica
sobre genética, um estatístico analisou os dados do resultado do cruzamento de ervilhas de jardim.
Os alelos dominantes no experimento foram Y : cor amarela e R = formato redondo,
resultando no dominante conjunto Y R, sendo examinados um total de 269 vagens com quatro
sementes resultantes de um cruzamento híbrido. Seja
X = quantidade de Y Rs em uma vagem selecionada aleatoriamente , os valores de X
possíveis são de 0 a 4, que se identifica com as células de 1 a 5, descritas na tabela a seguir. Uma
vagem com x = 4 produz um número observado na célula 5. Acompanhe melhor os dados na
tabela a seguir:
C é lula i 1 2 3 4 5
Ervilha/V agens Y R 0 1 2 3 4
Observada 16 45 100 82 26
Solução:
Seja a hipótese X como as sementes de genótipos individuais dentro de uma vagem, sendo uma
distribuição independente com n = 4 e θ =
9
16
.
5 2
(V alor Observado − V alor Esperado)
2
x = ∑
V alor Esperado
i=1
2 2 2 2 2
(16 − 9, 86) (45 − 50, 68) (100 − 97, 75) (82 − 83, 78) (26 − 26, 93)
2
x = + + + + =
9, 86 50, 68 97, 75 83, 78 26, 93
4) De acordo com o limite superior definido pelo teste de aderência, pelo método qui-quadrado, para
n = 4 , temos que 0, 100 < 4, 523 < 7, 77, logo, H0 não deve ser rejeitada em qualquer nível de
significância, ou seja, para que H0 seja rejeitada, o valor de alfa deve ser menor que 0,100, para os
valores de ∝= 0, 100, ∝= 0, 05, ∝= 0, 025, ∝ 0, 01 e ∝= 0, 005 .
Que tal fixar o conteúdo visto até aqui por meio de uma atividade? Vamos lá?
Conhecimento
Teste seus Conhecimentos
(Atividade não pontuada)
Observados 9 11 25 20 15 80
Esperados 16 16 16 16 16 80
Elabore o teste qui-quadrado, utilizando a tabela dada. Temos que considerar nesse
~
problema que: H0 : nao há diferenças significativas entre os bairros.
H1 : ç
há diferen as significativas entre os bairros . Verifique o valor de x
2
ea
análise do teste qui-quadrado H0 em relação a H1 .
a) x = 10, 75. Pelo teste qui-quadrado, o valor 10,75 é maior que 9,49, rejeita-se H em
2
0
prol de H . 1
b) x = 2, 15. Pelo teste qui-quadrado, o valor 2,15 é menor que 9,49, H não deve ser
2
0
rejeitada em prol de H . 1
c) x = 2, 75. Pelo teste qui-quadrado, o valor 2,75 é menor que 9,49, que se rejeita H
2
0
em prol de H . 1
d) x = 12, 76. Pelo teste qui-quadrado, o valor 12,76 é menor que 16, H não deve ser
2
0
rejeitada em prol de H . 1
e) x = 11, 75. Pelo teste qui-quadrado, o valor 11,75 é maior que 9,49, não se rejeita
2
H em prol de H .
0 1
Material
Complementar
WEB
O princípio da inclusão-exclusão
Ano: 2019
ACESSAR
WEB
ACESSAR
LIVRO
Probabilidade e estatística
Editora: LTC
ISBN: 978-85-216-2100-3
Você estudou também o teste de aderência qui-quadrado, com base nas diferenças entre os valores
observados e esperados de dados agrupados em classes e podendo ser aplicado a qualquer distribuição
de teste. No teste qui quadrado, foram estudados os dados de medida e suas respectivas distribuições
hipotéticas, determinando a região de rejeição de hipótese, calculando o grau de liberdade e encontrando
o maior valor do qui-quadrado tabelado.
Referências
COSTA, G. G. O. Curso de estatística inferencial e
probabilidades : teoria e prática. São Paulo: Atlas, 2012.
ROSS, S. Probabilidade : um curso moderno com aplicações. 8. ed. Porto Alegre: Bookman, 2010.