PDF Modeloslineares
PDF Modeloslineares
PDF Modeloslineares
Gauss M. Cordeiro
MORAL
DEMÉTRIO
CORDEIRO
MODELOS LINEARES Clarice G. B. Demétrio
GENERALIZADOS Rafael A. Moral
E APLICAÇÕES
Gauss M. Cordeiro
MODELOS LINEARES
Obteve seu PhD em Estatística no Imperial College, Universidade de Londres (1982), e tem
GENERALIZADOS E APLICAÇÕES
GENERALIZADOS E APLICAÇÕES
pós-doutorado no Instituto de Matemática Pura e Aplicada (1990-1992). Publicou mais de 400
artigos em periódicos internacionais e orientou mais de 60 alunos de pós-graduação. Trabalha na
área de Análise de Sobrevivência, Distribuições de Probabilidade e Modelos de Regressão.
MODELOS LINEARES
Clarice G. B. Demétrio
C
Tem graduação em Engenharia Agronômica (1972-75), e mestrado (1976-79) e doutorado (1979-
M
-85) em Estatística e Experimentação Agronômica na ESALQ/USP, pós-doutorado no Imperial
Y College of Science and Technology, Londres (1986-87) e Doctor Honoris Causa (2019) pela
CM University of Hasselt, Bélgica. É professora titular no Departamento de Ciências Exatas da
MY ESALQ/USP, desenvolvendo pesquisa e orientando, principalmente, em Modelos Lineares Gene-
CY ralizados e Extensões.
CMY
K
Rafael A. Moral
Professor associado de Estatística e diretor do grupo de pesquisas em Ecologia Teórica e Estatística
na Maynooth University, Irlanda. Tem graduação em Ciências Biológicas (2007-11), e mestrado
(2012-14) e doutorado (2014-17) em Estatística e Experimentação Agronômica pela ESALQ/USP.
Desenvolve pesquisa em Modelagem Estatística Aplicada a Ecologia, Manejo da Vida Selvagem,
Agricultura e Ciências Ambientais.
www.blucher.com.br
i i
i i
i i
i i
i i
✐ ✐
Conteúdo
3 Estimação 55
3.1 Estatísticas suficientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 O algoritmo de estimação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3 Estimação em modelos especiais . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 Resultados adicionais na estimação . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5 Seleção do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.6 Considerações sobre a função de verossimilhança . . . . . . . . . . . . . . . . . 67
3.7 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4 Métodos de Inferência 75
4.1 Distribuição dos estimadores dos parâmetros . . . . . . . . . . . . . . . . . . . 75
4.2 Função desvio e estatística de Pearson generalizada . . . . . . . . . . . . . . . 80
4.2.1 Função desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.2 Estatística de Pearson generalizada 𝑋 2 . . . . . . . . . . . . . . . . . . 87
4.3 Análise de desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.4 Estimação do parâmetro de dispersão . . . . . . . . . . . . . . . . . . . . . . . 92
4.4.1 Comparação dos três métodos de estimação do parâmetro de dispersão
no modelo gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.5 Testes de hipóteses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.5.1 Teste de uma hipótese nula simples . . . . . . . . . . . . . . . . . . . . 96
4.5.2 Teste de uma hipótese nula composta . . . . . . . . . . . . . . . . . . . 98
4.6 Regiões de confiança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.7 Seleção de variáveis explanatórias . . . . . . . . . . . . . . . . . . . . . . . . . 101
✐ ✐
✐ ✐
✐ ✐
✐ ✐
✐ ✐
✐ ✐
Conteúdo 9
B.6 Programa R para os dados do Exemplo 6.4: Tempos de sobrevivência de ratos . 227
B.7 Programa R para os dados do Exemplo 6.5: Dados de assinaturas de TV a cabo 228
B.8 Programa R para os dados do exemplo 7.1: Rotenona . . . . . . . . . . . . . . . 230
B.9 Programa R para os dados do exemplo 7.2: Cipermetrina . . . . . . . . . . . . . 231
B.10 Programa R para os dados do exemplo 7.3: Mortalidade do besouro da farinha 234
B.11 Programa R para os dados do exemplo 7.4: Proporções de gemas florais de
macieiras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
B.12 Programa R para os dados do exemplo 7.5: Cultura de tecidos de macieiras . . 241
B.13 Programa R para os dados do exemplo 7.6: Toxicidade a dissulfeto de carbono
gasoso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
B.14 Programa R para os dados do exemplo 7.7: Armazenamento de microorganismos 245
B.15 Programa R para os dados do exemplo 7.8: Número de brotos em um estudo de
micropropagação de macieiras . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
B.16 Programa R para os dados do exemplo 7.9: Número de espécies de plantas . . . 246
B.17 Programa R para os dados do exemplo 7.10: Coleta de insetos em armadilhas
adesivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
B.18 Programa R para os dados do exemplo 7.11: Pneumoconiose em mineiros de carvão 248
Referências 251
✐ ✐
✐ ✐
✐ ✐
CAPÍTULO 1
1.1 INTRODUÇÃO
Muitas distribuições conhecidas podem ser colocadas em uma família paramétrica
denominada família exponencial de distribuições. Assim, por exemplo, pertencem a
essa família as distribuições normal, binomial, binomial negativa, gama, Poisson, normal
inversa, multinomial, beta, logarítmica, entre outras. Essa classe de distribuições foi
proposta, independentemente, por Koopman, Pitman e Darmois, nos anos de 1935 e
1936, ao estudarem as propriedades de suficiência estatística. Posteriormente, muitos
outros aspectos dessa família foram estudados e tornaram-se importantes na teoria
moderna da Estatística. O conceito de família exponencial foi introduzido na Estatística
por Fisher, mas os modelos da família exponencial surgiram na Mecânica Estatística
no final do século XIX e foram desenvolvidos por Maxwell, Boltzmann e Gibbs. A
importância dessa família teve maior destaque, na área dos modelos de regressão, a partir
do trabalho pioneiro de Nelder e Wedderburn (1972), que definiram os modelos lineares
generalizados (MLGs). Na década de 1980, esses modelos popularizaram-se, inicialmente,
no Reino Unido, e, posteriormente, nos Estados Unidos e por toda Europa ocidental.
✐ ✐
✐ ✐
✐ ✐
Exemplo 1.1
e− 𝜃 𝜃 𝑥 1
𝑓 (𝑥; 𝜃) = = exp[𝑥 log(𝜃) − 𝜃]
𝑥! 𝑥!
e, portanto, é um membro da família exponencial (1.1) com 𝜂(𝜃) = log(𝜃), 𝑏(𝜃) = 𝜃,
𝑡 (𝑥) = 𝑥 e ℎ(𝑥) = 1/𝑥!.
Exemplo 1.2
Exemplo 1.3
✐ ✐
✐ ✐
✐ ✐
em que 𝑏(·) e 𝑐(·) são funções conhecidas. Quando 𝜙 é conhecido, a família de distri-
buições (1.4) é idêntica à família exponencial na forma canônica (1.2). Essa família, tam-
bém, é conhecida como família exponencial linear. Na Seção 1.4, será demonstrado que
o valor esperado e a variância de 𝑌 com distribuição na família (1.4) são
✐ ✐
✐ ✐
✐ ✐
✐ ✐
✐ ✐
✐
✐
✐
✐
2
𝜎2 𝜇 𝜃 1
2 2 𝜎2
Normal: N(𝜇, 𝜎 2 ) − + log ( 2𝜋𝜎 )
1 + e𝜃
𝜇 𝑘e𝜃
Binomial negativa: BN(𝜇, 𝑘) 1 log log 𝜇
Γ(𝑘 + 𝑦)
Γ(𝑘)𝑦 ! 𝑘
−𝑘 log ( 1 − e 𝜃 ) +1
− 𝜇
𝜇+𝑘 1 − e𝜃
1 1
𝜇
Gama: G(𝜇, 𝜈) 𝜈 −1 𝜇2
𝜇 𝜃
− − log (−𝜃) 𝜈 log (𝜈𝑦) − log (𝑦) − log Γ(𝜈) −
1 1 1
𝜎2 𝜇3
2𝜇 2 𝜎 𝑦
Normal inversa: IG(𝜇, 𝜎 2 ) − 2 −(−2𝜃) 1/2 − log ( 2𝜋𝜎 2 𝑦 3 ) + 2 (−2𝜃) −1/2
Note que Γ(·) é a função gama, isto é, Γ(𝛼) = 0 𝑥 𝛼−1 e−𝑥 𝑑𝑥, 𝛼 > 0.
“output” — 2024/4/2 — 8:23 — page 15 — #15
∫∞
15
✐
✐
✐
✐
✐ ✐
Exemplo 1.4
Tem-se, então,
2 (𝑦 − 𝜇) 2 1 2
𝑓 (𝑦; 𝜇, 𝜎 ) = exp − − log(2𝜋𝜎 )
2𝜎 2 2
2
1 𝜇 1 2 𝑦2
= exp 2 𝑦𝜇 − − log(2𝜋𝜎 ) − ,
𝜎 2 2 2𝜎 2
Exemplo 1.5
✐ ✐
✐ ✐
✐ ✐
Prova: a prova será feita apenas para o caso de variáveis aleatórias contínuas. No caso
discreto, basta substituir a integral pelo somatório. Sabe-se que
∫
𝑓 (𝑦; 𝜃, 𝜙)𝑑𝑦 = 1,
𝐴
e, portanto, ∫
exp 𝜙 −1 [𝜃𝑦 − 𝑏(𝜃)] + 𝑐(𝑦, 𝜙) 𝑑𝑦 = 1,
𝐴
obtendo-se
∫
exp 𝜙 −1 𝜃𝑦 + 𝑐(𝑦, 𝜙) 𝑑𝑦 = exp 𝜙 −1 𝑏(𝜃) . (1.7)
𝐴
Logo,
∫
𝑡𝑌
𝑀 (𝑡; 𝜃, 𝜙) = E e = exp(𝑡𝑦) 𝑓 (𝑦)𝑑𝑦
∫ 𝐴
= exp 𝜙 −1 [(𝜙𝑡 + 𝜃)𝑦 − 𝑏(𝜃)] + 𝑐(𝑦, 𝜙) 𝑑𝑦
𝐴
∫
1
= exp 𝜙 −1 (𝜙𝑡 + 𝜃)𝑦 + 𝑐(𝑦, 𝜙) 𝑑𝑦
exp 𝜙 −1 𝑏(𝜃) 𝐴
✐ ✐
✐ ✐
✐ ✐
𝜅𝑟 = 𝜙𝑟 −1 𝑏 (𝑟 ) (𝜃). (1.9)
𝑑ℓ 𝑑2ℓ
𝑈= = 𝜙 −1 [𝑦 − 𝑏 ′ (𝜃)] e 𝑈 ′ = 2 = −𝜙 −1 𝑏 ′′ (𝜃).
𝑑𝜃 𝑑𝜃
Logo,
E(𝑈) = 𝜙 −1 [E(𝑌 ) − 𝑏 ′ (𝜃)] = 0, que implica em E(𝑌 ) = 𝑏 ′ (𝜃)
e, assim,
Então,
Var(𝑌 ) = 𝜙 𝑏 ′′ (𝜃).
✐ ✐
✐ ✐
✐ ✐
Exemplo 1.6
Exemplo 1.7
Assim, a f.g.m. é
𝑚 − 𝜇 𝜇 𝑡 𝑚
𝑀 (𝑡) = e 𝜑 (𝑡 ) = + e .
𝑚 𝑚
✐ ✐
✐ ✐
✐ ✐
Exemplo 1.8
Exemplo 1.9
tem-se que 𝑡 (𝑦) = log(𝑦), 𝜃 = 𝜇 e Var(𝑌 ) = 𝜇, que é do mesmo tipo que a função
de variância do modelo de Poisson.
✐ ✐
✐ ✐
✐ ✐
Exemplo 1.10
✐ ✐
✐ ✐
✐ ✐
Pode-se verificar (Exercício 12) que as distribuições normal, gama, normal inversa e
beta pertencem à família exponencial biparamétrica canônica (1.11) com 𝑘 = 2.
Gelfand e Dalal (1990) estudaram a família exponencial biparamétrica 𝑓 (𝑥; 𝜃, 𝜏) =
ℎ(𝑥) exp[𝜃𝑥 + 𝜏𝑡 (𝑥) − 𝑏(𝜃, 𝜏)], que é um caso especial de (1.10), com 𝑘 = 2. Essa
família tem despertado interesse, recentemente, como o componente aleatório dos MLGs
superdispersos (DEY; GELFAND; PENG, 1997). Dois casos especiais importantes dessa
família são diretamente obtidos:
✐ ✐
✐ ✐
✐ ✐
Exemplo 1.11
𝑛!
𝑓 (x; 𝝅) = 𝜋1𝑥1 . . . 𝜋 𝑘𝑥𝑘 ,
𝑥1 ! . . . 𝑥 𝑘 !
∑︁
𝑘 ∑︁
𝑘
em que 𝑥𝑖 = 𝑛 e 𝜋𝑖 = 1. Essa distribuição pertence à família exponencial
𝑖=1 𝑖=1
canônica (1.11) com vetor de parâmetros canônicos 𝜽 = [log(𝜋1 ), . . . , log(𝜋 𝑘 )] 𝑇
e estatística canônica T = (𝑋1 , . . . , 𝑋 𝑘 ) 𝑇 . Entretanto, devido à restrição
∑︁
𝑘
𝜋𝑖 = 1, a representação mínima da família exponencial é obtida considerando
𝑖=1
𝜽 = [log(𝜋1 /𝜋 𝑘 ), . . . , log(𝜋 𝑘−1 /𝜋 𝑘 )] 𝑇 e T = (𝑋1 , . . . , 𝑋 𝑘−1 ) 𝑇 , ambos vetores de
dimensão 𝑘 − 1, resultando na família exponencial multiparamétrica de dimensão
𝑘 −1
" 𝑘−1 #
𝑛! ∑︁
𝑓 (x; 𝜽) = exp 𝜃 𝑖 𝑥 𝑖 − 𝑏(𝜽) , (1.12)
𝑥1 ! . . . 𝑥 𝑘 ! 𝑖=1
!
∑︁
𝑘−1
com 𝜃 𝑖 = log(𝜋𝑖 /𝜋 𝑘 ), 𝑖 = 1, . . . , 𝑘 − 1, e 𝑏(𝜽) = 𝑛 log 1 + e 𝜃i , pois
𝑖=1
Í 𝑘−1 −1
𝜋𝑖 = 𝜋 𝑘 e 𝜃i , i
= 1, . . . , k − 1 e 𝜋 𝑘 = 1 + 𝑖=1 . e 𝜃i
Pode-se demonstrar que os dois primeiros momentos da estatística suficiente
T = [𝑇1 (X), · · · , 𝑇𝑘 (X)] 𝑇 na família exponencial canônica (1.11) são iguais a
𝜕𝑏(𝜽) 𝜕 2 𝑏(𝜽)
E(T) = , Cov(T) = . (1.13)
𝜕𝜽 𝜕𝜽𝜕𝜽 𝑇
As expressões (1.13) generalizam (1.3). Nas equações (1.13), o vetor 𝜕𝑏(𝜽)/𝜕𝜽
de dimensão 𝑘 tem um componente típico E[𝑇𝑖 (X)] = 𝜕𝑏(𝜽)/𝜕𝜃 𝑖 e a matriz
𝜕 2 𝑏(𝜽)/𝜕𝜽𝜕𝜽 𝑇 de ordem 𝑘 tem como elemento típico Cov(𝑇𝑖 (X), 𝑇 𝑗 (X)) =
𝜕 2 𝑏(𝜽)/𝜕𝜃 𝑖 𝜕𝜃 𝑗 . Assim, os valores esperados e as covariâncias das estatísticas
✐ ✐
✐ ✐
✐ ✐
para 𝑖 = 𝑗
!
𝜕2 ∑︁
𝑘−1
𝜃𝑖
Var(𝑋𝑖 ) = 𝑛 2 log 1 + e = 𝑛𝜋𝑖 (1 − 𝜋𝑖 ),
𝜕𝜃 𝑖 𝑖=1
e para 𝑖 ≠ 𝑗
!
𝜕2 ∑︁
𝑘−1
−𝑛e 𝜃𝑖 e 𝜃 𝑗
Cov(𝑋𝑖 , 𝑋 𝑗 ) = 𝑛 log 1 + e 𝜃𝑖 = = −𝑛𝜋𝑖 𝜋 𝑗 .
𝜕𝜃 𝑖 𝜕𝜃 𝑗 Í 𝑘−1 𝜃 2
𝑖=1 1 + 𝑖=1 e 𝑖
Exemplo 1.12
✐ ✐
✐ ✐
Capa_Cordeiro_Modelos lineares_P2.pdf 1 05/02/2024 23:34:20
Gauss M. Cordeiro
MORAL
DEMÉTRIO
CORDEIRO
MODELOS LINEARES Clarice G. B. Demétrio
GENERALIZADOS Rafael A. Moral
E APLICAÇÕES
Gauss M. Cordeiro
MODELOS LINEARES
Obteve seu PhD em Estatística no Imperial College, Universidade de Londres (1982), e tem
GENERALIZADOS E APLICAÇÕES
GENERALIZADOS E APLICAÇÕES
pós-doutorado no Instituto de Matemática Pura e Aplicada (1990-1992). Publicou mais de 400
artigos em periódicos internacionais e orientou mais de 60 alunos de pós-graduação. Trabalha na
área de Análise de Sobrevivência, Distribuições de Probabilidade e Modelos de Regressão.
MODELOS LINEARES
Clarice G. B. Demétrio
C
Tem graduação em Engenharia Agronômica (1972-75), e mestrado (1976-79) e doutorado (1979-
M
-85) em Estatística e Experimentação Agronômica na ESALQ/USP, pós-doutorado no Imperial
Y College of Science and Technology, Londres (1986-87) e Doctor Honoris Causa (2019) pela
CM University of Hasselt, Bélgica. É professora titular no Departamento de Ciências Exatas da
MY ESALQ/USP, desenvolvendo pesquisa e orientando, principalmente, em Modelos Lineares Gene-
CY ralizados e Extensões.
CMY
K
Rafael A. Moral
Professor associado de Estatística e diretor do grupo de pesquisas em Ecologia Teórica e Estatística
na Maynooth University, Irlanda. Tem graduação em Ciências Biológicas (2007-11), e mestrado
(2012-14) e doutorado (2014-17) em Estatística e Experimentação Agronômica pela ESALQ/USP.
Desenvolve pesquisa em Modelagem Estatística Aplicada a Ecologia, Manejo da Vida Selvagem,
Agricultura e Ciências Ambientais.
www.blucher.com.br