Estatistica PDF
Estatistica PDF
Estatistica PDF
brasileiros com doença Y é 40%, ou seja, p=0,40. A distribuição dos pesos dos alunos da universidade é
normal.
Teste de hipótese: é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base
nos elementos amostrais;
As hipóteses: Designa-se por H0 (hipótese nula) a hipótese a ser testada e por H1 a hipótese
alternativa. A rejeição de H0 implica na aceitação de H1. A hipótese alternativa geralmente representa a
suposição que o pesquisador quer provar, sendo H0 formulada com o propósito de ser rejeitada.
Vejamos alguns exemplos de testes:
H0: µ=100 H0: ρ=0,10
Teste Bicaudal (bilateral)
H1: µ≠100 H1: ρ≠0,10
α α
2 2 α α
RA RA RA
RC RC RC RC
− tα 2 tα 2 tα − tα
(a) (b) (c)
4º passo) Calcular
x − µ0
t cal =
s n
onde:
x : média amostral;
µ0: valor de H0;
s: desvio padrão amostral;
n: tamanho da amostra.
5º passo) Conclusões
Se Tcal estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0 e aceita-se a hipótese H1.
x=
∑ xi = 421 = 28,07
n 15
1 n (∑ xi )
2
2
=
1
−
(421)2 = 1 * [520,93] = 37,21 então s = 6,1
S =
2
* ∑ xi −
2
S * 12337
n − 1 i =1 n 15 − 1 15 14
1º passo:
H0: µ=30
vs
H1: µ≠30 (a) teste bicaudal
2º passo:
Graus de liberdade: n-1 15-1=14 gl=14
Nível de significância=0,05 α=0,05 = 5%
3º passo: busca-se na tabela “t” Student no eixo horizontal o valor de 5% e no eixo vertical os graus de
liberdade (gl=14). Obtendo-se desta forma o valor de 2,145. Assim teríamos:
0,025 0,025
RA
RC RC
-2,145 0 2,145
5º passo: Conclusão
Como o valor de tcal=-1,225 encontra-se na região aceitável (RA), aceita-se a hipótese H0. Assim, a média
amostral ( x =28,07mm) é estatisticamente igual a média populacional (µ=30mm).
2º passo)
Fixa-se o nível de significância α. A variável usada é a normal padronizada Z, em geral quando
n>30.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 4
3º passo) Definir a Região Crítica (RC) e Região Aceitável (RA)
α α
2 2 α α
RA RA RA
RC RC RC RC
− Zα 2 Zα 2 Zα − Zα
(a) (b) (c)
4º passo) Calcular
f − ρ0
Z cal =
ρ 0 * (1 − ρ 0 )
n
onde:
n: tamanho da amostra.
f: freqüência relativa evidenciando a proporção existente;
ρ0: valor da hipótese H0;
5º passo) Conclusões
Se Zcal estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0 e aceita-se a hipótese H1.
Exemplo: As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,60. Teste a hipótese ao nível de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos.
1º passo:
H0: ρ=0,60
vs
H1: ρ≠0,60 (a) (a) teste bicaudal
2º passo:
Nível de significância=0,05 α=0,05 = 5% e a variável usada é a normal padrão(0,1).
3º passo: vimos anteriormente no capítulo sobre intervalos de confiança que quando se trata da família
de distribuição normal reduzida Z, para a proporção da área do intervalo, teremos para 95% o valor de
1,96. Obtém-se desta forma o valor crítico (RC) de Z α Z 0 , 05 =1,96.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 5
0,025 0,025
RA
RC RC
-1,96 0 1,96
4º passo: calcular o valor de Z
f = 530 = 0,53 que representa a proporção dos sobreviventes até 60 anos dos 1000 nascimentos
1000
amostrados.
f − ρ0 0,53 − 0,60
Z cal = Z cal = Z cal = −4,52
ρ 0 * (1 − ρ 0 ) 0,60 * (1 − 0,60)
n 1000
5º passo: Conclusão
Como o valor de Zcal=-4,52 encontra-se na região crítica (RC), rejeita-se a hipótese H0. Assim, a proporção
amostral (f=0,53) é estatisticamente diferente da proporção populacional (ρ=0,60).
α α
2 2 α α
RA RA RA
RC RC RC RC
− Zα 2 Zα 2 Zα − Zα
(a) (b) (c)
4º passo) Calcular
Z cal =
(x1 − x2 )
σ 12 σ 22
+
n1 n2
onde:
x 1 e x 2: médias amostrais da população X1 e X2;
σ 12 e σ 22 : variâncias populacionais;
n1 e n2 :tamanho das amostras de cada população .
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 6
5º passo) Conclusões
Se Zcal estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0 e aceita-se a hipótese H1.
(a) Se − Z α 2 ≤ Z cal ≤ Z α 2 , aceita-se H0; Bicaudal
Exemplo: Um fabricante de pneus faz dois tipos. Para o tipo 1, σ=2500 milhas, e para o tipo 2,
σ=3000 milhas. Um táxi testou 50 pneus do tipo “1” e 40 do tipo “2”, obtendo 24000 milhas e 26000
milhas de duração média dos respectivos tipos. Adotando-se um risco α=5%, testar a hipótese de
que a vida média dos dois tipos é a mesma.
1º passo) Enunciar as hipóteses:
H0: µ1-µ2=0 ∴ µ1=µ2
vs
H1: µ1≠µ2 (a) teste bicaudal
0,025 0,025
RA
RC RC
-1,96 0 1,96
4º passo: calcular o valor de Z
(x1 − x 2 ) Z cal =
(24000 − 26000 ) Z cal = −3,38
Z cal =
σ 2
1
+
σ 2
2 (2500 )2 + (3000 )2
n1 n2 50 40
5º passo: Conclusão
Como o valor calculado de Zcal=-3,38 encontra-se na região crítica (RC), rejeita-se a hipótese H0. Assim, em
média os dois tipos de pneus têm durabilidade diferente.
α α
2 2 α α
RA RA RA
RC RC RC RC
− tα 2 tα 2 tα − tα
(a) (b) (c)
4º passo) Calcular
( x1 − x2 ) sc =
(n1 − 1) * S12 + (n2 − 1) * S 22
t cal =
n +n
sc * 1 2
onde
(n1 + n2 − 2)
n1 * n2
onde:
x 1 e x 2: médias amostrais da população X1 e X2;
n1 e n2 :tamanho das amostras de cada população;
sc: desvio-padrão comum as duas populações;
S12 e S 22 : variâncias amostrais da população X1 e X2;
5º passo) Conclusões
Se Tcal estiver em RA, aceita-se a hipótese H0, caso contrário, rejeita-se H0 e aceita-se a hipótese H1.
0,025 0,025
RA
RC RC
-1,980 0 1,980
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 8
4º passo: calcular o valor de tcal
2º passo)
Fixa-se o nível de significância α. A variável usada é a normal padronizada Z.
3º passo) Definir a Região Crítica (RC) e Região Aceitável (RA)
α α
2 2 α α
RA RA RA
RC RC RC RC
− Zα 2 Zα 2 Zα − Zα
(a) (b) (c)
4º passo) Calcular
f1 − f 2
Z cal =
1 1
ρ * (1 − ρ ) * +
n1 n2
onde:
n1 e n2 :tamanho das amostras de cada população;
ƒ1 e ƒ2: freqüências relativas amostrais evidenciando a proporção existente para cada população;
ρ: estimador comum a ρ1 e ρ2;
x1 + x 2 x1 x2
ρ= f1 = f2 =
n1 + n2 n1 n2
5º passo) Conclusões
1º passo:
H0: ρ1=ρ2
vs
H1: ρ1≠ρ2 (a) (a) teste bicaudal
2º passo:
Nível de significância=0,10 α=0,10 = 10% e a variável usada é a normal padrão (0,1).
3º passo: sabe-se que quando trata-se da família de distribuição normal padrão Z, teremos para
α=10% o valor crítico (RC) de Zα Z 0 , 05 =1,65.
2
0,05 0,05
RA
RC RC
-1,65 0 1,65
4º passo: calcular o valor de Zcal
f 1 = 70 = 0,35 e f 2 = 50 = 0,25 que representam respectivamente, a proporção de homens e
200 200
mulheres que lembram do anúncio.
70 + 50
ρ= = 0,30 que representa o estimador comum as duas populações.
200 + 200
0,35 − 0,25 Z cal = 2,18
Z cal =
0,30 * (1 − 0,30) *
1 1
+
200 200
5º passo: Conclusão
Como o valor experimental ou calculado (Zcal=2,18) é maior do que o valor tabelado ou crítico
( Z α Z 0, 05 =|1,65|), rejeita-se a hipótese H0 (ρ1=ρ2), ou seja, as proporções entre estas duas populações
2
são diferentes.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 10
Tabela de distribuição t-Student
BIBLIOGRAFIA:
a
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de Estatística. 6 ed. São Paulo:Atlas,
1996, 320 p.
COSTA NETO, Pedro Luis de Oliveira. Estatística. São Paulo:Edgard Blücher, 1977, 264p.
DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1998, 453 p.
a
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica: métodos quantitativos. 4 ed. São
Paulo:Atual, 1987, 321p.
a
SPIEGEL, Murray R. Estatística. 3 ed. São Paulo:Makron Books, 1993, 629p.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 1
2. ESTATÍSTICA EXPERIMENTAL
Denomina-se Pesquisa, um conjunto de atividades orientadas para a busca de um determinado
conhecimento. Para merecer o qualificativo de científica, a pesquisa deve ser feita de modo sistematizado,
utilizando para isto métodos próprios e técnicas específicas.
A pesquisa científica se distingue de outras modalidades quaisquer de pesquisa, pelo método,
pela técnica, por estar voltada para a realidade empírica e pela forma de comunicar o conhecimento obtido
(URIBE-OPAZO,2001).
2.1 FINALIDADE
Descobrir respostas para questões, mediante a aplicação de métodos científicos;
Tentar conhecer e explicar os fenômenos que ocorrem no mundo existente.
2.2 PLANO DE PESQUISA
Fase I Fase II Fase III
e. Fatores: são tipos distintos de condições que serão manipuladas nas unidades experimentais. Os
diferentes modos de presença de um fator no estudo são considerados níveis do fator.
f. Tratamento: é um método, elemento ou material cujo efeito deseja-se medir ou comparar em um
experimento (máquinas, métodos, produtos, materiais). Como exemplo, veja a Figura 3 que mostra o
esquema de um experimento feito para comparar dois germicidas (tratamentos 1 e 2), em tubos de
ensaio.
Figura 3: Tratamento1 versus Tratamento2 Figura 4: Grupo controle versus grupo tratado
Fonte: VIEIRA & HOFFMANN(1989). Fonte: VIEIRA & HOFFMANN(1989).
Apenas como exemplo, imagine que se deseja comparar o efeito de duas rações na engorda de
suínos. Nesse caso, o experimento poderia ser planejado como segue:
a unidade experimental: um animal.
a variável em análise e a forma como será medida: ganho de peso, medido pela diferença entre o
peso final e o peso inicial de cada animal.
os tratamentos em comparação: ração A e ração B.
forma de designar os tratamentos às unidades experimentais: sorteio.
Figura 10: Dois experimentos inteiramente ao acaso: um com grupos de mesmo tamanho, outro com grupos
de tamanhos diferentes.
Fonte: VIEIRA & HOFFMANN(1989).
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 6
16.4.1.1. Análise de Variância – ANOVA
Uma suposição básica e implícita na ANOVA é que as diversas médias amostrais são obtidas de
populações normalmente distribuídas e que têm mesma variância. Entretanto, segundo KAZMIER
(1982) esta suposição não é muito afetado por violações da hipótese de normalidade, quando as
populações são unimodais e os tamanhos das amostras aproximadamente iguais.
Se a variável em estudo tem distribuição normal ou aproximadamente normal, para comparar mais
de duas médias aplica-se o teste F (Fisher-Snedecor). Primeiro, é preciso estudar as causas da variação.
Por que os dados variam? Uma explicação é o fato de as amostras provirem de populações diferentes.
Outra explicação é o acaso, porque mesmo dados provenientes da mesma população variam.
O teste F é feito através da análise de variância, que separa a variabilidade devido aos
“tratamentos” da variabilidade residual (acaso). Assim, a idéia da análise de variância é comparar a
variação devida aos tratamentos com a variação devido ao acaso. Seja k o número de níveis de um
fator em estudo. A notação é a seguinte:
Tratamentos
Total
T1 T2 T3 ... K
Y11 Y21 Y31 ... Yk1
Y12 Y22 Y32 ... Yk2
. . . ... .
. . . ... .
Y1r1 Y2r2 Y3r3 ... Ykrk
Total ΣT 1 ΣT 2 ΣT 3 ΣT k ΣT
Média Y1. Y2. Y3. Yk . Y..
Nº de
r1 r2 r3 rk n=kr
repetições
onde:
Yij : é a j-ésima observação correspondente ao i-ésimo tratamento (valor da variável resposta);
ri : é o número de unidades experimentais ou parcelas submetidas ao i-ésimo tratamento;
k
n = ∑ ri : é o tamanho amostral (o número total de ensaios);
i =1
1 ni
Yi. = ∑Yij : média por tratamento i=1,2,...,k;
ri j =1
ni
1 k
Y.. = ∑
n i =1
∑Y
j =1
ij : média geral (somatória / nº total de dados).
onde:
Yij = variável resposta para o tratamento i e repetição j;
k
µ = média geral comum a todas as observações µ = 1 ∑ ri µ i ;
n i =1
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 7
Τi = efeito do i-ésimo tratamento em Y e mede o desvio padrão da média µi em relação a µ, isto é
Ti = µ i − µ ;
eij = é o erro aleatório não observável associado a Yij.
As suposições associadas a este modelo são:
i) Os erros eij são independentes (aleatorização);
ii) Os erros eij possuem variância constante (σ = cte);
2
iii) Os erros eij são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição
normal com média zero e variância constante, isto é, eij ≈ N (0,σ ).
2
b) Hipóteses
O objetivo do estudo realizado é verificar se as médias µ1, µ2,…, µk são iguais ou não, o que
equivale a testar se os efeitos dos tratamentos (Τi) são iguais a zero ou não. Este teste pode ser expresso
por:
Η 0: Τ1=Τ2= … = Τk=0 (hipótese nula)
vs.
Η 1: Τ1≠0 para pelo menos um i, (hipótese alternativa), ou seja, vamos testar a não existência do
efeito fator.
O procedimento utilizado para testar as hipóteses é a análise de variância.
(∑ Y ) 2
(∑ T ) 2
C=
ij
C=
k
ou
n n
c.3) a soma de quadrados total (mede a variabilidade total das observações em relação a média geral):
(∑ Y ) − C ∑ (Y )
k ni
SQTot = SQTot = ∑
2 2
ij ou ij − Y..
i =1 j=1
c.4) a soma de quadrados de tratamentos (mede a variabilidade entre as médias dos tratamentos em
relação a média geral):
∑ Τk2
( )
k
SQTr = ∑ ri Y i . − Y..
2
SQTr = −C ou
r i =1
c.5) a soma de quadrados de resíduos (é uma medida de homogeneidade interna dos tratamentos):
∑ (Y )
ni
SQR = SQTot - SQTr
k
SQR = ∑
2
ou ij − Yi .
i =1 j=1
c.6) o quadrado médio de tratamentos (este será um estimador não viciado da variância populacional σ ,
2
SQR
QMR =
n-k
c.8) o valor de F:
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 8
QMTr
F0 =
QMR
A ANOVA constata se existe efeito dos tratamentos em estudo.
Fonte de Graus de Soma Quadrado Quadrado
F
Variação (F.V) Liberdade(G.L.) (S.Q.) Médio (Q.M.)
Tratamentos
k–1 SQTr QMTr F0
(entre)
Resíduos
n–k SQR QMR
(dentro dos tratamentos)
TOTAL n–1 SQTot
d) Regra de Decisão
Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabelas 1, 2 e 3,
respectivamente para níveis de significância de 1, 5 e 10%) procurando o valor de Ftab(k-1,n-k,α%), com (k-1) e
(n-k) graus de liberdade no numerador e denominador, respectivamente.
Se Fo ≥ Ftab (k-1, n-k,α%), rejeita-se a hipótese Η0 ao nível de α% de significância, ou seja, aceita-se a
hipótese alternativa Η1 que diz que em média os tratamentos são diferentes.
Se Fo<Ftab (k-1, n-k,α%), aceita-se a hipótese Η0 ao nível de α% de significância, ou seja, em média dos
tratamentos apresentaram-se iguais.
QMR
d.m.s. = q (k; n − k) *
r
O valor de q(k;n-k)com k graus de liberdade para o tratamento e (n-k) graus de liberdade para o resíduo
podem ser encontrados nas Tabelas 5, 6 e 7, respectivamente para um nível de significância de 1%, 5%
e 10%. (anexo).
Já QMR (quadrado médio dos resíduos) pode ser encontrado na Tabela ANOVA e r, representa o nº de
repetições de cada tratamento.
Para este teste, duas médias são estatisticamente diferentes quando o valor absoluto da diferença entre
elas for maior ou igual a d.m.s.
Yij = µ + Ti + eij
b) Estimativas dos parâmetros
Os estimadores de µ são: a % de umidade média extraída da amostra de tijolos (28) nas 4
secadoras foi: µˆ = Y .. = (22,7 + 20,7 + 21,8 + 22,5) / 4 = 21,9 .
A média por tratamento Y i . (cada secadora), pode ser vista na Tabela 1 e é apresentada abaixo:
Secadora 1 ⇒ µˆ 1 = Y1 . = 22,7 % de umidade
(∑ T ) 2
C=
(158,8 + 144,7 + 152,4 + 157,7 )2 =
(613,6) 2
⇒ C = 13446,6
C=
k
n 28 28
c.3) a soma de quadrados total:
SQTot = (∑ Y ) − C
2
ij
(
SQTot = 22,7 2 + 24,2 2 + 21,5 2 + .... + 22,12 + 22,9 2 − 13446,6 )
SQTot = (13482,0) − 13446,6 ⇒ SQTot = 35,4
SQTr 17,8
QMTr = QMTr = ⇒ QMTr = 5,9
k −1 3
c.7) o quadrado médio de resíduos:
SQR 17,6
QMR = QMR = ⇒ QMR = 0,7
n-k 24
c.8) o valor de F:
QMTr 5,9
F0 = F0 = ⇒ F0 = 8,4
QMR 0,7
Em resumo temos então:
Fonte de
G.L S.Q Q.M. F
Variação
Tratamentos 3 17,8 5,9 8,4
Resíduo 24 17,6 0,7
TOTAL 27 35,4
d) Hipóteses de interesse
H0: Τ1=Τ2=Τ3=Τ4= 0 (hipótese de nulidade)
Versus
H1: pelo menos um Τi é diferente de zero (hipótese alternativa)
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 11
e) Regra de Decisão
Na tabela de Fisher-Snedecor procuramos o Ftab(k-1;n-k;α%). Nesta tabela (tabua VI) encontramos no eixo
horizontal os graus de liberdade de (k-1), ao passo que no eixo vertical os graus de liberdade de (n-k).
Desta forma encontramos o valor de Ftab(3;24;0,05) = 3,01.
Como Fo=8,4>Ftab(3;24;0,05)=3,01, rejeita-se a hipótese de nulidade H0 ao nível de 5% de significância, ou
seja, pelo menos um tratamento Τi é diferente de zero.
Com isto, verifica-se que realmente pelo menos um tratamento ( secadora 1, 2, 3 ou 4) possui
estatisticamente média diferente. Porém basta agora descobrirmos quais médias são estatisticamente iguais
e quais diferem entre si, e isto se consegue fazendo-se uso dos testes de comparações múltiplas.
f) Utilizando o teste Tukey realizar-se-á as comparações múltiplas entre as quantidades de umidade
extraídas dos tijolos pelas diferentes secadoras. Quais são suas conclusões ao nível de 5% de
significância?
As estimativas de µ1 µ2 µ3 e µ4 são Y1 . = 22,7(secadora1), Y2 . = 20,7 (secadora2), Y3 . = 21,8
(secadora3) e Y4 . = 22,5 (secadora4), respectivamente.
Os contrastes(C) do estimador, entre as porcentagens médias de umidade extraídas dos tijolos para
as diferentes secadoras são:
Secadora1 e Secadora2 ⇒ C12 = Y1 . - Y2 . = 22,7–20,7 = 2,0
Secadora1 e Secadora3 ⇒ C13 = Y1 . - Y3 . = 22,7–21,8 = 0,9
Secadora1 e Secadora4 ⇒ C14 = Y1 . - Y4 . = 22,7–22,5 = 0,2
Secadora2 e Secadora3 ⇒ C23 = Y2 . - Y3 . = 20,7–21,8 = -1,1
Secadora2 e Secadora4 ⇒ C24 = Y2 . - Y4 . = 20,7–22,5 = -1,8
Secadora3 e Secadora4 ⇒ C34 = Y3 . - Y4 . = 21,8–22,5 = -0,7
Hipóteses de Interesse
H0: C12=0; C13=0; C14=0; C23=0; C24=0; C34=0
Versus
H1: O Contraste(C) é diferente de zero
O Teste Tukey
Hipótese de interesse
H0: µi = µj
Versus
H1: µi ≠ µj para i≠j
A estatística de Tukey é a Diferença mínima significativa (d.m.s.)
QMR
d.m.s. = q (k; n −k) *
r
O valor de q(k;n-k)com k graus de liberdade para o tratamento e (n-k) graus de liberdade para o resíduo é
encontrado Tabela 6 a um nível de significância de 5%. (anexo). Assim, q(k;n-k)= q(4;24)=3,90;
QMR=0,7 (ANOVA) e r=7 (repetições)
Assim, o valor da d.m.s. será:
0,7
d.m.s. = 3,90 * d.m.s. = 1,23
7
Para este teste, duas médias são estatisticamente diferentes quando o valor absoluto da diferença entre
elas for maior ou igual a d.m.s. Por exemplo, como o contraste C12=2,0 ≥ d.m.s.=1,23 as médias são
estatisticamente diferentes, ou seja rejeito H0.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 12
Resumo do teste Tukey
Contrastes Valor d.m.s. Decisão a 5%
C12 2,01 1,23 Rejeito H0
C13 0,91 1,23 Aceito H0
C14 0,15 1,23 Aceito H0
C23 -1,10 1,23 Aceito H0
C24 -1,86 1,23 Rejeito H0
C34 -0,76 1,23 Aceito H0
Quadro de Comparações de Médias segundo os respectivos métodos
Médias Tukey
µ1 a
µ2 b
µ3 ab
µ4 a
B A D C E
Bloco 2
E D A B C
Bloco 3
A C D E B
Bloco 4
B D C A E
Uma outra forma de delineamento em blocos são os experimentos em blocos ao acaso com
repetições. Aqui o número de unidades que caem dentro de um bloco pode ser maior do que o número de
tratamentos que o pesquisador pretende comparar. Imagine que um pesquisador dispõe de 13 ratos, sendo
7 machos similares entre si e 6 fêmeas também similares entre si e se queira comparar o efeito de duas
rações sobre o ganho de peso dos animais. O esquema experimental poderia ser tal como o apresentado
na Figura 12.
a b
sujeito a ∑ τi =
i =1
∑β
j=1
j =0
onde:
Yij = variável resposta coletada sob o i-ésimo nível do fator no bloco j;
k
1
µ = média global comum a todas as observações µ=
N
∑ri =1
i µi ou para experimento balanceado
1 k
µ= ∑ µi ;
k i =1
τi = efeito do i-ésimo nível do fator, ou seja, efeito tratamento;
βj = efeito do i-ésimo bloco, ou seja, efeito do bloco;
eij = componente do erro aleatório associado à observação Yij.
As suposições associadas a este modelo são:
i) Os erros eij são independentes (aleatorização);
ii) Os erros eij possuem variância constante (σ = cte);
2
iii) Os erros eij são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição
normal com média zero e variância constante, isto é eij ≈ N (0,σ ).
2
b) Hipóteses de Interesse
Para o caso em estudo estamos considerando o caso que o tratamento (fator) é um fator fixo.
H0:τ1 = τ2 =...= τa = 0 (hipótese de nulidade)
vs.
H1: τi ≠ 0, para pelo menos um i (hipótese alternativa)
(∑ Y ) 2
C=
(∑ T ) k
2
C=
ij
ou
kb kb
c.3) a soma de quadrados total (mede a variabilidade total das observações em relação a média geral):
SQTot = (∑ Yij2 ) − C
c.4) a soma de quadrados de tratamentos (mede a variabilidade entre as médias dos tratamentos em
relação a média geral):
∑ Τk2
SQTr = −C
b
c.5) a soma de quadrados de blocos (mede a variabilidade entre as médias dos blocos em relação a
média geral):
∑ Bk2
SQB = −C
k
c.6) a soma de quadrados de resíduos (é uma medida de homogeneidade interna dos tratamentos):
SQR = SQTot - SQTr - SQB
c.7) o quadrado médio de tratamentos (este será um estimador não viciado da variância populacional σ ,
2
SQR
QMR =
(k - 1)(b - 1)
c.10) o valor de F:
QMTr
F0 =
QMR
A Tabela de Análise de Variância – ANOVA fica então da seguinte forma:
Fonte de Graus de Soma Quadrado Médio
F
Variação Liberdade Quadrado
Tratamentos k–1 SQTr QMTr Fo
Bloco b-1 SQB QMB F1
Resíduos (k-1)(b-1) SQR QMR
TOTAL kb–1 SQTot
d) Regra de Decisão
Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabelas 1, 2 e 3,
respectivamente para níveis de significância de 1, 5 e 10%) procurando o valor de Ftab [k-1; (k-1)(b-1);α%] com
(k-1) graus de liberdade para os tratamentos (numerador) e (k-1)(b-1) graus de liberdade para o resíduo
(denominador).
Se Fo ≥ Ftab [k-1; (k-1)(b-1);α%], rejeita-se a hipótese de nulidade H0 a nível de α% de significância,
conseqüentemente, pelo menos um Tratamento τi é diferente de zero.
Se Fo < Ftab [k-1; (k-1)(b-1);α%], aceita-se a hipótese H0 ao nível de α% de significância, ou seja, em média os
tratamentos são iguais.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 16
f) Comparações múltiplas
De acordo dom URIBE-OPAZO (1999), se o fator em um experimento aleatório em blocos
completos é fixo e a ANOVA indica que existe uma diferença significativa entre as médias dos níveis do
fator (tratamentos), então deve-se realizar as comparações múltiplas para detectar e localizar as diferenças
detectadas no teste F. Os testes T, Tukey e Dunnett podem ser utilizados, considerando r=b e os graus de
liberdade do resíduo (k-1)(b-1).
Exemplo de Aplicação
1) Um pesquisador deseja comparar a produtividade de quatro variedades de milho (A,B,C,D) mas,
em lugar de sortear as variedades para as parcelas no campo, primeiro dividiu a área que
dispunha em cinco blocos (I, II, III, IV, V) tão homogêneos quanto possível. Depois dividiu cada
bloco em quatro parcelas e sorteou, para cada bloco, uma variedade por parcela. O esquema do
experimento de campo está apresentado na Figura abaixo com quatro tratamentos e cinco
blocos:
I V
A C D C A
B D A B C
D A B D B IV
B C D C A
II III
2
Produção de milho em kg/100m segundo a variedade e o bloco
Variedade (tratamentos)
Blocos Total
A B C D
I 34 26 37 23 120
II 26 37 45 28 136
III 33 42 39 30 144
IV 36 34 41 37 148
V 31 36 53 32 152
Total 160 175 215 150 700
Média 32 35 43 30 35
a) Análise preliminar
2
Unidade Experimental Parcelas de 100 m .
Variável de Interesse Produtividade de milho
Fator em estudo Variedades de milho
Níveis do Fator 4 (variedades A, B, C, D)
Fator Fixo Porque os 4 níveis foram definidos pelo pesquisador
Blocos 5 ( blocos I, II, III, IV, V)
Quando temos um experimento em Blocos completamente ao acaso (balanceado), com um fator
fixo, temos interesse em verificar a influência dos k níveis desse fator (tratamento) nos diferentes Blocos
para a variável resposta Y em estudo. Assim um modelo estatístico associado a este tipo de experimento é
dado pela forma:
Yij = µ + τ i + β j + e ij
b) Hipóteses de Interesse
H0: Τ1=Τ2=Τ3=Τ4= 0 (hipótese de nulidade)
Versus
H1: pelo menos um Τi é diferente de zero (hipótese alternativa)
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 17
c) Tabela de Análise de Variância para um fator fixo (ANOVA)
Para fazer a análise de variância de um experimento em blocos casualizado é preciso calcular as
seguintes quantidades:
c.1) os graus de liberdade:
de tratamentos: k-1 4-1=3
de blocos: b-1 5-1=4
do total: kb-1 4*5-1=20-1=19
do resíduo: (kb-1)-(k-1)-(b-1) = (k-1)*(b-1) 19-3-4=12
c.2) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O
valor de C é chamado de “correção”:
C=
(∑ T )
k
2
C=
(160 + 175 + 215 + 150)2 =
(700) 2
⇒ C = 24500 =
kb 4*5 20
c.3) a soma de quadrados total:
SQTot = (∑ Y ) − C
2
ij
( )
SQTot = 342 + 262 + 332 + ... + 37 2 + 322 − 24500 ⇒ SQTot = 950
c.4) a soma de quadrados de tratamentos:
∑ Τk2
SQTr = −C
b
160 2 + 175 2 + 215 2 + 150 2
SQTr = − 24500 ⇒ SQTr = 490
5
c.5) a soma de quadrados de blocos :
∑ Bk2
SQB = −C
k
120 2 + 136 2 + 144 2 + 148 2 + 152 2
SQB = − 24500 ⇒ SQB = 160
4
c.6) a soma de quadrados de resíduos :
SQR = SQTot - SQTr - SQB
SQR = 950 − 490 − 160 ⇒ SQR = 300
c.7) o quadrado médio de tratamentos:
SQTr 490
QMTr = QMTr = ⇒ QMTr = 163,33
k −1 4 −1
c.8) o quadrado médio de blocos:
SQB 160
QMB = QMB = ⇒ QMB = 40
b −1 5 −1
c.9) o quadrado médio de resíduos:
SQR 300 300
QMR = QMR = = ⇒ QMR = 25
(k - 1)(b - 1) (4 - 1) * (5 - 1) 3 * 4
c.10) o valor de F:
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 18
QMTr 163,33
F0 = F0 = ⇒ F0 = 6,53
QMR 25
A Tabela de Análise de Variância – ANOVA fica então da seguinte forma:
Fonte de Graus de Soma Quadrado Médio
F
Variação Liberdade Quadrado
Tratamentos 3 490 163,33 6,53
Bloco 4 160 40,00 1,60
Resíduos 12 300 25,00
TOTAL 19 950
d) Regra de Decisão
Para avaliarmos as hipóteses fazemos uso da tabela de Fisher-Snedecor (Tabelas 1, 2 e 3,
respectivamente para níveis de significância de 1, 5 e 10%) procurando o valor de Ftab [k-1; (k-1)(b-1);α%] com (k-
1) graus de liberdade para os tratamentos (numerador) e (k-1)(b-1) graus de liberdade para o resíduo
(denominador).
Se Fo ≥ Ftab [k-1; (k-1)(b-1);α%], rejeita-se a hipótese de nulidade H0 a nível de α% de significância,
conseqüentemente, pelo menos um Tratamento τi é diferente de zero.
Se Fo < Ftab [k-1; (k-1)(b-1);α%], aceita-se a hipótese H0 ao nível de α% de significância, ou seja, em média os
tratamentos são iguais.
Tratamento B ⇒ µˆ 2 = Y2 . = 35 kg/100m
2
Tratamento C ⇒ µˆ 3 = Y3 . = 43 kg/100m2
Tratamento D ⇒ µˆ 4 = Y4 . = 30 kg/100m
2
Tratamento C ⇒ Tˆ = Y . − Y .. = 43 − 35 = 8 kg/100m
2
3 3
Y1 . = 32 (A), Y2 . = 35 (B),
Y3 . = 43 (C) e Y4 . = 30 (D).
QMR
d.m.s. = q c (k; n − k;α%) *
r
O valor de q[k;(k-1)(b-1);α%] com k graus de liberdade para o tratamento e (k-1)*(b-1) graus de liberdade para o
resíduo é encontrado na Tabela 6 a um nível de significância de 5%. (anexo). Assim, q[k;(k-1)(b-1)] = q[4;(4-1)*(5-
1)]= q[4;12;5%]=4,20
QMR=25,0 (ANOVA) e r=b=5 (quando trata-se de experimentos em Blocos, o termo r da fórmula acima
deve ser substituído pelo numero de blocos “b”)
Assim, o valor da d.m.s. será:
25 d.m.s. = 9,4
d.m.s. = 4,20 *
5
Assim, para o teste de Tukey duas médias serão estatisticamente diferentes quando o valor
absoluto da diferença entre elas for maior ou igual a d.m.s.
Por exemplo, como para o contraste CAB=3,0 ≤ d.m.s.=9,4 as médias são estatisticamente iguais, ou seja,
aceito H0. Já para o contraste CAc=11,0 ≥ d.m.s.=9,4 as médias são estatisticamente diferentes, ou seja,
rejeito H0.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 20
Resumo do teste Tukey
Contrastes Valor absoluto(C) d.m.s. Decisão a 5%
CAB 3 9,4 Aceito H0 (iguais)
CAC 11 9,4 Rejeito H0(diferente)
CAD 2 9,4 Aceito H0 (iguais)
CBC 8 9,4 Aceito H0 (iguais)
CBD 5 9,4 Aceito H0 (iguais)
CCD 13 9,4 Rejeito H0 (diferente)
Quadro de Comparações de Médias segundo os respectivos métodos
Médias Tukey
µA 32 a
µB 35 a b c
µC 43 b
µD 30 a c
Nota: Letras iguais correspondem a médias iguais ao nível de 5% de significância pelo teste de Tukey
a) Teste T (t-Student)
De acordo com BANZATTO & KRONKA (1992), os requisitos básicos deste teste são:
os contrastes a serem testados devem ser ortogonais entre si;
os contrastes devem ser estabelecidos antes de serem examinados os dados (na fase de planejamento
do experimento).
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 21
Hipótese de interesse
H0: C=0
vs.
H1: C≠0
A estatística do Teste T para testar a hipótese H0 é dada através da diferença mínima
significativa (d.m.s.):
1 1
Experimento não balanceado d .m.s. = t c ( n − k ;α %) * + * QMR
r r
i j
2 * QMR
Experimento balanceado d .m.s. = t c ( n − k ;α %) *
r
O valor de tc(n-k; α%) com n-k graus de liberdade para o resíduo e α% de significância podem ser
encontrados na Tabua V (anexo). Já QMR (quadrado médio dos resíduos) pode ser encontrado na Tabela
ANOVA e r, representa o nº de repetições de cada tratamento.
Regra de Decisão
Toda vez que o valor absoluto da diferença entre duas médias (contrastes) for maior ou igual
que o valor da d.m.s., as médias são estatisticamente diferentes, ao nível de significância de α%, o que
implica na rejeição da hipótese H0.
b) Teste de Tukey
De acordo com BANZATTO & KRONKA (1992), este teste pode ser utilizado para testar todo e
qualquer contraste entre duas médias. É um teste muito versátil, mas não permite comparar grupos entre
si. Para que o teste seja exato, é necessário que todos os tratamentos possuam o mesmo número de
réplicas.
O teste tem por base a diferença mínima significante (d.m.s.), ou seja, a menor diferença de
médias de amostras que deve ser tomada como estatisticamente significante, em determinado nível.
Hipótese de interesse
H0: µi=µj
vs.
H1: µi≠µj para i≠j
A estatística de Tukey é dada através da diferença mínima significativa (d.m.s.)
1 1 QMR
Experimento não balanceado d.m.s. = q c (k; n − k;α%) * + *
r r 2
i j
QMR
Experimento balanceado d.m.s. = q c (k; n − k;α%) *
r
O valor de qc(k;n-k;α%) com k graus de liberdade para o tratamento e (n-k) graus de liberdade para o
resíduo podem ser encontrados nas Tabelas 5, 6 e 7, respectivamente, para um nível de significância de
1%, 5% e 10%. (anexo). Já QMR (quadrado médio dos resíduos) pode ser encontrado na Tabela ANOVA e
r, representa o nº de repetições de cada tratamento.
Regra de Decisão
Para este teste, duas médias são estatisticamente diferentes quando o valor absoluto da diferença
entre elas for maior ou igual a d.m.s.
Obs.: De acordo com GOMES(1987), no caso de serem diferentes os números de repetições, o teste de
Tukey pode ainda ser usado, mas então é apenas aproximado.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 22
c) Teste de Dunnett
Utiliza-se este teste quando as únicas comparações que interessam ao experimentador são
aquelas feitas entre a testemunha e cada um dos demais tratamentos, não havendo interesse na
comparação dos demais tratamentos entre si.
Hipótese de interesse
H0: µi = µcontrole. para i=1,2,...,p
Versus
H1: µi ≠ µcontrole.
A estatística de Dunnett é dada através da diferença mínima significativa (d.m.s.):
1 1
Experimento não balanceado d .m.s. = t d [( k −1); ( n − k ); α % ] * + * QMR
r rc
t
2 * QMR
Experimento balanceado d .m.s. = t d [( k −1); ( n − k ); α % ] *
r
O valor de td [(k-1); (n-k); α%] com (k-1) graus de liberdade para os grupos tratados e (n-k) graus de
liberdade para o resíduo com α% de significância podem ser encontrados nas Tabelas 11 e 12,
respectivamente para uma significância de 1% e 5%. Já o QMR (quadrado médio dos resíduos) pode ser
encontrado na Tabela ANOVA e r, representa o nº de repetições de cada tratamento. Para o caso de
experimento não balanceado, o termo rc representa o número de repetições para o grupo controle e rt o
número de repetições para o grupo tratado.
Regra de Decisão
Rejeita-se a hipótese H0 quando o valor absoluto do contraste C=µi-µcontrole. for maior ou igual que a
d.m.s. a um nível de significância de α%.
8 9
7 8
7
6
Notas
Notas
crianças crianças
6
5 adultos adultos
5
4
4
3 3
A B A B
Tratamentos Tratamentos
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 23
NÃO HAVERÁ INTERAÇÃO TRATAMENTOS VERSUS BLOCOS SE:
Os tratamentos tiverem o mesmo efeito em todos os blocos, conforme abaixo:
10
9
8
Notas
7 crianças
6 adultos
5
4
3
A B
Tratamentos
Considere como exemplo, um esquema que pode ser utilizado para execução e acompanhamento
de um experimento a campo onde, tem-se um delineamento em blocos casualizados com repetições
estudando-se 2 tratamentos (A,B) em 2 blocos e com 3 repetições de cada tratamento por bloco,
perfazendo um total de 12 parcelas experimentais. Dentro de cada Bloco mais uma vez os tratamentos
devem ser distribuídos por sorteio.
Bloco 1
B A A B A B
Bloco 2
A B A B B A
Uma outra forma de delineamento em blocos são os experimentos em blocos ao acaso com
repetições. Aqui o número de unidades que caem dentro de um bloco pode ser maior do que o número de
tratamentos que o pesquisador pretende comparar. Imagine que um pesquisador dispõe de 13 ratos, sendo
7 machos similares entre si e 6 fêmeas também similares entre si e se queira comparar o efeito de duas
rações sobre o ganho de peso dos animais. O esquema experimental poderia ser tal como o apresentado
na Figura 12.
onde:
Yij = variável resposta coletada sob o i-ésimo nível do fator no bloco j;
µ = média global comum a todas as observações;
τi = efeito do i-ésimo nível do fator, ou seja, efeito tratamento;
βj = efeito do i-ésimo bloco, ou seja, efeito do bloco;
τβij= efeito da interação entre tratamentos e blocos;
eij = componente do erro aleatório associado à observação Yij.
As suposições associadas a este modelo são:
i) Os erros eij são independentes (aleatorização);
ii) Os erros eij possuem variância constante (σ = cte);
2
iii) Os erros eij são variáveis aleatórias independentes e identicamente distribuídas, tendo distribuição
normal com média zero e variância constante, isto é eij ≈ N (0,σ ).
2
b) Hipóteses de Interesse
Para o caso em estudo estamos considerando o caso que o tratamento (fator) é um fator fixo.
H0:τ1 = τ2 =...= τa = 0 (hipótese de nulidade)
vs.
H1: τi ≠ 0, para pelo menos um i (hipótese alternativa)
c) Tabela de Análise de Variância para um fator fixo (ANOVA)
Para fazer a análise de variância de um experimento em blocos casualizados com repetições é
preciso calcular as seguintes informações:
c.1) os graus de liberdade:
de tratamentos: k-1
de blocos: b-1
da interação: (k-1)*(b-1)
do resíduo: k*b*(r-1)
do total: n-1
c.2) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O
valor de C é chamado de “correção”:
(∑ Y ) 2
C=
(∑ T ) k
2
C=
ij
ou
n n
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 25
c.3) a soma de quadrados total :
SQTot = (∑ Yij2 ) − C
c.4) a soma de quadrados de tratamentos:
∑ Τk2
SQTr = −C
b*r
c.5) a soma de quadrados de blocos:
∑ Bk2
SQB = −C
k * r
c.6) a soma de quadrados da interação (tratamento versus blocos):
SQI =
∑I 2
- C - SQTr - SQB
r
c.7) a soma de quadrados de resíduos:
SQR = SQTot - SQTr - SQB - SQI
c.8) o quadrado médio de tratamentos:
SQTr
QMTr =
k −1
c.9) o quadrado médio de blocos:
SQB
QMB =
b −1
c.10) o quadrado médio da interação:
SQI
QMI =
(k - 1) * (b - 1)
c.11) o quadrado médio de resíduos:
SQR
QMR =
k * b * (r - 1)
c.12) os valores de F:
Exemplo de Aplicação
1) Um professor conduziu um experimento para comparar a eficiência de quatro fontes de
informação: jornais(JO), televisão (TE), revistas (RE) e rádio(RA). Participaram desse experimento
24 alunos. Como os alunos eram de idades diferentes, o professor separou os alunos em dois
blocos, de acordo com a faixa de idade (jovens e velhos). Depois sorteou, dentro de cada bloco,
uma fonte de informação para cada aluno. Os alunos então se submeteram ao experimento, isto
é, tomaram conhecimento sobre determinado assunto apenas pela fonte de informação que lhes
havia sido sorteada. Depois, todos fizeram o mesmo teste de conhecimento, obtendo-se as notas
abaixo:
Desempenho em termos de notas dos alunos para cada fonte de informação e faixa de idade
Blocos Tratamentos TOTAL
JO TE RE RA
65 56 58 38
I 69 49 65 30 648
73 54 57 34
72 73 76 71
II 79 77 69 65 864
80 69 71 62
TOTAL 438 378 396 300 1512
a) Análise preliminar
Unidade Experimental Alunos
Variável de Interesse Eficiência das fontes de informação
Fator em estudo Fontes de informação
Níveis do Fator 4 [jornais(JO), televisão (TE), revistas (RE) , rádio(RA)]
Fator Fixo Porque as 4 fontes de informação foram definidos pelo professor
Blocos 2 ( blocos I, II – faixa de idade)
Quando temos um experimento em blocos casualizados com repetições (balanceado), com um fator
fixo, temos interesse em verificar a influência dos k níveis desse fator (tratamento) nos diferentes blocos
para a variável resposta Y em estudo. Assim, os seguintes modelos estatísticos associados a este tipo de
experimento podem ocorrer caso haja interação ou não haja interação, respectivamente:
80
75
70
65
60 I
Notas
55 II
50
45
40
35
30
JO TE RE RA
Tratamentos
Como não houve paralelismo entre os comportamentos dos tratamentos considerando os dois
blocos, há indícios de que haja interação entre tratamentos e blocos.
b) Hipóteses de Interesse
H0: Τ1=Τ2=...=Τk= 0 (hipótese de nulidade)
Versus
H1: pelo menos um Τk é diferente de zero (hipótese alternativa)
c) Tabela de Análise de Variância para um fator fixo (ANOVA)
Para fazer a análise de variância de um experimento em blocos casualizado é preciso calcular as
seguintes informações:
c.1) os graus de liberdade:
de tratamentos: k-1 4-1=3
de blocos: b-1 2-1=1
da interação: (k-1)*(b-1) (4-1)*(2-1)=3*1=3
do resíduo: k*b*(r-1) 4*2*(3-1)=16
do total: n-1 24-1=23
c.2) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O
valor de C é chamado de “correção”:
C=
(∑ T ) k
2
C=
(1512)2 ⇒ C = 95256
n 24
c.3) a soma de quadrados total :
SQTot = (∑ Yij2 ) − C
(
SQTot = 65 2 + 69 2 + ... + 65 2 + 62 2 − 95256 ) SQTot = 99638 − 95256 ⇒ SQTot = 4382
SQI =
∑I 2
- C - SQTr - SQB
r
207 2 + 2312 + 159 2 + 219 2 + 180 2 + 216 2 + 102 2 + 198 2
SQI = - 95256 - 1668 - 1944 = 99372 - 98868 = 504
3
A título de exemplificação, usaremos aqui o teste T-Student para comparação múltipla entre os
tratamentos (JO,TE,RE,RA). Quais são suas conclusões ao nível de 5% de significância?
O Teste T-Student
A estatística de T-Student é avaliada pela diferença mínima significativa (d.m.s.)
2 * QMR
d .m.s. = t c {[ k*b*(r -1)];α %} *
r
O valor de tc{[k*b*(r-1)]; α%} com [k*b*(r-1)] que são os graus de liberdade do resíduo da ANOVA e a coluna de
5% (0,05) de significância da tabela T-Student (Tabela 4 em anexo). Assim, tc[16; 5%] = 2,12. O QMR=16,625
(ANOVA) e r=3 (quando se trata de experimentos em blocos com repetições e há interação, utiliza-se o
número de repetições de cada tratamento dentro de cada bloco, caso contrário o número total de repetições
de cada tratamento, independente do bloco).
Assim, o valor da d.m.s. será:
2 *16,625
d .m.s. = 2,12 * → d .m.s. = 7,06
3
Assim, para o teste de T-Student duas médias serão estatisticamente diferentes quando o valor
absoluto da diferença entre elas ( |C| ) for maior ou igual a d.m.s.
Os contrastes(C) entre os tratamentos são apresentados na tabela abaixo:
Contrastes(C) Bloco I Bloco II
CJO-TE |69-53|=16 * (≠) |77-73|=04 (=)
CJO-RE |69-60|=09 * (≠) |77-72|=05 (=)
CJO-RA |69-34|=35 * (≠) |77-66|=11 * (≠)
CTE-RE |53-60|=07 (=) |73-72|=01 (=)
CTE-RA |53-34|=19 * (≠) |73-66|=07 (=)
CRE-RA |60-34|=26 * (≠) |72-66|=06 (=)
Nota: (*) representa médias estatisticamente diferentes entre si a 5% de
significância, segundo o teste T-Student.
Por exemplo, como dentro do Bloco I o contraste CJO-TE=16 ≥ d.m.s.=7,06, diz-se que as médias são
estatisticamente diferentes entre si. E em caso contrário, elas seriam consideradas iguais entre si.
Quadro de comparações de médias segundo os tratamentos e blocos
Médias Bloco 1 (jovens) Bloco 2 (velhos)
µjornal 69 a 77 a
µtelevisão 53 b 73 ab
µrevista 60 b 72 ab
µrádio 34 66 b
Nota: Letras iguais correspondem a médias iguais ao nível de 5% de significância por T-Student.
Com base nisto é fácil verificar que :
a) entre os mais jovens (bloco I), televisão e revista deram resultados estatisticamente iguais;
b) entre os mais jovens (bloco I), jornal foi estatisticamente melhor que as outras 3 fontes de
informação;
c) entre os mais jovens (bloco I), o rádio foi o que apresentou resultados estatisticamente piores
quando comparados com as outras 3 fontes de informação;
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 30
d) entre os mais velhos (bloco II), as fontes de informação jornal, televisão e revistas apresentaram
entre si resultados estatisticamente iguais;
e) entre os mais velhos (bloco II), as fontes de informação televisão, revistas e rádio também
apresentaram entre si resultados estatisticamente iguais;
f) assim, entre os mais velhos (bloco II), observou-se que somente o jornal apresentou resultado
estatisticamente diferente e melhor que o rádio.
O experimento poderia ser montado num esquema fatorial 3 x 3, ou seja, dois fatores cada qual
em três níveis. Como exemplo imagine um experimento de adubação onde se comparam três níveis de
nitrogênio (N) e três níveis de fósforo (P), obtendo-se um total de 9 tratamentos em comparação como
mostra o esquema abaixo:
Nitrogênio (N)
Fósforo (P)
N0 N1 N2
P0 N0P0 N1P0 N2P0
P1 N0P1 N1P1 N2P1
P2 N0P2 N1P2 N2P2
Os fatoriais 2 x 2 x 2 são experimentos em que se analisam os efeitos de três fatores – como por
exemplo, nitrogênio (N), fósforo (P) e potássio (K) – cada um em dois níveis [ausência (0) e presença (1)].
Neste caso teremos 8 tratamentos em comparação como mostra o esquema abaixo:
Nitrogênio (N)
N0 N1
Fósforo (P)
Potássio (K) P0 P1 P0 P1
K0 N0P0K0 N0P1K0 N1P0K0 N1P1K0
K1 N0P0K1 N0P1K1 N1P0K1 N1P1K0
Também podem ser feitos experimentos fatoriais 3 x 4, 2 x 3, etc. Assim, por exemplo, um
experimento para testar três níveis de fósforo, na presença (1) ou ausência (0) de irrigação, seria um
fatorial 3 x 2.
a) Modelo Estatístico
Considerando um experimento cruzado fixo, o modelo associado será:
onde:
Yijk = observação correspondente à k-ésima unidade experimental submetida ao i-ésimo nível do
Fator A e j-ésimo nível do Fator B;
µ = média global comum a todas as observações;
αi = efeito do i-ésimo nível do fator A;
βj = efeito do j-ésimo nível do fator B;
αβij= é o efeito de interação entre o i-ésimo nível do fator A e o j-ésimo nível do fator B;
eijk = componente do erro aleatório associado à observação Yijk.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 32
Os efeitos αi e βj são denominados efeitos principais. Caso não exista interação entre os fatores,
o modelo ficará: Yijk = µ + α i + β j + eijk . Neste caso os efeitos A e B são aditivos.
Segundo URIBE-OPAZO (1999), em experimentos deste tipo todas as informações sobre o efeito
dos fatores A e B na variável resposta pode ser obtida fazendo-se a inferência apenas sobre as médias µi. e
µ.j que representam respectivamente, a média populacional da variável resposta no i-ésimo nível do fator A
e, a média populacional da variável resposta no j-ésimo nível do fator B.
Isto ocorre porque em experimentos aditivos, a diferença entre as médias populacionais em
quaisquer 2 níveis de um fator é a mesma qualquer que seja o nível do outro fator, o que não ocorre
quando existe interação entre os fatores, onde o padrão do nível de diferença entre os níveis de um fator
depende dos níveis do outro fator.
Considere por exemplo, um experimento com dois fatores A e B com 2 e 3 níveis respectivamente.
Na figura abaixo, representa-se graficamente a existência de interação (b) e inexistência desse efeito (a).
Sem Interação Com Interação
A1
A1
A2
A2
(a) (b)
B1 B2 B3
B1 B2 B3
As suposições associadas ao modelo
i) Os erros eijk são variáveis aleatórias independentes e identicamente distribuídas, tendo
distribuição normal com média zero e variância constante, isto é, eijk ≈ N (0,σ2).
b) Hipóteses de Interesse
As hipóteses gerais são:
H01: α1 = α2 =...= αa = 0 (não existe efeito do fator A)
vs.
H11: pelo menos um αi ≠ 0 (existe efeito do fator A)
c) Tabela de Análise de Variância (ANOVA) para experimentos com dois fatores cruzados
Para fazer a análise de variância de um experimento fatorial com interação é preciso determinar
as seguintes informações:
c.1) os graus de liberdade:
de fator A: a-1
de fator B: b-1
da interação: (a-1)*(b-1)
do resíduo: a*b*(r-1)
do total: n-1
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 33
c.2) o valor de C é dado pelo total geral elevado ao quadrado e dividido pelo número de dados. O
valor de C é chamado de “correção”:
C=
(∑ Y ) ijk
2
n
c.3) a soma de quadrados total :
SQTot = (∑ Y ) − C 2
ijk
c.4) a soma de quadrados do Fator A: (mede a variação devida ao acaso quando o fator A não exerce
efeito sobre a variável resposta. Quando há efeito de A, SQA reflete a variabilidade provocada por este
efeito, além da variação devido ao acaso).
∑ ΤAk2
SQA = −C
b * r
c.5) a soma de quadrados do Fator B: (mede a variação devida ao acaso quando o fator B não exerce
efeito sobre a variável resposta. Quando há efeito de B, SQB reflete a variabilidade provocada por este
efeito, além da variação devido ao acaso).
∑ TBk2
SQB = −C
a * r
c.6) a soma de quadrados da interação (Fator A versus Fator B): (mede a variação devida ao acaso
quando a interação entre os fatores A e B não exerce efeito sobre a variável resposta. Se há efeito da
interação entre A e B, SQAB reflete a variabilidade provocada por este efeito, além da variação devido
ao acaso).
∑I2
SQI = - C - SQA - SQB
r
c.7) a soma de quadrados de resíduos: (mede a variação devida ao acaso, isto é, a variação das
observações dentro de cada tratamento. Ou ainda, mede a variação natural do experimento sem levar
em conta os possíveis efeitos A e B e da interação AB).
SQR = SQTot - SQA - SQB - SQI
c.8) o quadrados médios do Fator A, Fator B, da interação(A*B) e do resíduo:
SQA SQB SQI SQR
QMA = QMB = QMI = QMR =
a −1 b −1 (a - 1) * (b - 1) a * b * (r - 1)
c.9) os valores de F:
Assim, fazendo mais uma vez uso da tabela de Fisher-Snedecor (Tabela 1, 2 ou 3) procurando o
valor da distribuição estatística sobre H0 (Ftab) para cada estatística (F0, F1 e F2), chega-se às
conclusões:
Se Fcal(0,1 e2) ≥ Ftab, rejeita-se a hipótese de nulidade H0i a nível de α% de significância.
Se Fcal(0,1 e2) < Ftab, aceita-se a hipótese H0i.
A ANOVA preliminar será então avaliada através destes quatro tratamentos, ou seja, através de um
DIC, conforme tabela abaixo:
F. V. G.L. S.Q. Q.M. F
Tratamentos 3 2088 696 51,56
Resíduo 8 108 13,5
TOTAL 11 2196
Como F0=51,56 ≥ Ftab[3;8;5%]=4,07 significa que houve diferença entre os tratamentos. Como o
experimento tem um delineamento fatorial, temos que testa a interação entre os dois fatores, assim, a
ANOVA precisa ser desdobrada. Para isso, o primeiro passo é organizar a tabela abaixo:
Irrigação (A)
A0 A1 Total
25 41
B0 32 ∑ 84 35
∑ 114 198
27 x = 28 38 x = 38
Calagem(B)
35 ∑ 96 60 ∑ 186
B1 28 67 282
x = 32 x = 62
33 59
Total 180 300 480
a) Modelo Estatístico
Considerando um experimento cruzado fixo, o modelo associado será:
70
Peso das plantas
60
B0
50
B1
40
30
20
A0 Tratamentos A1
Como não houve paralelismo entre os comportamentos dos tratamentos considerando os dois
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 36
fatores (irrigação e calagem), há indícios de que haja interação entre os dois fatores em estudo.
b) Hipóteses de Interesse
H0: Τ1=Τ2=...=Τk= 0 (hipótese de nulidade)
Versus
H1: pelo menos um Τk é diferente de zero (hipótese alternativa)
c.1) os graus de liberdade:
de fator A: a-1 2-1=1
de fator B: b-1 2-1=1
da interação: (a-1)*(b-1) (2-1)*(2-1)=1
do resíduo: a*b*(r-1) 2*2*(3-1) =8
do total: n-1 12-1 =11
c.2) O valor de C é chamado de “correção”:
C=
(∑ Y ) ijk
2
C=
(480)2 = 19200
n 12
c.3) a soma de quadrados total :
SQTot = (∑ Y ) − C
2
ijk SQTot = (25 2 + 32 2 + ... + 67 2 + 59 2 ) − 19200 = 21396 − 19200 = 2196
c.4) a soma de quadrados do tratamento A:
∑ ΤAk
2
1802 + 3002
SQA = −C
SQA = − 19200 = 20400 − 19200 = 1200
b*r 2*3
c.5) a soma de quadrados do tratamento B:
∑ TAk2 1982 + 2822
SQB = −C
SQB = − 19200 = 19788 − 19200 = 588
a * r 2 * 3
c.6) a soma de quadrados da interação (Fator A versus Fator B):
∑I2 84 2 + 96 2 + 114 2 + 186 2
SQI = - C - SQA - SQB SQI = − 19200 - 1200 - 588 = 300
r 3
c.7) a soma de quadrados de resíduos:
SQR = SQTot - SQA - SQB - SQI SQR = 2196 − 1200 − 588 − 300 = 108
c.8) os quadrados médios do Fator A, Fator B, da interação(A*B) e do resíduo:
SQA 1200 SQB 588
QMA = = = 1200 QMB = = = 588
a −1 1 b −1 1
SQI 300 SQR 108
QMI = = = 300 QMR = = 13,5
(a - 1) * (b - 1) (2 − 1) * (2 − 1) a * b * (r - 1) 2 * 2 * (3 − 1)
c.9) os valores de F:
QMA 1200 QMB 588 QMI 300
F0 = = = 88,89 F1 = = = 43,56 F2 = = = 22,22
QMR 13,5 QMR 13,5 QMR 13,5
Análise de Variância (ANOVA) fica então:
Fonte de Graus de Soma Quadrado Quadrado Médio
F
Variação (F.V.) Liberdade (G.L.) (S.Q.) (Q.M.)
Fator A (irrigação) 1 1200 1200 88,89
Fator B (calagem) 1 588 588 43,56
Interação (A*B) 1 300 300 22,22
Resíduos 8 108 13,5 --
TOTAL 11 2196 -- --
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 37
d) Regra de Decisão
Como F2=22,22 ≥ Ftab[1;8;5%]=5,32, rejeita-se a hipótese de nulidade H0 a nível de 5% de significância,
conseqüentemente, a interação entre os níveis do Fator A – irrigação (com e sem) e os níveis do Fator
B – calagem (com e sem) é significativa, portanto, recomenda-se comparar os níveis de B dentro de
A e os níveis de A dentro de B através de um teste de comparação de médias.
Aplicando o teste Tukey para comparação múltipla entre os níveis dos dois fatores (A e B), quais
são suas conclusões ao nível de 5% de significância?
A estatística de Tukey é avaliada pela diferença mínima significativa (d.m.s.)
QMR 13,5
d .m.s. = qc{( a*b );[ k *b*(r -1)];α %} * d .m.s. = 4,53 * → d .m.s. = 9,61
r 3
O valor de qc{(a*b); [k*b*(r-1)]; α%} com (a*b) que representa os graus de liberdade (número de níveis do Fator A e
Fator B) buscados na coluna da tabela; [k*b*(r-1)] que são os graus de liberdade do resíduo da ANOVA
(buscados na linha da tabela) da Tabela 6 em anexo a 5% (0,05) de significância da tabela Tukey. Assim,
qc[(2*2); [2*2*(3-1)]; 5%] qc[4; 8; 5%]=4,53. O QMR=13,5 (ANOVA) e r=3 (três repetições dentro de cada nível de
cada Fator. Assim, o valor da d.m.s. será:
Médias do Fator A (irrigação) dentro do Fator B (calagem)
Calagem Irrigação Contraste
A0 A1 | A0 – A1 |
B0 28 38 10*
B1 32 62 30*
| B0 – B1 | 4 24* ----
Nota: (*) representa médias estatisticamente diferentes entre si a 5% de
significância, segundo o teste Tukey.
Com base nisto podemos concluir que:
a) A irrigação (Fator A) teve efeito sobre o peso das plantas, tanto na presença (B1) como na
ausência (B0) de calagem;
b) Na presença de irrigação (A1), a calagem (Fator B) teve efeito sobre o peso das plantas. Já na
ausência de irrigação (A0), a calagem (Fator B) não teve efeito sobre o peso das plantas.
Mas as pesquisas nem sempre têm, como objetivo, testar a interação. Muitas vezes já se sabe
que a interação existe. Se for este o caso, o pesquisador pode optar por outra forma de desdobrar a
ANOVA. Por exemplo, se o objetivo é comparar os efeitos do Fator B(calagem) dentro de cada nível
do Fator A (irrigação), é razoável desdobrar a ANOVA como é feito a seguir:
Irrigação (A)
A0 A1 Total
25 41
B0 32 ∑
84
35
∑ 114 198
27 x = 28 38 x = 38
Calagem(B)
35 60
B1 28
∑ 96 67
∑ 186 282
33 x = 32 59 x = 62
Total 180 300 480
c.4) a soma de quadrados do tratamento A - irrigação (já calculada):
∑ ΤAk2
1802 + 3002
SQA = −C
SQA = − 19200 = 20400 − 19200 = 1200
b * r 2*3
c.4.1) a soma de quadrados do tratamento B c.4.2) a soma de quadrados do tratamento B
dentro do nível A0: dentro do nível A1:
842 + 962 1802 1142 + 1862 3002
SQBdt A0 = − = 24 SQBdt A1 = − = 864
3 6 3 6
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 38
Estes resultados estão apresentados na ANOVA desdobrada a seguir:
Fonte de Graus de Soma Quadrado Quadrado Médio
F Ftab
Variação (F.V.) Liberdade (G.L.) (S.Q.) (Q.M.)
Fator A (irrigação) 1 1200 1200 88,89 (s) 5,32
B dentro A0 1 24 24 1,78 (ns) 5,32
B dentro A1 1 864 864 64,00 (s) 5,32
Tratamentos 3 2088 696 51,56 (s) 4,07
Resíduos 8 108 13,5 --
TOTAL 11 2196 -- --
Nota: (ns) representa diferença de médias não significativa, ou seja iguais e (s) representa diferença de médias
estatisticamente significativas, ou seja diferentes entre si a 5% de significância.
Finalmente, a ANOVA, apresentada anteriormente, poderia ter sido desdobrada de outra forma.
Poderiam ter sido comparados, os efeitos de A (irrigação) dentro de cada nível de B (calagem), desde
que fosse esse o objetivo da pesquisa. A maneira de conduzir a ANOVA é similar a que foi descrita
anteriormente, bastando trocar A por B e B por A.
c.5) a soma de quadrados do tratamento B - calagem (já calculada):
∑ TAk2 1982 + 2822
SQB = −C
SQB = − 19200 = 19788 − 19200 = 588
a * r 2*3
c.5.1) a soma de quadrados do tratamento A c.5.2) a soma de quadrados do tratamento A
dentro do nível B0: dentro do nível B1:
842 + 1142 1982 962 + 1862 2822
SQAdt B0 = − = 150 SQAdt B1 = − = 1350
3 6 3 6
Totais ∑A 21 ... ∑A 2r
Exemplo 1: Os experimentos em esquema fatorial geralmente recebem críticas quanto ao fato de que não
são práticos para instalação de determinados tipos de tratamentos como nos casos de irrigação, adubação,
pulverização, etc. Para melhor explicar, imagine que este interessado em comparar duas variedades (A1 e
A2) e três níveis de irrigação (I0, I1 e I2).
Se o delineamento fosse no esquema fatorial ficaria da forma apresentada abaixo, o que claramente
não seria prático para instalação em campo. Se tivéssemos mais variedades e/ou mais níveis de água o
problema seria mais grave.
Uma solução para resolver este problema seria inicialmente realizar o sorteio do fator que torna mais
difícil a instalação no esquema fatorial (irrigação) assim:
I2 I0 I1
A1 A2 A2 A1 A2 A1
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 40
Exemplo 2: Vamos considerar um experimento para testar o fator calcário (fator A), com 3 níveis (A1, A2,
A3). Um segundo fator adubo (fator B) em 3 níveis (B1, B2, B3) pode ser sobreposto, dividindo-se cada
parcela de A em 3 subparcelas, e casualizando os níveis de B nestas 3 subparcelas. Após a casualização
dos níveis de A e dos níveis de B o esquema de distribuição no campo pode ser o seguinte:
A2 A1 A3
B1 B3 B2 B2 B1 B3 B1 B2 B3
Verifica-se então que a casualização é feito em 2 estágios, primeiro casualizamos os níveis do fator
A, em seguida, casualizamos os níveis do fator B nas subparcelas de cada parcela.
Segundo BANZATTO & KRONKA (1992) o delineamento em parcelas subdivididas é desejável nas
seguintes situações:
Ele pode ser usado quando os tratamentos associados aos níveis de um dos fatores exigem maior
quantidade de material na unidade experimental do que os tratamentos do outro fator, o que é comum
em ensaios de campo e de laboratório. Por exemplo, num ensaio de campo um dos fatores poderia ser
o método de preparo do solo, que exige parcelas grandes, e o outro fator poderia ser variedades, que
podem ser comparadas usando parcelas menores;
O delineamento pode ser usado quando um fator adicional é incorporado num experimento para ampliar
seu objetivo. Por exemplo: vamos supor que o principal objetivo de um experimento seja comparar os
efeitos de diversos fungicidas como proteção contra infecção por uma doença. Para ampliar o objetivo
do experimento, diversas variedades são incluídas, as quais se sabe que diferem quanto a resistência à
doença. Aqui, as variedades poderiam ser distribuídas nas parcelas e os fungicidas nas subparcelas;
Em resumo, quando se trata de experimentos em parcelas subdivididas deseja-se que a variação
entre subparcelas seja menor do que a existente entre as parcelas. Assim, o fator que deverá ser
casualizado nas subparcelas de cada parcela será aquele que: requer uma menor quantidade de material
experimental; seja de maior importância, mostre menores diferenças ou para aquele que pode alguma razão
se deseje uma maior precisão.
Duarte e Aquino (1986) citados por URIBE-OPAZO (1999) apresentam os casos em que o esquema
“split plot” é recomendado quando:
um dos fatores torna difícil a instalação do experimento no esquema fatorial;
um dos fatores exige uma área maior para sua instalação;
deseja-se maior precisão para as comparações entre os níveis de um fator do que entre os níveis do
outro fator.
onde:
Yijk = valor da subparcela que recebeu o nível i e j dos fatores A e B na repetição k;
µ = média global comum a todas as observações;
αi = efeito do nível i do fator “A” que está na parcela;
e(α)k= erro da parcela que recebeu o nível “i” de “A” na repetição k (Erro(A))
βj = efeito do nível “j” do fator “B” que está na subparcela;
αβij= é o efeito de interação entre os fatores A e B;
e(β )jk = erro da subparcela que recebeu os níveis i e j dos fatores A e B na repetição k. (Erro(B))
Uma característica importante deste modelo é a existência de dois erros aleatórios que são
variáveis aleatórias independentes e identicamente distribuídas com distribuição normal, ou seja
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 41
e(α)k ≈
N(0,σ p)e e(β )jk ≈ N(0,σ sp)
2 2
que correspondem respectivamente ao Erro(A) e Erro(B). Em geral
espera-se que o QME(B) < QME(A), pois QME(B) é estimado com um maior número de graus de liberdade
que QME(A).
Se considerarmos a mesma condição, num delineamento em blocos casualizados, teríamos o
seguinte modelo:
Yijk = µ + α i + e(α )k + β j + αβ ij + Bl j + e( β ) jk
b) Hipóteses de Interesse
As hipóteses gerais são:
H0A: α1 = α2 =...= αa = 0 (não existe efeito do fator A - parcela)
vs.
H1A: pelo menos um αi ≠ 0 (existe efeito do fator A)
C=
(∑ Y ) ijk
2
n
c.3) a soma de quadrados TOTAIS - SQTot (subparcelas):
SQTot = (∑ Yijk2 ) − C
c.4) a soma de quadrados do Fator A - SQA (parcelas):
∑ Fpar
2
SQA = −C
b*r
c.5) a soma de quadrados TOTAIS do Fator A – SQTPar (parcelas):
∑ Rbk2
SQTPar = −C
b
c.6) a soma de do ERRO 1 (parcelas):
SQE(A) = SQTPar − SQA
c.7) a soma de quadrados do Fator B - SQB (subparcelas):
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 42
∑ Fsubpar
2
SQB = −C
a*r
c.8) a soma de quadrados da interação [Fator A (parcelas) versus Fator B (subparcelas)]:
∑I2
SQI = - C - SQA - SQB
r
c.9) a soma de do ERRO 2 (subparcelas):
SQE(B) = SQTot - SQA - SQE(A) - SQB - SQI
c.10) o quadrados médios do Fator A (parcelas), Fator B (subparcelas), da interação(A*B) e do
resíduo:
SQA SQE(A) SQB SQI SQE(B)
QMA = QME(A) = QMB = QMI = QME(B) =
a −1 a * (r - 1) b −1 (a - 1) * (b - 1) a * (b - 1) * (r - 1)
c.11) os valores de F:
QMA QMB QMI
F0 = F1 = F2 =
QME(A) QME(B) QME(B)
e) Comparações múltiplas
a) Modelo Estatístico
E1 E2 E3
120
100
Rendimento (m³)
80
60
40
20
0
A B C D E
Variedades (subparcelas)
Como não houve paralelismo entre o comportamento dos dois fatores (espaçamentos e
variedades), há indícios de que haja interação entre os dois fatores em estudo.
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 45
b) Hipóteses de Interesse
H0A: α1 = α2 =...= αa = 0 (não existe efeito do fator A – parcela - espaçamentos)
vs.
H1A: pelo menos um αi ≠ 0 (existe efeito do fator A)
(∑ Y ) 2
C=
(4054)2 = 365220,4
C=
ijk
n 45
c.3) a soma de quadrados TOTAIS - SQTot (subparcelas):
SQTot = (∑ Y )− C
2
ijk
( )
SQTot = 802 + 662 + ... + 1082 + 1032 − 365220,4
SQTot = 377746 − 365220,4 = 12525,6
c.4) a soma de quadrados do Fator A - SQA (parcelas):
∑ Fpar
2
11962 + 13412 + 15172
SQA = −C SQA = − 365220,4
b*r 5*3
SQA = 368665,7 − 365220,4 = 3445,3
c.5) a soma de quadrados TOTAIS do Fator A – SQTPar (parcelas):
∑ Rbk2 4282 + 3902 + 3782 + 4232 + 4622 + 4562 + 5012 + 5212 + 4952
SQTPar = −C SQTPar = − 365220,4
b
5
SQTPar = 369188,8 − 365220,4 = 3968,4
c.6) a soma de do ERRO 1 (parcelas):
SQE(A) = SQTPar − SQA SQE(A) = 3968,4 − 3445,3 = 523,1
c.7) a soma de quadrados do Fator B - SQB (subparcelas):
∑ Fsubpar
2
6502 + 9722 + 8082 + 8222 + 8022
SQB = −C SQB = − 365220,4
a*r 3* 3
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 46
Var (C )
d .m.s. = qc [a ;n*] *
2
onde:
Caso 3: comparar as médias dos tratamentos das subparcelas (variedades) dentro de cada nível das
parcelas (espaçamentos). O valor da Tabela 6 de Tukey é: q c [b; a*( b −1)*( r −1) ] = q c [5; 24;5% ] = 4,17
QME ( B)
d .m.s. = qc [b; a*(b −1)*( r −1) ] * d .m.s. = 4,17 *
37,2
= 14,7
r 3
Contrastes E1 (2x2m) E2 (2,5x2,5m) E3 (3x3m)
CA-B |70,3-107,7|= 37,4 (≠) |75,0-103,3|= 28,3 (≠) |71,3-113,0|= 41,7 (≠)
CA-C |70,3-70,7|= 0,4 (=) |75,0-88,7|= 13,7 (=) |71,3-110,0|= 38,7 (≠)
CA-D |70,3-76,0|= 5,7 (=) |75,0-91,3|= 16,3 (≠) |71,3-106,7|= 35,4 (≠)
CA-E |70,3-74,0|= 3,7 (=) |75,0-88,7|= 13,7 (=) |71,3-104,7|= 33,3 (≠)
CB-C |107,7-70,7|= 37,0 (≠) |103,3-88,7|= 14,6 (=) |113,0-110,0|= 3,0 (=)
CB-D |107,7-76,0|= 31,7 (≠) |103,3-91,3|= 12,0 (=) |113,0-106,7|= 6,3 (=)
CB-E |107,7-74,0|= 33,7 (≠) |103,3-88,7|= 14,6 (=) |113,0-104,7|= 8,3 (=)
CC-D |70,7-76,0|= 5,3 (=) |88,7-91,3|= 2,6 (=) |110,0-106,7|= 3,3 (=)
CC-E |70,7-74,0|= 3,3 (=) |88,7-88,7|= 0,0 (=) |110,0-104,7|= 5,3 (=)
CD-E |76,0-74,0|= 2,0 (=) |91,3-88,7|= 2,6 (=) |106,7-104,7|= 2,0 (=)
Var (C )
d .m.s. = qc [a ;n*] *
2
(g.l.) para tabela 6
n* =
[QME ( A) + (b − 1) * QME ( B)]2
[QME ( A)]2 (b − 1) 2 * [QME ( B)]2
+
a * (r − 1) a * (b − 1) * (r − 1)
n* =
[87,2 + (5 − 1) * 37,2]2 =
236 2
= 25,43 = 25 g.l.
87,2 2 (5 − 1) 2 * [37,2] 87,2 2 4 2 * 37,2 2
2
31,47
d .m.s. = qc [a ;n*] *
Var (C ) d .m.s. = 5,53 * = 21,9
2 2
Contrastes A B C D E
CE1-E2 |70,3-75,0|=4,7 (=) |107,7-103,3|=4,3 (=) |70,7-88,7|=18,0 (=) |76,0-91,3|=15,3 (=) |74,0-88,7|=14,7 (=)
CE1-E3 |70,3-71,3|=1,0 (=) |107,7-113,0|=5,3 (=) |70,7,110,0|=39,3 (≠) |76,0-106,7|=30,7 (≠) |74,0-104,7|=30,7(≠)
CE2-E3 |75,0-71,3|=3,7 (=) |103,3-113,0|=9,7 (=) |88,7-110,0|=21,3 (=) |91,3-106,7|=15,4 (=) |88,7-104,7|=16,0(=)
Prof. Jerry A. Johann “Estatística Descritiva, Probabilidades e Inferência” 48
Quadro Resumo de médias das parcelas (espaçamentos) e subparcelas (variedades)
Parcelas / Subparcelas A B C D E
E1 (2x2m) 70,3a 107,7a 70,7a 76,0a 74,0a
E2 (2,5x2,5m) 75,0a 103,3a 88,7ab 91,3ab 88,7ab
E3 (3x3m) 71,3a 113,0a 110,0ab 106,7ab 104,7ab
Nota: Letras iguais correspondem a médias iguais ao nível de 5% de significância por Tukey.