Apostila 1 - Experimentos
Apostila 1 - Experimentos
Apostila 1 - Experimentos
DEPARTAMENTO DE ESTATÍSTICA
1 Introdução
Em diferentes áreas de estudo, muitas vezes somos levados a tomar decisões para a popu-
lação baseados na observação de uma amostra. Temos que decidir, por exemplo, se uma nova
cultivar que está sendo desenvolvida é melhor do que as já utilizadas. Temos que escolher entre
um conjunto de métodos quais devem continuar ou quais devem ser desprezados, ou ainda, in-
dicar qual dose propicia um melhor resultado no fenômeno em estudo, e assim por diante.
Para tomar estas decisões com embasamento científico, necessitamos estabelecer critérios.
Estes critérios devem ser criados de modo a possibilitar a melhor comparação possível (elimi-
nando efeitos perturbadores) entre as características de interesse. Assim surgem as técnicas
estatísticas para uma pesquisa científica, funcionando como um suporte à tomada de decisão.
A estatística experimental usa uma parte destas técnicas e tem por objetivo o estudo de ex-
perimentos, sendo responsável pelo seu planejamento, execução, análise dos dados obtidos e
interpretação dos resultados.
• definição do problema;
• planejamento do experimento;
Este curso tem como objetivo apresentar os conceitos de estatística experimental, desde a
definição do problema passando cuidadosamente pelo planejamento e apresentando as princi-
pais técnicas de análise dos dados experimentais até chegar na interpretação dos resultados.
Espera-se que ao final o aluno consiga planejar e conduzir um experimento de modo a compa-
rar diferentes tratamentos, sejam eles qualitativos ou quantitativos. Além de conseguir realizar
inferências para a população com base na análise de variância, por meio de testes de hipóteses,
testes de comparações múltiplas ou regressão.
O esquema da figura acima é inerente a todo ensaio experimental, assim compreender este
esquema é essencial em qualquer experimento. Na Figura 1 percebe-se que dentre as diver-
sas variáveis envolvidas em um experimento, a variável resposta (direita) é a única que sai do
experimento. O fator (esquerda) é aquela cujos níveis são controlados formando assim os tra-
tamentos que se tem o interesse de comparar. Existem ainda as variáveis irrelevantes ou não
controladas (embaixo) e as variáveis que são controladas (acima), pois afetam a resposta, mas
não se tem interesse em compará-las.
De modo geral, se você não tem nenhum conhecimento sobre a área em estudo todas as
variáveis ficam embaixo. A medida que são estabelecidos os objetivos e as hipóteses começa-
se a separar as variáveis da esquerda e da direita. E por fim, com o conhecimento sobre a
variável resposta e as condições de realização do experimento define-se quais variáveis podem
ser controladas passando para a parte superior.
• Erro experimental: é a variação que ocorre entre as respostas das parcelas que recebe-
ram o mesmo tratamento, devido ao acaso e a variáveis desconhecidas ou não controladas;
2.1 A Parcela
Também chamada de unidade experimental a parcela é onde é feita a aplicação do trata-
mento, é a menor porção de um experimento e deve ser representativa do fenômeno em estudo.
É a parcela que fornece os dados para serem avaliados, assim, é necessário um estudo um pouco
mais detalhado sobre ela.
• Um vaso com plantas ou um conjunto de três vasos, cada um com uma planta;
A escolha do tamanho da parcela deve ser feito de modo a minimizar o erro experimental.
Existem estudos estatísticos para a determinação do tamanho e forma de parcelas experimen-
tais. Na prática, os pesquisadores utilizam parcelas semelhantes às de outros experimentos já
realizados em condições parecidas.
Por exemplo, em experimentos de análise sensorial pode existir efeito residual de um ali-
mento entre uma prova e outra. O provador pode tomar um copo de água entre uma prova e
outra evitando assim que o efeito de uma unidade experimental ocorra sobre a próxima, influ-
enciando na variável resposta, este copo de água pode ser chamado de bordadura.
Em experimentos realizados no campo o efeito bordadura fica mais evidente. Considere por
exemplo um experimento para avaliar o crescimento de plantas sob diferentes doses de adubo,
em certa unidade experimental uma planta pode crescer mais do que outras sob diferentes tra-
tamentos. Assim parcelas próximas dessa, podem sofrer o efeito de sombreamento e ter sua
resposta influenciada. Ou dependendo da forma de aplicação do adubo, este pode escorrer entre
as parcelas, ou ainda as raízes das plantas podem se estender até outra parcela, etc. É preciso
portanto descartar as plantas das extremidades da parcela para servir de proteção contra esta
interferência. Esta parte da parcela que servirá de proteção é a chamada bordadura da parcela.
Veja na figura abaixo a ilustração de uma parcela retangular com quatro linhas de plantio
sendo que a bordadura constitui as linhas laterais e três plantas nas extremidades de cada linha.
Veja na figura acima que a parcela é um recorte de uma parte da plantação de eucalipto.
Naturalmente existem outras linhas de plantio acima e abaixo das linhas da parcela, bem como
existem outras plantas na linha. Assim ao determinar a área da parcela é preciso considerar
que o limite da parcela não passa necessariamente sobre a as plantas da linha da extremidade.
O comum é considerar a metade do espaçamento entre linhas acima da primeira linha e me-
tade abaixo da última linha da parcela. Mesmo raciocínio para os lados direito e esquerdo,
considera-se que a parcela vai até a metade da distância entre a última planta da parcela e a
planta seguinte.
Assim para o cálculo da área da parcela considera-se os dados como na figura abaixo:
A altura da parcela é dada pelos 3 espaços de 3m entre as 4 linhas, mais 1,5m acima da
primeira linha e 1,5m abaixo da última: Alt = 3 × 3 + 1, 5 + 1, 5 = 12m. Desta forma:
Para atingir os objetivos propostos o erro experimental deve ser minimizado, aumentando
assim a precisão do experimento, o que só é possível com um bom planejamento.
O acompanhamento estatístico deve ser feito desde o planejamento, sob o risco de não
conseguir realizar as comparações de interesse ou mesmo, não chegar em nenhuma conclusão
válida causando desperdício de recursos. Um experimento bem planejado deve ser simples, ter
precisão suficiente e ausência de erro sistemático, além de possibilitar as análises estatísticas
apropriadas e fornecer conclusões válidas.
3.1 Hipóteses
Todo experimento deve começar com uma hipótese, ou seja, é preciso ter os objetivos do
experimento bem definidos. O sucesso de um estudo científico inicia-se com o bom entendi-
mento do problema, estabelecendo os objetivos a serem atingidos e a clareza na formulação das
hipóteses a serem testadas.
Naturalmente surgem duas hípóteses:
• A que sugere que não existe diferença significativa entre o efeito dos tratamentos na
variável resposta em estudo, denominada hipótese nula, ou H0 .
• E a que sugere que pelo menos um dos tratamentos apresenta efeito diferente dos demais
na variável resposta em estudo, denominada hipótese alternativa, ou H1 .
Dada uma hipótese, ela pode ser avaliada por meio de um experimento. Coletados os dados,
a estatística nos fornece ferramentas para testar estas hipóteses. As possíveis conclusões são:
- Rejeitar H0 , pois existem evidências suficientes no experimento.
- Não rejeitar H0 , pois não existem evidências suficientes no experimento.
É conveniente lembrar que mesmo tomando todos os cuidados necessários, as decisões to-
madas podem não ser corretas, pois estaremos trabalhando com amostras. As situações possí-
veis são explicitadas na tabela a seguir.
Tabela 1: Possíveis situações envolvidas na escolha de uma hipótese.
Decisão
Rejeitar H0 Não rejeitar H0
H0 verdadeira erro tipo I ✓
H0 falsa ✓ erro tipo II
Entre os dois possíveis erros, o erro tipo I é o mais grave. Assim a probabilidade de cometer
o erro tipo I pode ser fixada pelo pesquisador e é denominada “nível de significância” do teste,
simbolizada por α. Geralmente α = 5% ou α = 1%.
Na lista acima, os items 1 à 4 já foram discutidos neste material. Sobre os items 5 e 6 iremos
estudar um pouco mais adiante no curso.
i) Repetição
ii) Casualização
Consiste na atribuição dos tratamentos aleatoriamente nas parcelas (sorteio). Evita o arranjo
sistemático, garantindo a independência dos erros.
Este só deve ser utilizado quando as parcelas, antes de receberem os tratamentos apresentam
condições diferentes entre si. As parcelas semelhantes são agrupadas em blocos, assim o expe-
rimento fica dividido em blocos heterogêneos entre si, mas homogêneo dentro de cada bloco.
Naturalmente cada bloco deve receber todos os tratamentos, evitando assim o favorecimento
de algum tratamento.
Exemplo: Suponha que você deseja realizar um experimento para comparar a produtividade
de 3 cultivares de milho.
Naturalmente você terá que repetir as parcelas, pois sem repetição não será possível esti-
mar o erro experimental. Suponha que tem espaço para 4 repetições.
Esta repetição sistemática, causa dependência entre as parcelas, pois os tratamentos estão
sempre em sequência, assim é preciso fazer a casualização.
Veja que se o local de realização do experimento for homogêneo em todas as parcelas, en-
tão já finalizamos o croqui do experimento. Por isso a repetição e casualização são os únicos
princípios que devem ocorrer em todos os experimentos.
Mas apenas para ilustrar o controle local, considere que existe uma declividade no terreno
e se o croqui ficar da forma como está na figura acima, o tratamento B seria beneficiado pois
tem mais parcelas dele na parte de baixo, teoricamente mais fértil. Assim precisamos garantir
que tenha todos os tratamentos em todos os níveis de fertilidade, esta é a idéia do controle
local. Veja como ficaria na figura abaixo.
Agora existe um controle local sobre a declividade do terreno. Desta forma, cada linha (ou
bloco) contém todos os tratamentos.
De modo geral, o controle local funciona como restrições no momento de casualizar os trata-
mentos. As diferentes maneiras de utilizar o controle local definem os principais delineamentos
experimentais, os quais veremos com mais detalhes ao longo do curso.
3.3 Exercícios
1: Um extensionista, desejando comparar 10 rações para avaliar o ganho de peso em animais,
procedeu da seguinte forma:
- tomou 10 animais de uma propriedade rural. Estes 10 animais não eram homogêneos entre
si, porque foram oriundos de diferentes cruzamentos raciais e apresentavam idades diferentes.
Ele então separou um grupo com os 5 melhores e outro com os 5 piores animais.
- as rações que o extensionista julgou ser as melhores foram designadas ao grupo dos me-
lhores animais, e as rações que o extensionista julgou ser as piores foram designadas aos piores
animais, de tal forma que cada animal recebeu uma única ração.
- ao final de sua pesquisa, o extensionista recomendou a ração que proporcionou maior ga-
nho de peso nos animais.
4 Inferência Estatística
Em estatística estamos interessados em generalizar conclusões com base em amostras. Par-
ticularmente em estatística experimental desejamos expandir as conclusões com base nos resul-
tados de um experimento planejado. Em outras palavras, desejamos obter conclusões para os
parâmetros com base em estimativas obtidas no experimento.
Relembre-se que:
• Parâmetro: medida utilizada para descrever uma característica da população.
• Estimador: é a expressão algébrica utilizada para obter um valor aproximado do parâ-
metro.
• Estimativa: é o valor numérico obtido pelo estimador com base na amostra.
No dia a dia usamos inferência para tomarmos decisões, praticamente o tempo todo. Por
exemplo, quando queremos verificar o tempero de uma sopa, pegamos um pouco na colher e
experimentamos. O produtor, para saber se o lote de café já atingiu o ponto ideal de seca, ob-
serva alguns grãos aleatoriamente.
Para ficar ainda mais claro este processo de inferência, imagine que você vai a feira para
comprar abacaxi e um feirante te oferece um pedaço de abacaxi. Qual o seu procedimento? Se
aquele pedaço de abacaxi for doce, naturalmente você infere que todo o lote de abacaxi vendido
por aquele feirante é doce. Por outro lado, se o pedaço for azedo, você deverá inferir que todo
o lote é azedo. Claro que podemos tomar decisões erradas devido à amostragem. Por exemplo,
corremos o risco de levar abacaxi azedo para casa, mesmo que a nossa prova tenha sido doce.
Isto pode acontecer porque o lote de abacaxi pode não ser completamente uniforme no teor de
açúcar, ou porque experimentamos um abacaxi doce no meio de um lote composto por abacaxis
azedos. Este exemplo prático ilustra o princípio básico de um teste de hipóteses.
4.2 O teste F
O teste para a razão de variâncias de duas populações independentes, também chamado de
teste F, é uma generalização do teste t para duas médias.
n
(yi −Ȳ )2
P
2 i=1
Lembre-se que o estimador da variância é dado por: S = n−1
S12
∼ Fv1 ,v2
S22
em que v1 e v2 são os graus de liberdade associados às variâncias do numerador e do denomi-
nador respectivamente, necessários para obter o quantil da distribuição F.
As fontes de variação da tabela de análise de variância são definidas com base no modelo
estatístico do experimento. O modelo estatístico varia de acordo com o delineamento e com
o número de fatores. O modelo estatístico é composto pela soma dos efeitos explicados pelo
experimento e o erro experimental (efeito das variáveis desconhecidas ou não controladas).
i) Aditividade - o efeito de cada um dos termos que compõem o modelo devem ser aditivos;
ii) Homogeneidade - os erros devem ser estimados todos da mesma população, isto implica
que cada tratamento deve ter aproximadamente a mesma variância;
iii) Normalidade - os erros devem possuir distribuição normal com média zero;
iv) Independência - cada observação possui um erro, que deve ser independente dos demais,
seja em um mesmo tratamento, seja em tratamentos diferentes.
A verificação destas pressuposições pode ser feita por meio de testes estatísticos. Quando
estas pressuposições não são atendidas pode-se utilizar algumas técnicas que amenizam este
desvio. O mais comum é a transformação dos dados. Quando uma transformação de dados
é feita, todas as comparações e estimativas de intervalo de confiança devem ser determinadas
na nova escala, sendo que as médias dos tratamentos podem ser re-transformadas para a escala
original. As transformações mais comuns são: raiz quadrada e logarítmica. Existem técnicas
para identificar a transformação mais adequada a ser feita nos dados (BOX & COX, 1964).
Outra opção é trabalhar com modelos que considerem estes desvios de pressupostos, como
distribuições assimétricas e variâncias heterogêneas. São exemplos os modelos lineares gene-
ralizados (GLM) e os modelos lineares generalizados de forma e escala (GAMLSS).
Tratamentos
Repetições 1 2 ··· I
1 y11 y21 ··· yI1
2 y12 y22 ··· yI2
.. .. .. .. ..
. . . . .
J y1J y2J ··· yIJ
Totais T1 T2 ··· TI
Considere que yij é o valor observado da variável resposta na parcela ij, isto é, na J-ésima re-
petição do tratamento I, por exemplo, y12 é a segunda repetição do tratamento 1. Já T1 , T2 , ...,
TI são os totais dos tratamentos, assim podemos definir a média de cada tratamento por Ȳi = TJi .
Além disso, G é o total geral do experimento, que pode ser obtido pela soma de todas as
IJ
P
parcelas (G = yij ) ou pela soma dos totais de tratamentos (G = T1 + T2 + ... + TI ).
ij
G
Assim, a média geral é dada por Ȳ = n
, sendo n o número de parcelas do experimento.
E portanto:
IJ
X
SQtotal = (yij )2 − C
ij
A decisão de o que é grande fica definida pelo quantil tabelado da distribuição F (denotado
por Ft) e o nível de significância α adotado. Assim o teste F se resume à comparar Fc com Ft.
Caso Fc seja menor que Ft então aceita-se H0 ao nível α de significância. Já no caso de Fc
maior que Ft, então rejeita-se H0 ao nível α de significância.
Resolução:
a) O fator é cultivar de sorgo, os tratamentos sãs as três cultivares estudadas e a variável resposta
é a produção de massa verde em ton/h.
b) As hipóteses são:
H0 : Não existe diferença entre os efeitos das cultivares na produção de massa verde de sorgo.
H1 : Pelo menos uma cultivar apresenta efeito diferente das demais na produção de
massa verde de sorgo.
2799
e) Ȳ = 15
= 186, 6
918
f) ȲA = 5
= 183, 6
J
P
(yAj −ȲA )
2 2 2 +(181−183,6)2 +(184−183,6)2
SA2 = j=1
J−1
= (186−183,6) +(180−183,6) +(187−183,6)
5−1
= 9, 3
850
ȲB = 5
= 170
J
P
(yBj −ȲB )
j=1 (158−170)2 +(173−170)2 +(175−170)2 +(174−170)2 +(170−170)2
SB2 = J−1
= 5−1
= 48, 5
1031
ȲC = 5
= 206, 2
J
P
(yCj −ȲC )
j=1 (190−206,2)2 +(215−206,2)2 +(221−206,2)2 +(195−206,2)2 +(210−206,2)2
SC2 = J−1
= 5−1
= 174, 7
g)
183,6+170+206,2
3
= 183, 6
h)
9,3+48,5+174,7 232,5
3
= 3
= 77, 5
i)
Parece que existe uma diferença entre as médias das cultivares, mas a variância é muita alta.
j)
Primeiro calculamos a correção:
IJ
( yij )2
P
ij G2 (186 + 180 + · · · + 195 + 210)2
C= = =
I ×J n 15
27992
C= = 522293, 40
15
Agora a SQtotal fica:
IJ
X
SQtotal = (yij )2 − C = (1862 + 1802 + · · · + 1952 + 2102 ) − 522293, 40 = 4273, 60
ij
A SQtrat fica:
I
1X 2 1
SQtrat = Ti − C = (9182 + 8502 + 10312 ) − 522293, 40 = 3343, 60
J i=1 5
A SQerro fica:
IJ I
X
2 1X 2 1
SQerro = (yij ) − Ti = (1862 +1802 +· · ·+1952 +2102 )− (9182 +8502 +10312 ) = 930
ij
J i=1 5
FV GL SQ QM Fc
tratamentos 2 3346,60 1671,8 21,57
erro 12 930 77,5
Total 14 4273,6
Como Fc > Ft (21,57 > 3,89) então rejeita-se H0 ao nível de significância de 5%, ou seja,
pelo menos uma cultivar apresenta efeito diferente das demais na produção de massa verde de
sorgo. Diz-se de modo muito resumido que neste caso o teste F foi significativo.
Regra de decisão
O que deve ficar claro é que o p-valor é o menor nível de significância em que H0 seria
rejeitada, para uma amostra observada. Uma vez que o p-valor tenha sido determinado, a
conclusão, em qualquer nível específico α, resulta da comparação do p-valor com α:
FV GL SQ QM Fc p-valor
tratamentos 2 3346,60 1671,8 21,57 0,0001
erro 12 930 77,5
Total 14 4273,6
Assim, a interpretação fica bem mais simples, pois para interpretar o resultado da ANAVA
não é necessário obter o valor de F tabelado. Basta comparar o p-valor com o nível de signifi-
cância adotado, a conclusão fica:
Como p-valor < 5% (0,0001 < 0,05) então rejeita-se H0 ao nível de significância de 5%,
ou seja, pelo menos uma cultivar apresenta efeito diferente das demais na produção de massa
verde de sorgo.
OBS: Na tabela de ANAVA, você pode colocar a FV tratamentos ou utilizar o nome do fator
em estudo. No caso deste exemplo, pode-se colocar cultivares no lugar de tratamentos.
No DIC a distribuição dos tratamentos nas parcelas é feita inteiramente ao acaso. O que
diferencia os demais delineamentos é que são acrescentadas restrições no momento de fazer
esta casualização.
Como no DIC não são feitas restrições no sorteio dos tratamentos nas parcelas, este de-
lineamento pressupõe que as condições experimentais em todas as parcelas são homogêneas.
Assim, o DIC deve ser utilizado apenas em experimentos realizados em ambientes com con-
dições controladas, como: laboratório, casa de vegetação, terreno com pouca variabilidade do
solo, computadores, etc.
Vantagens
• é um delineamento bastante flexível, pois o número de repetições e o número de trata-
mentos depende apenas do número de parcelas disponíveis;
• a análise de variância é simples, mesmo se o número de repetições for diferente entre os
tratamentos;
• o número de graus de liberdade para o erro experimental é o maior possível, em compa-
ração com os outros delineamentos com o mesmo número total de parcelas.
Desvantagens
• exige homogeneidade das condições experimentais em todas as parcelas;
• pode conduzir a grandes estimativas para a variância ao acaso (QMerro ), pois o erro ex-
perimental recebe toda a variabilidade que não é explicada pelos tratamentos. Logo pode
ter baixa precisão se as parcelas não são uniformes.
Casualização:
Como no delineamento inteiramente casualizado as condições são homogêneas então todas
as parcelas tem a mesma chance de receber qualquer tratamento.
Pode se fazer um sorteio aleatório das 5 repetições de cada tratamento considerando toda a
área experimental. Por exemplo:
A C D D C
B D B A B
D A C D A
C B C A B
Sugestão: Enumere todas as parcelas de 1 à 20, e sorteie as 5 repetições de cada tratamento
de uma vez. Por exemplo, os primeiros 5 números sorteados correspondem às parcelas que
receberão o tratamento A, e assim sucessivamente.
yij = µ + τi + εij
em que:
A pressuposição i) da ANAVA fala sobre a adividade dos termos deste modelo linear apre-
sentado acima. Além disso é sobre o componente aleatório do erro experimental que são
feitas as pressuposições ii), iii) e iv) da ANAVA. Podemos escrever de modo resumido que
εij ∼ N (0, Iσ 2 ).
Resolução:
a) O Fator foi a Cultivar de café e a variável resposta foi área foliar (em cm2 ). Como só temos
um fator, os tratamentos são as categorias (ou níveis) do fator, assim os tratamentos são as 4
cultivares de café.
c) As hipóteses são:
H0 : Não existe diferença entre os efeitos das cultivares na área foliar de café.
H1 : Pelo menos uma cultivar apresenta efeito diferente das demais na área foliar de café.
d)
Primeiro precisamos calcular a correção:
IJ
yij )2
P
(
ij G2 (15 + 30 + 27 + 36)2
C= = =
I ×J n 12
116642
C= = 972
12
Agora a SQtotal fica:
IJ
X
SQtotal = (yij )2 − C = (42 + 52 + · · · + 142 + 122 ) − 972 = 104
ij
A SQtrat fica:
I
1X 2 1
SQtrat = Ti − C = (152 + 302 + 272 + 362 ) − 972 = 78
J i=1 3
A SQerro fica:
FV GL SQ QM Fc p-valor
trat 3 78 26 8 0,0086
erro 8 26 3,25
total 11 104
Conclusão:
Como p-valor < 5% (0,0086 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma cultivar apresenta efeito diferente das demais na área foliar de café.
e)
√ √
QM erro 3, 25
CV = × 100 = × 100 = 20, 03%.
Ȳ 9
Assim o experimento possui precisão baixa.
6.4 Exercícios
1- Planeje um experimento para avaliar cinco tipos de substratos (matéria fresca, matéria seca
no sol, matéria seca na sombra, matéria seca em estufa a 40ºC e matéria seca em estufa a 60ºC)
na germinação de sementes. Considere que se tem a disposição na casa de vegetação um espaço
para 20 parcelas experimentais.
i) identifique o fator, a variável resposta, o delineamento e o número de repetições;
ii) faça um croqui da área experimental com a casualização dos tratamentos nas parcelas;
iii) obtenha o esquema para a análise da variância, somente com as fontes de variação (FV) e
os números de graus de liberdade (GL).
2- Um pesquisador pretende estudar o efeito que a aplicação de cloreto de cálcio pode provo-
car nas características físico-químicas durante o armazenamento de uvas para consumo. Foram
preparadas soluções de CaCl2 nas concentrações de 0, 1, 2, 3 e 4%. Este pesquisador tem
disponíveis 120 cachos de uvas de um conjunto uniforme, previamente colhidos e limpos de
qualquer injúria. Algumas das características avaliadas foram: perda de peso e teores de sólidos
solúveis. Auxilie o pesquisador no planejamento deste experimento indicando: i) O fator e a
variável resposta; ii) os tratamentos e o delineamento; iii) o número de repetições e o tamanho
da parcela; iv) o esquema para a análise da variância, somente com FV e GL.
4- Com base no significado de cada uma das variações presente nesse tipo de experimento, ela-
bore exemplos numéricos (fictícios ou simulados) para um experimento com quatro tratamentos
e três repetições, tais que:
i) A variação “total” seja nula;
ii) Apenas a variação “entre” tratamento seja nula;
iii) Apenas a variação “dentro” de tratamentos seja nula;
iv) Apenas a variabilidade “dentro de um” tratamento seja nula (os outros não).
5- A ingá-mirim é uma espécie nativa da Floresta Amazônica com potencial para arborização
urbana. Com o objetivo de estudar a taxa de germinação de plântulas desta espécie, para poste-
rior propagação, realizou-se um experimento em casa de vegetação em temperatura ambiente e
com irrigações periódicas. O delineamento experimental utilizado foi inteiramente casualizado,
com quatro tratamentos e quatro repetições cada uma com 25 sementes em cada bandeja de
plástico com 25x39x7,5 cm. Os resíduos agroflorestais testados como substrato foram a casca
de castanha-do-brasil triturada (A), casca de amendoim triturada (B), resíduo de açaí peneirado
(C) e areia como testemunha (D). Após a germinação das sementes foram analisadas porcenta-
gem de germinação.
Tratamentos
REPETIÇÕES A B C D
1 50 51 76 58
2 91 95 84 52
3 81 72 86 98
4 62 56 70 66
TOTAL 284 274 316 274
a) Indique o Fator, a variável resposta e os tratamentos.
b) O que é a parcela neste experimento?
c) Quantas sementes serão necessárias para esse experimento?
d) Qual o delineamento utilizado? Esse delineamento é o mais correto para esse experimento?
e) Quais as hipóteses do experimento?
f) Faça a Análise de variância e interprete os resultados.
Tratamentos
REPETIÇÕES 1 2 3 4 5 6
1 15 19 20 23 18 26
2 11 24 16 30 22 24
3 13 14 23 29 17 20
TOTAL 39 57 59 82 57 70
a) Indique o Fator, a variável resposta e os tratamentos.
b) O que é a parcela neste experimento?
c) Qual o delineamento utilizado e qual o número de repetições?
d) Calcule o número de plantas utilizadas neste experimento.
e) Quais as hipóteses do experimento?
f) Apresente o croqui com uma possível casualização deste experimento.
g) Admitindo que as pressuposições são atendidas, faça a Análise de variância e interprete.
h) Calcule o coeficiente de variação e avalie a precisão do experimento.
Quando não rejeitamos H0 (teste F não significativo, p-valor > 0,05) todas as possíveis com-
parações de médias dos tratamentos seriam nulas. Neste caso, as análises terminam no quadro
de ANAVA, não sendo necessário aplicar outros testes.
Já quando rejeita-se H0 na ANAVA (teste F significativo, p-valor < 0,05), indica apenas que
existe diferença entre os tratamentos, mas não localiza onde está a diferença, exceto no caso de
apenas dois tratamentos (I=2). Pois, se só existem dois tratamentos e o teste F indica diferença
nos efeitos, então um é diferente do outro.
Caso o experimento tenha mais de dois tratamentos (I > 2) torna-se necessário aplicar algum
teste de comparações de médias de modo a identificar quais tratamentos são diferentes entre si.
Em outras palavras, se a hipótese de nulidade for rejeitada, implica que existe pelo menos um
contraste (comparação) entre médias estatisticamente diferente de zero.
7.1 Contrastes
Um contraste é uma combinação linear das médias dos tratamentos. Sabendo que existe
diferença entre os efeitos dos tratamentos, fazemos contrastes para comparar as médias e en-
contrar qual diferença é realmente significativa, é como se estivéssemos aplicando um zoom
na comparação dos tratamentos. A ideia do contraste entre os tratamentos é fornecer respos-
tas sobre algumas pergunta de interesse prático do experimento.
Exemplos
Ĉ1 = Ȳ1 − 2Ȳ2 NÃO é um contraste, pois 1 − 2 ̸= 0.
Os contrastes C1 e C2 são ortogonais entre si somente se a soma dos produtos dos respectivos
coeficientes forem iguais a zero. Isto é:
I
X
ai b i = 0
i−1
Exemplo: Considere os seguintes contrastes entre os tratamentos A, B e C:
Ĉ1 = 2ȲA − ȲB − ȲC Ĉ2 = ȲA − 2ȲB + ȲC Ĉ3 = ȲB − ȲC .
Diz-se que um grupo com três ou mais contrastes são ortogonais entre si se eles forem
ortogonais dois a dois. Assim, o grupo de contrastes apresentado acima não são ortogonais
entre si (apenas Ĉ1 e Ĉ3 são ortogonais). Em um experimento com I tratamentos, existem I-1
contrastes ortogonais entre si. Existem diferentes grupos de contrastes ortogonais, mas cada
grupo possui no máximo I-1 contrastes, ou seja o grupo de contrastes ortogonais não é único.
Caso |Ĉ| < DM S então a diferença estimada com as médias observadas é menor do que o
mínimo que precisaria ser para dizer que os grupos comparados são diferentes (DMS). Assim
não se rejeita H0 , ou seja, os grupos de médias são iguais e o contraste é não significativo.
Caso |Ĉ| > DM S então a diferença estimada com as médias observadas entre os grupos
comparados é maior que o mínimo aceitável para dizer que eram iguais (DMS). Logo rejeita-se
H0 , ou seja, os grupos de médias são diferentes e o contraste é significativo.
IMPORTANTE: Se o contraste for significativo, isto é, os grupos são diferentes, então o sinal
da estimativa do contraste Ĉ (+ ou -) indica qual grupo é melhor. Se for positivo o grupo com
sinais positivos é melhor (geralmente o grupo à esquerda). Se for negativo o grupo com sinais
negativos é melhor (geralmente o grupo da direita).
Existem vários testes para avaliar os contrastes entre as médias: teste t, teste F, teste de
Scheffé, teste de Dunnett. Para avaliar as comparações duas a duas (todos os possíveis contras-
tes com apenas 2 médias) os testes mais conhecidos são: teste de Tukey, teste de Duncan, teste
SNK e teste de Scott-Knott.
A conclusão do teste (rejeita ou aceita H0 ) pode variar de um teste para outro, pois o valor
da DMS é calculado com base em diferentes distribuições amostrais. Devido a esta possibi-
lidade de diferença nas conclusões a respeito da significância do contraste, podemos planejar
corretamente qual teste deve ser utilizado em cada situação.
Na estatística dizemos que um teste é mais “conservador” que o outro quando a DMS dele
é maior, pois ele tende a conservar a hipótese de igualdade entre médias como verdadeira. Isto
porque naturalmente, quanto maior a DMS mais difícil se torna rejeitar H0 . No entanto, se um
teste é muito conservador apresenta maior taxa de erro tipo II (Não rejeitar H0 falsa). Um teste
pouco conservador é chamado em estatística de “liberal”, basta uma pequena diferença entre as
médias observadas para ele indicar a rejeição de H0 . Naturalmente, cabe salientar que um teste
mais liberal tende a cometer maiores taxas de erro tipo I (Rejeitar H0 verdadeira).
O conhecimento sobre estas características dos testes pode ajudar o pesquisador a escolher
qual procedimento de comparação múltipla utilizar. Se por exemplo, no momento de plane-
jamento do experimento, o pesquisador com base em sua experiência sabe que as diferenças
entre os efeitos dos níveis do fator em teste são pequenas e ele deseja detectar estas pequenas
diferenças, então ele deve usar um teste menos conservador. Se por outro lado, ele quer concluir
que os níveis do fator têm efeitos diferentes somente quando a diferença nos seus efeitos for
relativamente grande, então ele deve usar um teste mais conservador, isto é, com maior DMS.
O que precisa ficar claro é que cada um dos testes possui vantagens e desvantagens, não
existe um teste que seja o melhor de todos. O importante é saber como e quando utilizar cada
um deles. Serão apresentados abaixo alguns destes testes e suas características.
É o teste mais geral, não sendo muito recomendado apenas para contrastes que visam com-
parar somente duas médias de tratamentos. Por ter esta grande abrangência de aplicação é um
dos testes mais conservadores.
Assim, basta comparar o valor da estimativa do contraste com a DMS. Se |Ĉ| > DM S,
então rejeita-se H0 . Caso contrário não se rejeita H0 .
Exemplo 1: Um experimento foi realizado em DIC com 5 repetições para avaliar a produtivi-
dade de 5 cultivares de arroz: A- Pratão; B- Pérola; C- Batatais; D- IAC-4; E- IAC-9. O quadro
de ANAVA é apresentado abaixo:
FV GL SQ QM Fc p-valor
cultivares 4 6,1 1,525 8,03 0,0005
erro 20 3,8 0,19
Total 24 9,9
Como p-valor < 5% (0,0005 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma cultivar apresenta efeito diferente das demais na produtividade de arroz.
Ex. 1 - i) As médias (em ton/ha) estimadas para as cultivares neste experimento foram: ȲA =
1, 9, ȲB = 2, 5, ȲC = 1, 4, ȲD = 2, 4 e ȲE = 2, 8. Como existe diferença entre os tratamentos,
formule um contraste para comparar as demais cultivares contra as cultivares do IAC. Aplique
o teste de Scheffé (5%) para avaliar este contraste.
Resolução:
1º Preciso comparar as demais cultivares (A, B e C) contra das do IAC (D e E), logo as
médias das cultivares IAC devem ter sinais diferentes das demais:
É um contraste pois: 2 + 2 + 2 − 3 − 3 = 0
v
u
u (I − 1)F(α;ν ,ν ) QM erro XI r
1 2 2 4 × 2, 86 × 0, 19
DM Sα = t ci = × (22 + 22 + 22 + (−3)2 + (−3)2 )
J i=1
5
DM S5% = 3, 61
6º Conclusão:
Como |Ĉ| > DM S (4 > 3, 61) então rejeita-se H0 ao nível de significância de 5%, ou seja,
o valor do contraste é diferente de zero, isto é, as cultivares IAC e as demais apresentam efeitos
diferentes na produtividade de arroz de acordo com o teste de Scheffé.
Podemos concluir então que uma das diferenças no efeito das cultivares identificada pelo
teste F é em relação as cultivares do IAC contra as demais. Caso seja de interesse fazer outras
comparações, deveríamos prosseguir com a análise formulando novos contrastes e aplicando o
teste de Scheffé para identificar exatamente quais cultivares são diferentes das demais.
Como o contraste foi significativo e a estimativa foi negativa (-4), podemos afirmar que as
cultivares IAC (que receberam sinal negativo no 1º passo) apresentam maior produtividade em
relação as demais.
Observações:
i) Veja que se tivéssemos invertido os sinais no momento de formular os contrastes (IAC
positivos e demais negativos) apenas modificaria o sinal da estimativa que seria igual a 4.
ii) Os coeficientes escolhidos para balancear o contraste não são únicos. Por exemplo: (1/3,
1/3, 1/3, -1/2, -1/2) ou (10, 10, 10, -15, -15) também funcionariam. Esta escolha afetaria a
estimativa do contraste, mas também modificaria a DMS, logo não interferem na conclusão.
Minha sugestão é que prefiram trabalhar com os menores coeficientes inteiros, apenas para
facilitar os cálculos mesmo.
O teste F para contrastes ortogonais não é realizado comparando o valor estimado com uma
DMS. A regra de decisão é obtida com base na soma de quadrados, assim os contrastes ortogo-
nais podem ser organizados na tabela de ANAVA.
É feita então uma análise de variância com o desdobramento dos graus de liberdade e da
soma de quadrados de tratamentos através de contrastes ortogonais, com aplicação do teste F.
Como este desdobramento é ortogonal, é possível verificar também que a soma das SQ’s dos
contrastes coincide exatamente com a SQtrat .
Ĉ 2 × J
SQC = I
P 2
ci
i=1
Uma regra prática para a elaboração de um grupo de contrastes ortogonais entre si é suge-
rida por Banzatto & Kronka (2006).
Resolução:
Como temos I = 5, então teremos 4 contrastes ortogonais. Para elaborar o grupo de contras-
tes ortogonais vamos seguir a ideia apresentada acima. A primeira subdivisão já foi sugerida no
item i) comparando as cultivares do IAC contra as demais, assim:
Conforme comentado, veja que como a escolha dos dois subgrupos iniciais (Ĉ1 ) não é única,
então o grupo de contrastes ortogonais também não é único. Basta modificar a escolha dos gru-
pos comparados em Ĉ1 que teremos um novo grupo de 4 contrastes ortogonais entre si.
As estimativas de cada contraste foram: Ĉ1 = −4; Ĉ2 = 1, 6; Ĉ3 = −0, 4 e Ĉ4 = −0, 6.
Confirmado que estes contrastes são ortogonais podemos obter as SQ’s e montar a tabela de
ANAVA para o teste F dos contrastes ortogonais.
FV GL SQ QM Fc p-valor
(cultivares) (4) ( 6,1 )
C1 1 2,67 2,67 14,05 0,0013
C2 1 2,13 2,13 11,21 0,0032
C3 1 0,4 0,4 2,10 0,1628
C4 1 0,9 0,9 4,73 0,0418
erro 20 3,8 0,19
Total 24 9,9
Para interpretar os testes F de cada contraste acima, veja que da tabela de F temos F(5%;1,20) =
4, 35, basta comparar com os valores de F calculados. Mas conforme já vimos, esta interpreta-
ção também pode ser feita com base no p-valor.
Para C1 .
Como p-valor < 5% (0,0013 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.
Podemos afirmar então que de acordo com o teste F, as cultivares da IAC apresentam efeito
diferente das demais na produtividade de arroz. Como a estimativa do contraste é negativa (-4)
podemos concluir ainda que as cultivares IAC apresentam maior produtividade, pois elas que
estavam com sinal negativo no contraste.
Para C2 .
Como p-valor < 5% (0,0032 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.
Podemos afirmar então que de acordo com o teste F, as cultivares Pratão e Pérola apresentam
efeito diferente da cultivar Batatais na produtividade de arroz. Como a estimativa do contraste
é positiva (1,6) podemos concluir ainda que as cultivares Pratão e Pérola apresentam maior pro-
dutividade, pois elas que estavam com sinal positivo no contraste.
Para C3 .
Como p-valor > 5% (0,1628 > 0,05) então não se rejeita H0 ao nível de significância de 5%,
ou seja, o valor do contraste é estatisticamente igual a zero e os grupos comparados apresentam
efeitos iguais entre si na produtividade de arroz de acordo com o teste F.
Podemos afirmar então que de acordo com o teste F, não existe diferença significativa entre
as cultivares IAC-4 e IAC-9.
Para C4 .
Como p-valor < 5% (0,0418 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.
Podemos afirmar então que de acordo com o teste F, a cultivar Pratão apresenta efeito dife-
rente da cultivar Pérola na produtividade de arroz. Como a estimativa do contraste é negativa
(-0,6) podemos concluir ainda que a cultivar Pérola apresenta maior produtividade do que a
Pratão, pois esta que estava com sinal negativo no contraste.
IMPORTANTE: Por ser um exemplo de aplicação do teste F para contrastes ortogonais, na-
turalmente os contrastes foram estabelecidos após a realização do experimento. A exigência
de que os contrastes ortogonais estejam definidos antes da realização do experimento é para
garantir que todos os contrastes apresentem respostas para questões práticas sem a sugestão
(interferência) dos resultados observados no experimento.
O teste leva este nome porque o estatístico canadense Charles Dunnett foi pioneiro no con-
ceito de que, quando um controle está presente, as comparações de interesse preliminar podem
ser as comparações de cada novo tratamento com o controle. Desta modo, no teste de Dunnett
os contrastes são realizados sempre com duas médias, comparando cada tratamento contra a
testemunha (ou controle).
Ex. - iii) Com os tratamentos do exemplo 1, considere por exemplo, que a cultivar Pratão é a
padrão da região. O experimento foi realizado para verificar se as demais cultivares se adaptam
a esta região. Portanto aplique o teste de Dunnett para comparar estas cultivares com a Pratão
(controle).
Resolução:
Primeiro, lembre-se que temos 5 tratamentos e 5 repetições, assim 4 deles serão comparados
contra a controle que sera a Pratão (comum da região). O valor obtido da tabela de Dunnett é
D(5%;5,20) = 2, 65. Assim a DMS de Dunnett fica:
r r
2 × QM erro 2 × 0, 19
DM S5% = D(α;I,ν) = 2, 65 = 0, 73
J 5
Pratão vs Pérola
Ĉ1 = ŶA − ŶB ⇒ Ĉ1 = 1, 9 − 2, 5 = −0, 6
Como |Ĉ| < DM S (0, 6 < 0, 73) então não se rejeita H0 ao nível de 5% de significância, ou
seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e Pérola apresentam efeitos
semelhantes na produtividade de arroz de acordo com o teste de Dunnett.
Pratão vs Batatais
Ĉ1 = ŶA − ŶC ⇒ Ĉ1 = 1, 9 − 1, 4 = 0, 5
Como |Ĉ| < DM S (0, 5 < 0, 73) então não se rejeita H0 ao nível de 5% de significância,
ou seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e Batatais apresentam
efeitos semelhantes na produtividade de arroz de acordo com o teste de Dunnett.
Pratão vs IAC-4
Ĉ1 = ŶA − ŶD ⇒ Ĉ1 = 1, 9 − 2, 4 = −0, 5
Como |Ĉ| < DM S (0, 5 < 0, 73) então não se rejeita H0 ao nível de 5% de significância, ou
seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e IAC-4 apresentam efeitos
semelhantes na produtividade de arroz de acordo com o teste de Dunnett.
Pratão vs IAC-9
Ĉ1 = ŶA − ŶE ⇒ Ĉ1 = 1, 9 − 2, 8 = −0, 9
Como |Ĉ| > DM S (0, 9 > 0, 73) então rejeita-se H0 ao nível de 5% de significância, ou
seja, o valor do contraste é diferente de zero, assim as cultivares Pratão e IAC-9 não possuem
o mesmo efeito na produtividade de arroz de acordo com o teste de Dunnett. Além disso, a
estimativa deste contraste é negativa, logo a cultivar IAC-9 apresenta maior produtividade que
a Pratão.
Uma maneira mais resumida de apresentar os resultados é por meio de uma tabela:
Cultivar Média
Pratão (Controle) 1,9
Pérola 2,5
Batatais 1,4
IAC-4 2,4
IAC-9* 2,8
A ideia também é calcular o contraste entre as duas médias e comparar com uma DMS.
r
QM erro
DM Sα = q(α;I,v)
J
em que: I é o número de tratamentos, v é o grau de liberdade do erro da ANAVA, q(α;I,v) é o
quantil da amplitude total estudentizada, valor tabelado obtido da tabela específica do teste de
Tukey; α é o nível de significância do teste; QMerro é o quadrado médio do erro obtido da
tabela de ANAVA e J é o número de repetições.
Após a aplicação do teste é gerada uma tabela com médias seguidas por letras. A interpre-
tação do teste de Tukey é que médias seguidas por mesma letra não diferem entre si.
Ex. - iii) Considere ainda os dados do exemplo 1, aplique o teste de Tukey (5%) para avaliar o
efeito destas cultivares.
Resolução:
5º Atribua a mesma letra da maior média para todas as médias acima do resultado obtido no
passo anterior;
6º Atribua outra letra para a segunda maior média e subtraia a DMS da segunda maior média;
7º Atribua a mesma letra para todas as médias entre a segunda maior e o resultado do passo
anterior;
8º Continue assim até o momento em que ao subtrair a DMS obtenha um resultado menor
do que a menor das médias. Elimine as possíveis redundâncias (grupos com mesma letra
dentro de grupos que já possuíam outra mesma letra) e organize os dados em uma tabela.
Portanto, para os dados do exemplo, temos da tabela de Tukey que q(5%;5,20) = 4, 23.
Fazendo o cálculo da DMS e das diferenças das médias em relação a DMS:
r
0, 19
DM S5% = 4, 23 = 0, 82
5
2, 8 − 0, 82 = 1, 98; 2, 5 − 0, 82 = 1, 68; 2, 4 − 0, 82 = 1, 58; 1, 9 − 0, 82 = 1, 08.
Atribuindo as letras conforme algoritmo apresentado acima, temos a seguinte tabela:
Cultivares Medias
IAC-9 2,8 a
Pérola 2,5 ab
IAC-4 2,4 ab
Pratão 1,9 bc
Batatais 1,4 c
Percebe-se pelo teste de Tukey que as cultivares IAC-9, Pérola e IAC-4 possuem efeitos
iguais entre si pelo teste de Tukey, ao passo que as cultivares Pérola, IAC-4 e Pratão também
possuem efeitos iguais. Ainda as cultivares Pratão e Batatais também podem ser consideradas
com o mesmo efeito na produtividade de soja.
Veja que a discussão fica um tanto complicada, mas na prática, não precisamos ficar dis-
cutindo cada grupo de letras do teste de Tukey. Particularmente, gosto de dizer que fazemos
o teste de Tukey para saber qual ou quais dos tratamentos apresentam efeito estatisticamente
igual ao tratamento de melhor média. Não é preciso aplicar o teste de Tukey para saber qual é o
tratamento que possui a melhor média (basta olhar o tratamento com melhor média), aplica-se
este teste para saber se tem algum outro tratamento que possui efeito semelhante ao melhor.
Médias seguidas por mesma letra não diferem entre si de acordo com o teste de Tukey ao
nível de significância de 5%. Assim as cultivares IAC-9, Pérola e IAC-4 são estatisticamente
iguais e são as melhores na produtividade de arroz.
A grande vantagem do teste de Scott-Knott é que nenhuma média pode pertencer a mais de
um grupo, eliminando esta ambiguidade. Portanto este teste é indicado quando tem-se muitos
tratamentos. Sua significância é baseada na distribuição de qui-quadrado (χ2 ) e o teste pode ser
realizado com o uso de softwares estatísticos (SISVAR, SAS, R).
No entanto, é preciso tomar cuidado com a aplicação do teste de Scott-Knott. Este teste
necessariamente força a divisão dos tratamentos em grupos heterogêneos entre si. O que deve
ser interpretado com muita cautela, pois essa divisão nem sempre é tão evidente e podem levar
à altas taxas de erro tipo I.
Ex. - iv) Com os dados do exemplo 1, aplique o teste de Scott-Knott (5%) para avaliar o efeito
das 5 cultivares na produtividade de arroz.
Resolução:
O teste Scott-Knott é feito apenas utilizando softwares. No caso deste exemplo a tabela de
médias fica:
Cultivares Medias
IAC-9 2,8 a
Pérola 2,5 a
IAC-4 2,4 a
Pratão 1,9 b
Batatais 1,4 b
Os testes que foram apresentados neste material ordenados em função da sua rigorosidade
para afirmar que o contraste é significativo são indicados abaixo. Quanto mais a direita, mais
conservador é o teste:
Quando o fator em estudo é uma variável QUALITATIVA, um esquema que pode auxiliar
na escolha do teste de comparações múltiplas a ser utilizado é apresentado abaixo.
7.4 Exercícios
1- Com base no que você aprendeu sobre os testes de comparações múltiplas, responda “com
suas palavras” os itens abaixo.
a) Porque a soma dos coeficientes do contraste deve ser igual a zero?
b) O que é um teste conservador? Qual tipo de erro este teste tende a cometer mais?
c) Dentre os testes apresentados quais são indicados para avaliar contrastes que devem ser
definidos antes da realização do experimento?
d) Qual dos testes apresentados é o mais utilizado em estatística experimental?
e) O que é um conjunto de tratamentos não estruturado?
4- Um pesquisador que deseja avaliar os teores de frutose (%) dos frutos de 5 cultivares de
pêssego com 5 repetições e conduzido em DIC, obteve o seguinte quadro de ANAVA:
FV GL SQ QM Fc p-valor
cultivares 4 2850,96 O P 0,0001
erro L 902,4 N
total M 3753,36
5- Foi realizado um experimento com aves para avaliar qual o melhor complemento alimentar
a ser utilizada na época de muda de penas. No experimento foram comparados 4 tratamentos:
Vitamina A, Vitamina B, Vitamina A + Vitamina B e testemunha. Caso o teste F da ANAVA
seja significativo qual a estratégia mais adequada para comparar estas médias? Indique duas
opções de testes diferentes.
Para fazer o download do e instalar visite a página do prof. Daniel Furtado Ferreira, criador
do SISVAR: http://www.des.ufla.br/~danielff/programas/sisvar.html.
Assim para aprender a utilizar as ferramentas básicas do SISVAR para análise dos principais
delineamentos acesse o curso oferecido no XII programa de verão DES-ICET/UFLA 2021 por
meio dos seguintes links:
• 1° parte: https://youtu.be/0Zcq_Mghmb0
• 2° parte: https://youtu.be/eWieHP6O5RQ
9 Regressão
Um fator é dito quantitativo quando os seus níveis se diferem em relação a quantidade deste
fator. Neste caso os tratamentos são os níveis do fator, ou a combinação deles no caso de expe-
rimentos com mais de um fator.
A palavra “regressão” foi empregada originalmente pelo estatístico inglês Francis Galton
no século XIX, que, estudando a estatura das pessoas, elaborou a proposição (posteriormente
confirmada) de que filhos de pais muito altos tendem a ser mais baixos do que seus pais, o
oposto ocorrendo com os filhos de pais muito baixos. Daí o nome do termo, pois Galton perce-
beu que existe uma tendência dos dados de regredirem em direção à média da população.
Y = β0 + β1 X + β2 X 2 + ε
Y = β0 + β1 X + β2 X 2 + β3 X 3 + ε
Mas qual grau de polinômio utilizar? Ou em outras palavras, qual modelo de regressão uti-
lizar? Linear? Quadrático? Cúbico? É Para responder estas perguntas que precisamos fazer a
ANAVA dos modelos de regressão.
FV GL
(Trat) (I - 1)
Reg. Linear 1
Reg. Quadrática 1
Reg. Cubica 1
desvio (I - 4)
Erro experimental I*(J - 1)
Total I*J - 1
Para os outros delineamentos a ideia da regressão na ANAVA não muda, pois a parte equi-
valente aos modelos de regressão (Reg. Linear, Reg. Quadrática, Reg. Cúbica e desvio) se
mantém a mesma. O que muda são as outras fontes de variação acrescentadas em razão dos
delineamentos e os graus de liberdade das mesmas.
Na tabela de ANAVA com regressão, a primeira FV que deve ser avaliada é a falta de ajuste
ou “desvio”, cujas hipóteses podem ser resumidas em:
H0 : A falta de ajuste deixada pelos modelos estudados é pequena, insignificante.
H1 : A falta de ajuste deixada pelos modelos estudados é significativa.
Caso rejeite H0 para o desvio, isto é, caso ele seja significativo (p-valor < 0,05) indica que
os modelos apresentados não são os mais adequados para descrever a relação entre as variáveis
estudadas. Pode se partir para o estudo de outros modelos de regressão, como por exemplo, os
não lineares.
Caso p-valor > 0, 05 então não se rejeita H0 para o desvio (ou falta de ajuste), assim algum
dos modelos lineares apresentados na ANAVA (linear, quadrática ou cúbica) pode ser utilizado
para descrever a relação entre X e Y .
Na análise de variância, a idéia é escolher o polinômio de maior grau que seja significativo
(p-valor < 0,05). Portanto começa-se a verificar a significância do maior grau para o menor.
Identificado o modelo de regressão que melhor descreve a relação entre as variáveis em es-
tudo, agora basta obter as estimativas dos seus parâmetros (β̂0 , β̂1 , ...). No caso do SISVAR
estas estimativas são denominadas de (b0 , b1 , b2 e b3 ), assim o polinômio estimado fica:
Para a Reg. Linear: Para a Reg. Quadrática: Para a Reg. Cúbica:
Ŷ = b0 + b1 X Ŷ = b0 + b1 X + b2 X 2 Ŷ = b0 + b1 X + b2 X 2 + b3 X 3
Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos
valores observados de Y em função da variação dos níveis da variável X, minimizando os erros.
Coeficiente de Determinação - R2
Uma maneira simples de medir a qualidade do ajuste obtido pela equação de regressão
estimada é utilizando o coeficiente de determinação - R2 .
O coeficiente de determinação varia de 0 à 100% e descreve o quanto da variabilidade ocor-
rida na variável Y é explicada pelo modelo de regressão estimado em função da variável X.
Assim, naturalmente, quanto maior o R2 melhor (ou mais confiável) é o ajuste fornecido pelo
modelo de regressão.
Para o caso em que tem-se uma única observação para cada dose (estudos que não objetivam
comparar as doses, sem repetição), o R2 pode ser calculado por:
SQRegressao
R2 =
SQT otal
Já para o caso em que tem-se mais de um valor observado para cada dose (mais comum em
experimentação), o R2 pode ser calculado por:
SQRegressao
R2 =
SQT rat
2
O R , não deve ser utilizado para selecionar o modelos com diferentes números de parâme-
tros, pois quanto mais parâmetros maior é a parte da variabilidade em Y explicada pelo modelo,
que implica em maior SQRegressao e consequentemente maior o R2 , mesmo que este parâmetro
acrescentado não seja significativo.
Cabe reforçar, portanto, que a escolha do modelo de regressão mais adequado deve ser feita
com base no teste F da ANAVA de regressão (o polinômio de maior grau que for significativo)
e só depois observar o valor de R2 .
Figura 6: Ilustração dos pontos de máximo (X̂max , Ŷmax ) observados em modelos de regressão
linear simples e quadrático.
na maior dose observada da variável X (X̂max ) e se a reta for decrescente o valor de Y máximo
ocorre na menor dose observada de X. E vice-versa para os pontos de mínimo.
Para obter a estimativa de Ŷmax (ou Ŷmin ), basta substituir o valor de X̂max (ou X̂min ) na
expressão do modelo com os parâmetros estimados e fazer os cálculos. Ficando então:
Ŷmax = b0 + b1 X̂max
No caso de polinômios de segundo grau o valor de X̂max (ou X̂min ) é aquele que zera a
primeira derivada de Y em relação a X. Isto é:
∂Y
X̂max = = f ′ (X) = 0
∂X
E o valor de Ŷmax (ou Ŷmin ) é obtido substituindo o valor de X̂max (ou X̂min ) na expressão
com os valores estimados.
2
Ŷmax = b0 + b1 X̂max + b2 X̂max
−(b21 − 4 × b2 × b0 )
Ŷv =
4 × b2
Para identificar se o ponto que pertence ao intervalo é de máximo ou de mínimo será ne-
cessário calcular a segunda derivada. Ao substituir o ponto crítico (xc1 ou xc2 ) na expressão
da segunda derivada (f ′′ (xc )), se o resultado for negativo (f ′′ (xc ) < 0), então este ponto (xc ) é
ponto de máximo. Caso o resultado seja positivo (f ′′ (xc ) > 0), então xc é ponto de mínimo.
Exemplo Resolvido
Foi realizado um experimento para comparar 4 doses de um certo fertilizante adicionadas
ao substrato no crescimento de mudas de bananeira Musa Prata. As doses em estudo foram:
10%, 15%, 20% e 25%. O resultado da ANAVA é apresentado abaixo:
FV GL SQ QM Fc p-valor
doses 3 2,3168 0,7723 62,79 0,0000
erro 12 0,1476 0,0123
Total 15 2,4644
Como p-valor < 5% (0,0000 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma dose do fertilizante apresenta efeito diferente das demais no crescimento
de mudas de bananeira Musa Prata.
Portanto, como o fator em estudo é uma variável quantitativa devemos fazer o estudo de re-
gressão. Temos 3 graus de liberdade de tratamentos, logo podemos testar até a regressão linear
quadrática (desvio = 1 GL, Linear = 1 GL, Quadrático = 1 GL).
FV GL SQ QM Fc p-valor
(doses) (3) 2,3168
Reg. Linear 1 1,4851 1,4851 120,82 0,0000
Reg. Quadrática 1 0,7656 0,7656 62,28 0,0002
desvio 1 0,0661 0,0661 5,38 0,0595
erro 12 0,1476 0,0123
Total 15 2,4644
Como p-valor > 0,05 então o desvio (ou falta de ajuste) não foi significativo, assim algum
dos modelos lineares apresentados acima (linear ou quadrático) pode ser utilizado para repre-
sentar o crescimento de mudas de bananeira Musa Prata em função das doses do fertilizante
adicionadas ao substrato.
Para o modelo liner quadrático, b2, o p-valor foi 0,0020 < 0,05, logo rejeita-se H0 para o
modelo quadrático, ou seja β2 ̸= 0, portanto este modelo é significativo.
Para o modelo linear, b1, o p-valor foi 0,000 < 0,05, logo rejeita-se H0 para o modelo linear,
ou seja β1 ̸= 0 logo o modelo linear também é significativo. Mas como comentado, devemos
utilizar o polinômio de maior grau que foi significativo, assim utilizaremos o modelo quadrático.
As estimativas para os parâmetros foram: b0 = −0, 03; b1 = 36, 07; b2 = 87, 5, logo o
modelo estimado fica:
Como pode-se observar na figura abaixo, trata-se de um modelo de um parábola com con-
cavidade voltada para baixo, logo possui ponto de máximo.
Para obter a dose de fertilizante que propicia o crescimento máximo, basta derivar o modelo
estimado e igualar a zero:
∂Y
X̂max = = f ′ (X) = 0
∂X
36, 07 − 175X̂max = 0
X̂max = 0, 2061 ou 20,61%
Para identificar o crescimento máximo estimado nesta dose, basta substituir na equação:
A “blocagem” é também chamada de controle local, pois permite que se controle alguma
causa de variação conhecida que afeta a variável resposta, diminuindo assim o erro experimen-
tal.
Tanto o teste F, quanto os demais procedimentos de comparação múltipla têm como base
para avaliar a diferença entre tratamentos a estimativa da variabilidade ao acaso, associada ao
erro experimental, a qual é conhecida como Quadrado Médio do Erro (QMerro). Fica fácil
entender que, para o pesquisador atingir o seu objetivo, apontar diferenças significativas entre
os efeitos de níveis do fator, ele deve planejar e executar o seu experimento de tal forma que a
influência do erro experimental seja a menor possível. Lembre-se que o erro experimental (va-
riação ao acaso) é estimado pela variação entre as parcelas que receberam o mesmo tratamento.
Exemplo: Para ilustrar a ideia do controle local considere um exemplo em que um pesquisador
objetiva comparar a produtividade (kg/parcela) de 4 progênies de milho (A, B, C e D). Para
tanto, planejou o experimento em DIC com 4 repetições. As parcelas foram sorteadas no campo
conforme ilustrado abaixo, os valores entre parênteses são a produtividade observada na parcela.
A (65) B (76) D (55) C (71)
A (92) D (78) D (70) B (62)
C (90) A (85) C (87) D (92)
C (131) B (110) B (107) A (105)
Ao planejar o experimento, o pesquisador não considerou que temos um declive no terreno,
e por consequência uma diferença de fertilidade. Veja que no exemplo, as parcelas localizadas
embaixo (última linha) apresentam uma maior produção. Como esta diferença não foi contro-
lada ela inflaciona o cálculo do erro experimental, pois algumas diferenças de produtividade
são consideradas como sendo ao acaso ao passo que são devido a fertilidade do solo.
Além de inflacionar o erro experimental, veja que conforme a distribuição dos tratamentos
apresentada no croqui acima, o tratamento B aparece duas vezes na última linha (mais fértil),
assim pode haver um confundimento que leve a pensar que o tratamento B é melhor que os
demais, quando na verdade apresentam maior produção média devido a ter mais parcelas na
área mais fértil do terreno.
Caso o pesquisador não controle o efeito do fator perturbador (no caso do exemplo, fer-
tilidade do solo) por meio da formação de blocos de unidades experimentais homogêneas e
acrescente a restrição de que cada tratamento (progênie) deve aparecer uma vez em cada linha,
o efeito do fator pertubador é absorvido pelo erro experimental. Tal absorção tende a provocar
um aumento no valor do QMerro, o que pode acarretar em não identificar nenhuma diferença
nos efeitos dos tratamentos, quando de fato uma ou mais diferenças possam existir.
efeitos dos níveis do fator para que tais diferenças atinjam significância estatística.
Vantagens
• reduz o erro experimental pois isola as diferenças entre os blocos;
Desvantagens
• número de tratamentos limitado pelo tamanho do bloco (homogêneo);
• redução do GL do erro.
Como no exemplo são 4 repetições, então devemos ter 4 blocos. Cada um deles deve conter
os 4 tratamentos. Portanto, são 4 × 4 = 16 parcelas.
Bloco I A B D C
Bloco II C D A B
Bloco III B C A D
Bloco IV D B C A
Sugestão: Escreva os nomes dos tratamentos em pedacinhos de papel e para cada bloco sorteie a
sequência dos tratamentos, sendo o primeiro tratamento atribuído a primeira parcela dos blocos
e assim sucessivamente.
OBS-1: Os blocos não precisam necessariamente ser do mesmo formato, desde que as parcelas
sejam de mesmo tamanho e cada bloco contenha todos os tratamentos. A exigência de homo-
geneidade dentro dos blocos é mais importante do que o formato do mesmo.
yij = µ + τi + bj + εij
em que:
Admitindo que o experimento pode ser descrito pelo modelo linear acima e que as pressu-
posições i) a iv) são atendidas, podemos passar ao quadro de ANAVA.
IJ
X
SQtotal = (yij )2 − C = (782 + 762 + · · · + 1092 + 902 ) − 101568 = 4970
ij
A SQtrat fica:
I
1X 2 1
SQtrat = Ti − C = (2192 + 2552 + 3002 + 3302 ) − 101568 = 2394
J i=1 3
A SQbloco fica:
J
1X 2 1
SQbloco = Bj − C = (4182 + 3822 + 3042 ) − 101568 = 1698
I j=1 4
A SQerro fica:
Agora que já obtivemos a SQ, podemos completar a tabela de ANAVA seguindo o raciocínio
apresentado na Tabela 1. A tabela de ANAVA fica:
FV GL SQ QM Fc p-valor
preparo de solo 3 2394 798 5,45 0,0378
bloco 2 1698 849 5,80 0,0396
erro 6 878 146,33
total 11 4970
Para Tratamentos
Como p-valor < 5% (0,0378 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma tipo de preparo de solo apresenta efeito diferente das demais na produção
de madeira.
Para Blocos
Como p-valor < 5% (0,0396 < 0,05) então rejeita-se H0 ao nível de significância de 5%,
ou seja, o uso de blocos foi eficiente para avaliar o efeito do preparo de solo na produção de
madeira.
Para aplicar o teste de Tukey, vamos seguir o algoritmo sugerido no material. Precisamos
primeiro calcular a DMS, da tabela de Tukey temos q(5%;4,6) = 4, 90, calculando a DMS:
r
146, 33
DM S5% = 4, 90 = 34, 22
3
As médias ordenadas da maior para a menor ficam: ȲD = 110, ȲC = 100, ȲB = 85 e
ȲA = 73.
Fazendo: 110 − 34.22 = 75, 78, assim as médias 110, 100 e 85 recebem todas a letra (a).
Passando agora para a segunda maior média, fazemos: 100 − 34.22 = 65, 78, assim as mé-
dias 100, 85 e 73 recebem todas a letra (b).
Como atingimos a última média então finalizamos o teste. Assim a tabela com as médias
organizadas com as letras fica:
Médias seguidas por mesma letra não diferem entre si pelo teste de Tukey ao nível de 5%
de significância. Assim, podemos concluir que os preparos de solo D, C e B não diferem
significativamente entre si e são os que proporcionam as maiores produções de madeira.
10.4 Exercícios
1- Um pesquisador pretende estudar o efeito que a aplicação de cloreto de cálcio pode provocar
nos teores de sólidos solúveis durante o armazenamento de uvas para consumo. Foram prepa-
radas soluções de CaCl2 nas concentrações de 0, 1, 2, 3 e 4%. O pesquisador tem à disposição
120 cachos de uvas de um conjunto uniforme, previamente colhidos e limpos de qualquer injú-
ria. Caso seja encontrada diferença entre as Planeje o experimento indicando o delineamento,
o número de repetições e o tamanho da parcela. Como proceder para encontrar a concentração
ideal de CaCl2?
4- Suponha que um colega seu tenha usado um programa de computador para realizar a analise
de variância com regressão de um experimento no DIC com 4 repetições, no qual foi avaliado
o efeito de 5 níveis de adubo na produção de soja. O orientador desse seu colega pediu que ele
testasse até o polinômio de terceiro grau. Como seu colega "matou"todas as aulas de estatística,
ele não copiou todos os resultados e foi pedir sua ajuda para a escolha do melhor modelo a partir
da tabela abaixo, referentes a analise regressão na ANAVA. Baseado nestes resultados, pede-se,
complete a tabela de ANAVA (não precisa colocar o p-valor) e escolha o modelo mais adequado
para descrever a relação entre as variáveis. DICA: Da tabela de F, temos que F5%;1,15 = 4, 54.
FV GL SQ QM Fc p-valor
(tratamentos) (4) 96
Reg. Linear 36
Reg. Quadrática 30
Reg. Cúbica 10
desvio 20
erro 15 75 5
Total 19
5- Uma empresa que produz alimentos para filhotes de cães desenvolveu 5 novas rações, utili-
zando vários alimentos disponíveis na região e que possibilitam vender o produto (a ração) com
um preço menor. Mas, para que essas novas rações possam ser colocadas no mercado é preciso
que elas sejam testadas em animais (cães). A empresa possui tem interesse/recursos apenas para
comercializar as rações que proporcionam um ganho de peso maior aos animais. Os técnicos da
empresa procuraram o canil da cidade para tentar encontrar animais para a realização dos testes.
Lá chegando, observaram que não existia muita diferença de peso entre os animais, mas eles
estavam misturados em várias raças diferentes. Observando mais um pouco, verificaram que
podiam arranjar grupos de 4 animais de 6 raças diferentes com pesos semelhantes. Apresente o
planejamento deste experimento indicando: o número de tratamentos, o número de parcelas, o
delineamento experimental e o teste de comparações múltiplas a ser utilizado caso tenha dife-
rença entre as rações.
6- Um pesquisador recebeu quatro novos produtos para serem comparados com um produto de
uso tradicional em uma região. Cada novo produto corresponde a um herbicida utilizado para
o controle de ervas daninhas em uma lavoura. Estes herbicidas tem comprovada eficiência em
outras regiões. Pretende-se avaliar o efeito dos produtos, 30 dias após a aplicação. O grau
de infestação é a variável de interesse do pesquisador. No local disponível na fazenda para a
realização do experimento, tem espaço suficiente para realizar 4 repetições e existem indícios
de diferenças de umidade no solo. As dosagens são pré-determinadas pelos revendedores dos
produtos. Neste estágio da pesquisa não há interesse em testar diferentes dosagens. Apresente
o planejamento deste experimento indicando: o número de tratamentos, o número de parcelas,
o delineamento experimental, o teste de comparações múltiplas a ser utilizado caso tenha dife-
rença entre os produtos e faça o croqui do experimento.
7- Um pesquisador da área de bovinos de corte pretende avaliar cinco rações no ganho de peso
para animais em confinamento. Os animais disponíveis são 20 novilhos da raça Nelore cas-
trados, de mesma idade, apresentando os seguintes pesos (kg): 322; 336; 364; 300; 325; 338;
368; 369; 340; 326; 304; 308; 342; 328; 305; 360; 335; 328; 307; 362. Planeje o experimento
enfocando: delineamento, número de repetições, tamanho da parcela e apresente o croqui.
Variedade Blocos
1 2 3 4 5
Co 819 101 109 105 95 110
Co 820 107 124 122 105 127
CB 70 130 140 138 135 134
CB 80 133 144 141 134 135
CB 90 119 130 120 128 126
a) Quais hipóteses estão sendo avaliadas nesse experimento?
b) Faça a análise da variância e interprete os resultados dos 2 testes F;
c) Avalie a precisão do experimento;
d) Aplique o teste de Tukey (5%) e interprete os resultados;
e) Faça uma avaliação do contraste variedades Co´s contra as variedades CB´s pelo teste de
Scheffé (5%) e interprete o resultado.
Cultivares Blocos
1 2 3 4
Ciat5 6,3 5,6 5,1 6,1
Ciat4 4,9 4,5 5,3 5,4
BR1 4,6 4,4 4,7 5,5
BR2 4,8 4,5 5,7 5
Iac01 3,8 4,4 4,7 4,9
Iac02 3,7 3,6 4,3 3,8
a) Fazer a análise de variância com a interpretação do teste F para tratamentos e para blocos;
b) Avalie a precisão do experimento;
c) Aplique o teste de Tukey (5%). Faça uma tabela com os nomes das cultivares, seus valores
médios, letras do teste de Tukey e, indique qual(is) a(s) melhor(es) cultivar(es). E, qual(is) não
deve(m) ser utilizada(s)?
d) Compare as cultivares Ciat versus as cultivares BR utilizando o teste de Scheffé (5%) e in-
terprete os resultados.
10- Um experimento foi conduzido no delineamento em blocos casualizado, com três repeti-
ções, para avaliar o efeito da aplicação no solo de diferentes doses de adubação nitrogenada
em cobertura sobre a produção de grãos de milho. Os tratamentos (doses de N) e valores de
produção de grãos, em t/ha, foram:
Doses de N
Blocos 0 10 20 30 40
I 2,6 4,0 6,8 7,2 9,6
II 3,0 6,4 5,3 9,4 10,2
III 1,9 5,5 7,4 8,3 8,4
Faça a análise de variância, interprete os resultados do teste F para tratamentos e para blocos.
Se necessário compare o efeito das doses de N adequadamente.
11- Foi realizado um experimento com aves para avaliar qual o melhor complemento alimentar
a ser utilizada na época de muda de penas. Devido aos animais serem de 4 ninhadas diferentes,
optou-se por utilizar o delineamento em blocos casualizados. Cada animal foi considerado
como uma parcela e foram comparados 4 tratamentos. O aluno perdeu o pendrive com os
dados e ficou apenas com os resultados da análise de variância deste experimento anotados no
caderno. No entanto, uma caneta estourou na mochila manchando o papel e a tabela ficou um
pouco incompleta, ajude este “aluno desatento” a completar a análise de variância e tirar as
conclusões do experimento.
FV GL SQ QM Fc
Tratamentos 3 229,19
Blocos 89,19
erro 9
Total 475,94
Neste delineamento o princípio do controle local é utilizado duas vezes, pois existem duas
variáveis que influenciam na resposta mas não temos interesse em compará-las (não são fato-
res). Na prática este controle funciona como se fossem blocos organizados em duas direções.
Uma característica do DQL é que o número de linhas deve ser igual ao número de colunas
que deve ser igual ao número de tratamentos, totalizando assim I 2 parcelas, daí o nome "qua-
drado".
O delineamento em quadrado latino é portanto indicado quando tem-se duas causas de vari-
ação que são conhecidas e podem ser controladas, sendo comumente utilizado em experimentos
industriais (controlando: linhas de produção, turno, semana, etc...), zootécnicos (controlando:
raças, ninhadas, faixas de peso, etc...) e agronômicos (controlando: bancada, prateleira, inten-
sidade luminosa, fertilidade do solo, teor de umidade, etc...).
Vantagens
• Possibilita controlar duas fontes de variação diferentes, evitando a superestimação do erro
experimental;
• Em ambientes heterogêneos obtêm resultados mais precisos com o uso do DQL ao invés
do DBC ou DIC, pois a formação hábil de linhas e colunas permite que tratamentos sejam
comparados em condições mais homogêneas.
Desvantagens
• Se as linhas e colunas não forem significativas ocorre perda de precisão;
Sugestão: Sorteie uma letra (tratamento) e preencha a diagonal principal do quadrado com ela,
depois termine de preencher as linhas em ordem alfabética. Enumere as linhas de 1 à 5 e faça
um sorteio, por exemplo: (3,1,4,5,2). Re-ordene as linhas de acordo com o sorteio. Agora
enumere as colunas de 1 à 5 e faça um sorteio, por exemplo: (4,2,5,1,3). Re-ordene agora as
colunas de acordo com a ordem do sorteio.
yijk = µ + τi + lj + ck + εijk
em que:
Admitindo que o experimento pode ser descrito pelo modelo linear acima e que as pressu-
posições i) a iv) da análise de variância são atendidas, podemos passar ao quadro de ANAVA.
IJK
yijk )2
P
(
ijk
C=
I2
em que: Ti , Li e Ci são os totais dos tratamentos, linhas e colunas respectivamente.
Para obter as somas de quadrados basta substituir os valores nas fórmulas apresentadas na
página anterior. Veja que você precisará saber os totais de tratamentos, de linhas, de colunas e
o valor da correção:
TA = 142 TB = 140 TC = 144 TD = 107
IJ
yij )2
P
(
ij G2 (34 + 33 + 32 + · · · + 39)2 5332
C= = = = = 17755, 56
I ×J n 16 16
IJ
X
SQtotal = (yij )2 − C = (342 + 332 + 322 + · · · + 382 + 392 ) − 17755, 56 = 299, 44
ij
A SQtrat fica:
I
1X 2 1
SQtrat = Ti − C = (1422 + 1402 + 1442 + 1072 ) − 17755, 56 = 231, 69
J i=1 4
A SQlinha fica:
I
1X 2 1
SQlinha = Li − C = (1232 + 1332 + 1332 + 1442 ) − 17755, 56 = 55, 19
I i=1 4
A SQcoluna fica:
I
1X 2 1
SQcoluna = Ci − C = (1362 + 1352 + 1312 + 1312 ) − 17755, 56 = 5, 19
I i=1 4
A SQerro fica:
FV GL SQ QM Fc p-valor
dietas 3 231,69 77,23 62,79 0,0001
linhas 3 55,19 18,40 14,96 0,0034
colunas 3 5,19 1,73 1,41 0,3287
erro 6 7,37 1,23
total 15 299,44
Como p-valor < 5% (0,0001 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma dieta apresenta efeito diferente das demais no ganho de peso dos leitões.
Para Linhas
Como p-valor < 5% (0,0034 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, controlar o sexo e peso inicial foi eficiente para avaliar o efeito da dieta no ganho de peso
dos leitões.
Para Colunas
Como p-valor > 5% (0,3287 > 0,05) então não se rejeita H0 ao nível de significância de 5%,
ou seja, controlar a leitegada não foi eficiente para avaliar o efeito da dieta no ganho de peso
dos leitões.
Assim um próximo experimento para realizar o ganho peso nas mesmas condições, pode ser
realizado em DBC controlando apenas o sexo e peso inicial, não sendo necessário controlar a
leitegada.
O próximo passo seria realizar um teste de comparação de médias, como Tukey por exem-
plo, para saber qual ou quais dietas são as melhores (propiciam maior ganho de peso).
11.4 Exercícios
1- Está sendo planejado um experimento para avaliar o sabor de cafés de 5 diferentes regiões de
Minas Gerais. No laboratório tem-se a disposição 5 provadores treinados e o torrador consegue
distinguir 5 pontos de torra que naturalmente influenciam no sabor do café, mas não tem-se o
intuito de comparar o melhor ponto de torra no momento (já é conhecido os efeitos dos pontos
de torra no sabor). Planeje o experimento, indicando o fator, a variável resposta, o delineamento
mais adequado, o número de repetições e apresente um croqui da casualização dos tratamentos
segundo o delineamento indicado.
2- Uma empresa que produz motores elétricos desenvolveu 6 novas tecnologias para reduçãao
de ruídos, utilizando vários componentes eletrônicos disponíveis na fábrica. Mas, para que essas
novas tecnologias possam ser colocadas no mercado é preciso que elas sejam testadas em um
experimento. Mesmo porque a empresa não pretende lançar as 6 tecnologias, dará preferência
para aquelas que proporcionam um menor ruído. Ao procurar por motores para a realização
dos testes observou-se que estes são fabricados por operadores diferentes em diferentes lotes,
além disso não foi possível obter motores apenas de um único lote. Planeje o experimento, de
forma que os técnicos possam avaliar o ruído dos motores, sem que o efeito de lote e operador
influenciem de forma significativa nos resultados. Detalhe bem o planejamento do experimento
indicando: fator, variável resposta, delineamento, número de repetições e apresente um croqui.
3- Um experimento foi realizado para avaliar as produções de grãos de milho (t ha-1) em função
das doses de nitrogênio em cobertura (aplicado aos 40 dias após emergência das plantas). O
delineamento experimental foi em quadrado latino com cinco repetições. O experimento foi
realizado no campo, sendo que a área experimental foi subdividida em linhas e colunas para
controlar os efeitos de declividade do solo e proximidade com uma plantação de eucaliptos. Os
tratamentos foram as doses de nitrogênio (g/parcela) aplicadas à lanço no solo: A = 0, B = 25,
C = 50, D = 75 e E = 100. Os valores de produção de grãos de milho em t ha-1 foram:
Linhas Coluna
1 2 3 4 5
1 B 7,2 D 9,0 A 4,9 C 9,7 E 11,0
2 C 8,5 E 10,1 B 7,9 D 8,7 A 2,8
3 D 9,6 A 5,8 C 9,9 E 9,5 B 5,9
4 E 9,2 B 9,7 D 10,2 A 4,5 C 10,1
5 A 3,8 C 9,5 E 9,8 B 7,1 D 9,5
a) Quais motivos levaram este experimento a ser realizado em DQL? O que poderia acontecer
se realizasse este experimento em DBC controlando apenas a declividade do solo?
b) Faça a análise de variância com a interpretação do teste F para as doses de Nitrogênio (trata-
mentos), para as linhas e também para as colunas;
c) Fazer a análise de regressão linear polinomial, interpretando os resultados;
d) Obter o coeficiente de determinação do modelo escolhido e interpretar o seu significado;
e) Fazer o gráfico da variável dependente em função da variável independente, com as médias
observadas e a equação estimada;
f) É possível estimar a produção em t ha-1 para a dose 70 g/parcela? Se sim qual o valor da
produção estimada?
g) É possível estimar a produção em t ha-1 para a dose 110 g/parcela? Se sim qual o valor da
produção estimada?
4- Um experimento em “quadrado latino” visou comparar quatro rações para vacas leiteiras.
Foram usadas quatro vacas na 1a , 2a , 3a e 4a lactação de quatro diferentes raças. As produ-
ções médias diárias de leite das vacas, por tratamento durante o período experimental foram as
seguintes:
Raças Lactação
1ª 2ª 3ª 4ª
Holandês 12,1 (B) 22,0 (A) 20,0 (C) 15,4 (D)
Pardo Suiça 14,6 (D) 14,5 (C) 21,4 (A) 12,0 (B)
Girolanda 15,1 (C) 14,3 (D) 14,4 (B) 21,2 (A)
Jersey 18,0 (A) 11,6 (B) 15,6 (D) 14,7 (C)
a) Quais motivos levaram este experimento a ser realizado em DQL?
b) Faça a análise de variância com a interpretação do teste F para as cultivares (tratamentos),
para as linhas e também para as colunas;
c) Aplique o teste de Tukey (5%) quando necessário e interprete os resultados;
5- Um experimento foi realizado para avaliar o desgaste de pneus em função das diferentes po-
sições (P1, P2, P3 e P4) das rodas no automóvel. Naturalmente, desconfia-se que este desgaste
depende do carro e da marca. Os valores observados para o desgaste foram:
Carro Marcas
A B C D
I P3 (17) P2 (14) P1 (12) P4 (13)
II P4 (14) P3 (14) P2 (12) P1 (11)
III P1 (13) P4 (11) P3 (11) P2 (10)
IV P2 (13) P1 (8) P4 (9) P3 (9)
a) Indique o fator em estudo as variáveis perturbadoras e a variável resposta; b) Elabore as
hipóteses em avaliação;
c) Faça a análise da variância e interprete os resultados;
d) Aplique o teste de Tukey, se necessário, e interprete o resultado.
OBS: P1 e P2 refere aos pneus dianteiros e P3 e P4 refere aos pneus traseiros.
FV GL SQ QM Fc p-valor
proteínas 293,34 7,28 0,0200
animais 238,54 0,0317
períodos 412,01 0,0090
erro
total 1024,48
a) Quais motivos levaram este experimento a ser realizado em DQL?
b) O que poderia acontecer caso esse experimento fosse conduzido em DBC controlando apenas
os diferentes períodos?
c) Complete a tabela de ANAVA e interprete-a.
d) Considerando que a média geral foi 66,8, calcule o coeficiente de variação e interprete-o.
Aprendemos até aqui sobre 3 delineamentos experimentais, os quais são destacadas abaixo
suas principais características.
Basicamente o que diferencia os delineamentos são as restrições que são impostas no mo-
mento de fazer esta aleatorização dos tratamentos no croqui. Para ilustrar, considere o exemplo
abaixo:
Pode se fazer um sorteio aleatório das 5 repetições de cada tratamento considerando toda a
área experimental. Por exemplo:
A C D D C
B D B A B
D A C D A
C B C A B
F.V. G.L.
trat 3
O esquema da ANAVA fica:
erro 16
total 19
Assim se uma repetição do tratamento A, por exemplo, já caiu no bloco 3, então neste bloco
não podemos mais ter repetições do tratamento A. Um exemplo do sorteio em blocos pode ser:
OBS: Os blocos não precisam necessariamente ser do mesmo formato, desde que contenha
todos os tratamentos.
F.V. G.L.
trat 3
O esquema da ANAVA fica: bloco 4
erro 12
total 19
Sugestão: Faça o sorteio dentro de cada bloco. Enumere as parcelas de 1 à 4, e faça o sorteio,
sendo que o primeiro valor sorteado recebe o tratamento A, o segundo o B, o terceiro o C e
quarto o D. Repita a operação para os demais blocos.
Assim como temos 4 tratamentos teremos que trabalhar apenas com 4 repetições.
No delineamento em quadrado latino, além da restrição do DBC temos ainda outra restrição,
que diz que cada tratamento deve aparecer apenas uma vez em cada linha e em cada coluna.
Desta forma o sorteio dos tratamentos nas parcelas deve também levar isso em conta. Um exem-
plo de casualização é:
A B D C
B C A D
D A C B
C D B A
OBS: As colunas e linhas não precisam necessariamente ser todas grudadas, a forma apre-
sentada acima é apenas a maneira que facilita a visualização. O que importa é que o tratamento
deve aparecer apenas uma vez em cada linha e apenas uma vez em cada coluna, poderia ser por
exemplo:
A B D C
B C A D
D A C B
C D B A
FV GL
trat 3
linha 3
O esquema da ANAVA fica:
coluna 3
erro 6
total 15
Sugestão: Sorteie uma letra para a diagonal principal, preencha as demais linhas em ordem
alfabética. Sorteie as linhas, re-ordene as linhas de acordo com o sorteio. Sorteie as colunas,
re-ordene as colunas de acordo com o sorteio.
O número de repetições em um experimento pode estar limitado a vários fatores, como por
exemplo: variabilidade da variável resposta, custos de implantação e execução do experimento,
disponibilidade de material experimental e recursos humanos, facilidade de avaliação etc.
O mais importante é a variabilidade da variável resposta que vai ser estudada no experi-
mento. Se forem avaliadas mais de uma variável resposta, o número de repetições será de-
terminado pela variável com maior variação, ou então, pela variável mais importante para o
pesquisador. Na maior parte dos experimentos, o pesquisador determina, por experiência e co-
nhecimento do fenômeno, qual a quantidade ideal e possível de unidades experimentais que um
experimento pode ter.
Não existe uma regra dizendo qual deve ser o número mínimo de repetições, esta informa-
ção depende do conhecimento do pesquisador sobre o assunto e do conjunto de condições em
que será realizado o experimento. Como sugestão GOMES (2009) indica que os experimentos
tenham pelo menos 20 unidades experimentais e 10 graus de liberdade para o resíduo.
q 2 × QMerro × F
J=
d2
onde: q é a amplitude total estudentizada (Tabela de Tukey); QMerro é o quadrado médio do
erro de um experimento realizado previamente em condições semelhantes; F é o quantil da
distribuição F com n1 sendo o grau de liberdade do erro do experimento atual e n2 o grau de
liberdade do erro de algum experimento anterior; d é a diferença em valor absoluto que espera-
se que seja comprovada no experimento (diferença que eu quero que seja significativa entre os
meus tratamentos com um determinado nível de significância).
12.2.2 Exemplo
Suponha um experimento com 5 tratamentos. Tem-se de experimentos anteriores uma esti-
mativa do QMerro = 54, 76 Kg/parcela, por exemplo, com grau de liberdade do resíduo igual a
60. Deseja-se que o novo experimento, indique através do teste de Tukey, que os tratamentos se-
jam diferentes caso a diferença entre as médias estimadas de produção sejam de 15 Kg/parcela
ou maiores (ou seja, DMS=15).
Um novo experimento está sendo planejado em DBC com 5 tratamentos e com 5 repetições,
inicialmente tem-se 4 GL para tratamentos e 16 GL para o resíduo. Considerando um α = 0, 05
tem-se da tabela de Tukey q(5,16;α=5%) = 4, 33 e F(16,60;α=5%) = 1, 81.
4, 332 × 54, 76 × 1, 81
J= = 8, 3
152
Assim, o número de repetições ideal está entre 5 e 8,3. Consideraremos então que va-
mos fazer o experimento com 7 repetições e refazemos os cálculos: q(5,24;α=5%) = 4, 17 e
F(24,60;α=5%) = 1, 70.
4, 172 × 54, 76 × 1, 70
J= = 7, 2
152
Assim, o número de repetições ideal está entre 7 e 7,2. Portanto recomenda-se, neste caso,
que se utilize 7 repetições.