Apostila 1 - Experimentos

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 67

UNIVERSIDADE FEDERAL DE LAVRAS

DEPARTAMENTO DE ESTATÍSTICA

Prof. Tales Jesus Fernandes Estatística Experimental

1 Introdução
Em diferentes áreas de estudo, muitas vezes somos levados a tomar decisões para a popu-
lação baseados na observação de uma amostra. Temos que decidir, por exemplo, se uma nova
cultivar que está sendo desenvolvida é melhor do que as já utilizadas. Temos que escolher entre
um conjunto de métodos quais devem continuar ou quais devem ser desprezados, ou ainda, in-
dicar qual dose propicia um melhor resultado no fenômeno em estudo, e assim por diante.

Para tomar estas decisões com embasamento científico, necessitamos estabelecer critérios.
Estes critérios devem ser criados de modo a possibilitar a melhor comparação possível (elimi-
nando efeitos perturbadores) entre as características de interesse. Assim surgem as técnicas
estatísticas para uma pesquisa científica, funcionando como um suporte à tomada de decisão.

A estatística experimental usa uma parte destas técnicas e tem por objetivo o estudo de ex-
perimentos, sendo responsável pelo seu planejamento, execução, análise dos dados obtidos e
interpretação dos resultados.

De maneira mais detalhada, as fases envolvidas na realização de um experimento são apre-


sentadas a seguir:

• definição do problema;

• formulação das hipóteses;

• planejamento do experimento;

• coleta das observações;

• análise dos dados coletados;

• interpretação dos resultados.

Não raramente a estatística experimental é utilizada de maneira equivocada apenas na aná-


lise dos dados, comprometendo e muito as possíveis conclusões. Nestes casos, os experimentos
podem ser mal realizados e/ou as análises dos seus resultados erroneamente interpretados. Evi-
denciando assim ser imprescindível a participação de alguém com conhecimento de estatística
experimental em todas as fases do experimento.

Este curso tem como objetivo apresentar os conceitos de estatística experimental, desde a
definição do problema passando cuidadosamente pelo planejamento e apresentando as princi-
pais técnicas de análise dos dados experimentais até chegar na interpretação dos resultados.
Espera-se que ao final o aluno consiga planejar e conduzir um experimento de modo a compa-
rar diferentes tratamentos, sejam eles qualitativos ou quantitativos. Além de conseguir realizar
inferências para a população com base na análise de variância, por meio de testes de hipóteses,
testes de comparações múltiplas ou regressão.

Prof. Tales Jesus Fernandes DES-UFLA 1


2 Definições iniciais
Os fundamentos das técnicas utilizadas em estatística experimental foram idealizadas por
Ronald A. Fisher em seu livro “Statistical methods for research workers” (1925). Este livro
era voltado para a área agrícola, assim a terminologia de estatística experimental tem origem
na área agrícola, embora hoje seja utilizada de forma geral nas mais diversas áreas de pesquisa.
Assim, algumas definições são necessárias:
• Experimento: é um procedimento previamente planejado com base em alguns princípios,
no qual é feita a comparação de variáveis;
• Variável: características que influenciam os resultados do experimento. Uma variável
pode ser subdivida em categorias (se qualitativa) ou níveis (se quantitativa);
• Fator: é a variável em estudo no experimento, cujo objetivo é comparar algumas de suas
categorias ou níveis;
• Resposta: também chamada de variável dependente, nela será medido o efeito do fator;
• Tratamentos: em experimentos com apenas um fator, os tratamentos são os níveis ou
categorias deste fator. Já com dois ou mais fatores, os tratamentos são formados pela
combinação dos níveis (ou categorias) destes fatores;
Desta forma, o esquema de um experimento é apresentado na figura abaixo:

Figura 1: Ilustração das variáveis envolvidas em um experimento.

O esquema da figura acima é inerente a todo ensaio experimental, assim compreender este
esquema é essencial em qualquer experimento. Na Figura 1 percebe-se que dentre as diver-
sas variáveis envolvidas em um experimento, a variável resposta (direita) é a única que sai do
experimento. O fator (esquerda) é aquela cujos níveis são controlados formando assim os tra-
tamentos que se tem o interesse de comparar. Existem ainda as variáveis irrelevantes ou não
controladas (embaixo) e as variáveis que são controladas (acima), pois afetam a resposta, mas
não se tem interesse em compará-las.

De modo geral, se você não tem nenhum conhecimento sobre a área em estudo todas as
variáveis ficam embaixo. A medida que são estabelecidos os objetivos e as hipóteses começa-
se a separar as variáveis da esquerda e da direita. E por fim, com o conhecimento sobre a
variável resposta e as condições de realização do experimento define-se quais variáveis podem
ser controladas passando para a parte superior.

Prof. Tales Jesus Fernandes DES-UFLA 2


2.1 A Parcela

• Parcela: é a unidade que vai receber o tratamento e fornecer os resultados. Um experi-


mento é constituído por várias parcelas;

• Erro experimental: é a variação que ocorre entre as respostas das parcelas que recebe-
ram o mesmo tratamento, devido ao acaso e a variáveis desconhecidas ou não controladas;

• Delineamento experimental: é o plano para indicar como os tratamentos deverão ser


distribuídos (sorteados) nas parcelas, são restrições impostas ao sorteio;

• Croqui: é um desenho esquemático, indicando a localização dos tratamentos que de-


vem ser alocados às parcelas por meio de sorteio conforme as restrições definidas pelo
delineamento experimental.

2.1 A Parcela
Também chamada de unidade experimental a parcela é onde é feita a aplicação do trata-
mento, é a menor porção de um experimento e deve ser representativa do fenômeno em estudo.
É a parcela que fornece os dados para serem avaliados, assim, é necessário um estudo um pouco
mais detalhado sobre ela.

A parcela pode ser de diferentes formas e tamanhos. A definição do tamanho da parcela


depende do tipo de material com que se está trabalhando, da quantidade de material disponível,
do número de tratamentos, do uso (ou não) de equipamentos, dos custos e da variabilidade
inerente à variável resposta. A parcela pode ser definida pela quantidade de indivíduos, área, ou
número de elementos. São exemplos de parcela:

• Uma planta de laranjeira, um conjunto de dez frutos ou um grupo de plantas de milho;

• Uma área de terreno com oito plantas ou uma área de 20 m2 ;

• Um vaso com plantas ou um conjunto de três vasos, cada um com uma planta;

• Um animal ou um conjunto de animais (gaiola, piquete, etc...)

• Um tubo de ensaio, uma bancada ou uma placa de petri.

A escolha do tamanho da parcela deve ser feito de modo a minimizar o erro experimental.
Existem estudos estatísticos para a determinação do tamanho e forma de parcelas experimen-
tais. Na prática, os pesquisadores utilizam parcelas semelhantes às de outros experimentos já
realizados em condições parecidas.

2.2 O efeito Bordadura


Em alguns experimentos as observações realizadas em uma parcela podem sofrer o efeito
das parcelas vizinhas. O efeito residual de uma parcela na outra é chamado de efeito bordadura.
O pesquisador deve planejar o experimento de modo a eliminar esse efeito.

Por exemplo, em experimentos de análise sensorial pode existir efeito residual de um ali-
mento entre uma prova e outra. O provador pode tomar um copo de água entre uma prova e
outra evitando assim que o efeito de uma unidade experimental ocorra sobre a próxima, influ-
enciando na variável resposta, este copo de água pode ser chamado de bordadura.

Prof. Tales Jesus Fernandes DES-UFLA 3


2.2 O efeito Bordadura

Em experimentos realizados no campo o efeito bordadura fica mais evidente. Considere por
exemplo um experimento para avaliar o crescimento de plantas sob diferentes doses de adubo,
em certa unidade experimental uma planta pode crescer mais do que outras sob diferentes tra-
tamentos. Assim parcelas próximas dessa, podem sofrer o efeito de sombreamento e ter sua
resposta influenciada. Ou dependendo da forma de aplicação do adubo, este pode escorrer entre
as parcelas, ou ainda as raízes das plantas podem se estender até outra parcela, etc. É preciso
portanto descartar as plantas das extremidades da parcela para servir de proteção contra esta
interferência. Esta parte da parcela que servirá de proteção é a chamada bordadura da parcela.

Veja na figura abaixo a ilustração de uma parcela retangular com quatro linhas de plantio
sendo que a bordadura constitui as linhas laterais e três plantas nas extremidades de cada linha.

Figura 2: Ilustração de uma parcela com bordadura em um experimento com plantas.

Em experimentos agrícolas portanto, a bordadura constitui parte da parcela e a variável


resposta das observações na bordadura não deve ser considerada. Por exemplo, no caso de
experimentos com plantas, a variável resposta das plantas da bordadura não precisa ser mensu-
rada. A área da parcela, excetuando-se a bordadura, é denominada área útil da parcela e apenas
nela deverão ser efetuadas as avaliações (área com as plantas vermelhas). Naturalmente, a área
total da parcela menos a área útil é a chamada área de bordadura (área com as plantas pretas).

Exemplo: Num experimento com plantas de eucalipto a parcela experimental constituiu-se de


4 linhas de plantio espaçadas de 3m, cada linha com 8 plantas espaçadas de 2m. A bordadura
foi uma linha de cada lado e uma planta em cada extremidade dentro da parcela. Esquematize
uma parcela no campo, destacando a área total da parcela, a área da parcela útil e a área da
bordadura. Calcule o número de plantas da parcela, da parcela útil e da bordadura. Se no ex-
perimento foram estudadas 5 famílias de eucaliptos e foram feitas 4 repetições, quantas plantas
foram utilizadas ao todo no experimento? Qual a área total ocupada pelo experimento?

A parcela no campo é dada por:

Prof. Tales Jesus Fernandes DES-UFLA 4


2.2 O efeito Bordadura

Veja na figura acima que a parcela é um recorte de uma parte da plantação de eucalipto.
Naturalmente existem outras linhas de plantio acima e abaixo das linhas da parcela, bem como
existem outras plantas na linha. Assim ao determinar a área da parcela é preciso considerar
que o limite da parcela não passa necessariamente sobre a as plantas da linha da extremidade.
O comum é considerar a metade do espaçamento entre linhas acima da primeira linha e me-
tade abaixo da última linha da parcela. Mesmo raciocínio para os lados direito e esquerdo,
considera-se que a parcela vai até a metade da distância entre a última planta da parcela e a
planta seguinte.

Assim para o cálculo da área da parcela considera-se os dados como na figura abaixo:

Como a linha de plantio da parcela contém 8 plantas e o espaçamento entre plantas é de


2m, então o comprimento da parcela é dada pelos 7 espaços entre plantas mais 1 metro em
cada extremidade: Comp. = 7 × 2 + 1 + 1 = 16m

A altura da parcela é dada pelos 3 espaços de 3m entre as 4 linhas, mais 1,5m acima da
primeira linha e 1,5m abaixo da última: Alt = 3 × 3 + 1, 5 + 1, 5 = 12m. Desta forma:

Área total da parcela é: 16 × 12 = 192m2 .


Área útil: 6 × 12 = 72m2 .
Área de bordadura: 192 − 72 = 120m2 .

Número de plantas da parcela: 4 × 8 = 32plantas


Número de plantas da área útil: 2 × 6 = 12plantas
Número de plantas da bordadura: 32 − 12 = 20plantas

O experimento possui 5 tratamentos e 4 repetições, logo: 5 × 4 = 20parcelas.

Assim a área total do experimento é de 192 × 20 = 3840m2


E o número de plantas utilizadas em todo o experimento é de: 32 × 20 = 640plantas.

Exercício 1: Em um experimento com a cultura do café a parcela foi de 5 linhas de plantio


espaçadas de 2m com 10 plantas cada. O espaço entre as plantas foi de 60cm. A bordadura foi
uma linha nas laterais e 2 plantas em cada extremidade. Esquematize uma parcela no campo, e
calcule a área total da parcela, a área da parcela útil e a área da bordadura. Calcule o número
de plantas da parcela, da parcela útil e da bordadura. Se no experimento foram estudadas 5
tratamentos com 6 repetições, quantas plantas foram utilizadas por cada tratamento? E quantas
plantas foram utilizadas ao todo no experimento? Qual a área total necessária para a realização
do experimento?

Prof. Tales Jesus Fernandes DES-UFLA 5


3 Planejamento de Experimentos
A principal característica de um estatístico não deve ser a habilidade para a análise de da-
dos, mas sim a competência para o planejamento de experimentos que possibilitem realizar as
comparações de interesse e forneçam informações úteis.

Para atingir os objetivos propostos o erro experimental deve ser minimizado, aumentando
assim a precisão do experimento, o que só é possível com um bom planejamento.

O acompanhamento estatístico deve ser feito desde o planejamento, sob o risco de não
conseguir realizar as comparações de interesse ou mesmo, não chegar em nenhuma conclusão
válida causando desperdício de recursos. Um experimento bem planejado deve ser simples, ter
precisão suficiente e ausência de erro sistemático, além de possibilitar as análises estatísticas
apropriadas e fornecer conclusões válidas.

“Normalmente é um grande erro planejar um único, grande e abrangente experimento para


iniciar um estudo (Montgomery, 1991).”

3.1 Hipóteses
Todo experimento deve começar com uma hipótese, ou seja, é preciso ter os objetivos do
experimento bem definidos. O sucesso de um estudo científico inicia-se com o bom entendi-
mento do problema, estabelecendo os objetivos a serem atingidos e a clareza na formulação das
hipóteses a serem testadas.
Naturalmente surgem duas hípóteses:
• A que sugere que não existe diferença significativa entre o efeito dos tratamentos na
variável resposta em estudo, denominada hipótese nula, ou H0 .
• E a que sugere que pelo menos um dos tratamentos apresenta efeito diferente dos demais
na variável resposta em estudo, denominada hipótese alternativa, ou H1 .
Dada uma hipótese, ela pode ser avaliada por meio de um experimento. Coletados os dados,
a estatística nos fornece ferramentas para testar estas hipóteses. As possíveis conclusões são:
- Rejeitar H0 , pois existem evidências suficientes no experimento.
- Não rejeitar H0 , pois não existem evidências suficientes no experimento.
É conveniente lembrar que mesmo tomando todos os cuidados necessários, as decisões to-
madas podem não ser corretas, pois estaremos trabalhando com amostras. As situações possí-
veis são explicitadas na tabela a seguir.
Tabela 1: Possíveis situações envolvidas na escolha de uma hipótese.
Decisão
Rejeitar H0 Não rejeitar H0
H0 verdadeira erro tipo I ✓
H0 falsa ✓ erro tipo II

Entre os dois possíveis erros, o erro tipo I é o mais grave. Assim a probabilidade de cometer
o erro tipo I pode ser fixada pelo pesquisador e é denominada “nível de significância” do teste,
simbolizada por α. Geralmente α = 5% ou α = 1%.

O nível de significância α é a probabilidade máxima de cometer o erro tipo I ao rejeitar H0 .

Prof. Tales Jesus Fernandes DES-UFLA 6


3.2 Princípios básicos da experimentação

No momento do planejamento de um experimento, devemos ter em mente, algumas reco-


mendações simples. Procure responder as seguintes questões:

1. Quais são minhas hipóteses?

2. Quais variáveis afetam minhas hipóteses?

3. Quais destas variáveis serão estudadas?

4. Como será constituída a parcela?

5. Quantas repetições são necessárias?

6. Qual delineamento experimental deve ser utilizado?

Na lista acima, os items 1 à 4 já foram discutidos neste material. Sobre os items 5 e 6 iremos
estudar um pouco mais adiante no curso.

3.2 Princípios básicos da experimentação


A repetição e a casualização são denominados princípios básicos da experimentação porque
são os fundamentos mínimos necessários à todo experimento.

i) Repetição

Consiste na aplicação de cada tratamento em mais de uma parcela experimental. Possibilita


estimar o erro experimental.

ii) Casualização

Consiste na atribuição dos tratamentos aleatoriamente nas parcelas (sorteio). Evita o arranjo
sistemático, garantindo a independência dos erros.

iii) Controle Local

Este só deve ser utilizado quando as parcelas, antes de receberem os tratamentos apresentam
condições diferentes entre si. As parcelas semelhantes são agrupadas em blocos, assim o expe-
rimento fica dividido em blocos heterogêneos entre si, mas homogêneo dentro de cada bloco.

Naturalmente cada bloco deve receber todos os tratamentos, evitando assim o favorecimento
de algum tratamento.

Desafio: Descreva um experimento a ser pesquisado na área de seu interesse. Des-


creva todos os detalhes conhecidos sobre o problema proposto. Formule os principais objetivos
a serem alcançados. Formule uma hipótese a ser verificada no estudo, indique as variáveis en-
volvidas, qual será o fator, qual a variável resposta. Como será constituída a parcela? Qual o
espaço necessário para a realização do experimento?

Prof. Tales Jesus Fernandes DES-UFLA 7


3.2 Princípios básicos da experimentação

Para ilustrar a aplicação dos princípios básicos da experimentação, acompanhe a elaboração


do croqui de um experimento no exemplo abaixo.

Exemplo: Suponha que você deseja realizar um experimento para comparar a produtividade
de 3 cultivares de milho.

Primeiramente você deverá definir o tamanho e forma da parcela. Em experimentos do


mesmo tipo as parcelas são retangulares. Assim, com uma parcela para cada tratamento:

Naturalmente você terá que repetir as parcelas, pois sem repetição não será possível esti-
mar o erro experimental. Suponha que tem espaço para 4 repetições.

Esta repetição sistemática, causa dependência entre as parcelas, pois os tratamentos estão
sempre em sequência, assim é preciso fazer a casualização.

Veja que se o local de realização do experimento for homogêneo em todas as parcelas, en-
tão já finalizamos o croqui do experimento. Por isso a repetição e casualização são os únicos
princípios que devem ocorrer em todos os experimentos.

Mas apenas para ilustrar o controle local, considere que existe uma declividade no terreno

Prof. Tales Jesus Fernandes DES-UFLA 8


3.3 Exercícios

e se o croqui ficar da forma como está na figura acima, o tratamento B seria beneficiado pois
tem mais parcelas dele na parte de baixo, teoricamente mais fértil. Assim precisamos garantir
que tenha todos os tratamentos em todos os níveis de fertilidade, esta é a idéia do controle
local. Veja como ficaria na figura abaixo.

Agora existe um controle local sobre a declividade do terreno. Desta forma, cada linha (ou
bloco) contém todos os tratamentos.

De modo geral, o controle local funciona como restrições no momento de casualizar os trata-
mentos. As diferentes maneiras de utilizar o controle local definem os principais delineamentos
experimentais, os quais veremos com mais detalhes ao longo do curso.

3.3 Exercícios
1: Um extensionista, desejando comparar 10 rações para avaliar o ganho de peso em animais,
procedeu da seguinte forma:

- tomou 10 animais de uma propriedade rural. Estes 10 animais não eram homogêneos entre
si, porque foram oriundos de diferentes cruzamentos raciais e apresentavam idades diferentes.
Ele então separou um grupo com os 5 melhores e outro com os 5 piores animais.
- as rações que o extensionista julgou ser as melhores foram designadas ao grupo dos me-
lhores animais, e as rações que o extensionista julgou ser as piores foram designadas aos piores
animais, de tal forma que cada animal recebeu uma única ração.
- ao final de sua pesquisa, o extensionista recomendou a ração que proporcionou maior ga-
nho de peso nos animais.

Baseado nestas informações, pergunta-se:

a) Qual o fator e qual a variável resposta neste experimento?


b) Quantos e quais foram os tratamentos neste experimento?
c) Como foi constituída a parcela neste experimento?
d) Qual(is) foi(ram) o(s) princípio(s) básico(s) da experimentação utilizados neste experimento?
e) É possível estimar o erro experimental neste experimento? Justifique sua resposta.
f) A conclusão dada pelo extensionista ao final do experimento, é estatisticamente aceitável?
Justifique a sua resposta.
g) Ajude o extensionista a planejar este experimento corretamente, mantendo o mesmo objetivo.

Prof. Tales Jesus Fernandes DES-UFLA 9


UNIVERSIDADE FEDERAL DE LAVRAS
DEPARTAMENTO DE ESTATÍSTICA
Prof. Tales Jesus Fernandes Estatística Experimental

4 Inferência Estatística
Em estatística estamos interessados em generalizar conclusões com base em amostras. Par-
ticularmente em estatística experimental desejamos expandir as conclusões com base nos resul-
tados de um experimento planejado. Em outras palavras, desejamos obter conclusões para os
parâmetros com base em estimativas obtidas no experimento.
Relembre-se que:
• Parâmetro: medida utilizada para descrever uma característica da população.
• Estimador: é a expressão algébrica utilizada para obter um valor aproximado do parâ-
metro.
• Estimativa: é o valor numérico obtido pelo estimador com base na amostra.

Figura 3: Esquema ilustrando o processo de inferência estatística.

No dia a dia usamos inferência para tomarmos decisões, praticamente o tempo todo. Por
exemplo, quando queremos verificar o tempero de uma sopa, pegamos um pouco na colher e
experimentamos. O produtor, para saber se o lote de café já atingiu o ponto ideal de seca, ob-
serva alguns grãos aleatoriamente.

Para ficar ainda mais claro este processo de inferência, imagine que você vai a feira para
comprar abacaxi e um feirante te oferece um pedaço de abacaxi. Qual o seu procedimento? Se
aquele pedaço de abacaxi for doce, naturalmente você infere que todo o lote de abacaxi vendido
por aquele feirante é doce. Por outro lado, se o pedaço for azedo, você deverá inferir que todo
o lote é azedo. Claro que podemos tomar decisões erradas devido à amostragem. Por exemplo,
corremos o risco de levar abacaxi azedo para casa, mesmo que a nossa prova tenha sido doce.
Isto pode acontecer porque o lote de abacaxi pode não ser completamente uniforme no teor de
açúcar, ou porque experimentamos um abacaxi doce no meio de um lote composto por abacaxis
azedos. Este exemplo prático ilustra o princípio básico de um teste de hipóteses.

Prof. Tales Jesus Fernandes DES-UFLA 10


4.1 Testes de Hipóteses

4.1 Testes de Hipóteses


Como vimos anteriormente, todo experimento deve começar com a elaboração das hipóte-
ses. Definimos então duas hipóteses: hipótese nula - H0 e hipótese alternativa - H1 .

Para decidirmos se devemos ou não rejeitar H0 , baseamos na comparação do valor espe-


cificado para o parâmetro com a estimativa obtida a partir de uma amostra. Naturalmente,
um estimador pode assumir valores diferentes para amostras diferentes, sendo que existem in-
tervalos de valores mais prováveis de ocorrer do que outros. Portanto pode-se construir uma
distribuição de probabilidades para os valores de um estimador. A esta distribuição dá-se o
nome de distribuição amostral do estimador.

A distribuição amostral fundamenta-se na obtenção de todas as amostras possíveis de


mesmo tamanho da população. É como se fossem realizadas todas as amostras possíveis da
população e construída a distribuição a partir do histograma amostral, por exemplo.

A lógica de um teste de hipóteses é comparar o valor da estatística de teste com algum


quantil da distribuição amostral do estimador em questão. Existem vários testes de hipóteses
disponíveis na literatura, os quais são apresentados em sua maioria na disciplina de estatística
básica. Para conhecer mais sobre alguns destes testes acesse o capítulo 6 da apostila disponí-
vel em https://github.com/talesjfer/Apostila-Estatistica-Aplicada. Em experimentação estamos
particularmente interessados no teste F.

4.2 O teste F
O teste para a razão de variâncias de duas populações independentes, também chamado de
teste F, é uma generalização do teste t para duas médias.
n
(yi −Ȳ )2
P
2 i=1
Lembre-se que o estimador da variância é dado por: S = n−1

A razão entre duas variâncias amostrais independentes, possui distribuição F de Snedecor.


O estimador desta razão, também chamado de estatística do teste é dado por:

S12
∼ Fv1 ,v2
S22
em que v1 e v2 são os graus de liberdade associados às variâncias do numerador e do denomi-
nador respectivamente, necessários para obter o quantil da distribuição F.

Figura 4: Distribuição amostral da razão de variâncias, F de Snedecor.

Prof. Tales Jesus Fernandes DES-UFLA 11


5 Análise de variância - ANAVA
A tabela de análise de variância (ANAVA) é uma tabela proposta por Ronald A. Fisher para
identificar a existência, ou não, de mudanças sistemáticas nas variáveis de interesse. É uma
forma de organizar e resumir as informações dos dados amostrais, decompondo a variação total
em diferentes variâncias e aplicar o teste F para a razão entre estas variâncias.

Tabela 2: Esquema de organização da tabela de ANAVA.


FV GL SQ QM Fc
tratamentos
erro
Total

em que: FV são as fontes de variação do experimento; GL são os graus de liberdade associa-


dos às fontes de variação; SQ são as somas de quadrado para cada fonte de variação; QM é o
quadrado médio, estimador da variância, obtido pela razão entre o SQ e o respectivo GL; Fc é
o valor obtido pela razão entre as variâncias (QM’s) de interesse.

As fontes de variação da tabela de análise de variância são definidas com base no modelo
estatístico do experimento. O modelo estatístico varia de acordo com o delineamento e com
o número de fatores. O modelo estatístico é composto pela soma dos efeitos explicados pelo
experimento e o erro experimental (efeito das variáveis desconhecidas ou não controladas).

5.1 Pressuposições da ANAVA


Como toda técnica estatística paramétrica, para que os resultados dos testes da ANAVA
sejam válidos é preciso que sejam atendidas algumas pressuposições básicas.

i) Aditividade - o efeito de cada um dos termos que compõem o modelo devem ser aditivos;
ii) Homogeneidade - os erros devem ser estimados todos da mesma população, isto implica
que cada tratamento deve ter aproximadamente a mesma variância;
iii) Normalidade - os erros devem possuir distribuição normal com média zero;
iv) Independência - cada observação possui um erro, que deve ser independente dos demais,
seja em um mesmo tratamento, seja em tratamentos diferentes.

As pressuposições i) e ii) são essenciais para a adequabilidade do uso da ANAVA. Já as


suposições iii) e iv) são necessárias para a validade dos testes estatísticos (teste F).

A verificação destas pressuposições pode ser feita por meio de testes estatísticos. Quando
estas pressuposições não são atendidas pode-se utilizar algumas técnicas que amenizam este
desvio. O mais comum é a transformação dos dados. Quando uma transformação de dados
é feita, todas as comparações e estimativas de intervalo de confiança devem ser determinadas
na nova escala, sendo que as médias dos tratamentos podem ser re-transformadas para a escala
original. As transformações mais comuns são: raiz quadrada e logarítmica. Existem técnicas
para identificar a transformação mais adequada a ser feita nos dados (BOX & COX, 1964).

Outra opção é trabalhar com modelos que considerem estes desvios de pressupostos, como
distribuições assimétricas e variâncias heterogêneas. São exemplos os modelos lineares gene-
ralizados (GLM) e os modelos lineares generalizados de forma e escala (GAMLSS).

Prof. Tales Jesus Fernandes DES-UFLA 12


5.2 Fontes de variação de um experimento

5.2 Fontes de variação de um experimento


Todo conjunto de dados numérico pode apresentar variabilidade entre seus valores. A vari-
ância, conforme vimos anteriormente, é uma medida de variabilidade calculada pela soma dos
quadrados dos desvios em relação a média dividido por n − 1.

A ANAVA de Fisher é um processo baseado na decomposição da variação total em partes


que podem ser atribuídas a causas conhecidas e numa parte devido a causas desconhecidas ou
não controladas (erro experimental).

Para ilustrar os cálculos destas variações, considere um experimento com I tratamentos e J


repetições. Este experimento conterá I × J = n parcelas. Os dados da pesquisa são geralmente
resumidos em um quadro como a seguir:

Tratamentos
Repetições 1 2 ··· I
1 y11 y21 ··· yI1
2 y12 y22 ··· yI2
.. .. .. .. ..
. . . . .
J y1J y2J ··· yIJ
Totais T1 T2 ··· TI

Considere que yij é o valor observado da variável resposta na parcela ij, isto é, na J-ésima re-
petição do tratamento I, por exemplo, y12 é a segunda repetição do tratamento 1. Já T1 , T2 , ...,
TI são os totais dos tratamentos, assim podemos definir a média de cada tratamento por Ȳi = TJi .

Além disso, G é o total geral do experimento, que pode ser obtido pela soma de todas as
IJ
P
parcelas (G = yij ) ou pela soma dos totais de tratamentos (G = T1 + T2 + ... + TI ).
ij
G
Assim, a média geral é dada por Ȳ = n
, sendo n o número de parcelas do experimento.

5.2.1 A variação total


Representa toda a variação ocorrida no experimento. Pode ser calculada por:
SQtotal
QMtotal = GL total
, em que: GLtotal = n − 1 e a SQtotal é a soma dos quadrados das diferenças
entre cada observação e a média geral:
IJ
X
SQtotal = (yij − Ȳ )2
ij

De modo mais simplificado, esta expressão pode ser re-escrita por:


IJ
yij )2
P
IJ (
X ij
SQtotal = (yij )2 −
ij
I ×J
A parte final da expressão é chamada de correção para a média, simbolizada por C. Assim:
IJ
yij )2
P
(
ij G2
C= =
I ×J n

Prof. Tales Jesus Fernandes DES-UFLA 13


5.2 Fontes de variação de um experimento

E portanto:
IJ
X
SQtotal = (yij )2 − C
ij

5.2.2 A variação entre os tratamentos


É a variação ocorrida no experimento devido ao efeito dos tratamentos. O QM de trata-
SQtrat
mentos é o estimador desta variância entre os tratamentos, é calculado por: QMtrat = GLtrat
,
sendo que GLtrat = I − 1 e a SQtrat corresponde a soma dos quadrados das diferenças entre
as médias de cada tratamento e a média geral:
IJ
X
SQtrat = J (Ȳi − Ȳ )2
ij

De modo mais simplificado a expressão pode ser re-escrita por:


I
1X 2
SQtrat = T −C
J i=1 i

5.2.3 A variação dentro dos tratamentos


É a variação devido ao acaso, em outras palavras é a variação do erro experimental. É
SQerro
estimada por: QMerro = GL erro
, sendo que GLerro = GLtotal −GLtrat , já o SQerro corresponde
ao somatório das somas dos quadrados dos desvios dentro dos tratamentos, calculado pela soma
do quadrado dos desvios de cada repetição com a média do respectivo tratamento:
I X
X J
SQerro = (yij − Ȳi )2
i j

Desenvolvendo a expressão acima, obtém-se:


IJ I
X 1X 22
SQerro = (yij ) − T
ij
J i=1 i

Portanto, na prática fazemos:

SQerro = SQtotal − SQtrat

A idéia básica da ANAVA de Fisher é verificar se a variabilidade “entre” as parcelas que


receberam diferentes tratamentos é muito maior do que a variabilidade das parcelas “dentro”
dos tratamentos.
Se a variabilidade “entre” os tratamentos for semelhante à variação ao acaso (“dentro” dos
tratamentos) então é um indício de que não existe diferença entre os tratamentos comparados,
pois a variação que existe entre eles pode ser confundida com a variação ao acaso. Já se a
variação “entre” os tratamentos for muito maior que a variação “dentro” dos tratamentos, é um
indício de que os diferentes tratamentos estão ocasionando uma variação na variável resposta
além do que a esperada (erro experimental), portanto é um indicativo de que os tratamentos
diferem entre-si. Neste caso a razão entre as variâncias (Fc da ANAVA) é grande.

Prof. Tales Jesus Fernandes DES-UFLA 14


5.2 Fontes de variação de um experimento

A decisão de o que é grande fica definida pelo quantil tabelado da distribuição F (denotado
por Ft) e o nível de significância α adotado. Assim o teste F se resume à comparar Fc com Ft.
Caso Fc seja menor que Ft então aceita-se H0 ao nível α de significância. Já no caso de Fc
maior que Ft, então rejeita-se H0 ao nível α de significância.

5.2.4 Exemplo Resolvido


Exemplo 1: Na tabela abaixo são apresentado os dados da produção de massa verde em ton/ha
de três cultivares de sorgo (A - BRS658, B - BRS373 e C - BRS380).
CULTIVARES
REPETIÇÃO A B C
1 186 158 190
2 180 173 215
3 187 175 221
4 181 174 195
5 184 170 210
TOTAL
Com base nos dados acima, defina: a) Qual o fator, o tratamento e qual a variável resposta?
b) Quais as hipóteses em estudo? c) O valor de I e J e o número de parcelas; d) o total de
cada cultivar e o total geral; e) a média geral do experimento; f) a média e a variância de cada
cultivar; g) a média das médias das cultivares e verifique que é igual a média geral; h) a média
das variâncias das cultivares; i) na sua opinião, existe diferença entre as cultivares? j) a SQtotal,
a SQtrat e a SQerro (ou SQdentro); k) complete a tabela de ANAVA; l) interprete o resultado o
teste F da ANAVA; m) verifique que o QMerro também chamado de variação dentro, ao acaso
ou variância residual, é igual ao resultado obtido no item h).

Resolução:

a) O fator é cultivar de sorgo, os tratamentos sãs as três cultivares estudadas e a variável resposta
é a produção de massa verde em ton/h.

b) As hipóteses são:

 H0 : Não existe diferença entre os efeitos das cultivares na produção de massa verde de sorgo.
H1 : Pelo menos uma cultivar apresenta efeito diferente das demais na produção de
massa verde de sorgo.

c) Temos 3 tratamentos e 5 repetições, logo: I = 3 e J = 5. Assim, n = 3 × 5 = 15 parcelas.

d) TA = 918; TB = 850; TC = 1031; G = 2799;

2799
e) Ȳ = 15
= 186, 6

918
f) ȲA = 5
= 183, 6
J
P
(yAj −ȲA )
2 2 2 +(181−183,6)2 +(184−183,6)2
SA2 = j=1
J−1
= (186−183,6) +(180−183,6) +(187−183,6)
5−1
= 9, 3

850
ȲB = 5
= 170
J
P
(yBj −ȲB )
j=1 (158−170)2 +(173−170)2 +(175−170)2 +(174−170)2 +(170−170)2
SB2 = J−1
= 5−1
= 48, 5

Prof. Tales Jesus Fernandes DES-UFLA 15


5.2 Fontes de variação de um experimento

1031
ȲC = 5
= 206, 2
J
P
(yCj −ȲC )
j=1 (190−206,2)2 +(215−206,2)2 +(221−206,2)2 +(195−206,2)2 +(210−206,2)2
SC2 = J−1
= 5−1
= 174, 7

g)
183,6+170+206,2
3
= 183, 6
h)
9,3+48,5+174,7 232,5
3
= 3
= 77, 5
i)
Parece que existe uma diferença entre as médias das cultivares, mas a variância é muita alta.
j)
Primeiro calculamos a correção:
IJ
( yij )2
P
ij G2 (186 + 180 + · · · + 195 + 210)2
C= = =
I ×J n 15
27992
C= = 522293, 40
15
Agora a SQtotal fica:

IJ
X
SQtotal = (yij )2 − C = (1862 + 1802 + · · · + 1952 + 2102 ) − 522293, 40 = 4273, 60
ij

A SQtrat fica:

I
1X 2 1
SQtrat = Ti − C = (9182 + 8502 + 10312 ) − 522293, 40 = 3343, 60
J i=1 5

A SQerro fica:

IJ I
X
2 1X 2 1
SQerro = (yij ) − Ti = (1862 +1802 +· · ·+1952 +2102 )− (9182 +8502 +10312 ) = 930
ij
J i=1 5

Ou de modo mais simples:

SQerro = SQtotal − SQtrat = 4273, 60 − 3343, 60 = 930


k) Para montar a tabela, os graus de liberdade são:
GLtotal = 15 − 1 = 14 GLtrat = 3 − 1 = 2 GLerro = 14 − 2 = 12

O QM é obtido pela divisão da SQ pelo respectivo GL (geralmente não calculamos o QMtotal ):


SQtrat 3346,60 SQerro 930
QMtrat = GLtrat
= 2
= 1671, 80 QMerro = GLerro
= 12
= 77, 50

E o F calculado (Fc) é a divisão entre as duas variâncias estimadas.


QMtrat 1671,8
Fc = QMerro
= 77,5
= 21, 57

Prof. Tales Jesus Fernandes DES-UFLA 16


5.3 Coeficiente de Variação

FV GL SQ QM Fc
tratamentos 2 3346,60 1671,8 21,57
erro 12 930 77,5
Total 14 4273,6

l) Para interpretar o teste F, precisaremos do valor de F tabelado, conforme ilustrado na Figura


2. Adotando o nível de significância de 5%, temos que F2,12;5% = 3, 89.

Como Fc > Ft (21,57 > 3,89) então rejeita-se H0 ao nível de significância de 5%, ou seja,
pelo menos uma cultivar apresenta efeito diferente das demais na produção de massa verde de
sorgo. Diz-se de modo muito resumido que neste caso o teste F foi significativo.

m) QMerro = 77, 5 Veja que coincide com a variância média.

5.3 Coeficiente de Variação


O coeficiente de variação (CV) é uma medida de dispersão que expressa a variabilidade dos
dados livre da influência da média e da unidade de medida. Logo pode ser utilizado para com-
parar a variabilidade de diferentes conjuntos de dados.

Em estatística experimental, o coeficiente de variação é portanto uma medida da variação


residual do experimento, apropriada para comparar experimentos entre si. Tem-se uma ideia da
precisão do experimento, sendo que valores menores sugerem uma melhor precisão.

O valor de CV é sempre indicado em porcentagem e pode ser calculado pela expressão:



QM erro
CV = × 100

em que QMerro é o quadrado médio do erro, obtido no quadro de ANAVA e Ȳ é a média geral
do experimento.

A precisão experimental depende do tipo de experimento e da variável resposta em estudo,


por exemplo, valores de produção de grãos apresentam maior variabilidade do que valores de
altura de planta. Nesse sentido não existe um consenso sobre qual seria o valor ideal para o CV.
De modo geral, existem várias tabelas de classificação da precisão do experimento com base no
CV, será apresentada abaixo a tabela sugerida por Pimentel Gomes (2009).

Tabela 3: Classificação da precisão do experimento com base no CV.


CV Precisão
CV < 10% alta
10% < CV < 20% media
20% < CV < 30% baixa
CV > 30% muito baixa

Exemplo: com base nos dados do exemplo 1 podemos calcular o CV.


√ √
QM erro 77, 5
CV = × 100 = × 100 = 4, 72%.
Ȳ 186, 6
Sugerindo assim que o experimento para avaliar a produção de massa fresca de sorgo foi
avaliado com alta precisão.

Prof. Tales Jesus Fernandes DES-UFLA 17


5.4 Nível descritivo de um teste de hipóteses (p-valor)

5.4 Nível descritivo de um teste de hipóteses (p-valor)


Ao realizarmos um teste de hipóteses, partimos de um valor de α pré-fixado. Lembre-se que
α é o nível de significância do teste, ou probabilidade de cometer o erro tipo I. Geralmente o
nível de significância é estabelecido em α = 5% ou α = 1%.
A ideia consiste em calcular, supondo que a hipótese nula é verdadeira, a probabilidade de
obter estimativas mais desfavoráveis, ou extremas (a luz da hipótese alternativa) do que está
sendo observado na amostra. Esta probabilidade será o “nível de significância observado” (ou
nível descritivo), denotado por p-valor.
Valores pequenos do p-valor evidenciam que a hipótese nula é falsa, pois a amostra fornece
uma estimativa que tem pequena probabilidade de acontecer, se H0 fosse verdadeira.

Figura 5: Ilustração de um teste de hipótese unilateral na distribuição F.

Regra de decisão
O que deve ficar claro é que o p-valor é o menor nível de significância em que H0 seria
rejeitada, para uma amostra observada. Uma vez que o p-valor tenha sido determinado, a
conclusão, em qualquer nível específico α, resulta da comparação do p-valor com α:

• p − valor ≤ α ⇒ Rejeita-se H0 ao nível α de significância.

• p − valor > α ⇒ Não se rejeita H0 ao nível α de significância.

Em relação à Figura 3, a área colorida é o nível de significância α adotado, área acima de


Ftabelado (geralmente α = 5%). Em palavras simples, o p-valor é como se colorisse a área acima
de Fcalculado . Perceba que se Fcalculado < Ftabelado então a área colorida seria maior do que a da
Figura 3. Já se Fcalculado > Ftabelado então a área colorida seria menor do que da Figura 3.
A principal vantagem do uso de um p-valor é que os softwares estatísticos mais amplamente
utilizados (SAS, R, SISVAR, etc...) incluem automaticamente um p-valor quando é feito algum
teste de hipóteses. Assim pode-se obter uma conclusão para o teste de hipóteses diretamente
da saída do software, basta conhecer as hipóteses (H0 e H1 ) envolvidas. Não é necessário
consultar uma tabela de valores críticos, nem saber qual é a estatística de teste e nem saber qual
a distribuição amostral do estimador em questão.
É acrescentada assim uma coluna na tabela de ANAVA com o p-valor. Cabe ressaltar que é
muito difícil calcular o p-valor à mão, seu uso será apenas quando a ANAVA for realizada em
algum software.

Prof. Tales Jesus Fernandes DES-UFLA 18


Exemplo: No caso do exemplo 1, a tabela de ANAVA com o p-valor fica:

FV GL SQ QM Fc p-valor
tratamentos 2 3346,60 1671,8 21,57 0,0001
erro 12 930 77,5
Total 14 4273,6

Assim, a interpretação fica bem mais simples, pois para interpretar o resultado da ANAVA
não é necessário obter o valor de F tabelado. Basta comparar o p-valor com o nível de signifi-
cância adotado, a conclusão fica:

Como p-valor < 5% (0,0001 < 0,05) então rejeita-se H0 ao nível de significância de 5%,
ou seja, pelo menos uma cultivar apresenta efeito diferente das demais na produção de massa
verde de sorgo.

OBS: Na tabela de ANAVA, você pode colocar a FV tratamentos ou utilizar o nome do fator
em estudo. No caso deste exemplo, pode-se colocar cultivares no lugar de tratamentos.

6 Delineamento Inteiramente Casualizado - DIC


É o mais simples dos delineamentos estatísticos, pois utiliza apenas os princípios da repeti-
ção e casualização.

No DIC a distribuição dos tratamentos nas parcelas é feita inteiramente ao acaso. O que
diferencia os demais delineamentos é que são acrescentadas restrições no momento de fazer
esta casualização.

Como no DIC não são feitas restrições no sorteio dos tratamentos nas parcelas, este de-
lineamento pressupõe que as condições experimentais em todas as parcelas são homogêneas.
Assim, o DIC deve ser utilizado apenas em experimentos realizados em ambientes com con-
dições controladas, como: laboratório, casa de vegetação, terreno com pouca variabilidade do
solo, computadores, etc.

Vantagens
• é um delineamento bastante flexível, pois o número de repetições e o número de trata-
mentos depende apenas do número de parcelas disponíveis;
• a análise de variância é simples, mesmo se o número de repetições for diferente entre os
tratamentos;
• o número de graus de liberdade para o erro experimental é o maior possível, em compa-
ração com os outros delineamentos com o mesmo número total de parcelas.

Desvantagens
• exige homogeneidade das condições experimentais em todas as parcelas;
• pode conduzir a grandes estimativas para a variância ao acaso (QMerro ), pois o erro ex-
perimental recebe toda a variabilidade que não é explicada pelos tratamentos. Logo pode
ter baixa precisão se as parcelas não são uniformes.

Prof. Tales Jesus Fernandes DES-UFLA 19


6.1 Casualização dos tratamentos em DIC

6.1 Casualização dos tratamentos em DIC


A casualização consiste em um conjunto de regras que define o processo de distribuição
aleatório dos tratamentos nas parcelas da área experimental. É neste momento que é criado o
croqui do experimento.

Para ilustrar, considere o exemplo abaixo:

Um pesquisador pretende instalar um experimento para comparar I = 4 tratamentos. Ele conta


com material experimental suficiente para utilizar J = 5 repetições. Apresente um croqui com
a casualização dos tratamentos.

Casualização:
Como no delineamento inteiramente casualizado as condições são homogêneas então todas
as parcelas tem a mesma chance de receber qualquer tratamento.

Com 4 tratamentos e 5 repetições, temos 4 × 5 = 20 parcelas.

Pode se fazer um sorteio aleatório das 5 repetições de cada tratamento considerando toda a
área experimental. Por exemplo:

A C D D C
B D B A B
D A C D A
C B C A B
Sugestão: Enumere todas as parcelas de 1 à 20, e sorteie as 5 repetições de cada tratamento
de uma vez. Por exemplo, os primeiros 5 números sorteados correspondem às parcelas que
receberão o tratamento A, e assim sucessivamente.

6.2 Modelo estatístico


Para os dados oriundos de um experimento realizado em DIC, o modelo linear que explica
as variações da variável resposta e deve ser utilizado nas análises estatísticas é:

yij = µ + τi + εij
em que:

• yij é o valor da variável resposta observada na parcela de tratamento i, na repetição j;

• µ é uma constante inerente a toda parcela;

• τi representa o efeito do i-ésimo tratamento na variável resposta;

• εij é o erro experimental da parcela ij.

A pressuposição i) da ANAVA fala sobre a adividade dos termos deste modelo linear apre-
sentado acima. Além disso é sobre o componente aleatório do erro experimental que são
feitas as pressuposições ii), iii) e iv) da ANAVA. Podemos escrever de modo resumido que
εij ∼ N (0, Iσ 2 ).

Prof. Tales Jesus Fernandes DES-UFLA 20


6.3 ANAVA para o DIC

6.3 ANAVA para o DIC


Assumindo que as pressuposições i) à iv) são atendidas podemos decompor a variação total
do experimento conforme a tabela de ANAVA proposta por Fisher. A tabela de análise de
variância para um experimento em DIC, com I tratamentos e J repetições é obtida por:

Tabela 4: Esquema de ANAVA para o DIC, com I tratamentos e J repetições.


FV GL SQ QM Fc p-valor
SQtrat QMtrat
trat I −1 SQtrat I−1 QMerro
P[F>Fc]
SQerro
erro I ∗ (J − 1) SQerro I∗(J−1)
total I ∗J −1 SQtotal

As fórmulas para a obtenção das Somas de Quadrado foram apresentadas anteriormente.

6.3.1 Exemplo Resolvido


Exemplo 2: Foi realizado em uma casa de vegetação para avaliar a área foliar (em cm2 ) de 4
cultivares de cafeeiro (A, B, C e D). Foram utilizadas 3 repetições no delineamento inteiramente
casualizado. A parcela constou de 2 folhas, sendo que foi calculada a área média entre as duas
como variável resposta. Os dados são apresentados abaixo.
CULTIVARES
REPETIÇÃO A B C D
1 4 10 7 10
2 5 12 9 14
3 6 8 11 12
TOTAL 15 30 27 36
a) Indique o Fator, a variável resposta e o número de tratamentos.
b) O que é a parcela? Quantas folhas foram utilizadas em todo o experimento?
c) Quais as hipóteses em estudo?
d) Faça a análise de variância e interprete os resultados.
e) Calcule o coeficiente de variação e avalie a precisão do experimento.

Resolução:
a) O Fator foi a Cultivar de café e a variável resposta foi área foliar (em cm2 ). Como só temos
um fator, os tratamentos são as categorias (ou níveis) do fator, assim os tratamentos são as 4
cultivares de café.

b) A parcela ou unidade experimental foi 2 folhas. Temos 3 × 4 = 12 parcelas, logo foram


utilizadas 24 folhas em todo o experimento.

c) As hipóteses são:

H0 : Não existe diferença entre os efeitos das cultivares na área foliar de café.
H1 : Pelo menos uma cultivar apresenta efeito diferente das demais na área foliar de café.

Prof. Tales Jesus Fernandes DES-UFLA 21


6.3 ANAVA para o DIC

d)
Primeiro precisamos calcular a correção:
IJ
yij )2
P
(
ij G2 (15 + 30 + 27 + 36)2
C= = =
I ×J n 12
116642
C= = 972
12
Agora a SQtotal fica:
IJ
X
SQtotal = (yij )2 − C = (42 + 52 + · · · + 142 + 122 ) − 972 = 104
ij

A SQtrat fica:
I
1X 2 1
SQtrat = Ti − C = (152 + 302 + 272 + 362 ) − 972 = 78
J i=1 3
A SQerro fica:

SQerro = SQtotal − SQtrat = 104 − 78 = 26


Completando a tabela de ANAVA de acordo com as fórmulas apresentadas na Tabela 3,
tem-se:

FV GL SQ QM Fc p-valor
trat 3 78 26 8 0,0086
erro 8 26 3,25
total 11 104

Conclusão:

Como p-valor < 5% (0,0086 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma cultivar apresenta efeito diferente das demais na área foliar de café.

e)
√ √
QM erro 3, 25
CV = × 100 = × 100 = 20, 03%.
Ȳ 9
Assim o experimento possui precisão baixa.

Prof. Tales Jesus Fernandes DES-UFLA 22


6.4 Exercícios

6.4 Exercícios
1- Planeje um experimento para avaliar cinco tipos de substratos (matéria fresca, matéria seca
no sol, matéria seca na sombra, matéria seca em estufa a 40ºC e matéria seca em estufa a 60ºC)
na germinação de sementes. Considere que se tem a disposição na casa de vegetação um espaço
para 20 parcelas experimentais.
i) identifique o fator, a variável resposta, o delineamento e o número de repetições;
ii) faça um croqui da área experimental com a casualização dos tratamentos nas parcelas;
iii) obtenha o esquema para a análise da variância, somente com as fontes de variação (FV) e
os números de graus de liberdade (GL).

2- Um pesquisador pretende estudar o efeito que a aplicação de cloreto de cálcio pode provo-
car nas características físico-químicas durante o armazenamento de uvas para consumo. Foram
preparadas soluções de CaCl2 nas concentrações de 0, 1, 2, 3 e 4%. Este pesquisador tem
disponíveis 120 cachos de uvas de um conjunto uniforme, previamente colhidos e limpos de
qualquer injúria. Algumas das características avaliadas foram: perda de peso e teores de sólidos
solúveis. Auxilie o pesquisador no planejamento deste experimento indicando: i) O fator e a
variável resposta; ii) os tratamentos e o delineamento; iii) o número de repetições e o tamanho
da parcela; iv) o esquema para a análise da variância, somente com FV e GL.

3- Os dados a seguir são referentes a produtividades em t/ha de um experimento com a cultura


de soja onde foram comparadas quatro tipos de adubo. no DIC com 5 repetições. As condições
da fazenda experimental eram homogêneas portanto o experimento foi realizado em DIC com
5 repetições. A parcela do experimento constou de 5 linhas de plantio espaçadas de 0,5m com
8 plantas espaçadas entre elas de 0,08m. A parcela útil foi as 3 linhas centrais descartando-se 1
planta em cada extremidade.
Tratamentos
REPETIÇÃO A B C D
1 1,80 1,52 1,96 1,10
2 2,04 1,58 2,22 1,88
3 2,12 1,43 1,65 1,22
4 1,92 1,60 1,70 1,78
5 1,64 1,37 1,45 1,02
TOTAL 9,52 7,50 8,98 7,00
a) Indique o Fator, a variável resposta e o número de tratamentos.
b) O que é a parcela? Calcule a área total, área útil e área de bordadura da parcela.
c) Calcule o número de plantas por parcela, na área útil e na bordadura.
d) Calcule a área total do experimento, o número de plantas em cada tratamento e total.
e) Mesmo sendo no campo, este experimento pôde ser realizado em DIC, por quê?
f) Quais as hipóteses em estudo?
g) Admitindo que as pressuposições são atendidas, faça a análise de variância e interprete os
resultados.
h) Calcule o coeficiente de variação e avalie a precisão do experimento.

4- Com base no significado de cada uma das variações presente nesse tipo de experimento, ela-
bore exemplos numéricos (fictícios ou simulados) para um experimento com quatro tratamentos
e três repetições, tais que:
i) A variação “total” seja nula;
ii) Apenas a variação “entre” tratamento seja nula;
iii) Apenas a variação “dentro” de tratamentos seja nula;
iv) Apenas a variabilidade “dentro de um” tratamento seja nula (os outros não).

Prof. Tales Jesus Fernandes DES-UFLA 23


6.4 Exercícios

5- A ingá-mirim é uma espécie nativa da Floresta Amazônica com potencial para arborização
urbana. Com o objetivo de estudar a taxa de germinação de plântulas desta espécie, para poste-
rior propagação, realizou-se um experimento em casa de vegetação em temperatura ambiente e
com irrigações periódicas. O delineamento experimental utilizado foi inteiramente casualizado,
com quatro tratamentos e quatro repetições cada uma com 25 sementes em cada bandeja de
plástico com 25x39x7,5 cm. Os resíduos agroflorestais testados como substrato foram a casca
de castanha-do-brasil triturada (A), casca de amendoim triturada (B), resíduo de açaí peneirado
(C) e areia como testemunha (D). Após a germinação das sementes foram analisadas porcenta-
gem de germinação.

Tratamentos
REPETIÇÕES A B C D
1 50 51 76 58
2 91 95 84 52
3 81 72 86 98
4 62 56 70 66
TOTAL 284 274 316 274
a) Indique o Fator, a variável resposta e os tratamentos.
b) O que é a parcela neste experimento?
c) Quantas sementes serão necessárias para esse experimento?
d) Qual o delineamento utilizado? Esse delineamento é o mais correto para esse experimento?
e) Quais as hipóteses do experimento?
f) Faça a Análise de variância e interprete os resultados.

6- A fim de determinar o crescimento vegetativo (altura) da sapucaia (Lecythis pisonis) em


centímetros, uma engenheira florestal utilizou 6 diferentes formulações de adubo NPK: 04-20-
20 (1), 04-30-15 (2), 05-25-25 (3), 06-24-12 (4), 08-28-16 (5) e 12-06-18 (6). Foi utilizada a
mesma dose de 10g em cada vaso, o substrato era o mesmo para todas as plantas, a diferença foi
o tipo de NPK aplicado. O experimento foi realizado em uma casa de vegetação e conduzido
em DIC com 3 repetições. A parcela foi constituída por vasos de 7,8 x 10,2 x 7,8 cm e em cada
vaso havia uma muda de sapucaia. Os dados estão apresentados abaixo:

Tratamentos
REPETIÇÕES 1 2 3 4 5 6
1 15 19 20 23 18 26
2 11 24 16 30 22 24
3 13 14 23 29 17 20
TOTAL 39 57 59 82 57 70
a) Indique o Fator, a variável resposta e os tratamentos.
b) O que é a parcela neste experimento?
c) Qual o delineamento utilizado e qual o número de repetições?
d) Calcule o número de plantas utilizadas neste experimento.
e) Quais as hipóteses do experimento?
f) Apresente o croqui com uma possível casualização deste experimento.
g) Admitindo que as pressuposições são atendidas, faça a Análise de variância e interprete.
h) Calcule o coeficiente de variação e avalie a precisão do experimento.

Prof. Tales Jesus Fernandes DES-UFLA 24


UNIVERSIDADE FEDERAL DE LAVRAS
DEPARTAMENTO DE ESTATÍSTICA

Prof. Tales Jesus Fernandes Estatística Experimental

7 A necessidade de comparar médias


Conforme visto no capítulo anterior, as hipóteses da ANAVA são:

H0 : Não existe diferença entre os efeitos dos tratamentos na variável resposta em estudo.
H1 : Pelo menos um tratamento apresenta efeito diferente dos demais na variável resposta em estudo.

Quando não rejeitamos H0 (teste F não significativo, p-valor > 0,05) todas as possíveis com-
parações de médias dos tratamentos seriam nulas. Neste caso, as análises terminam no quadro
de ANAVA, não sendo necessário aplicar outros testes.

Já quando rejeita-se H0 na ANAVA (teste F significativo, p-valor < 0,05), indica apenas que
existe diferença entre os tratamentos, mas não localiza onde está a diferença, exceto no caso de
apenas dois tratamentos (I=2). Pois, se só existem dois tratamentos e o teste F indica diferença
nos efeitos, então um é diferente do outro.

Caso o experimento tenha mais de dois tratamentos (I > 2) torna-se necessário aplicar algum
teste de comparações de médias de modo a identificar quais tratamentos são diferentes entre si.
Em outras palavras, se a hipótese de nulidade for rejeitada, implica que existe pelo menos um
contraste (comparação) entre médias estatisticamente diferente de zero.

7.1 Contrastes
Um contraste é uma combinação linear das médias dos tratamentos. Sabendo que existe
diferença entre os efeitos dos tratamentos, fazemos contrastes para comparar as médias e en-
contrar qual diferença é realmente significativa, é como se estivéssemos aplicando um zoom
na comparação dos tratamentos. A ideia do contraste entre os tratamentos é fornecer respos-
tas sobre algumas pergunta de interesse prático do experimento.

Um contraste é uma combinação linear das médias dos tratamentos. A expressão:

Ĉ = c1 Ȳ1 + c2 Ȳ2 + ... + cI ȲI


será um contraste entre as médias dos tratamentos (Y¯1 , Y¯2 , ..., Y¯I ) se a soma dos coeficientes (ci )
for igual a zero, é como se balancearmos a comparação, ou seja:
I
X
c1 + c2 + ... + cI = ci = 0
i=1

Exemplos
Ĉ1 = Ȳ1 − 2Ȳ2 NÃO é um contraste, pois 1 − 2 ̸= 0.

Ĉ2 = Ȳ1 + Ȳ2 − Ȳ3 − Ȳ4 é um contraste, pois 1 + 1 − 1 − 1 = 0.

Prof. Tales Jesus Fernandes DES-UFLA 25


7.1 Contrastes

Ĉ3 = 2Ȳ1 − Ȳ2 − Ȳ3 é um contraste, pois 2 − 1 − 1 = 0.

Ĉ4 = Ȳ1 − Ȳ2 − Ȳ3 − Ȳ4 NÃO é um contraste, pois 1 − 1 − 1 − 1 ̸= 0.

A variância de um contraste é estimada por:


I
X QM erro
V ˆar(Ĉ) = c2i ×
i=1
J
em que ci são os coeficientes do contraste, QMerro é o quadrado médio do erro obtido da
ANAVA e J é o número de repetições.

7.1.1 Contrastes ortogonais


Dois contrastes são ditos ortogonais entre si quando a variação de um contraste é indepen-
dente da variação do outro.

Considere dois contrastes:

Ĉ1 = a1 Ȳ1 + a2 Ȳ2 + ... + aI ȲI

Ĉ2 = b1 Ȳ1 + b2 Ȳ2 + ... + bI ȲI


Lembre-se que para ser contraste temos que:
I
P I
P
a1 + a2 + ... + aI = ai = 0 e b1 + b2 + ... + bI = bi = 0
i=1 i=1

Os contrastes C1 e C2 são ortogonais entre si somente se a soma dos produtos dos respectivos
coeficientes forem iguais a zero. Isto é:
I
X
ai b i = 0
i−1
Exemplo: Considere os seguintes contrastes entre os tratamentos A, B e C:

Ĉ1 = 2ȲA − ȲB − ȲC Ĉ2 = ȲA − 2ȲB + ȲC Ĉ3 = ȲB − ȲC .

Verificando os contrastes Ĉ1 e Ĉ2 :


I
P
ai bi = 2 × 1 + (−1) × (−2) + (−1) × 1 = 3 ̸= 0 ⇒ Não são ortogonais!
i−1

Verificando os contrastes Ĉ1 e Ĉ3 :


I
P
ai bi = 2 × 0 + (−1) × 1 + (−1) × (−1) = 0 ⇒ São ortogonais!
i−1
Verificando os contrastes Ĉ2 e Ĉ3 :
I
P
ai bi = 1 × 0 + (−2) × 1 + 1 × (−1) = −2 ̸= 0 ⇒ Não são ortogonais!
i−1

Diz-se que um grupo com três ou mais contrastes são ortogonais entre si se eles forem
ortogonais dois a dois. Assim, o grupo de contrastes apresentado acima não são ortogonais
entre si (apenas Ĉ1 e Ĉ3 são ortogonais). Em um experimento com I tratamentos, existem I-1
contrastes ortogonais entre si. Existem diferentes grupos de contrastes ortogonais, mas cada
grupo possui no máximo I-1 contrastes, ou seja o grupo de contrastes ortogonais não é único.

Prof. Tales Jesus Fernandes DES-UFLA 26


7.2 Testes de comparações múltiplas

7.2 Testes de comparações múltiplas


Os procedimentos de comparações múltiplas, visam identificar onde está a diferença entre
as médias dos tratamentos, indicadas pelo teste F da ANAVA. Para podermos, por conseqüên-
cia, identificar os melhores tratamentos, em outras palavras buscar qual ou quais tratamentos
são tão bons quanto o de melhor média. Note que a melhor média pode ser tanto a maior quanto
a menor, depende da variável resposta em estudo no experimento.

De modo geral, as hipóteses envolvidas na comparação de contrastes de médias são:



H0 : O valor do contraste é igual a zero, isto é, os grupos de médias tem efeitos iguais;
H1 : O valor do contraste é diferente de zero, isto é, os grupos de médias tem efeitos diferentes.

O procedimento para a maioria dos testes de comparações múltiplas consiste em comparar o


módulo do valor estimado para o contraste |Ĉ| com uma diferença mínima significativa - DMS.

Caso |Ĉ| < DM S então a diferença estimada com as médias observadas é menor do que o
mínimo que precisaria ser para dizer que os grupos comparados são diferentes (DMS). Assim
não se rejeita H0 , ou seja, os grupos de médias são iguais e o contraste é não significativo.

Caso |Ĉ| > DM S então a diferença estimada com as médias observadas entre os grupos
comparados é maior que o mínimo aceitável para dizer que eram iguais (DMS). Logo rejeita-se
H0 , ou seja, os grupos de médias são diferentes e o contraste é significativo.

IMPORTANTE: Se o contraste for significativo, isto é, os grupos são diferentes, então o sinal
da estimativa do contraste Ĉ (+ ou -) indica qual grupo é melhor. Se for positivo o grupo com
sinais positivos é melhor (geralmente o grupo à esquerda). Se for negativo o grupo com sinais
negativos é melhor (geralmente o grupo da direita).

Existem vários testes para avaliar os contrastes entre as médias: teste t, teste F, teste de
Scheffé, teste de Dunnett. Para avaliar as comparações duas a duas (todos os possíveis contras-
tes com apenas 2 médias) os testes mais conhecidos são: teste de Tukey, teste de Duncan, teste
SNK e teste de Scott-Knott.

A conclusão do teste (rejeita ou aceita H0 ) pode variar de um teste para outro, pois o valor
da DMS é calculado com base em diferentes distribuições amostrais. Devido a esta possibi-
lidade de diferença nas conclusões a respeito da significância do contraste, podemos planejar
corretamente qual teste deve ser utilizado em cada situação.

Na estatística dizemos que um teste é mais “conservador” que o outro quando a DMS dele
é maior, pois ele tende a conservar a hipótese de igualdade entre médias como verdadeira. Isto
porque naturalmente, quanto maior a DMS mais difícil se torna rejeitar H0 . No entanto, se um
teste é muito conservador apresenta maior taxa de erro tipo II (Não rejeitar H0 falsa). Um teste
pouco conservador é chamado em estatística de “liberal”, basta uma pequena diferença entre as
médias observadas para ele indicar a rejeição de H0 . Naturalmente, cabe salientar que um teste
mais liberal tende a cometer maiores taxas de erro tipo I (Rejeitar H0 verdadeira).

O conhecimento sobre estas características dos testes pode ajudar o pesquisador a escolher
qual procedimento de comparação múltipla utilizar. Se por exemplo, no momento de plane-
jamento do experimento, o pesquisador com base em sua experiência sabe que as diferenças

Prof. Tales Jesus Fernandes DES-UFLA 27


7.2 Testes de comparações múltiplas

entre os efeitos dos níveis do fator em teste são pequenas e ele deseja detectar estas pequenas
diferenças, então ele deve usar um teste menos conservador. Se por outro lado, ele quer concluir
que os níveis do fator têm efeitos diferentes somente quando a diferença nos seus efeitos for
relativamente grande, então ele deve usar um teste mais conservador, isto é, com maior DMS.

O que precisa ficar claro é que cada um dos testes possui vantagens e desvantagens, não
existe um teste que seja o melhor de todos. O importante é saber como e quando utilizar cada
um deles. Serão apresentados abaixo alguns destes testes e suas características.

7.2.1 O teste de Scheffé


Este teste pode ser aplicado para avaliar todo e qualquer contraste entre médias, mesmo
quando sugerido pelos dados. É frequentemente utilizado para testar contrastes que envolvam
grupos com mais de duas médias.

É o teste mais geral, não sendo muito recomendado apenas para contrastes que visam com-
parar somente duas médias de tratamentos. Por ter esta grande abrangência de aplicação é um
dos testes mais conservadores.

A DMS do teste de Scheffé ao nível α de significância é calculada por:


v
u
u (I − 1)F(α;ν ,ν ) QM erro X I
1 2
DM Sα = t c2i
J i=1

em que: I é o número de tratamentos; F(α;ν1 ,ν2 ) é o valor tabelado da distribuição F, ao nível α


de significância com ν1 sendo o grau de liberdade de tratamentos e ν2 o grau de liberdade do
erro; QMerro é o quadrado médio do erro, obtido na ANAVA; J é o número de repetições e ci
são os coeficientes do contraste em estudo.

Assim, basta comparar o valor da estimativa do contraste com a DMS. Se |Ĉ| > DM S,
então rejeita-se H0 . Caso contrário não se rejeita H0 .

Exemplo 1: Um experimento foi realizado em DIC com 5 repetições para avaliar a produtivi-
dade de 5 cultivares de arroz: A- Pratão; B- Pérola; C- Batatais; D- IAC-4; E- IAC-9. O quadro
de ANAVA é apresentado abaixo:

FV GL SQ QM Fc p-valor
cultivares 4 6,1 1,525 8,03 0,0005
erro 20 3,8 0,19
Total 24 9,9

As hipóteses em questão são:



H0 : Não existe diferença entre os efeitos das cultivares na produtividade de arroz.
H1 : Pelo menos uma cultivar apresenta efeito diferente das demais na produtividade de arroz.

Como p-valor < 5% (0,0005 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma cultivar apresenta efeito diferente das demais na produtividade de arroz.

Prof. Tales Jesus Fernandes DES-UFLA 28


7.2 Testes de comparações múltiplas

Ex. 1 - i) As médias (em ton/ha) estimadas para as cultivares neste experimento foram: ȲA =
1, 9, ȲB = 2, 5, ȲC = 1, 4, ȲD = 2, 4 e ȲE = 2, 8. Como existe diferença entre os tratamentos,
formule um contraste para comparar as demais cultivares contra as cultivares do IAC. Aplique
o teste de Scheffé (5%) para avaliar este contraste.

Resolução:

1º Preciso comparar as demais cultivares (A, B e C) contra das do IAC (D e E), logo as
médias das cultivares IAC devem ter sinais diferentes das demais:

Ĉ1 = ȲA + ȲB + ȲC − ȲD − ȲE

2º No entanto preciso balancear os coeficientes pois a comparação acima não é um contraste.

Ĉ1 = 2ȲA + 2ȲB + 2ȲC − 3ȲD − 3ȲE

É um contraste pois: 2 + 2 + 2 − 3 − 3 = 0

3º Para aplicar o teste de Scheffé as hipóteses são:



H0 : O valor do contraste é igual a zero, isto é, os grupos de médias tem efeitos iguais;
H1 : O valor do contraste é diferente de zero, isto é, os grupos de médias tem efeitos diferentes.

4º A estimativa do contraste é obtida substituindo os valores das médias observadas:

Ĉ1 = 2ȲA + 2ȲB + 2ȲC − 3ȲD − 3ȲE = 2 × 1, 9 + 2 × 2, 5 + 2 × 1, 4 − 3 × 2, 4 − 3 × 2, 8 = −4

5º Agora calculamos a DMS de Scheffé:

Lembre-se que: I = 5, J = 5 e da tabela de F, temos que F5%;4,20 = 2, 86

v
u
u (I − 1)F(α;ν ,ν ) QM erro XI r
1 2 2 4 × 2, 86 × 0, 19
DM Sα = t ci = × (22 + 22 + 22 + (−3)2 + (−3)2 )
J i=1
5

DM S5% = 3, 61

6º Conclusão:

Como |Ĉ| > DM S (4 > 3, 61) então rejeita-se H0 ao nível de significância de 5%, ou seja,
o valor do contraste é diferente de zero, isto é, as cultivares IAC e as demais apresentam efeitos
diferentes na produtividade de arroz de acordo com o teste de Scheffé.

Podemos concluir então que uma das diferenças no efeito das cultivares identificada pelo
teste F é em relação as cultivares do IAC contra as demais. Caso seja de interesse fazer outras
comparações, deveríamos prosseguir com a análise formulando novos contrastes e aplicando o
teste de Scheffé para identificar exatamente quais cultivares são diferentes das demais.

Como o contraste foi significativo e a estimativa foi negativa (-4), podemos afirmar que as
cultivares IAC (que receberam sinal negativo no 1º passo) apresentam maior produtividade em
relação as demais.

Prof. Tales Jesus Fernandes DES-UFLA 29


7.2 Testes de comparações múltiplas

Observações:
i) Veja que se tivéssemos invertido os sinais no momento de formular os contrastes (IAC
positivos e demais negativos) apenas modificaria o sinal da estimativa que seria igual a 4.

ii) Os coeficientes escolhidos para balancear o contraste não são únicos. Por exemplo: (1/3,
1/3, 1/3, -1/2, -1/2) ou (10, 10, 10, -15, -15) também funcionariam. Esta escolha afetaria a
estimativa do contraste, mas também modificaria a DMS, logo não interferem na conclusão.
Minha sugestão é que prefiram trabalhar com os menores coeficientes inteiros, apenas para
facilitar os cálculos mesmo.

Interpretação pelo p-valor


Quando fizer o teste de Scheffé utilizando algum software, também será calculado um p-
valor. A interpretação do teste de Scheffé também pode ser feita com base neste p-valor. Per-
ceba que a ideia é a mesma:

• Se p − valor ≤ α ⇒ Rejeita-se H0 ao nível α de significância, ou seja, o contraste é


diferente de zero, logo os grupos de médias ocasionam efeitos diferentes na resposta.

• Se p − valor > α ⇒ Não se rejeita H0 ao nível α de significância, ou seja, o contraste é


igual a zero, logo os grupos de médias ocasionam efeitos iguais na resposta.

7.2.2 O teste F para contrastes ortogonais


Este teste é uma consequência do teste t, pois com um grau de liberdade temos que (t2 = F ).
É um teste menos conservador que o teste de Scheffé, porém exige que os contrastes a serem
testados sejam ortogonais e que estes contrastes sejam estabelecidos antes de se examinar os
dados. Em outras palavras os contrastes devem responder alguma questão prática e não devem
ser sugeridos pelos resultados do experimento.

O teste F para contrastes ortogonais não é realizado comparando o valor estimado com uma
DMS. A regra de decisão é obtida com base na soma de quadrados, assim os contrastes ortogo-
nais podem ser organizados na tabela de ANAVA.

A comparação de tratamentos por contrastes ortogonais consiste em decompor os I-1 núme-


ros de graus de liberdade de tratamentos em I-1 somas de quadrados, sendo cada uma com 1
grau de liberdade correspondente às somas de quadrados do respectivo contraste.

É feita então uma análise de variância com o desdobramento dos graus de liberdade e da
soma de quadrados de tratamentos através de contrastes ortogonais, com aplicação do teste F.
Como este desdobramento é ortogonal, é possível verificar também que a soma das SQ’s dos
contrastes coincide exatamente com a SQtrat .

A soma de quadrados de um contraste é obtida por:

Ĉ 2 × J
SQC = I
P 2
ci
i=1

em que Ĉ é a estimativa do contraste obtida após substituir as médias; J é o número de repetições


e ci são os coeficientes do contraste.

Prof. Tales Jesus Fernandes DES-UFLA 30


7.2 Testes de comparações múltiplas

Uma regra prática para a elaboração de um grupo de contrastes ortogonais entre si é suge-
rida por Banzatto & Kronka (2006).

Divida o conjunto das médias de todos os tratamentos do experimento em dois grupos. O


primeiro contraste é obtido pela comparação das médias de um grupo contra as médias do ou-
tro grupo. Para isso atribui-se sinais positivos para membros de um grupo e negativos para
membros do outro grupo. Dentro de cada grupo formado no passo anterior, que possui mais
que uma média, faça novamente a subdivisão em 2 subgrupos. Repete-se este passo até que se
forme subgrupos com apenas uma média. Ao final, deveremos ter formado (I-1) comparações.
Note-que a primeira subdivisão é muito importante, pois nos demais contrastes não será mais
possível misturar médias separadas no grupo inicial.

Ex. - ii) Com os tratamentos do exemplo 1, formule um conjunto de contrastes ortogonais,


indique a interpretação prática de cada um deles, aplique o teste F e interprete.

Resolução:
Como temos I = 5, então teremos 4 contrastes ortogonais. Para elaborar o grupo de contras-
tes ortogonais vamos seguir a ideia apresentada acima. A primeira subdivisão já foi sugerida no
item i) comparando as cultivares do IAC contra as demais, assim:

Ĉ1 = 2ȲA + 2ȲB + 2ȲC − 3ȲD − 3ȲE


Agora seguindo a ideia devemos criar novas subdivisões dentro dos subgrupos, logo, uma
subdivisão no grupo da esquerda do contraste Ĉ1 resulta em:

Ĉ2 = ȲA + ȲB − 2ȲC


Como só tem duas médias no grupo da direita (IAC) do contraste Ĉ1 a única subdivisão
possível é:

Ĉ3 = ȲD − ȲE


E o que está faltando é a subdivisão do grupo da esquerda formada no contraste Ĉ2 .

Ĉ4 = ȲA − ȲB


Pronto temos um grupo de 4 contrastes ortogonais entre si. Para confirmar que são ortogo-
nais, basta verificar que a soma dos produtos dos coeficientes é igual a zero.
Verificando os contrastes Ĉ1 e Ĉ2 :
PI
ai bi = 2 × 1 + 2 × 1 + 2 × (−2) + (−3) × 0 + (−3) × 0 = 0 ⇒ São ortogonais!
i−1

Verificando os contrastes Ĉ1 e Ĉ3 :


I
P
ai bi = 2 × 0 + 2 × 0 + 2 × 0 + (−3) × 1 + (−3) × (−1) = 0 ⇒ São ortogonais!
i−1

Verificando os contrastes Ĉ1 e Ĉ4 :


I
P
ai bi = 2 × 1 + 2 × (−1) + 2 × 0 + (−3) × 0 + (−3) × 0 = 0 ⇒ São ortogonais!
i−1

Verificando os contrastes Ĉ2 e Ĉ3 :


I
P
ai bi = 1 × 0 + 1 × 0 + (−2) × 0 + 0 × 1 + 0 × (−1) = 0 ⇒ São ortogonais!
i−1

Prof. Tales Jesus Fernandes DES-UFLA 31


7.2 Testes de comparações múltiplas

Verificando os contrastes Ĉ2 e Ĉ4 :


I
P
ai bi = 1 × 1 + 1 × (−1) + (−2) × 0 + 0 × 0 + 0 × 0 = 0 ⇒ São ortogonais!
i−1

Verificando os contrastes Ĉ3 e Ĉ4 :


I
P
ai bi = 0 × 1 + 0 × (−1) + 0 × 0 + 1 × 0 + (−1) × 0 = 0 ⇒ São ortogonais!
i−1

Quais perguntas são respondidas em cada contraste?

Ĉ1 : Se as cultivares IAC apresentam efeito diferentes das demais.


Ĉ2 : Se as cultivares Pratão e Pérola apresentam efeito diferente da cultivar Batatais.
Ĉ3 : Se a cultivar IAC-4 apresenta efeito diferente da cultivar IAC-9.
Ĉ4 : Se a cultivar Pratão apresenta efeito diferente da cultivar Pérola.

Conforme comentado, veja que como a escolha dos dois subgrupos iniciais (Ĉ1 ) não é única,
então o grupo de contrastes ortogonais também não é único. Basta modificar a escolha dos gru-
pos comparados em Ĉ1 que teremos um novo grupo de 4 contrastes ortogonais entre si.

As estimativas de cada contraste foram: Ĉ1 = −4; Ĉ2 = 1, 6; Ĉ3 = −0, 4 e Ĉ4 = −0, 6.
Confirmado que estes contrastes são ortogonais podemos obter as SQ’s e montar a tabela de
ANAVA para o teste F dos contrastes ortogonais.

FV GL SQ QM Fc p-valor
(cultivares) (4) ( 6,1 )
C1 1 2,67 2,67 14,05 0,0013
C2 1 2,13 2,13 11,21 0,0032
C3 1 0,4 0,4 2,10 0,1628
C4 1 0,9 0,9 4,73 0,0418
erro 20 3,8 0,19
Total 24 9,9

Para interpretar os testes F de cada contraste acima, veja que da tabela de F temos F(5%;1,20) =
4, 35, basta comparar com os valores de F calculados. Mas conforme já vimos, esta interpreta-
ção também pode ser feita com base no p-valor.

Para C1 .
Como p-valor < 5% (0,0013 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.

Podemos afirmar então que de acordo com o teste F, as cultivares da IAC apresentam efeito
diferente das demais na produtividade de arroz. Como a estimativa do contraste é negativa (-4)
podemos concluir ainda que as cultivares IAC apresentam maior produtividade, pois elas que
estavam com sinal negativo no contraste.

Para C2 .
Como p-valor < 5% (0,0032 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.

Prof. Tales Jesus Fernandes DES-UFLA 32


7.2 Testes de comparações múltiplas

Podemos afirmar então que de acordo com o teste F, as cultivares Pratão e Pérola apresentam
efeito diferente da cultivar Batatais na produtividade de arroz. Como a estimativa do contraste
é positiva (1,6) podemos concluir ainda que as cultivares Pratão e Pérola apresentam maior pro-
dutividade, pois elas que estavam com sinal positivo no contraste.

Para C3 .
Como p-valor > 5% (0,1628 > 0,05) então não se rejeita H0 ao nível de significância de 5%,
ou seja, o valor do contraste é estatisticamente igual a zero e os grupos comparados apresentam
efeitos iguais entre si na produtividade de arroz de acordo com o teste F.

Podemos afirmar então que de acordo com o teste F, não existe diferença significativa entre
as cultivares IAC-4 e IAC-9.

Para C4 .
Como p-valor < 5% (0,0418 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, o valor do contraste é estatisticamente diferente de zero e os grupos comparados apresen-
tam efeitos diferentes na produtividade de arroz de acordo com o teste F.

Podemos afirmar então que de acordo com o teste F, a cultivar Pratão apresenta efeito dife-
rente da cultivar Pérola na produtividade de arroz. Como a estimativa do contraste é negativa
(-0,6) podemos concluir ainda que a cultivar Pérola apresenta maior produtividade do que a
Pratão, pois esta que estava com sinal negativo no contraste.

IMPORTANTE: Por ser um exemplo de aplicação do teste F para contrastes ortogonais, na-
turalmente os contrastes foram estabelecidos após a realização do experimento. A exigência
de que os contrastes ortogonais estejam definidos antes da realização do experimento é para
garantir que todos os contrastes apresentem respostas para questões práticas sem a sugestão
(interferência) dos resultados observados no experimento.

7.2.3 O teste de Dunnett


Utilizado para avaliar contrastes entre duas médias, sendo uma a média de algum tratamento
qualquer e a outra, a média do tratamento padrão, controle ou testemunha (é imprescindível que
o tratamento controle faça parte do experimento).

O teste leva este nome porque o estatístico canadense Charles Dunnett foi pioneiro no con-
ceito de que, quando um controle está presente, as comparações de interesse preliminar podem
ser as comparações de cada novo tratamento com o controle. Desta modo, no teste de Dunnett
os contrastes são realizados sempre com duas médias, comparando cada tratamento contra a
testemunha (ou controle).

O valor da DMS para o teste de Dunnett é obtido pela seguinte expressão:


r
2 × QM erro
DM Sα = D(α;I,ν)
J
em que D(α;I,ν) é um quantil obtido da tabela de Dunnett, considerando α o nível de significân-
cia adotado; I o número de tratamentos e ν o grau de liberdade do erro. O QMerro é obtido da
tabela de ANAVA e J é o número de repetições.

Prof. Tales Jesus Fernandes DES-UFLA 33


7.2 Testes de comparações múltiplas

Ex. - iii) Com os tratamentos do exemplo 1, considere por exemplo, que a cultivar Pratão é a
padrão da região. O experimento foi realizado para verificar se as demais cultivares se adaptam
a esta região. Portanto aplique o teste de Dunnett para comparar estas cultivares com a Pratão
(controle).
Resolução:
Primeiro, lembre-se que temos 5 tratamentos e 5 repetições, assim 4 deles serão comparados
contra a controle que sera a Pratão (comum da região). O valor obtido da tabela de Dunnett é
D(5%;5,20) = 2, 65. Assim a DMS de Dunnett fica:
r r
2 × QM erro 2 × 0, 19
DM S5% = D(α;I,ν) = 2, 65 = 0, 73
J 5
Pratão vs Pérola
Ĉ1 = ŶA − ŶB ⇒ Ĉ1 = 1, 9 − 2, 5 = −0, 6

Como |Ĉ| < DM S (0, 6 < 0, 73) então não se rejeita H0 ao nível de 5% de significância, ou
seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e Pérola apresentam efeitos
semelhantes na produtividade de arroz de acordo com o teste de Dunnett.

Pratão vs Batatais
Ĉ1 = ŶA − ŶC ⇒ Ĉ1 = 1, 9 − 1, 4 = 0, 5

Como |Ĉ| < DM S (0, 5 < 0, 73) então não se rejeita H0 ao nível de 5% de significância,
ou seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e Batatais apresentam
efeitos semelhantes na produtividade de arroz de acordo com o teste de Dunnett.

Pratão vs IAC-4
Ĉ1 = ŶA − ŶD ⇒ Ĉ1 = 1, 9 − 2, 4 = −0, 5

Como |Ĉ| < DM S (0, 5 < 0, 73) então não se rejeita H0 ao nível de 5% de significância, ou
seja, o valor do contraste é igual a zero, isto é, as cultivares Pratão e IAC-4 apresentam efeitos
semelhantes na produtividade de arroz de acordo com o teste de Dunnett.

Pratão vs IAC-9
Ĉ1 = ŶA − ŶE ⇒ Ĉ1 = 1, 9 − 2, 8 = −0, 9
Como |Ĉ| > DM S (0, 9 > 0, 73) então rejeita-se H0 ao nível de 5% de significância, ou
seja, o valor do contraste é diferente de zero, assim as cultivares Pratão e IAC-9 não possuem
o mesmo efeito na produtividade de arroz de acordo com o teste de Dunnett. Além disso, a
estimativa deste contraste é negativa, logo a cultivar IAC-9 apresenta maior produtividade que
a Pratão.
Uma maneira mais resumida de apresentar os resultados é por meio de uma tabela:

Cultivar Média
Pratão (Controle) 1,9
Pérola 2,5
Batatais 1,4
IAC-4 2,4
IAC-9* 2,8

Cultivares marcadas com * apresentam efeito estatisticamente diferente do controle de acordo


com o teste de Dunnett ao nível de significância de 5%.

Prof. Tales Jesus Fernandes DES-UFLA 34


7.2 Testes de comparações múltiplas

7.2.4 O teste de Tukey


Quando a estrutura dos tratamentos não sugere algum agrupamento e deseja-se uma avali-
ação mais detalhada, comparando todas as combinações possíveis de médias duas a duas, são
recomendados outros testes sendo que o mais conhecido deles é o teste de Tukey.

Assim o teste de Tukey é o mais utilizado em Estatística Experimental.

A ideia também é calcular o contraste entre as duas médias e comparar com uma DMS.
r
QM erro
DM Sα = q(α;I,v)
J
em que: I é o número de tratamentos, v é o grau de liberdade do erro da ANAVA, q(α;I,v) é o
quantil da amplitude total estudentizada, valor tabelado obtido da tabela específica do teste de
Tukey; α é o nível de significância do teste; QMerro é o quadrado médio do erro obtido da
tabela de ANAVA e J é o número de repetições.

Após a aplicação do teste é gerada uma tabela com médias seguidas por letras. A interpre-
tação do teste de Tukey é que médias seguidas por mesma letra não diferem entre si.

Ex. - iii) Considere ainda os dados do exemplo 1, aplique o teste de Tukey (5%) para avaliar o
efeito destas cultivares.

Resolução:

O raciocínio de aplicação do teste de Tukey é igual ao do teste de Dunnet, no entanto são


criados todos os contrastes 2 a 2 (e não só contra uma das médias). Como neste exemplo temos
5 médias, então o número de combinações duas a duas a serem feitas é C5,2 = 10. Perceba que
são muitos contrastes para serem comparados com a DMS, assim desenvolveu-se um algoritmo
mais eficiente para a realização deste teste.

Algoritmo de aplicação do teste de Tukey:

1º Calcule a DMS de Tukey;

2º Ordene as médias dos tratamentos da maior para a menor;

3º Atribua uma letra para a maior média;

4º Subtraia a DMS da maior média;

5º Atribua a mesma letra da maior média para todas as médias acima do resultado obtido no
passo anterior;

6º Atribua outra letra para a segunda maior média e subtraia a DMS da segunda maior média;

7º Atribua a mesma letra para todas as médias entre a segunda maior e o resultado do passo
anterior;

8º Continue assim até o momento em que ao subtrair a DMS obtenha um resultado menor
do que a menor das médias. Elimine as possíveis redundâncias (grupos com mesma letra
dentro de grupos que já possuíam outra mesma letra) e organize os dados em uma tabela.

Prof. Tales Jesus Fernandes DES-UFLA 35


7.2 Testes de comparações múltiplas

Portanto, para os dados do exemplo, temos da tabela de Tukey que q(5%;5,20) = 4, 23.
Fazendo o cálculo da DMS e das diferenças das médias em relação a DMS:
r
0, 19
DM S5% = 4, 23 = 0, 82
5
2, 8 − 0, 82 = 1, 98; 2, 5 − 0, 82 = 1, 68; 2, 4 − 0, 82 = 1, 58; 1, 9 − 0, 82 = 1, 08.
Atribuindo as letras conforme algoritmo apresentado acima, temos a seguinte tabela:

Cultivares Medias
IAC-9 2,8 a
Pérola 2,5 ab
IAC-4 2,4 ab
Pratão 1,9 bc
Batatais 1,4 c

Percebe-se pelo teste de Tukey que as cultivares IAC-9, Pérola e IAC-4 possuem efeitos
iguais entre si pelo teste de Tukey, ao passo que as cultivares Pérola, IAC-4 e Pratão também
possuem efeitos iguais. Ainda as cultivares Pratão e Batatais também podem ser consideradas
com o mesmo efeito na produtividade de soja.

Veja que a discussão fica um tanto complicada, mas na prática, não precisamos ficar dis-
cutindo cada grupo de letras do teste de Tukey. Particularmente, gosto de dizer que fazemos
o teste de Tukey para saber qual ou quais dos tratamentos apresentam efeito estatisticamente
igual ao tratamento de melhor média. Não é preciso aplicar o teste de Tukey para saber qual é o
tratamento que possui a melhor média (basta olhar o tratamento com melhor média), aplica-se
este teste para saber se tem algum outro tratamento que possui efeito semelhante ao melhor.

Assim, uma forma resumida de apresentar a conclusão do teste de Tukey é:

Médias seguidas por mesma letra não diferem entre si de acordo com o teste de Tukey ao
nível de significância de 5%. Assim as cultivares IAC-9, Pérola e IAC-4 são estatisticamente
iguais e são as melhores na produtividade de arroz.

7.2.5 O teste de Scott-Knott


A medida que aumenta o número de tratamentos, o teste de Tukey pode levar à algumas
ambiguidades na interpretação devido a sobreposição das letras.

A grande vantagem do teste de Scott-Knott é que nenhuma média pode pertencer a mais de
um grupo, eliminando esta ambiguidade. Portanto este teste é indicado quando tem-se muitos
tratamentos. Sua significância é baseada na distribuição de qui-quadrado (χ2 ) e o teste pode ser
realizado com o uso de softwares estatísticos (SISVAR, SAS, R).

No entanto, é preciso tomar cuidado com a aplicação do teste de Scott-Knott. Este teste
necessariamente força a divisão dos tratamentos em grupos heterogêneos entre si. O que deve
ser interpretado com muita cautela, pois essa divisão nem sempre é tão evidente e podem levar
à altas taxas de erro tipo I.

Ex. - iv) Com os dados do exemplo 1, aplique o teste de Scott-Knott (5%) para avaliar o efeito
das 5 cultivares na produtividade de arroz.

Prof. Tales Jesus Fernandes DES-UFLA 36


7.3 Escolha do teste a ser utilizado

Resolução:
O teste Scott-Knott é feito apenas utilizando softwares. No caso deste exemplo a tabela de
médias fica:
Cultivares Medias
IAC-9 2,8 a
Pérola 2,5 a
IAC-4 2,4 a
Pratão 1,9 b
Batatais 1,4 b

Portanto, com base nos resultados do teste de Scott-Knott ao nível de significância de 5%


podemos afirmar que as cultivares IAC-9, Pérola e IAC-4 são estatisticamente iguais e são as que
apresentam os melhores resultados na produtividade de arroz. As cultivares Pratão e Batatais
também são iguais entre si e apresentam as piores produtividades.

7.3 Escolha do teste a ser utilizado


A escolha de qual teste de comparações múltiplas utilizar é comumente um problema de
pesquisas. O experimentador deve considerar que não existe um teste melhor que todos os ou-
tros sempre. É preciso conhecer um pouco sobre as características dos testes em questão. Outro
aspecto é que não deve-se aplicar todos os testes aos dados, sob o risco te ficar ainda mais con-
fuso sobre as conclusões do experimento. Deve-se escolher um ou no máximo dois testes.

Os testes que foram apresentados neste material ordenados em função da sua rigorosidade
para afirmar que o contraste é significativo são indicados abaixo. Quanto mais a direita, mais
conservador é o teste:

Scott-Knott ⇒ Dunnett ⇒ Tukey ⇒ F ⇒ Scheffé

Portanto, se o teste de Scheffé indicou que o contraste é significativo (rejeita-se H0 ), qual-


quer outro teste também indicará esta significância. Por outro lado, pode acontecer por exemplo,
de o teste F aceitar H0 e o teste de Tukey sugerir que existe diferenças entre os tratamentos.

Quando o fator em estudo é uma variável QUALITATIVA, um esquema que pode auxiliar
na escolha do teste de comparações múltiplas a ser utilizado é apresentado abaixo.

Verifique primeiramente a natureza dos tratamentos (estruturados ou não estruturados) e os


objetivos do experimento. Considerando tratamentos:

• NÃO ESTRUTURADOS: deseja-se comparar todos os tratamentos.


– Scheffé: comparar qualquer contraste entre grupos de médias definido após a reali-
zação do experimento;
– Tukey: comparar todos os pares de médias entre si;
– Scott-Knott: quando-se tem muitos tratamentos e objetiva-se dividí-los em grupos.
• ESTRUTURADOS: deseja-se comparar apenas grupos pré-definidos dos tratamentos.
– Contrastes ortogonais (teste F): comparar contrastes de interesse prático, estabe-
lecidos antes da realização do experimento;
– Dunnett: comparar todos os tratamentos com um controle (ou testemunha).

Prof. Tales Jesus Fernandes DES-UFLA 37


7.4 Exercícios

7.4 Exercícios
1- Com base no que você aprendeu sobre os testes de comparações múltiplas, responda “com
suas palavras” os itens abaixo.
a) Porque a soma dos coeficientes do contraste deve ser igual a zero?
b) O que é um teste conservador? Qual tipo de erro este teste tende a cometer mais?
c) Dentre os testes apresentados quais são indicados para avaliar contrastes que devem ser
definidos antes da realização do experimento?
d) Qual dos testes apresentados é o mais utilizado em estatística experimental?
e) O que é um conjunto de tratamentos não estruturado?

2- Num experimento conduzido em laboratório de sementes, foi avaliado o efeito de quatro


reguladores de crescimento na germinação e outras características de sementes de milho. As
condições experimentais eram homogêneas permitindo usar o delineamento inteiramente casu-
alizado com cinco repetições e a unidade experimental constituiu-se de uma bandeja com 50
sementes. Os produtos comerciais testados nos tratamentos foram os seguintes:
A - Stimulate; B - Booster; C - ½ Stimulate + ½ Cellerate; D - Cellerate.
a) Qual foi o delineamento experimental adotado no ensaio? Quais as razões levaram o pes-
quisador a escolher este delineamento? Quantas repetições foram utilizadas? Quantas sementes
foram utilizadas no experimento?
b) Formule um contraste para comparar o produto "Booster", contra os demais produtos.
Qual teste é indicado para este contraste?
c) Formule um contraste para avaliar os produtos "Stimulate"e "Cellerate"fornecidos isola-
damente e misturados. Qual teste é indicado para este contraste?

3- Um experimento foi realizado no delineamento inteiramente casualizado para avaliar o con-


trole de plantas daninhas em milho, sendo os valores médios de massa seca das plantas sobre-
viventes (em kg), de quatro repetições, em função dos tratamentos utilizados, foram:
Tratamentos Dala Dala + Port Gly 5% Gly 10% Capina manual Capina enxada testemunha
Massa seca média 3,8 4,2 2,5 1,6 5,9 4,6 8,7
OBS: Sabe-se que QMerro = 1,73; F(6,17;5%) = 2, 61; D(5%7,17) = 2, 85
a) Aplique o teste de Dunnett (5%) e interprete os resultados.
b) Elabore um contraste para comparar os produtos a base de Dala com os a base de Gly.
Aplique o teste de Scheffé (5%) e interprete os resultados indicando os melhores tratamentos.
c) Elabore um contraste para comparar as capinas contra os tratamentos químicos. Aplique
o teste de Scheffé (5%) e interprete os resultados indicando os melhores tratamentos.

4- Um pesquisador que deseja avaliar os teores de frutose (%) dos frutos de 5 cultivares de
pêssego com 5 repetições e conduzido em DIC, obteve o seguinte quadro de ANAVA:

FV GL SQ QM Fc p-valor
cultivares 4 2850,96 O P 0,0001
erro L 902,4 N
total M 3753,36

Sabendo que a média geral é igual a 56,84, determine os valores de L, M, N, O e P. Calcule o


Coeficiente de Variação, comente sobre a precisão do experimento. Qual o teste de comparações
múltiplas pode ser utilizado?

Prof. Tales Jesus Fernandes DES-UFLA 38


7.4 Exercícios

5- Foi realizado um experimento com aves para avaliar qual o melhor complemento alimentar
a ser utilizada na época de muda de penas. No experimento foram comparados 4 tratamentos:
Vitamina A, Vitamina B, Vitamina A + Vitamina B e testemunha. Caso o teste F da ANAVA
seja significativo qual a estratégia mais adequada para comparar estas médias? Indique duas
opções de testes diferentes.

6- Um experimento foi realizado para avaliar o desenvolvimento de leitões quando alimentados


por diferentes rações, constituídas por misturas com a Ração Base (RB). A parcela experimen-
tal constou de 1 leitão e o experimento foi realizado no delineamento inteiramente casualizado
- DIC. Os valores obtidos para o peso por animal, em kg, após o fim do experimento para os
tratamentos e respectivas repetições foram:
Tratamentos Repetições Total
(Tipos de Rações) 1 2 3 4
RB + Milho 20 22 23 21
RB + Milho + Aditivo 24 25 23 26
RB + Soja 27 27 25 29
RB + Soja + Aditivo 26 28 30 32
a) Qual o fator e qual a variável resposta?
b) Quantos leitões foram utilizados no experimento? Qual a principal dificuldade para rea-
lizar este experimento em DIC?
c) Apresente as hipóteses em estudo, faça a análise de variância e interprete o resultado.
d) Avalie a precisão do experimento.
e) Aplique o teste de Tukey (5%) e interprete o resultado.
f) Formule um contraste para comparar o uso de milho com o uso de soja. Apresente as
hipóteses, aplique o teste de Scheffé (5%) e interprete o resultado.
g) Formule um conjunto de contrastes ortogonais e diga qual questão de interesse prático é
respondida em cada um destes contrastes.

7- Um experimento foi conduzido em casa de vegetação para avaliar o crescimento de mudas


de café quando submetidas à diferentes tipos de adubação. A parcela experimental constou de
3 plantas, sendo descartada a menor e a maior observação. Os valores observados para a altura
da planta mediana, em cm, para os tratamentos e respectivas repetições foram:
Tratamentos Repetições
1 2 3 4 5
Esterco Galinha 25 26 28 30 29
Esterco Curral 28 27 30 33 32
Esterco Líquido 32 30 35 38 36
Adubação P 18 15 19 12 14
Adubação NPK 24 25 26 28 27
a) Qual o fator e qual a variável resposta? Quantas mudas foram utilizadas no experimento?
b) Qual foi o delineamento utilizado neste experimento? Quais aspectos indicam o uso deste
delineamento?
c) Apresente as hipóteses em estudo, faça a análise de variância e interprete os resultados.
d) Avalie a precisão do experimento.
e) Aplique o teste de Scott-Knott (5%) e interprete-o.
f) Formule um conjunto de contrastes ortogonais e diga qual questão de interesse prático é
respondida em cada um dos contrastes. Faça a ANAVA considerando os contrastes ortogonais
e interprete o resultado.

Prof. Tales Jesus Fernandes DES-UFLA 39


8 O software SISVAR
Nas últimas décadas, os cálculos estatísticos foram muito facilitados pelo uso de aplicativos
computacionais. Nesta disciplina será utilizado o software gratuito SISVAR - Sistema de Aná-
lise de Variância - da Universidade Federal de Lavras (FERREIRA, 2019).

O Sisvar é um programa de análise estatística e planejamento de experimentos. Nele é pos-


sível gerar o croqui de casualização de seu experimento, bem como fazer todos os cálculos
envolvidos na análise dos resultados desde a ANAVA até os testes de comparações múltiplas.

Para fazer o download do e instalar visite a página do prof. Daniel Furtado Ferreira, criador
do SISVAR: http://www.des.ufla.br/~danielff/programas/sisvar.html.

Existem várias apostilas e cursos sobre o software SISVAR disponíveis. O departamento


de estatística do Instituto de Ciências Exatas e Tecnológicas da Universidade Federal de Lavras
(DES/ICET/UFLA) oferece geralmente cursos presenciais de capacitação de uso do SISVAR,
tanto ao longo do semestre quanto em programas de verão.

Devido as condições atípicas da pandemia de COVID-19 o programa de verão de 2021 do


DES/UFLA ocorreu de modo online, possibilitando desta forma que os cursos fiquem disponí-
veis no Youtube.

Assim para aprender a utilizar as ferramentas básicas do SISVAR para análise dos principais
delineamentos acesse o curso oferecido no XII programa de verão DES-ICET/UFLA 2021 por
meio dos seguintes links:

• 1° parte: https://youtu.be/0Zcq_Mghmb0

• 2° parte: https://youtu.be/eWieHP6O5RQ

OBS: Ao realizar um teste de comparação de médias no SISVAR, ao invés de usar letras em


ordem alfabética como fizemos nos exemplos neste material (a, b, c,...) ele utiliza apenas a letra
“a” com índices (a1 , a2 , a3 ,...), mas a interpretação é a mesma: médias seguidas por mesma
letra não diferem entre si pelo teste de Tukey (ou Scott-Knott).

Prof. Tales Jesus Fernandes DES-UFLA 40


UNIVERSIDADE FEDERAL DE LAVRAS
DEPARTAMENTO DE ESTATÍSTICA

Prof. Tales Jesus Fernandes Estatística Experimental

9 Regressão
Um fator é dito quantitativo quando os seus níveis se diferem em relação a quantidade deste
fator. Neste caso os tratamentos são os níveis do fator, ou a combinação deles no caso de expe-
rimentos com mais de um fator.

Quando os tratamentos são níveis de um fator quantitativo (doses, temperatura, itensidade


luminosa, teor de algum composto químico, etc...) podemos fazer o estudo das médias utili-
zando os modelos de regressão. Neste caso, utilizar regressão é melhor que os testes de com-
parações múltiplas, pois uma vez escolhido o modelo podemos obter mais informações como:
ponto de máximo (ou mínimo) e estimativas para a variável resposta mesmo em doses não es-
tudadas, desde que compreendidas entre as doses em estudo.

A palavra “regressão” foi empregada originalmente pelo estatístico inglês Francis Galton
no século XIX, que, estudando a estatura das pessoas, elaborou a proposição (posteriormente
confirmada) de que filhos de pais muito altos tendem a ser mais baixos do que seus pais, o
oposto ocorrendo com os filhos de pais muito baixos. Daí o nome do termo, pois Galton perce-
beu que existe uma tendência dos dados de regredirem em direção à média da população.

9.1 Regressão na ANAVA


No contexto de estatística experimental utiliza-se apenas uma variável independente (X) que
são os níveis do fator em estudo (tratamentos) e a variável dependente (Y) é a que chamamos de
variável resposta. Estamos interessados em estimar a relação entre estas variáveis quantitativas
de modo que o efeito da variável resposta (Y) possa ser estimado com base na modificação dos
níveis do fator (X).

No desdobramento dos graus de liberdade de tratamentos em regressão na análise de variân-


cia, estamos interessados apenas nos modelos lineares polinomiais em função de uma variável
explicativa. Os mais utilizados são:

Regressão linear simples


Y = β0 + β1 X + ε
Regressão linear quadrática

Y = β0 + β1 X + β2 X 2 + ε

Regressão linear cúbica

Y = β0 + β1 X + β2 X 2 + β3 X 3 + ε

em que: Y é a variável resposta, ou dependente, a qual deseja-se explicar o comportamento; X


é a variável que representa os níveis dos tratamentos, ou independente, com as quais deseja se
explicar o comportamento de Y , β0 , β1 , β2 e β3 são os parâmetros do modelo, os quais devemos

Prof. Tales Jesus Fernandes DES-UFLA 41


9.1 Regressão na ANAVA

estimar para descrever a relação entre a variável Y e a variável X e ε é o erro associado ao


modelo, que possui média zero e variância constante.

Mas qual grau de polinômio utilizar? Ou em outras palavras, qual modelo de regressão uti-
lizar? Linear? Quadrático? Cúbico? É Para responder estas perguntas que precisamos fazer a
ANAVA dos modelos de regressão.

Na ANAVA, cada modelo de regressão corresponde a 1 grau de liberdade de tratamentos,


assim é possível testar modelos até o limite de graus de liberdade de tratamentos, embora não
tenha sentido prático um polinômio de grau superior a 3. É preciso também deixar um grau
de liberdade para testar a falta de ajuste do modelo, o qual chamamos convenientemente de
“desvio”.

Para o DIC o esquema do quadro de ANAVA considerando regressão fica:

FV GL
(Trat) (I - 1)
Reg. Linear 1
Reg. Quadrática 1
Reg. Cubica 1
desvio (I - 4)
Erro experimental I*(J - 1)
Total I*J - 1

Para os outros delineamentos a ideia da regressão na ANAVA não muda, pois a parte equi-
valente aos modelos de regressão (Reg. Linear, Reg. Quadrática, Reg. Cúbica e desvio) se
mantém a mesma. O que muda são as outras fontes de variação acrescentadas em razão dos
delineamentos e os graus de liberdade das mesmas.

Na tabela de ANAVA com regressão, a primeira FV que deve ser avaliada é a falta de ajuste
ou “desvio”, cujas hipóteses podem ser resumidas em:


H0 : A falta de ajuste deixada pelos modelos estudados é pequena, insignificante.
H1 : A falta de ajuste deixada pelos modelos estudados é significativa.

Caso rejeite H0 para o desvio, isto é, caso ele seja significativo (p-valor < 0,05) indica que
os modelos apresentados não são os mais adequados para descrever a relação entre as variáveis
estudadas. Pode se partir para o estudo de outros modelos de regressão, como por exemplo, os
não lineares.

Caso p-valor > 0, 05 então não se rejeita H0 para o desvio (ou falta de ajuste), assim algum
dos modelos lineares apresentados na ANAVA (linear, quadrática ou cúbica) pode ser utilizado
para descrever a relação entre X e Y .

Em relação aos modelos de regressão as hipóteses são:


Para a Reg. Linear: Para a Reg. Quadrática: Para a Reg. Cúbica:
  
H0 : β1 = 0 H0 : β2 = 0 H0 : β3 = 0
H1 : β1 ̸= 0 H1 : β2 ̸= 0 H1 : β3 ̸= 0

Prof. Tales Jesus Fernandes DES-UFLA 42


9.2 O gráfico de regressão

Na análise de variância, a idéia é escolher o polinômio de maior grau que seja significativo
(p-valor < 0,05). Portanto começa-se a verificar a significância do maior grau para o menor.
Identificado o modelo de regressão que melhor descreve a relação entre as variáveis em es-
tudo, agora basta obter as estimativas dos seus parâmetros (β̂0 , β̂1 , ...). No caso do SISVAR
estas estimativas são denominadas de (b0 , b1 , b2 e b3 ), assim o polinômio estimado fica:
Para a Reg. Linear: Para a Reg. Quadrática: Para a Reg. Cúbica:

Ŷ = b0 + b1 X Ŷ = b0 + b1 X + b2 X 2 Ŷ = b0 + b1 X + b2 X 2 + b3 X 3

9.2 O gráfico de regressão


Uma boa ideia é fazer uma análise exploratória dos dados por meio de um gráfico de dis-
persão. Se fizermos um gráfico simples (X, Y) poderemos ter uma idéia inicial de como se
comportam os valores da variável dependente (Y) em função das modificações nos níveis da
variável independente (X).
Para fazer o gráfico de dispersão criei um aplicativo em Shiny que pode ser acessado pelo en-
dereço: https://talesufla.shinyapps.io/RegressaoLinearPolinomial/.
Basta digitar os dados em duas colunas no bloco de notas (separadas por 1 espaço em branco),
sendo a primeira com tratamentos e a segunda com as médias observadas em cada tratamento
(utilize ponto e não vírgula como separador das casas decimais).
Veja que ao carregar os dados é feito o diagrama de dispersão e após inserir os valores das
estimativas dos parâmetros (b0 , b1 , b2 e b3 ) é passada a linha do modelo de regressão estimada.
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se ajustar per-
feitamente à curva do modelo proposto, é o que chamamos de erro. Haverá na maioria dos
pontos, uma distância entre os pontos do diagrama e aqueles obtidos quando a curva do mo-
delo proposto é traçada. Isto acontece, devido ao fato do fenômeno que está em estudo, não ser
um fenômeno matemático e sim um fenômeno que está sujeito a influências de inúmeros fatores.

Assim, o objetivo da regressão é obter um modelo matemático que melhor se ajuste aos
valores observados de Y em função da variação dos níveis da variável X, minimizando os erros.

Coeficiente de Determinação - R2
Uma maneira simples de medir a qualidade do ajuste obtido pela equação de regressão
estimada é utilizando o coeficiente de determinação - R2 .
O coeficiente de determinação varia de 0 à 100% e descreve o quanto da variabilidade ocor-
rida na variável Y é explicada pelo modelo de regressão estimado em função da variável X.
Assim, naturalmente, quanto maior o R2 melhor (ou mais confiável) é o ajuste fornecido pelo
modelo de regressão.
Para o caso em que tem-se uma única observação para cada dose (estudos que não objetivam
comparar as doses, sem repetição), o R2 pode ser calculado por:
SQRegressao
R2 =
SQT otal
Já para o caso em que tem-se mais de um valor observado para cada dose (mais comum em
experimentação), o R2 pode ser calculado por:

Prof. Tales Jesus Fernandes DES-UFLA 43


9.2 O gráfico de regressão

SQRegressao
R2 =
SQT rat
2
O R , não deve ser utilizado para selecionar o modelos com diferentes números de parâme-
tros, pois quanto mais parâmetros maior é a parte da variabilidade em Y explicada pelo modelo,
que implica em maior SQRegressao e consequentemente maior o R2 , mesmo que este parâmetro
acrescentado não seja significativo.

Cabe reforçar, portanto, que a escolha do modelo de regressão mais adequado deve ser feita
com base no teste F da ANAVA de regressão (o polinômio de maior grau que for significativo)
e só depois observar o valor de R2 .

Pontos extremos de um modelo de regressão


Como comentado, uma das vantagens do uso de modelos de regressão é que podemos obter
uma estimativa para a variável Y , para qualquer valor dentro do intervalo estudado de X.

Podemos também estimar os pontos extremos de interesse. Sejam eles de máximo ou de


mínimo, dependendo da variável resposta em estudo. Por exemplo: se for um experimento com
produtividade nos interessa os pontos de máximo, já se for com o nível de contaminação por
determinada doença nos interessa os pontos de mínimo.

Figura 6: Ilustração dos pontos de máximo (X̂max , Ŷmax ) observados em modelos de regressão
linear simples e quadrático.

No modelo linear simples


Como pode ser observado na figura acima, se o modelo escolhido pela análise de variância
for o linear simples, então por se tratar de uma reta, os pontos de máximo ou mínimo se encon-
tram nos extremos. Assim se a reta for crescente o valor da variável Y máximo (Ŷmax ) ocorre

Prof. Tales Jesus Fernandes DES-UFLA 44


9.2 O gráfico de regressão

na maior dose observada da variável X (X̂max ) e se a reta for decrescente o valor de Y máximo
ocorre na menor dose observada de X. E vice-versa para os pontos de mínimo.

Para obter a estimativa de Ŷmax (ou Ŷmin ), basta substituir o valor de X̂max (ou X̂min ) na
expressão do modelo com os parâmetros estimados e fazer os cálculos. Ficando então:

Ŷmax = b0 + b1 X̂max

No modelo linear quadrático


Caso seja um polinômio de segundo ou terceiro grau então os pontos de máximo ou mínimo
são obtidos por meio de derivadas.

No caso de polinômios de segundo grau o valor de X̂max (ou X̂min ) é aquele que zera a
primeira derivada de Y em relação a X. Isto é:
∂Y
X̂max = = f ′ (X) = 0
∂X
E o valor de Ŷmax (ou Ŷmin ) é obtido substituindo o valor de X̂max (ou X̂min ) na expressão
com os valores estimados.

2
Ŷmax = b0 + b1 X̂max + b2 X̂max

CURIOSIDADE: Os pontos de máximo (ou mínimo) em um polinômio de segundo grau, cor-


respondem ao X do vértice (X̂v ) e ao Y do vértice (Ŷv ). Caso se recordem do ensino médio e
prefiram guardar a fórmula ao invés de calcular a derivada, basta lembrar que:

X do vértice (tratamento) é calculado por:


−b1
X̂v =
2 × b2
Y do vértice (variável resposta) é calculado por:

−(b21 − 4 × b2 × b0 )
Ŷv =
4 × b2

No modelo linear cúbico


O modelo linear cúbico não é muito comum em exemplos de experimentação. No entanto,
caso em alguma análise se depare com ele, a ideia de obtenção dos pontos extremos por meio
da derivada segue a mesma. Deve se ficar atento, pois a primeira derivada possui duas raízes
(xc1 , xc2 ), sendo que uma delas corresponde ao ponto de máximo e a outra ao ponto de mínimo.
Após encontrar estes pontos, identifique qual deles pertence ao intervalo estudado, em geral,
apenas um destes pontos (xc1 ou xc2 ) pertence ao intervalo delimitado pelas doses do eixo X.

Para identificar se o ponto que pertence ao intervalo é de máximo ou de mínimo será ne-
cessário calcular a segunda derivada. Ao substituir o ponto crítico (xc1 ou xc2 ) na expressão
da segunda derivada (f ′′ (xc )), se o resultado for negativo (f ′′ (xc ) < 0), então este ponto (xc ) é
ponto de máximo. Caso o resultado seja positivo (f ′′ (xc ) > 0), então xc é ponto de mínimo.

Prof. Tales Jesus Fernandes DES-UFLA 45


9.2 O gráfico de regressão

Exemplo Resolvido
Foi realizado um experimento para comparar 4 doses de um certo fertilizante adicionadas
ao substrato no crescimento de mudas de bananeira Musa Prata. As doses em estudo foram:
10%, 15%, 20% e 25%. O resultado da ANAVA é apresentado abaixo:

FV GL SQ QM Fc p-valor
doses 3 2,3168 0,7723 62,79 0,0000
erro 12 0,1476 0,0123
Total 15 2,4644

As hipóteses em questão são:




 H0 : Não existe diferença entre os efeitos das doses deste fertilizante no crescimento
de mudas de bananeira Musa Prata.


 H1 : Pelo menos uma dose deste fertilizante apresenta efeito diferente das demais no
crescimento de mudas de bananeira Musa Prata.

Como p-valor < 5% (0,0000 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma dose do fertilizante apresenta efeito diferente das demais no crescimento
de mudas de bananeira Musa Prata.

Portanto, como o fator em estudo é uma variável quantitativa devemos fazer o estudo de re-
gressão. Temos 3 graus de liberdade de tratamentos, logo podemos testar até a regressão linear
quadrática (desvio = 1 GL, Linear = 1 GL, Quadrático = 1 GL).

A ANAVA de regressão é apresentada abaixo:

FV GL SQ QM Fc p-valor
(doses) (3) 2,3168
Reg. Linear 1 1,4851 1,4851 120,82 0,0000
Reg. Quadrática 1 0,7656 0,7656 62,28 0,0002
desvio 1 0,0661 0,0661 5,38 0,0595
erro 12 0,1476 0,0123
Total 15 2,4644

Como p-valor > 0,05 então o desvio (ou falta de ajuste) não foi significativo, assim algum
dos modelos lineares apresentados acima (linear ou quadrático) pode ser utilizado para repre-
sentar o crescimento de mudas de bananeira Musa Prata em função das doses do fertilizante
adicionadas ao substrato.

Para o modelo liner quadrático, b2, o p-valor foi 0,0020 < 0,05, logo rejeita-se H0 para o
modelo quadrático, ou seja β2 ̸= 0, portanto este modelo é significativo.

Para o modelo linear, b1, o p-valor foi 0,000 < 0,05, logo rejeita-se H0 para o modelo linear,
ou seja β1 ̸= 0 logo o modelo linear também é significativo. Mas como comentado, devemos
utilizar o polinômio de maior grau que foi significativo, assim utilizaremos o modelo quadrático.

As estimativas para os parâmetros foram: b0 = −0, 03; b1 = 36, 07; b2 = 87, 5, logo o
modelo estimado fica:

Prof. Tales Jesus Fernandes DES-UFLA 46


9.2 O gráfico de regressão

Ŷ = −0, 03 + 36, 07X − 87, 5X 2


O coeficiente de determinação foi:
SQRegressao 1, 4851 + 0, 7656
R2 = = = 97, 14%
SQT rat 2, 3168
Que significa que 97,14% da variação ocorrida no crescimento das mudas de bananeira
Musa Prata pode ser explicada pelo modelo de regressão linear quadrática em função das doses
do fertilizante.

Como pode-se observar na figura abaixo, trata-se de um modelo de um parábola com con-
cavidade voltada para baixo, logo possui ponto de máximo.

Figura 7: Modelo de regressão quadrático descrevendo o crescimento de mudas de bananeira


Musa Prata em função das doses de certo fertilizante misturadas ao substrato.

Para obter a dose de fertilizante que propicia o crescimento máximo, basta derivar o modelo
estimado e igualar a zero:

∂Y
X̂max = = f ′ (X) = 0
∂X
36, 07 − 175X̂max = 0
X̂max = 0, 2061 ou 20,61%

Para identificar o crescimento máximo estimado nesta dose, basta substituir na equação:

Ŷ = −0, 03 + 36, 07 × 0, 2061 − 87, 5 × (0, 2061)2 = 3, 69cm


Portanto, como comentamos o estudo de regressão é muito mais completo, pois consegui-
mos concluir que: existe diferença entre os efeitos das doses de fertilizante no crescimento
de bananeira Musa Prata. Além disso, a relação entre as doses e o crescimento apresenta um
padrão quadrático que atinge um crescimento máximo de 3,69 centímetros na dose 20,61%
do fertilizante. Podemos também estimar o crescimento para qualquer dose não observada do
fertilizante entre 10% e 25%. Todas estas estimativas com uma confiabilidade de 97,14%.

Prof. Tales Jesus Fernandes DES-UFLA 47


10 O Delineamento em Blocos Casualizados - DBC
É o delineamento mais utilizado em experimentos no campo. Sempre que não houver homo-
geneidade das condições experimentais em todas as parcelas, deve-se usar blocos estabelecendo
subambientes homogêneos colocando-se em cada um deles todos os tratamentos.

A “blocagem” é também chamada de controle local, pois permite que se controle alguma
causa de variação conhecida que afeta a variável resposta, diminuindo assim o erro experimen-
tal.

Tanto o teste F, quanto os demais procedimentos de comparação múltipla têm como base
para avaliar a diferença entre tratamentos a estimativa da variabilidade ao acaso, associada ao
erro experimental, a qual é conhecida como Quadrado Médio do Erro (QMerro). Fica fácil
entender que, para o pesquisador atingir o seu objetivo, apontar diferenças significativas entre
os efeitos de níveis do fator, ele deve planejar e executar o seu experimento de tal forma que a
influência do erro experimental seja a menor possível. Lembre-se que o erro experimental (va-
riação ao acaso) é estimado pela variação entre as parcelas que receberam o mesmo tratamento.

Exemplo: Para ilustrar a ideia do controle local considere um exemplo em que um pesquisador
objetiva comparar a produtividade (kg/parcela) de 4 progênies de milho (A, B, C e D). Para
tanto, planejou o experimento em DIC com 4 repetições. As parcelas foram sorteadas no campo
conforme ilustrado abaixo, os valores entre parênteses são a produtividade observada na parcela.
A (65) B (76) D (55) C (71)
A (92) D (78) D (70) B (62)
C (90) A (85) C (87) D (92)
C (131) B (110) B (107) A (105)
Ao planejar o experimento, o pesquisador não considerou que temos um declive no terreno,
e por consequência uma diferença de fertilidade. Veja que no exemplo, as parcelas localizadas
embaixo (última linha) apresentam uma maior produção. Como esta diferença não foi contro-
lada ela inflaciona o cálculo do erro experimental, pois algumas diferenças de produtividade
são consideradas como sendo ao acaso ao passo que são devido a fertilidade do solo.

Além de inflacionar o erro experimental, veja que conforme a distribuição dos tratamentos
apresentada no croqui acima, o tratamento B aparece duas vezes na última linha (mais fértil),
assim pode haver um confundimento que leve a pensar que o tratamento B é melhor que os
demais, quando na verdade apresentam maior produção média devido a ter mais parcelas na
área mais fértil do terreno.

Caso o pesquisador não controle o efeito do fator perturbador (no caso do exemplo, fer-
tilidade do solo) por meio da formação de blocos de unidades experimentais homogêneas e
acrescente a restrição de que cada tratamento (progênie) deve aparecer uma vez em cada linha,
o efeito do fator pertubador é absorvido pelo erro experimental. Tal absorção tende a provocar
um aumento no valor do QMerro, o que pode acarretar em não identificar nenhuma diferença
nos efeitos dos tratamentos, quando de fato uma ou mais diferenças possam existir.

No entanto, a instalação de um experimento no DBC quando o mesmo não é necessário,


pode implicar na perda de eficiência do experimento, pois quando se instala um experimento
no DBC com J blocos, quando na verdade o DIC seria suficiente, são perdidos (J-1) graus de
liberdade para o resíduo. No DBC o número de graus de liberdade para o resíduo é menor.
Conseqüente o valor de F tabelado é maior. Portanto maior deverá ser a diferença entre os

Prof. Tales Jesus Fernandes DES-UFLA 48


10.1 Casualização dos tratamentos em DBC

efeitos dos níveis do fator para que tais diferenças atinjam significância estatística.

Vantagens
• reduz o erro experimental pois isola as diferenças entre os blocos;

• controla diferentes condições ambientais no campo.

Desvantagens
• número de tratamentos limitado pelo tamanho do bloco (homogêneo);

• redução do GL do erro.

10.1 Casualização dos tratamentos em DBC


Neste delineamento, no momento de fazer o sorteio das repetições dos tratamentos, ao con-
trário do DIC, já temos uma restrição que é garantir que cada bloco tenha todos os tratamentos.
Em outras palavras devemos dividir as repetições dos tratamentos de modo que fique uma em
cada bloco. Assim se uma repetição do tratamento A, por exemplo, já caiu no bloco 3, então
neste bloco não podemos mais ter repetições do tratamento A.

Para ilustrar o sorteio em blocos, considere o caso do exemplo anterior:

Como no exemplo são 4 repetições, então devemos ter 4 blocos. Cada um deles deve conter
os 4 tratamentos. Portanto, são 4 × 4 = 16 parcelas.

Bloco I A B D C
Bloco II C D A B
Bloco III B C A D
Bloco IV D B C A
Sugestão: Escreva os nomes dos tratamentos em pedacinhos de papel e para cada bloco sorteie a
sequência dos tratamentos, sendo o primeiro tratamento atribuído a primeira parcela dos blocos
e assim sucessivamente.

OBS-1: Os blocos não precisam necessariamente ser do mesmo formato, desde que as parcelas
sejam de mesmo tamanho e cada bloco contenha todos os tratamentos. A exigência de homo-
geneidade dentro dos blocos é mais importante do que o formato do mesmo.

OBS-2: O número de blocos geralmente coincide com o número de repetições do experimento.


Mas em casos específicos (onde tem-se poucos blocos, por exemplo), pode-se ter mais de uma
repetição dos tratamentos dentro de cada bloco. O importante é manter o balanceamento, man-
tendo o mesmo número de repetições de todos os tratamentos dentro dos blocos. Por exemplo,
cada tratamento pode aparecer três vezes dentro de cada bloco, assim, sendo J a quantidade de
blocos, então o número de repetições do experimento é 3*J.

10.2 Modelo Estatístico


Para os dados obtidos de um experimento realizado em DBC, o modelo linear que explica
as variações da variável resposta e deve ser utilizado nas análises estatísticas é:

Prof. Tales Jesus Fernandes DES-UFLA 49


10.3 ANAVA para o DBC

yij = µ + τi + bj + εij
em que:

• yij é o valor da variável resposta observada na parcela de tratamento i, na repetição j;

• µ é uma constante inerente a toda parcela;

• τi representa o efeito do i-ésimo tratamento na variável resposta;

• bj indica o efeito do j-ésimo bloco na variável resposta;

• εij é o erro experimental da parcela ij.

Admitindo que o experimento pode ser descrito pelo modelo linear acima e que as pressu-
posições i) a iv) são atendidas, podemos passar ao quadro de ANAVA.

10.3 ANAVA para o DBC


A tabela de análise de variância para um experimento em DBC com I tratamentos e J repe-
tições é dada por:

Tabela 5: Esquema de ANAVA para o DBC, com I tratamentos e J repetições.


FV GL SQ QM Fc p-valor
SQtrat QMtrat
trat I −1 SQtrat I−1 QMerro
P[F>Fc]
SQbloco QMbloco
bloco J −1 SQbloco J−1 QMerro
P[F>Fc]
SQerro
erro (I − 1) ∗ (J − 1) SQerro (I−1)∗(J−1)
total I ∗J −1 SQtotal

As fórmulas para obtenção de SQtrat e SQtotal são as mesmas apresentadas anteriormente,


na semana sobre o DIC. Já para obter a SQbloco temos que:
J
1X 2
SQbloco = B −C
I j=1 j

em que Bj são os totais dos blocos e C é a correção, também definida anteriormente.

E para calcular e SQerro fazemos:

SQerro = SQtotal − SQtrat − SQbloco


.

10.3.1 Exemplo Resolvido


Foi realizado um experimento para avaliar 4 tipos de preparo de solo (A, B, C e D) para o
plantio e manejo de eucaliptos. O experimento foi realizado em DBC com 3 repetições para
controlar a fertilidade do solo. A produção de madeira em m3 por parcela é apresentada na
tabela abaixo. Admitindo que as pressuposições da ANAVA foram atendidas, faça a análise de
variância e aplique o teste de Tukey (5%) para comparar os efeitos dos preparos de solo.

Prof. Tales Jesus Fernandes DES-UFLA 50


10.3 ANAVA para o DBC

Tratamentos Blocos Total


(Preparo de solo) 1 2 3
A 78 76 65 219(3)
B 110 90 55 255
C 99 107 94 300
D 131 109 90 330
Total 418(4) 382 304 1104(12)
OBS: Os números entre parênteses no expoente são para indicar de quantas parcelas foram ob-
tidas aqueles totais. É uma forma de facilitar os cálculos das somas de quadrado. Por exemplo,
o Total 418 foi obtido da soma de 4 parcelas.

As hipóteses para tratamentos são:



 H0 : Não existe diferença entre os efeitos dos preparos de solo na produção de madeira.
H1 : Pelo menos um preparo de solo apresenta efeito diferente das demais na produção de
madeira.

As hipóteses para blocos são:




 H0 : O uso de blocos não foi eficiente para avaliar o efeito do preparo de solo na
produção de madeira (em experimentos futuros não precisa dividir em blocos).


 H 1 : O uso de blocos foi eficiente para avaliar o efeito do preparo de solo na
produção de madeira.

Para obter as somas de quadrados basta substituir os valores nas fórmulas:


IJ
( yij )2
P
ij G2 (418 + 382 + 304)2 11042
C= = = = = 101568
I ×J n 12 12

Agora a SQtotal fica:

IJ
X
SQtotal = (yij )2 − C = (782 + 762 + · · · + 1092 + 902 ) − 101568 = 4970
ij

A SQtrat fica:

I
1X 2 1
SQtrat = Ti − C = (2192 + 2552 + 3002 + 3302 ) − 101568 = 2394
J i=1 3

A SQbloco fica:
J
1X 2 1
SQbloco = Bj − C = (4182 + 3822 + 3042 ) − 101568 = 1698
I j=1 4

A SQerro fica:

SQerro = SQtotal − SQtrat − SQbloco = 4970 − 2394 − 1698 = 878

Prof. Tales Jesus Fernandes DES-UFLA 51


10.3 ANAVA para o DBC

Agora que já obtivemos a SQ, podemos completar a tabela de ANAVA seguindo o raciocínio
apresentado na Tabela 1. A tabela de ANAVA fica:

FV GL SQ QM Fc p-valor
preparo de solo 3 2394 798 5,45 0,0378
bloco 2 1698 849 5,80 0,0396
erro 6 878 146,33
total 11 4970
Para Tratamentos

Como p-valor < 5% (0,0378 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma tipo de preparo de solo apresenta efeito diferente das demais na produção
de madeira.
Para Blocos

Como p-valor < 5% (0,0396 < 0,05) então rejeita-se H0 ao nível de significância de 5%,
ou seja, o uso de blocos foi eficiente para avaliar o efeito do preparo de solo na produção de
madeira.

Para aplicar o teste de Tukey, vamos seguir o algoritmo sugerido no material. Precisamos
primeiro calcular a DMS, da tabela de Tukey temos q(5%;4,6) = 4, 90, calculando a DMS:

r
146, 33
DM S5% = 4, 90 = 34, 22
3
As médias ordenadas da maior para a menor ficam: ȲD = 110, ȲC = 100, ȲB = 85 e
ȲA = 73.

Fazendo: 110 − 34.22 = 75, 78, assim as médias 110, 100 e 85 recebem todas a letra (a).

Passando agora para a segunda maior média, fazemos: 100 − 34.22 = 65, 78, assim as mé-
dias 100, 85 e 73 recebem todas a letra (b).

Como atingimos a última média então finalizamos o teste. Assim a tabela com as médias
organizadas com as letras fica:

Preparos de solo Prod. média


A 73 b
B 85 ba
C 100 ba
D 110 a

Médias seguidas por mesma letra não diferem entre si pelo teste de Tukey ao nível de 5%
de significância. Assim, podemos concluir que os preparos de solo D, C e B não diferem
significativamente entre si e são os que proporcionam as maiores produções de madeira.

Prof. Tales Jesus Fernandes DES-UFLA 52


10.4 Exercícios

10.4 Exercícios
1- Um pesquisador pretende estudar o efeito que a aplicação de cloreto de cálcio pode provocar
nos teores de sólidos solúveis durante o armazenamento de uvas para consumo. Foram prepa-
radas soluções de CaCl2 nas concentrações de 0, 1, 2, 3 e 4%. O pesquisador tem à disposição
120 cachos de uvas de um conjunto uniforme, previamente colhidos e limpos de qualquer injú-
ria. Caso seja encontrada diferença entre as Planeje o experimento indicando o delineamento,
o número de repetições e o tamanho da parcela. Como proceder para encontrar a concentração
ideal de CaCl2?

2- Um experimento foi conduzido no delineamento inteiramente casualizado, com cinco repe-


tições, para avaliar o efeito de diferentes concentrações (0; 2,5; 5,0; 7,5; 10,0) de óleo essencial
de capim-cidreira sobre o crescimento micelial de fungos. Os tratamentos (doses de óleo essen-
cial, em µL−1 ) e valores de diâmetro (cm) do crescimento micelial foram:

Rep/Doses 0 2,5 5,0 7,5 10,0


I 5,0 3,7 2,3 2,1 1,0
II 5,8 5,0 2,4 1,5 0,8
III 7,2 5,7 4,0 3,2 1,2
IV 7,0 4,6 4,8 2,7 0,5
V 7,6 6,2 4,8 2,8 0,0
Total
a) Fazer a análise de variância e interpretar os resultados;
b) Fazer análise de variância com regressão e interpretar os resultados;
c) Obter o coeficiente de determinação e interpretar seu significado;
d) Obter as estimativas dos parâmetros e escrever a equação de regressão;
e) Fazer o gráfico da variável dependente no eixo das ordenadas em função dos níveis da variá-
vel independente no eixo das abscissas;
f) Faça um estudo dos pontos extremos de interesse, pontos de máximo ou mínimo, indique
tanto o x quanto o y.

3- Um experimento foi instalado conforme o delineamento inteiramente casualizado com três


repetições para testar o efeito de 5 doses de adubo nitrogenado (0, 30, 60, 90 e 120 kg/ha) na
produtividade de milho. Os resultados obtidos em ton/ha são:
Rep/Doses 0 30 60 90 120
I 8,6 10,5 12,5 12,6 13,7
II 9,5 10,0 12,8 15,1 12,8
III 9,4 11,5 12,2 14,9 11,3
Total 27,5 32,0 37,5 42,6 37,8
a) Fazer a análise de variância e interpretar os resultados;
b) Fazer análise de variância com regressão e interpretar os resultados;
c) Obter o coeficiente de determinação e interpretar seu significado;
d) Obter as estimativas dos parâmetros e escrever a equação de regressão;
e) Fazer o gráfico da variável dependente no eixo das ordenadas em função dos níveis da variá-
vel independente no eixo das abscissas;
f) Faça um estudo dos pontos extremos de interesse, pontos de máximo ou mínimo, indique
tanto no eixo x quanto no eixo y.

Prof. Tales Jesus Fernandes DES-UFLA 53


10.4 Exercícios

4- Suponha que um colega seu tenha usado um programa de computador para realizar a analise
de variância com regressão de um experimento no DIC com 4 repetições, no qual foi avaliado
o efeito de 5 níveis de adubo na produção de soja. O orientador desse seu colega pediu que ele
testasse até o polinômio de terceiro grau. Como seu colega "matou"todas as aulas de estatística,
ele não copiou todos os resultados e foi pedir sua ajuda para a escolha do melhor modelo a partir
da tabela abaixo, referentes a analise regressão na ANAVA. Baseado nestes resultados, pede-se,
complete a tabela de ANAVA (não precisa colocar o p-valor) e escolha o modelo mais adequado
para descrever a relação entre as variáveis. DICA: Da tabela de F, temos que F5%;1,15 = 4, 54.

FV GL SQ QM Fc p-valor
(tratamentos) (4) 96
Reg. Linear 36
Reg. Quadrática 30
Reg. Cúbica 10
desvio 20
erro 15 75 5
Total 19

5- Uma empresa que produz alimentos para filhotes de cães desenvolveu 5 novas rações, utili-
zando vários alimentos disponíveis na região e que possibilitam vender o produto (a ração) com
um preço menor. Mas, para que essas novas rações possam ser colocadas no mercado é preciso
que elas sejam testadas em animais (cães). A empresa possui tem interesse/recursos apenas para
comercializar as rações que proporcionam um ganho de peso maior aos animais. Os técnicos da
empresa procuraram o canil da cidade para tentar encontrar animais para a realização dos testes.
Lá chegando, observaram que não existia muita diferença de peso entre os animais, mas eles
estavam misturados em várias raças diferentes. Observando mais um pouco, verificaram que
podiam arranjar grupos de 4 animais de 6 raças diferentes com pesos semelhantes. Apresente o
planejamento deste experimento indicando: o número de tratamentos, o número de parcelas, o
delineamento experimental e o teste de comparações múltiplas a ser utilizado caso tenha dife-
rença entre as rações.

6- Um pesquisador recebeu quatro novos produtos para serem comparados com um produto de
uso tradicional em uma região. Cada novo produto corresponde a um herbicida utilizado para
o controle de ervas daninhas em uma lavoura. Estes herbicidas tem comprovada eficiência em
outras regiões. Pretende-se avaliar o efeito dos produtos, 30 dias após a aplicação. O grau
de infestação é a variável de interesse do pesquisador. No local disponível na fazenda para a
realização do experimento, tem espaço suficiente para realizar 4 repetições e existem indícios
de diferenças de umidade no solo. As dosagens são pré-determinadas pelos revendedores dos
produtos. Neste estágio da pesquisa não há interesse em testar diferentes dosagens. Apresente
o planejamento deste experimento indicando: o número de tratamentos, o número de parcelas,
o delineamento experimental, o teste de comparações múltiplas a ser utilizado caso tenha dife-
rença entre os produtos e faça o croqui do experimento.

7- Um pesquisador da área de bovinos de corte pretende avaliar cinco rações no ganho de peso
para animais em confinamento. Os animais disponíveis são 20 novilhos da raça Nelore cas-
trados, de mesma idade, apresentando os seguintes pesos (kg): 322; 336; 364; 300; 325; 338;
368; 369; 340; 326; 304; 308; 342; 328; 305; 360; 335; 328; 307; 362. Planeje o experimento
enfocando: delineamento, número de repetições, tamanho da parcela e apresente o croqui.

Prof. Tales Jesus Fernandes DES-UFLA 54


10.4 Exercícios

8- Um experimento foi conduzido para avaliar a competição entre variedades de cana-de-açúcar


em um solo do tipo latossolo vermelho escuro, utilizando-se o delineamento em blocos casu-
alizados, com cinco repetições. Os valores obtidos da produção de matéria verde, em t/ha foram:

Variedade Blocos
1 2 3 4 5
Co 819 101 109 105 95 110
Co 820 107 124 122 105 127
CB 70 130 140 138 135 134
CB 80 133 144 141 134 135
CB 90 119 130 120 128 126
a) Quais hipóteses estão sendo avaliadas nesse experimento?
b) Faça a análise da variância e interprete os resultados dos 2 testes F;
c) Avalie a precisão do experimento;
d) Aplique o teste de Tukey (5%) e interprete os resultados;
e) Faça uma avaliação do contraste variedades Co´s contra as variedades CB´s pelo teste de
Scheffé (5%) e interprete o resultado.

9- Um experimento foi conduzido no delineamento em blocos casualizados, com quatro re-


petições, com a finalidade de avaliar o comportamento produtivo de cultivares de arroz. Os
tratamentos (cultivares de arroz) e valores de produção de grãos (t/ha) foram:

Cultivares Blocos
1 2 3 4
Ciat5 6,3 5,6 5,1 6,1
Ciat4 4,9 4,5 5,3 5,4
BR1 4,6 4,4 4,7 5,5
BR2 4,8 4,5 5,7 5
Iac01 3,8 4,4 4,7 4,9
Iac02 3,7 3,6 4,3 3,8
a) Fazer a análise de variância com a interpretação do teste F para tratamentos e para blocos;
b) Avalie a precisão do experimento;
c) Aplique o teste de Tukey (5%). Faça uma tabela com os nomes das cultivares, seus valores
médios, letras do teste de Tukey e, indique qual(is) a(s) melhor(es) cultivar(es). E, qual(is) não
deve(m) ser utilizada(s)?
d) Compare as cultivares Ciat versus as cultivares BR utilizando o teste de Scheffé (5%) e in-
terprete os resultados.

10- Um experimento foi conduzido no delineamento em blocos casualizado, com três repeti-
ções, para avaliar o efeito da aplicação no solo de diferentes doses de adubação nitrogenada
em cobertura sobre a produção de grãos de milho. Os tratamentos (doses de N) e valores de
produção de grãos, em t/ha, foram:
Doses de N
Blocos 0 10 20 30 40
I 2,6 4,0 6,8 7,2 9,6
II 3,0 6,4 5,3 9,4 10,2
III 1,9 5,5 7,4 8,3 8,4
Faça a análise de variância, interprete os resultados do teste F para tratamentos e para blocos.
Se necessário compare o efeito das doses de N adequadamente.

Prof. Tales Jesus Fernandes DES-UFLA 55


10.4 Exercícios

11- Foi realizado um experimento com aves para avaliar qual o melhor complemento alimentar
a ser utilizada na época de muda de penas. Devido aos animais serem de 4 ninhadas diferentes,
optou-se por utilizar o delineamento em blocos casualizados. Cada animal foi considerado
como uma parcela e foram comparados 4 tratamentos. O aluno perdeu o pendrive com os
dados e ficou apenas com os resultados da análise de variância deste experimento anotados no
caderno. No entanto, uma caneta estourou na mochila manchando o papel e a tabela ficou um
pouco incompleta, ajude este “aluno desatento” a completar a análise de variância e tirar as
conclusões do experimento.

FV GL SQ QM Fc
Tratamentos 3 229,19
Blocos 89,19
erro 9
Total 475,94

Prof. Tales Jesus Fernandes DES-UFLA 56


UNIVERSIDADE FEDERAL DE LAVRAS
DEPARTAMENTO DE ESTATÍSTICA

Prof. Tales Jesus Fernandes GES 102 - Estatística Experimental

11 O Delineamento em Quadrado Latino


É utilizado quando as unidades experimentais são heterogêneas em relação à duas causas
de variação diferentes dos tratamentos e precisam ser controladas, eliminando assim estas duas
fontes de variação do erro experimental.

Neste delineamento o princípio do controle local é utilizado duas vezes, pois existem duas
variáveis que influenciam na resposta mas não temos interesse em compará-las (não são fato-
res). Na prática este controle funciona como se fossem blocos organizados em duas direções.

Geralmente, na configuração de um experimento em DQL, os níveis de um fator perturbador


são identificados por linhas em uma tabela de dupla entrada e os níveis do outro fator perturba-
dor são identificados por colunas na tabela.

Uma característica do DQL é que o número de linhas deve ser igual ao número de colunas
que deve ser igual ao número de tratamentos, totalizando assim I 2 parcelas, daí o nome "qua-
drado".

O delineamento em quadrado latino é portanto indicado quando tem-se duas causas de vari-
ação que são conhecidas e podem ser controladas, sendo comumente utilizado em experimentos
industriais (controlando: linhas de produção, turno, semana, etc...), zootécnicos (controlando:
raças, ninhadas, faixas de peso, etc...) e agronômicos (controlando: bancada, prateleira, inten-
sidade luminosa, fertilidade do solo, teor de umidade, etc...).

Vantagens
• Possibilita controlar duas fontes de variação diferentes, evitando a superestimação do erro
experimental;

• Em ambientes heterogêneos obtêm resultados mais precisos com o uso do DQL ao invés
do DBC ou DIC, pois a formação hábil de linhas e colunas permite que tratamentos sejam
comparados em condições mais homogêneas.

Desvantagens
• Se as linhas e colunas não forem significativas ocorre perda de precisão;

• As fontes de variação ficam com GL pequeno quando tiver poucos tratamentos;

• O experimento pode ficar grande e complicado de instalar com muitos tratamentos;

• Se existir interação/dependência entre os critérios de classificação e os tratamentos o teste


F não é válido.

Prof. Tales Jesus Fernandes DES-UFLA 57


11.1 Casualização dos tratamentos em DQL

11.1 Casualização dos tratamentos em DQL


O esquema do delineamento corresponde a um quadrado com I 2 parcelas. No momento do
sorteio dos tratamentos devem ser observadas duas restrições, pois cada tratamento deve ocorrer
uma única vez em cada linha e em cada coluna.

Para ilustrar o croqui com a casualização de um experimento em DQL considere o exemplo


abaixo:

Um pesquisador pretende instalar um experimento para comparar I = 5 tratamentos (A, B,


C, D, E). Por se tratar de um ambiente em que ele precisará controlar duas fontes de variação,
então ele utilizará o DQL e desta forma precisará fazer 5 repetições. O croqui para o delinea-
mento é apresentado abaixo.

Coluna I Coluna II Coluna III Coluna IV Coluna V


Linha I B D E C A
Linha II E B C A D
Linha III D A B E C
Linha IV C E A D B
Linha V A C D B E

Sugestão: Sorteie uma letra (tratamento) e preencha a diagonal principal do quadrado com ela,
depois termine de preencher as linhas em ordem alfabética. Enumere as linhas de 1 à 5 e faça
um sorteio, por exemplo: (3,1,4,5,2). Re-ordene as linhas de acordo com o sorteio. Agora
enumere as colunas de 1 à 5 e faça um sorteio, por exemplo: (4,2,5,1,3). Re-ordene agora as
colunas de acordo com a ordem do sorteio.

11.2 Modelo Estatístico


Considerando os dados de um experimento realizado em DQL, o modelo linear que explica
as variações da variável resposta e deve ser utilizado nas análises estatísticas é:

yijk = µ + τi + lj + ck + εijk
em que:

• yijk é o valor da variável resposta observada na parcela de tratamento i, na linha j e na


coluna k;

• µ é uma constante inerente a toda parcela;

• τi representa o efeito do i-ésimo tratamento na variável resposta;

• lj indica o efeito da j-ésima linha na variável resposta;

• ck indica o efeito da k-ésima coluna na variável resposta;

• εijk é o erro experimental da parcela ijk.

Admitindo que o experimento pode ser descrito pelo modelo linear acima e que as pressu-
posições i) a iv) da análise de variância são atendidas, podemos passar ao quadro de ANAVA.

Prof. Tales Jesus Fernandes DES-UFLA 58


11.3 ANAVA para o DQL

11.3 ANAVA para o DQL


A tabela de análise de variância para um experimento em DQL possui três testes F. Consi-
derando um esquema com I tratamentos temos:

Tabela 6: Esquema de ANAVA para o DQL com I tratamentos.


FV GL SQ QM Fc p-valor
SQtrat QMtrat
trat I −1 SQtrat I−1 QMerro
P[F>Fc]
SQlinha QMlinha
linha I −1 SQlinha J−1 QMerro
P[F>Fc]
SQcoluna QMcoluna
coluna I −1 SQcoluna J−1 QMerro
P[F>Fc]
SQerro
erro (I − 1) ∗ (I − 2) SQerro (I−1)∗(J−1)
total I2 − 1 SQtotal

As somas de quadrado para completar o quadro de ANAVA são obtidas por:


IJK
X
2
SQtotal = yijk −C
ijk
I
1X 2
SQtrat = T −C
I i=1 i
I
1X 2
SQlinha = L −C
I i=1 i
I
1X 2
SQcoluna = C −C
I i=1 i

SQerro = SQtotal − SQtrat − SQlinha − SQcoluna

IJK
yijk )2
P
(
ijk
C=
I2
em que: Ti , Li e Ci são os totais dos tratamentos, linhas e colunas respectivamente.

11.3.1 Exemplo Resolvido


Um experimento foi realizado para verificar o desenvolvimento de leitões submetidos a
diferentes dietas. Como critério de controle de fontes estranhas usou-se o sexo e peso inicial dos
leitões (as linhas) e as diferentes leitegadas (colunas). As dietas em estudo foram as seguintes:
A: ração com suplemento de 1%, B: ração com suplemento de 1% e promotor de crescimento
(PC250), C: ração com suplemento de 1% e promotor de crescimento (PC500) e D: ração sem
suplemento.
O croqui do experimento com os respectivos valores observados para ganho de peso (kg)
foram:
Leitegada I Leitegada II Leitegada III Leitegada IV
Fêmea Leve 34 (A) 33 (B) 32 (C) 24 (D)
Fêmea Pesada 37 (C) 28 (D) 35 (A) 33 (B)
Macho Leve 36 (B) 36 (C) 26 (D) 35 (A)
Macho Pesado 29 (D) 38 (A) 38 (B) 39 (C)

Prof. Tales Jesus Fernandes DES-UFLA 59


11.3 ANAVA para o DQL

As hipóteses para dietas (tratamentos) são:



H0 : Não existe diferença entre os efeitos das dietas no ganho de peso dos leitões.
H1 : Pelo menos uma dieta apresenta efeito diferente das demais no ganho de peso dos leitões.

As hipóteses para linhas são:



 H0 : Controlar o sexo e peso inicial não foi eficiente para avaliar o efeito da dieta no ganho de peso
dos leitões.
H1 : Controlar o sexo e peso inicial foi eficiente para avaliar o efeito da dieta no ganho de dos leitões.

As hipóteses para colunas são:



H0 : Controlar a leitegada não foi eficiente para avaliar o efeito da dieta no ganho de peso dos leitões.
H1 : Controlar a leitegada foi eficiente para avaliar o efeito da dieta no ganho de peso dos leitões.

Para obter as somas de quadrados basta substituir os valores nas fórmulas apresentadas na
página anterior. Veja que você precisará saber os totais de tratamentos, de linhas, de colunas e
o valor da correção:
TA = 142 TB = 140 TC = 144 TD = 107

L1 = 123 L2 = 133 L3 = 133 L4 = 144

C1 = 136 C2 = 135 C3 = 131 C4 = 131

IJ
yij )2
P
(
ij G2 (34 + 33 + 32 + · · · + 39)2 5332
C= = = = = 17755, 56
I ×J n 16 16

Agora a SQtotal fica:

IJ
X
SQtotal = (yij )2 − C = (342 + 332 + 322 + · · · + 382 + 392 ) − 17755, 56 = 299, 44
ij

A SQtrat fica:

I
1X 2 1
SQtrat = Ti − C = (1422 + 1402 + 1442 + 1072 ) − 17755, 56 = 231, 69
J i=1 4

A SQlinha fica:

I
1X 2 1
SQlinha = Li − C = (1232 + 1332 + 1332 + 1442 ) − 17755, 56 = 55, 19
I i=1 4

Prof. Tales Jesus Fernandes DES-UFLA 60


11.3 ANAVA para o DQL

A SQcoluna fica:

I
1X 2 1
SQcoluna = Ci − C = (1362 + 1352 + 1312 + 1312 ) − 17755, 56 = 5, 19
I i=1 4

A SQerro fica:

SQerro = SQtotal − SQtrat − SQlinha − SQcoluna = 299, 44 − 231, 69 − 55, 19 − 5, 19 = 7, 37

Substituindo na tabela de ANAVA fica:

FV GL SQ QM Fc p-valor
dietas 3 231,69 77,23 62,79 0,0001
linhas 3 55,19 18,40 14,96 0,0034
colunas 3 5,19 1,73 1,41 0,3287
erro 6 7,37 1,23
total 15 299,44

Para Dietas (Tratamentos)

Como p-valor < 5% (0,0001 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, pelo menos uma dieta apresenta efeito diferente das demais no ganho de peso dos leitões.

Para Linhas

Como p-valor < 5% (0,0034 < 0,05) então rejeita-se H0 ao nível de significância de 5%, ou
seja, controlar o sexo e peso inicial foi eficiente para avaliar o efeito da dieta no ganho de peso
dos leitões.

Para Colunas

Como p-valor > 5% (0,3287 > 0,05) então não se rejeita H0 ao nível de significância de 5%,
ou seja, controlar a leitegada não foi eficiente para avaliar o efeito da dieta no ganho de peso
dos leitões.

Assim um próximo experimento para realizar o ganho peso nas mesmas condições, pode ser
realizado em DBC controlando apenas o sexo e peso inicial, não sendo necessário controlar a
leitegada.

O próximo passo seria realizar um teste de comparação de médias, como Tukey por exem-
plo, para saber qual ou quais dietas são as melhores (propiciam maior ganho de peso).

Prof. Tales Jesus Fernandes DES-UFLA 61


11.4 Exercícios

11.4 Exercícios
1- Está sendo planejado um experimento para avaliar o sabor de cafés de 5 diferentes regiões de
Minas Gerais. No laboratório tem-se a disposição 5 provadores treinados e o torrador consegue
distinguir 5 pontos de torra que naturalmente influenciam no sabor do café, mas não tem-se o
intuito de comparar o melhor ponto de torra no momento (já é conhecido os efeitos dos pontos
de torra no sabor). Planeje o experimento, indicando o fator, a variável resposta, o delineamento
mais adequado, o número de repetições e apresente um croqui da casualização dos tratamentos
segundo o delineamento indicado.

2- Uma empresa que produz motores elétricos desenvolveu 6 novas tecnologias para reduçãao
de ruídos, utilizando vários componentes eletrônicos disponíveis na fábrica. Mas, para que essas
novas tecnologias possam ser colocadas no mercado é preciso que elas sejam testadas em um
experimento. Mesmo porque a empresa não pretende lançar as 6 tecnologias, dará preferência
para aquelas que proporcionam um menor ruído. Ao procurar por motores para a realização
dos testes observou-se que estes são fabricados por operadores diferentes em diferentes lotes,
além disso não foi possível obter motores apenas de um único lote. Planeje o experimento, de
forma que os técnicos possam avaliar o ruído dos motores, sem que o efeito de lote e operador
influenciem de forma significativa nos resultados. Detalhe bem o planejamento do experimento
indicando: fator, variável resposta, delineamento, número de repetições e apresente um croqui.

3- Um experimento foi realizado para avaliar as produções de grãos de milho (t ha-1) em função
das doses de nitrogênio em cobertura (aplicado aos 40 dias após emergência das plantas). O
delineamento experimental foi em quadrado latino com cinco repetições. O experimento foi
realizado no campo, sendo que a área experimental foi subdividida em linhas e colunas para
controlar os efeitos de declividade do solo e proximidade com uma plantação de eucaliptos. Os
tratamentos foram as doses de nitrogênio (g/parcela) aplicadas à lanço no solo: A = 0, B = 25,
C = 50, D = 75 e E = 100. Os valores de produção de grãos de milho em t ha-1 foram:
Linhas Coluna
1 2 3 4 5
1 B 7,2 D 9,0 A 4,9 C 9,7 E 11,0
2 C 8,5 E 10,1 B 7,9 D 8,7 A 2,8
3 D 9,6 A 5,8 C 9,9 E 9,5 B 5,9
4 E 9,2 B 9,7 D 10,2 A 4,5 C 10,1
5 A 3,8 C 9,5 E 9,8 B 7,1 D 9,5
a) Quais motivos levaram este experimento a ser realizado em DQL? O que poderia acontecer
se realizasse este experimento em DBC controlando apenas a declividade do solo?
b) Faça a análise de variância com a interpretação do teste F para as doses de Nitrogênio (trata-
mentos), para as linhas e também para as colunas;
c) Fazer a análise de regressão linear polinomial, interpretando os resultados;
d) Obter o coeficiente de determinação do modelo escolhido e interpretar o seu significado;
e) Fazer o gráfico da variável dependente em função da variável independente, com as médias
observadas e a equação estimada;
f) É possível estimar a produção em t ha-1 para a dose 70 g/parcela? Se sim qual o valor da
produção estimada?
g) É possível estimar a produção em t ha-1 para a dose 110 g/parcela? Se sim qual o valor da
produção estimada?

Prof. Tales Jesus Fernandes DES-UFLA 62


11.4 Exercícios

4- Um experimento em “quadrado latino” visou comparar quatro rações para vacas leiteiras.
Foram usadas quatro vacas na 1a , 2a , 3a e 4a lactação de quatro diferentes raças. As produ-
ções médias diárias de leite das vacas, por tratamento durante o período experimental foram as
seguintes:
Raças Lactação
1ª 2ª 3ª 4ª
Holandês 12,1 (B) 22,0 (A) 20,0 (C) 15,4 (D)
Pardo Suiça 14,6 (D) 14,5 (C) 21,4 (A) 12,0 (B)
Girolanda 15,1 (C) 14,3 (D) 14,4 (B) 21,2 (A)
Jersey 18,0 (A) 11,6 (B) 15,6 (D) 14,7 (C)
a) Quais motivos levaram este experimento a ser realizado em DQL?
b) Faça a análise de variância com a interpretação do teste F para as cultivares (tratamentos),
para as linhas e também para as colunas;
c) Aplique o teste de Tukey (5%) quando necessário e interprete os resultados;

5- Um experimento foi realizado para avaliar o desgaste de pneus em função das diferentes po-
sições (P1, P2, P3 e P4) das rodas no automóvel. Naturalmente, desconfia-se que este desgaste
depende do carro e da marca. Os valores observados para o desgaste foram:
Carro Marcas
A B C D
I P3 (17) P2 (14) P1 (12) P4 (13)
II P4 (14) P3 (14) P2 (12) P1 (11)
III P1 (13) P4 (11) P3 (11) P2 (10)
IV P2 (13) P1 (8) P4 (9) P3 (9)
a) Indique o fator em estudo as variáveis perturbadoras e a variável resposta; b) Elabore as
hipóteses em avaliação;
c) Faça a análise da variância e interprete os resultados;
d) Aplique o teste de Tukey, se necessário, e interprete o resultado.
OBS: P1 e P2 refere aos pneus dianteiros e P3 e P4 refere aos pneus traseiros.

6- A tabela a seguir apresenta a análise de variância de um estudo realizado para comparar a


digestibilidade aparente de carboidratos totais (%) de acordo com a ração utilizada (A, B, C e
D). Foram controlados os efeitos de animal e período (cada período tem 21 dias, sendo 14 dias
de adaptação e 7 de anotação), desta forma, foram utilizados 4 animais em 4 períodos sendo
que cada animal recebeu os 4 tratamentos em períodos diferentes.

FV GL SQ QM Fc p-valor
proteínas 293,34 7,28 0,0200
animais 238,54 0,0317
períodos 412,01 0,0090
erro
total 1024,48
a) Quais motivos levaram este experimento a ser realizado em DQL?
b) O que poderia acontecer caso esse experimento fosse conduzido em DBC controlando apenas
os diferentes períodos?
c) Complete a tabela de ANAVA e interprete-a.
d) Considerando que a média geral foi 66,8, calcule o coeficiente de variação e interprete-o.

Prof. Tales Jesus Fernandes DES-UFLA 63


12 Aspectos Gerais sobre o DIC, DBC e DQL
Como definimos no início do curso, delineamento experimental é o plano utilizado para in-
dicar como os tratamentos serão distribuídos nas parcelas.

Aprendemos até aqui sobre 3 delineamentos experimentais, os quais são destacadas abaixo
suas principais características.

• Delineamento Inteiramente Casualizado - DIC: é o mais simples dos delineamentos, in-


dicado para experimentos em laboratórios e casa de vegetação, pois exige que todas as
parcelas sejam homogêneas.

• Delineamento em Blocos Casualizados - DBC: é o mais utilizado em experimentos de


campo, indicado quando existe heterogeneidade das condições experimentais que podem
ser contornadas controlando uma variável.

• Delineamento em Quadrado Latino - DQL: o número de repetições deve ser igual ao


número de tratamentos, indicado quando as condições experimentais são heterogêneas e
podem ser controladas duas variáveis.

12.1 Aleatorização dos tratamentos


A aleatorização consiste em um conjunto de regras que define o processo de distribuição
dos tratamentos nas parcelas da área experimental.

Basicamente o que diferencia os delineamentos são as restrições que são impostas no mo-
mento de fazer esta aleatorização dos tratamentos no croqui. Para ilustrar, considere o exemplo
abaixo:

Exemplo: Um pesquisador pretende instalar um experimento para comparar I = 4 tratamen-


tos. Ele conta com material experimental suficiente para utilizar J = 5 repetições. Apresente a
casualização dos tratamentos e o esquema da análise de variância (Fontes de Variação e Graus
de liberdade) caso o experimento fosse instalado em cada um dos três delineamentos estudados
(DIC, DBC, DQL).

12.1.1 i) Delineamento Inteiramente Casualizado


Como neste delineamento as condições são homogêneas então todas as parcelas tem a
mesma chance de receber qualquer tratamento.

Com 4 tratamentos e 5 repetições, temos 4 × 5 = 20 parcelas.

Pode se fazer um sorteio aleatório das 5 repetições de cada tratamento considerando toda a
área experimental. Por exemplo:

A C D D C
B D B A B
D A C D A
C B C A B

Prof. Tales Jesus Fernandes DES-UFLA 64


12.1 Aleatorização dos tratamentos

F.V. G.L.
trat 3
O esquema da ANAVA fica:
erro 16
total 19

Sugestão: Enumere todas as parcelas de 1 à 20, e sorteie as 5 repetições de cada tratamento


de uma vez. Por exemplo, os primeiros 5 números sorteados correspondem às parcelas que
receberão o tratamento A, e assim sucessivamente.

12.1.2 ii) Delineamento em Blocos Casualizados


Neste delineamento, no momento de fazer o sorteio das 5 repetições dos tratamentos já te-
mos uma restrição que é garantir que cada bloco tenha todos os tratamentos. Em outras palavras
devemos dividir as 5 repetições dos tratamentos de modo que fique uma em cada bloco.

Assim se uma repetição do tratamento A, por exemplo, já caiu no bloco 3, então neste bloco
não podemos mais ter repetições do tratamento A. Um exemplo do sorteio em blocos pode ser:

bloco 1 bloco 2 bloco 3 bloco 4 bloco 5


A C B D A
C B A A C
B D C B D
D A D C B

OBS: Os blocos não precisam necessariamente ser do mesmo formato, desde que contenha
todos os tratamentos.

F.V. G.L.
trat 3
O esquema da ANAVA fica: bloco 4
erro 12
total 19

Sugestão: Faça o sorteio dentro de cada bloco. Enumere as parcelas de 1 à 4, e faça o sorteio,
sendo que o primeiro valor sorteado recebe o tratamento A, o segundo o B, o terceiro o C e
quarto o D. Repita a operação para os demais blocos.

12.1.3 iii) Delineamento em Quadrado Latino


No DQL, o número de repetições deve ser igual ao número de tratamentos, pois o croqui de
um delineamento em quadrado latino deve essencialmente ser um quadrado.

Assim como temos 4 tratamentos teremos que trabalhar apenas com 4 repetições.

No delineamento em quadrado latino, além da restrição do DBC temos ainda outra restrição,
que diz que cada tratamento deve aparecer apenas uma vez em cada linha e em cada coluna.
Desta forma o sorteio dos tratamentos nas parcelas deve também levar isso em conta. Um exem-
plo de casualização é:

Prof. Tales Jesus Fernandes DES-UFLA 65


12.2 Determinando o número de repetições

A B D C
B C A D
D A C B
C D B A

OBS: As colunas e linhas não precisam necessariamente ser todas grudadas, a forma apre-
sentada acima é apenas a maneira que facilita a visualização. O que importa é que o tratamento
deve aparecer apenas uma vez em cada linha e apenas uma vez em cada coluna, poderia ser por
exemplo:

A B D C
B C A D
D A C B
C D B A

FV GL
trat 3
linha 3
O esquema da ANAVA fica:
coluna 3
erro 6
total 15
Sugestão: Sorteie uma letra para a diagonal principal, preencha as demais linhas em ordem
alfabética. Sorteie as linhas, re-ordene as linhas de acordo com o sorteio. Sorteie as colunas,
re-ordene as colunas de acordo com o sorteio.

OBS: Em experimentos balanceados (mesmo número de repetição para todos os tratamen-


tos) tanto faz a ordem das linhas no quadro de ANAVA. O importante é que o total seja a última
fonte de variação e o erro experimental seja a penúltima fonte de variação.

12.2 Determinando o número de repetições


Ao começar a planejar um experimento, uma das primeiras questões que surge é:

Quantas repetições utilizar?


No caso do DQL o número de repetições já esta automaticamente definido pelo número de
tratamentos. Mas nos demais delineamentos determinar o número ideal de repetições é sempre
objeto de pesquisas. Quanto maior o número de repetições, espera-se que seja maior a precisão
do experimento.

O número de repetições em um experimento pode estar limitado a vários fatores, como por
exemplo: variabilidade da variável resposta, custos de implantação e execução do experimento,
disponibilidade de material experimental e recursos humanos, facilidade de avaliação etc.

O mais importante é a variabilidade da variável resposta que vai ser estudada no experi-
mento. Se forem avaliadas mais de uma variável resposta, o número de repetições será de-
terminado pela variável com maior variação, ou então, pela variável mais importante para o
pesquisador. Na maior parte dos experimentos, o pesquisador determina, por experiência e co-
nhecimento do fenômeno, qual a quantidade ideal e possível de unidades experimentais que um
experimento pode ter.

Prof. Tales Jesus Fernandes DES-UFLA 66


12.2 Determinando o número de repetições

Não existe uma regra dizendo qual deve ser o número mínimo de repetições, esta informa-
ção depende do conhecimento do pesquisador sobre o assunto e do conjunto de condições em
que será realizado o experimento. Como sugestão GOMES (2009) indica que os experimentos
tenham pelo menos 20 unidades experimentais e 10 graus de liberdade para o resíduo.

12.2.1 O método de Tukey


Existem alguns cálculos de modo a encontrar o “número ideal” de repetições. Uma possível
estimativa para J deverá estar vinculada principalmente a estimativa da variabilidade do experi-
mento e a precisão que deseja-se obter nas comparações. Tukey propôs um método baseado na
seguinte expressão:

q 2 × QMerro × F
J=
d2
onde: q é a amplitude total estudentizada (Tabela de Tukey); QMerro é o quadrado médio do
erro de um experimento realizado previamente em condições semelhantes; F é o quantil da
distribuição F com n1 sendo o grau de liberdade do erro do experimento atual e n2 o grau de
liberdade do erro de algum experimento anterior; d é a diferença em valor absoluto que espera-
se que seja comprovada no experimento (diferença que eu quero que seja significativa entre os
meus tratamentos com um determinado nível de significância).

Como q e F dependem do valor de J, então a solução é obtida por aproximações sucessivas,


a partir de uma tentativa inicial. O número J garantirá, com uma probabilidade (1 − α), que
uma diferença d seja comprovada estatisticamente, pelo teste de Tukey.

12.2.2 Exemplo
Suponha um experimento com 5 tratamentos. Tem-se de experimentos anteriores uma esti-
mativa do QMerro = 54, 76 Kg/parcela, por exemplo, com grau de liberdade do resíduo igual a
60. Deseja-se que o novo experimento, indique através do teste de Tukey, que os tratamentos se-
jam diferentes caso a diferença entre as médias estimadas de produção sejam de 15 Kg/parcela
ou maiores (ou seja, DMS=15).

Um novo experimento está sendo planejado em DBC com 5 tratamentos e com 5 repetições,
inicialmente tem-se 4 GL para tratamentos e 16 GL para o resíduo. Considerando um α = 0, 05
tem-se da tabela de Tukey q(5,16;α=5%) = 4, 33 e F(16,60;α=5%) = 1, 81.

Aplicando a expressão de Tukey temos:

4, 332 × 54, 76 × 1, 81
J= = 8, 3
152
Assim, o número de repetições ideal está entre 5 e 8,3. Consideraremos então que va-
mos fazer o experimento com 7 repetições e refazemos os cálculos: q(5,24;α=5%) = 4, 17 e
F(24,60;α=5%) = 1, 70.

4, 172 × 54, 76 × 1, 70
J= = 7, 2
152
Assim, o número de repetições ideal está entre 7 e 7,2. Portanto recomenda-se, neste caso,
que se utilize 7 repetições.

Prof. Tales Jesus Fernandes DES-UFLA 67

Você também pode gostar