UnidadeIV Delineamento Inteiramente Casualizado
UnidadeIV Delineamento Inteiramente Casualizado
UnidadeIV Delineamento Inteiramente Casualizado
1
UNIDADE IV DELINEAMENTO
INTEIRAMENTE CASUALIZADO
(DIC)
PROF.: RMULO MRA
CUIAB, MT
1. INTRODUO
Este delineamento apresenta como caracterstica
principal a necessidade de homogeneidade do
ambiente para todas as unidades experimentais.
o tipo de delineamento mais simples que existe. A
distribuio dos tratamentos s unidades
experimentais feita completamente ao acaso, ou
seja, no feita nenhuma restrio na casualizao.
Este o delineamento bsico, os demais se originam
dele pela imposio de restries (controle local).
Envolve dois princpios bsicos da experimentao:
repetio e casualizao.
Vantagens:
Delineamento bastante flexvel;
Pode-se usar qualquer nmero de tratamentos ou
repeties;
Apresenta maior nmero de graus de liberdade
associado ao resduo;
A anlise estatstica simples.
Desvantagens:
Exige homogeneidade total das condies
ambientais;
Pode conduzir a uma estimativa de varincia
residual alta, uma vez que abre mo do uso do
principio do controle local.
2. MODELO ESTATSTICO
Cada delineamento possui um modelo estatstico que
identifica os fatores que esto influenciado a varivel
em estudo.
Para o DIC tem-se o seguinte modelo:
ij i ij
e t m Y + + =
i = 1, 2, ... , I j = 1, 2, ... , J
em que:
Y
ij
= o valor observado para a varivel em estudo referente
ao i-simo na j-sima repetio;
m = mdia de todas as unidades experimentais para a
varivel em estudo;
t
i
= o efeito do particular tratamento i no valor observado Y
ij
;
e
ij
= o erro associado a observao Y
ij
ou seja o efeito
dos fatores no controlados na parcela;
O erro se deve ao fato de no ser possvel controlar
todas as condies experimentais. O erro
experimental refere-se s variaes observadas entre
as repeties do mesmo tratamento.
3. ESQUEMA DE CASUALIZAO DOS
TRATAMENTOS
Seja um experimento com 5 tratamentos (A, B, C, D e E)
e 4 repeties (20 parcelas ou unidades experimentais)
A B D E
B A C D
E A B C
D E A B
C E D C
24/04/2012
2
4. QUADRO DE TABULAO DE DADOS
Considere um experimento instalado no DIC com 5
tratamentos e 4 repeties. A coleta de dados da
pesquisa pode ser resumida, num quadro do tipo a seguir:
Tratamento
Repeties 1 2 3 4 5
1 Y
11
Y
21
Y
31
Y
41
Y
51
2 Y
12
Y
22
Y
32
Y
42
Y
52
3 Y
13
Y
23
Y
33
Y
43
Y
53
4 Y
14
Y
24
Y
34
Y
44
Y
54
Totais T
1
T
2
T
3
T
4
T
5
Deste quando pode-se retirar algumas informaes de
interesse:
- Nmero de unidades experimentais: N = I x J ou N =
nmero de unidades experimentais
-Total Geral:
- Total para o tratamento i:
- Mdia para o tratamento i:
- Mdia geral do experimento:
=
= =
= =
J I
j
i
I
i
i ij
T Y G
,
1
1 1
=
=
J
j
ij i
Y T
1
J
T
m
i
i
=
J I
G
m
.
=
5. ANLISE DE VARINCIA
A anlise de varincia foi introduzida por Fisher e
essencialmente um processo baseado na
decomposio da variao total existente entre uma
srie de observaes, ou seja, a variao existente
entre todas as observaes, em partes, na variao
devido diferena entre os efeitos dos tratamentos
e na variao devido ao acaso, que tambm
denominada de erro experimental ou resduo.
No entanto, para que esta tcnica seja empregada
necessrio que sejam satisfeitas as seguintes
pressuposies:
1) Os efeitos do modelo estatstico devem
ser aditivos
Nos experimentos, os vrios efeitos devem ser aditivos,
tanto que para cada delineamento estatstico existe um
modelo matemtico denominado modelo linear aditivo.
Para o delineamento inteiramente casualizado, este
modelo :
ij i ij
e t m Y + + =
onde expressa que o valor de qualquer unidade
experimental resultante de uma mdia geral, mais o
efeito de tratamento e o mais o efeito do erro
experimental.
2) Os erros experimentais devem ser
independentes
Cada observao possui um erro que deve ser
independente dos demais. O princpio da
casualizao assegura a validade da estimativa do
erro experimental, pois permite uma distribuio
independente do mesmo. A casualizao evita que
todas as parcelas que recebem o mesmo
tratamento sejam favorecidas ou desfavorecidas
entre as parcelas experimentais
3) Os erros experimentais devem ser
normalmente distribudos
A nica fonte de variao de amostragem so os
erros aleatrios. Estes devem ter distribuio
normal (ou aproximadamente normal) com mdia
igual a zero e varincia igual s
2
. Felizmente, as
variaes da suposio de normalidade no afetam
muito seriamente a validade da anlise de
varincia.
24/04/2012
3
4) As varincias das diferentes amostras
devem ser homogneas
Na anlise de varincia, o valor do Quadrado Mdio do
Resduo, que corresponde estimativa da anlise de
varincia do erro experimental, utilizada nas frmulas
matemticas dos testes de hipteses.
Tais testes so utilizados para verificar se existe ou no
diferena significativa entre os tratamentos avaliados.
O Quadrado Mdio do Resduo nada mais que a mdia
das diferentes varincias de cada tratamento (amostras).
Assim sendo, importante que as varincias das diferentes
amostras seja homogneas, de modo que os resultados
obtidos dos testes de hipteses tenham validade.
5.1 TESTE F MXIMO - HARTLEY
Uma das exigncias do modelo matemtico e, portanto, da
validade da anlise de varincia, que as varincias das
diferentes amostras devem ser homogneas. Entre os vrios
testes estatsticos utilizados para verificar a homogeneidade
de varincias, temos o teste F-mximo proposto por Hartley.
O teste F - mximo: simples e rpido, porm apresenta
menor preciso quando as amostras tem graus de liberdade
diferentes.
onde:
s
2
mxima: maior valor das estimativas das varincias entre as
amostras;
s
2
mnima: menor valor das estimativas das varincias entre as
amostras;
mnima s
mxima s
Mximo F
2
2
=
O valor calculado de F-mximo confrontado com o valor de
F-mximo tabelado, com K (nmero de estimativas das
varincias das diferentes amostras) e (N 1) graus de
liberdade associados a cada estimativa de varincia, sendo N
nmero de observao de cada amostra.
Assim, temos:
Se F-mximo calculado F-mximo tabelado as
estimativas das varincias so estatisticamente diferentes ao
nvel % de probabilidade, isto , no h homogeneidade de
varincias.
Se F-mximo calculado < F-mximo tabelado as
estimativas das varincias no diferem estatisticamente entre
si, ao nvel % de probabilidade, isto , as varincias so
homogneas.
Obs.: Para efeito de clculo manual, quando os graus de liberdade para
cada amostra forem diferentes, toma-se a mdia aritmtica dos mesmos.
EXEMPLO
Verificar se as varincias so homogneas pelo teste F-
Mximo a partir dos dados abaixo:
0
2 2
4
2
3
2
2
2
1 0
:
:
noH H
H
a
comum
o o o o o = = = =
Resoluo:
- Calcular as varincias de cada tratamento
57 , 74
5
6
) 491 (
40553
5
6
) 491 (
) 88 ... 78 (
1
2 2
2 2
2
6
1
6
1
2
2
1
=
=
+ +
=
|
.
|
\
|
=
=
n
n
X
X
s
i
i
i
i
60 , 149
5
6
) 510 (
44098
5
6
) 510 (
) 90 ... 100 (
1
2 2
2 2
2
6
1
6
1
2
2
2
=
=
+ +
=
|
.
|
\
|
=
=
n
n
X
X
s
i
i
i
i
27 , 84
2
3
= s 07 , 85
2
4
= s
01 , 2
57 , 74
60 , 149
2
2
= = =
mnima s
mxima s
Mximo F
F-mximo tabelado (K = 4; N-1 = 5): 5% = F
5%
(4; 5) = 13,7
F-Mximo calculado < F-Mximo tabelado no rejeita-se H
0
ao nvel de 5% de probabilidade, ou seja, as varincias dos
tratamentos so homogneas.
5.2 TESTE DE LILLIEFORS PARA
NORMALIDADE
Uma das exigncias do modelo matemtico e, portanto, da
validade da anlise de varincia, que os erros e
ij
tenham
distribuio normal.
Esta verificao dessa exigncia pode ser feita pelo teste de
Lilliefors. Este teste uma adaptao do teste de
Kolmogorov-Smirnov, sendo somente usado para a
verificao da normalidade a partir das estimativas da mdia
e desvio padro.
Aps calculadas todas as diferenas absolutas entre F(Z
i
) e
S(Z
i
) e entre F(Z
i
) e S(Z
i
- 1), para i = 1, 2, ..., n, identifica-se
a diferena absoluta mxima dada por:
24/04/2012
4
{ } ) ( ) ( , ) ( ) (
1
=
i i i i cal
Z F Z S Z S Z F mximo D
Se D
cal
D
tab
(, n) rejeita-se H
0
ao nvel de % de
probabilidade, ou seja, os erros no seguem distribuio
normal
Se D
cal
< D
tab
(, n) no rejeita-se H
0
ao nvel de % de
probabilidade, ou seja, os erros seguem distribuio
normal.
Sendo F(Z
i
) as probabilidades da varivel normal
reduzida, calculadas da seguinte forma:
s
m X
Z
i
i
=
em que: X
i
so os erros e
ij
a estimativa da mdia do e
ij
estimados, portanto, igual a zero
s a estimativa do desvio padro dos e
ij
.
m
Dessa forma:
= = =
ij
ij
i
d
s
e
Z
desvios padronizados;
- Para o clculo de S(Z
i
)
( ) ,
n
K
Z S
i
=
onde K o nmero de observaes
X
i
, em nosso caso, o nmero de
desvios e
ij
.
Devemos, inicialmente, obter os erros e
ij
.
Como y
ij
= m + t
i
+ e
ij
, temos que: e
ij
= y
ij
- m - t
i
Mas, no conhecemos m e t
i
, logo, devemos trabalhar
com suas estimativas:
i ij ij
t m y e
=
Temo que: logo
i i
t m m
+ =
m m t
i i
=
EXEMPLO
Um pesquisador instalou um experimento com objetivo de
comparar cultivares de pssego quanto ao enraizamento de
estacas. Para isto, utilizou um delineamento inteiramente
casualizado com 4 cultivares e 5 repeties. O resultado em
n de estacas enraizadas foi:
Resoluo:
H
0
: os dados seguem distribuio normal
H
a
: os dados no seguem distribuio normal
9 , 4 1 , 6 2 , 1
1 1
= = = m m t
- Calculando os efeitos dos tratamentos
9 , 4
1
= t 5 , 5
2
= t 7 , 6
3
= t 7 , 3
4
= t
0 7 , 3 7 , 6 ) 5 , 5 ( ) 9 , 4 ( 0
1
= + + + =
=
I
i
i
t
- Com as estimativas dos efeitos dos tratamentos, calcula-se
as estimativas dos erros:
i ij ij
t m y e
=
8 , 0 ) 9 , 4 ( 1 , 6 2
1 11 11
= = = t m y e
8 , 0 ) 9 , 4 ( 1 , 6 2
12
= = e
2 , 0 ) 9 , 4 ( 1 , 6 1
13
= = e
2 , 0 7 , 3 1 , 6 10
45
= = e
.......... .......... .......... ..........
6 , 4
16
6 , 73
) 1 5 ( 4
) 2 , 0 ( ... ) 8 , 0 (
) 1 (
2 2
,
1
1
2
2
= =
+ +
=
=
=
=
J I
e
s
J I
j
i
ij
1448 , 2 6 , 4 = = s
Os 16 G.L correspondem a 4+4+4+4 (de cada parcela), ou, I(J-1) = 4 x 4
= 16
A seguir, consulta-se a tabela de probabilidade da distribuio normal
reduzida, obtendo-se antes, as variveis reduzida Z
i
s
e
Z
ij
i
0
=
Como exemplo, tem-se:
0968 , 0 4032 , 0 5000 , 0 ) ( 30 , 1
1448 , 2
0 80 , 2
1 1
= = =
= Z F Z
2005 , 0 2996 , 0 5000 , 0 ) ( 84 , 0
1448 , 2
0 80 , 1
2 2
= = =
= Z F Z
6443 , 0 1443 , 0 5000 , 0 ) ( 37 , 0
1448 , 2
0 8 , 0
= + = =
=
i i
Z F Z
..... .......... .......... .......... .......... .......... .......... ..........
Calcula-se agora: ( )
n
K
Z S
i
=
( ) 1000 , 0
20
2
1
= = Z S
( ) 2000 , 0
20
4
2
= = Z S
( ) 0000 , 1
20
20
12
= = Z S
......... .......... ..........
onde: K corresponde a
frequncia acumulada e n=
nmero de termos
24/04/2012
5
Colocando-se os e
ij
(ordenados e respectivos Z
i
numa tabela tm-se:
O maior valor de |F(Z
i
) S(Z
i
) e |F(Z
i
-S(Z
i-1
)| 0,2057, logo, D
cal
=
mximo |F(Z
i
) S(Z
i
) = 0,2057|
Consultando a tabela de Lilliefors com n=20 e = 0,05 D
tab
=
D
0,05
(20)= 0,190
Como Dcal > Dtab , rejeita-se H
0
ao nvel de 5% de probabilidade, ou
seja, a distribuio dos erros no segue distribuio normal.
Observao: Se os erros no seguirem distribuio
normal, realiza-se a transformao dos erros afim
de assegurar a distribuio normal dos dados.
6. ANLISE DE VARINCIA PARA O DIC
No Delineamento inteiramente casualizado (DIC), a variao total, ou
seja, a variao existente entre todas as observaes, decomposta
apenas na variao devido diferena entre os efeitos dos tratamentos
e na variao devido ao acaso ou resduo.
SQTotal = SQTrat + SQRes
O quadro da anlise de varincia, geralmente denotada por ANOVA
(ANalysis Of VAriance) para a anlise de um experimento instalado
segundo o DIC, com igual nmero de repeties para todos os
tratamentos do seguinte tipo:
Sendo: FV = Fonte de Variao; GL = Graus de Liberdade; SQ = Soma
de Quadrados; QM = Quadrado Mdio; F
cal
= Valor de F calculado; F
tab
=
Valor de F tabelado.
FV GL SQ QM F
cal
F
tab
Tratamento (I-1) SQTrat SQTrat/(I-1) QMTrat/QMRes [(I-1);(J-1)}
Resduo I(J-1) SQRes SQRes/I(J-1)
Total IJ-1 SQTotal
J I
Y
J
T
SQTrat
J I
j i
ij
I
i
i
.
2
,
1 , 1
1
|
|
.
|
\
|
=
= =
=
Com as seguintes frmulas definidas:
- Soma de Quadrado do Tratamento
N
Y
r
T
SQTrat
i
r I
j i
ij
I
i i
i
2
,
1 , 1
1
|
|
.
|
\
|
=
= =
=
Tratamentos com mesmo
nmero de repeties
Tratamentos com nmeros de
repeties diferentes
Em que: T
i
= Totais dos tratamentos; J = nmero de repeties
(tratamentos balanceados); r
i
= nmero de unidades experimentais do
tratamento i; Y
ij
= valor observado no tratamento i e repetio j; e N =
nmero de unidades experimentais =
=
I
i
i
r
1
J I
Y
Y SQTotal
J I
j i
ij
J I
j i
ij
.
2
,
1 , 1
,
1 , 1
2
|
|
.
|
\
|
=
= =
= =
Com as seguintes frmulas definidas:
- Soma de Quadrado Total
N
Y
Y SQTotal
i
i
r I
j i
ij
r I
j i
ij
2
,
1 , 1
,
1 , 1
2
|
|
.
|
\
|
=
= =
= =
Tratamentos com mesmo
nmero de repeties
Tratamentos com nmeros de
repeties diferentes
-Soma de Quadrado do Resduo
SQRes = SQTotal-SQTrat
- Graus de Liberdade do Tratamento
GLTrat = (I-1), sendo I = nmero de tratamentos
- Graus de Liberdade do Total
GLTotal = I.J-1, sendo J nmero de repeties (Tratamentos
com mesmo nmero de repeties)
GLTotal = n 1 (Tratamentos com nmero de repeties
diferentes)
- Graus de Liberdade do Resduo
GLRes = I(J-1), sendo J nmero de repeties (Tratamentos com
mesmo nmero de repeties) ou GLRes = GLTotal - GLTrat
24/04/2012
6
-Quadro Mdio do Tratamento
-Quadrado Mdio do Resduo
-F calculado - F tabelado
GLTrat
SQTrat
I
SQTrat
QMTrat =
=
) 1 (
s GL
s SQ
J I
s SQ
s QM
Re
Re
) 1 (
Re
Re =
=
s QM
QMTrat
F
cal
Re
=
| | ) 1 ( ); 1 (
%
= J I I F F
tab o
| | s GL GLTrat F F
tab
Re ;
% o
=
As hipteses para o teste F da anlise de varincia para
tratamentos so as seguintes:
H
0
: m
1
= m
2
= ... = m
i
= m, o que equivale a dizer que todos os
possveis contrastes entre as mdias dos tratamentos, so
estatisticamente nulos, ao nvel de probabilidade que foi
executado o teste.
H
a
: no H
0
, o que equivale a dizer que existe pelo menos um
contraste entre as mdias dos tratamentos, estatisticamente
diferentes de zero, ao nvel de probabilidade que foi realizado o
teste.
Aregra decisria para o teste F a seguinte:
- F
cal
F
tab,
rejeita-se H
0
ao nvel de % de probabilidade, ou
seja, existe pelo menos um contraste entre as mdias dos
tratamentos estatisticamente diferente de zero.
- F
cal
< F
tab,
no rejeita-se H
0
ao nvel de % de probabilidade,
ou seja, todos os possveis contrastes entre as mdias dos
tratamentos so estatisticamente nulos.
EXEMPLO
Para comparar a produtividade de quatro variedades de
milho, um engenheiro florestal tomou vinte parcelas similares
e distribuiu, inteiramente ao acaso, cada uma das 4
variedades em 5 parcelas experimentais. A partir dos dados
experimentais fornecidos abaixo, possvel concluir que
existe diferena significativa entre as variedades com relao
a produtividade, utilizando o nvel de significncia de 5%?
H
0
: m
A
= m
B
= m
C
= m
D
= m
H
a
: no H
0
- Calculando os Graus de Liberdade
Resoluo:
FV GL SQ QM F
cal
Tratamento (4-1) SQTrat SQTrat/(I-1) QMTrat/QMRes
Resduo 4(5-1) SQRes SQRes/I(J-1)
Total 4.5-1 SQTotal
FV GL SQ QM F
cal
Tratamento 3 SQTrat SQTrat/(I-1) QMTrat/QMRes
Resduo 16 SQRes SQRes/I(J-1)
Total 19 SQTotal
- Calculando as Somas de Quadrados
FV GL SQ QM F
cal
Tratamento 3 SQTrat SQTrat/(I-1) QMTrat/QMRes
Resduo 16 SQRes SQRes/I(J-1)
Total 19 SQTotal
75 , 163 25 , 14311 14475 = =
( )
=
|
|
.
|
\
|
+ + + =
5 . 4
535
5
155
5
130
5
135
5
115
2 2 2 2 2
SQTrat
112 75 , 163 75 , 275 Re = = s SQ
75 , 275
5 . 4
535
) 28 ... 25 (
2
2 2
= + + = SQTotal
24/04/2012
7
FV GL SQ QM F
cal
Tratamento 3 163,75 SQTrat/(I-1) QMTrat/QMRes
Resduo 16 112 SQRes/I(J-1)
Total 19 275,75
- Calculando os Quadrados das somas
58 , 54
3
75 , 163
= = QMTrat 7
16
112
Re = = s QM
FV GL SQ QM F
cal
Tratamento 3 163,75 54,58 QMTrat/QMRes
Resduo 16 112 7
Total 19 275,75
80 , 7
7
58 , 54
= =
cal
F
- Calculando o Valor de F calculado
FV GL SQ QM F
cal
Tratamento 3 163,75 54,58 7,80
Resduo 16 112 7
Total 19 275,75
24 , 3 ) 16 ; 3 (
% 5
= = F F
tab
- Calculando o Valor de F tabelado
-Concluso:
F
cal
F
tab
7,80 > 3,24 rejeita-se H
0
ao nvel de 5% de
probabilidade, ou seja, existe pelo menos um contraste entre
as mdias dos tratamentos estatisticamente diferente de
zero.
FIM