Curso Estatística - PCR

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 32

Estatística e Planejamento

de Experimentos

Joseane Padilha da Silva


Msc. Em Estatística e Experimentação Agronômica
Objetivo principal da Aula

 Oferecer suporte estatístico aos pesquisa-


dores com o intuito de maximizar a
confiabilidade de seus experimentos.
Antes de tudo, revisemos o
conceito: “Tipos de Variáveis”
Qualidade Número de grãos
da espiga por espiga

Variáveis
Número de
A manchas na folha
L
T
U Textura dos grãos
R (opaco, vítrea) Qualitativas Quantitativas
A

Discretas
Comprimento Contínuas
de raízes
Densidade
do solo O tipo de variável vai
Influenciar diretamente na escolha
do método estatístico de análise
Conceito de “Bom Experimento”

 Pesquisa minuciosamente planejada tendo


como objetivo a tomada de decisões
confiáveis.

Minimizar o máximo possível os erros associados as


tomadas de decisões.
Características de um bom
experimento

 Ausência de erro sistemático  vicio;

 Precisão nas estimativas;

 Generalidade dos resultados;

 Simplicidade.
Um experimento mal planejado pode ter
como consequência...

 A inflação dos erros do tipo I e II.


Um experimento mal planejado
repercute da seguinte forma na Anova:
Relembrando a idéia da Anova:
Parte que mede o efeito real
dos grupos + Parte que contém aquilo que não é possível
controlar no experimento.
ERRO (RESIDUO)

(PARTE 1)
(PARTE 2)

N Toda a parte
não controlada
vem pra cá.
H0: A média dos tratamentos são iguais.
Então, imagino que a questão
seja...

 Do ponto de vista estatístico, como


realizar um bom experimento?
Tipos de Erros X Eficácia de um
planejamento de experimento

Primeiramente, é fundamental entender o


conceito de causas de variação.

1. Erro Experimental;
2. Erro Sistemático.
Erro Sistemático

ocorrem quando há falhas do método utilizado (erros de


método), defeito dos instrumentos de medição e reagentes
(erros instrumentais), deficiência da atuação do próprio
experimentador (erros pessoas).

Podem e devem ser detectados e corrigidos.


Erro Experimental

Definição de erro experimental: Variação das


unidades experimentais submetidas ao mesmo
tratamento.

Causas do erro experimental: Variabilidade


intrínseca das unidades experimentais (UE); falhas de
técnica experimental.

• tendem a anular-se num elevado número de medições;

• O efeito desses erros podem ser controlados através da


escolha correta de modelagem dos dados.
Então, como controlar as possíveis
causas de variação?

• Técnica experimental cuidadosa;


• Observações auxiliares ou concomitantes;
• Delineamento experimental eficiente ;
• Unidades experimentais homogêneas;
• Tamanho das parcelas.

Em outras palavras,

• Repetição de unidades experimentais;


• Uniformidade da amostra;
• Uniformidade do meio;
• Uniformidade na aplicação do tratamento.
Do ponto de vista estatístico, qual seria o “passo a passo” para um
bom planejamento de experimento ?

1 – Enunciar o problema e formular as hipóteses;


2 – Escolher os tratamentos e respectivos níveis a serem testados no
experimento e dos seus respectivos;
3 – Escolher a unidade experimental e a unidade de observação;
4 – Escolher as variáveis a serem medidas no experimento;
5 – Determinar as regras de atribuição dos tratamentos as unidades
experimentais. (escolha do tipo de delineamento de experimento );
6 – Determinar o número de repetições;
7 – Desenhar o croqui do experimento;
8 – Escolha do método estatístico correto para análise dos dados.
1 – Enunciar o problema e formular
as hipóteses
Comparar a expressão gênica de plantas inoculadas
com plantas não-inoculadas

Hipóteses a serem testadas:

H0: A expressão gênica das plantas inoculada é igual


a expressão gênica das plantas não inoculada.

CONTRA

H1: A expressão gênica das plantas inoculada é diferente


da expressão gênica das plantas não inoculada.
2 – Escolher os tratamentos e
respectivos níveis a serem testados
no experimento;

• Plantas Inoculadas (I)

• Plantas Não Inoculadas (NI)


3 – Escolher a unidade experimental e a
unidade de observação;

Unidade experimental : Bandejas

Unidade de observação : pool de X plantas


4 - Escolher as variáveis a serem medidas
no experimento;

Será mensuradas a seguinte variável:

• Expressão gênica obtida via PCR em tempo real.


5. Determinar as regras de atribuição dos
tratamentos as unidades experimentais.

Como irei atribuir os tratamentos as parcelas de soja?


SIM necessidade NÃO
de um controle
local?
Delineamento em Delineamento
Blocos Casualizados Inteiramente Casualizado

Por exemplo: Há algum efeito


de ambiente que deve ser A área experimental é homogênea
controlado?
6. Determinar o número de repetições;

O número ótimo de repetições depende de vários fatores:

 variabilidade do meio em que se realiza o experimento;


 confiabilidade desejada para o experimento;
número de tratamentos em estudo;
 recursos financeiros, físico, humano, etc.

Na literatura é possível encontrar vários métodos:

Ensaios de uniformidade;
Métodos de simulação;
Métodos baseados em ensaios anteriores;
Curvas Características de Operação;
 Método de Neyman; de Harris, Horvitz e Mood; de Cochram e Cox, de Tang.
Determinando o número de repetições

Um bom experimento tenta estimar o grau de precisão


que será alcançado e apresenta essa informação
como parte da proposta do experimento!
Número de repetições para calcular
diferenças entre médias

r > 2(t1 + t2)2σ2 / d2


Pode ser expresso
método de Cochran e Cox como percentagem
da média (CV) ou
Em que r = número de repetições;
na escala original

t1 = Valor na tabela t ao nível de significância desejado com


k*(r-1) graus de liberdade;

t2 = Valor na tabela t correspondendo a 2(1-P), onde P é a


probabilidade desejada de obter um resultado significante;
(note que 1-P is β, a probabilidade do erro do tipo II)

σ = desvio padrão (ou CV%);

d = a diferença que se deseja detectar.


r > 2(t1 + t2)2CV2 / d2
Exemplo de cálculo
 Vamos voltar ao nosso exemplo onde queremos
comparar a expressão gênica entre plantas inoculadas e
não inoculadas. Supondo que um experimento anterior
forneceu um CV de 11%

 Quantas réplicas são necessárias para detectar diferença


de 20% com probabilidade de 0.85, a um nível de
significância de 5%.
Vamos começar com r=4 réplicas ( df = 2trat * (4-1)rep= 6)

qt( 0.05/2, k(r-1) )


t1 = abs(qt(0.025,6)) =2.447
r > 2(2.447+1.134)2(11)2/(20)2
qt( 2*(1-P) , k(r-1) ) r > 7.76 ~ 8
t2= abs(qt(0.15/2,6)) = 1.134
r > 2(2.145+1.076)2(11)2/(20)2
Então, vamos testar com 8 (14 df)
r > 6.28 ~ 7
Testando com 7  r > 6.44 ~ 7 (convergiu)
Regra prática para o cálculo do
número de repetições
Uma regra prática, que tem surtido bons resultados na
experimentação agrícola e zootécnica, é a de que os ensaios
devem ter, no mínimo, 20 parcelas e/ou 15 graus de liberdade
para o resíduo ou erro experimental.

Vamos supor que o experimento foi feito em esquema inteiramente


casualizado (DIC), são dois tratamentos, então...

kr – k ≥ 15
2r ≥ 15
r≥8

Deve-se ter GL suficientes para uma estimativa


representativa do erro experimental. Experimentos com
poucos tratamentos necessitam de maior número de
repetições para se ter GL suficientes para o erro
experimental.
Voltando em: 6. Determinar o
número de repetições;

 Segundo o método de Cochran e


Cox, deve-se realizar no mínimo 7
repetições para cada tratamento;

 Segundo a regra prática, deve-se


realizar no mínimo 8 repetições
para cada tratamento testado.
8 – Desenhar o croqui

Atribuição cega!!!!
1º – Atribuir os tratamentos às unidades experimentais
Sorteio:
-Programa estatístico (sugestão:R)
-Urna
- Dados
Sorteando em R
sample(1:14,14,replace=F)

14 10 4 13 2 8 12 11 3 7 6 9 5 1
Parcelas

Tratamento Testemunha

Ou ainda, sortear conforme disposição da bandeja


sorteio=sample(1:14,14,replace=F)
matrix(sorteio,nrow=2,ncol=7)

Perceba que estamos considerando um experimento em esquema


inteiramente casualizado. Se decidíssemos blocar o experimento em
duas partes, pela regra prática o número de repetições deveria ser
baseado nos g.l (k-1)(r-1).
8- Análise Correta dos Dados
Relacionando a variável quantitativa com os fatores
qualitativos dos tratamentos
Estudar o
comportamento
da variável
resposta
Anodev/Modelos
Lineares
Generalizados (MLG)

Sim Tem Não


Anova
Paramétrica Normalidade ?

Modelos
Não-Paramétricos

Contrastes se FIM
necessário
Analisar a Contrastes se
qualidade do necessário
modelo
Relacionando a variável quantitativa com os fatores
quantitativos dos tratamentos
Estudar o
comportamento
da variável
resposta

Tem Não
Modelo de Modelos de
Normalidade ?
Regressão Regressão /MLG
Paramétrico
Ou Superfície
de Resposta

Analisar a
qualidade do
modelo
Análise Multivariada
As mais usadas:

• Análise de Correspondência;

• Análise de Cluster;

• Análise de Componentes Principais;

• Análise Fatorial.
Duas referências básicas:
GOMES, F.P. Curso de estatística experimental

VIEIRA, S. & HOFFMANN, R. Estatística Experimental

Apostilas do R na internet:

http://www.estatisticanor.xpg.com.br/3.html

http://leg.ufpr.br/Rpira/Rpira/

http://cran.r-project.org/doc/contrib/Beasley-BioestatisticaUsandoR.pdf

Site para baixar o R:


http://www.r-project.org/
OBRIGADA!

Você também pode gostar