Bioestatistica

Fazer download em docx, pdf ou txt
Fazer download em docx, pdf ou txt
Você está na página 1de 12

1.

1 Introdução

A estatística não paramétrica pode ser definida como uma coleção alternativa de
métodos estatísticos aplicada a conjuntos de dados onde as condições necessárias para
aplicação de uma técnica clássica inferencial por exemplo: (Intervalo de Confiança,
Teste de Hipótese) não são satisfatoriamente atendidas. É também bastante útil no
tratamento de dados onde o nível de mensuração das observações não é dos melhores.
ANA M. ABREU – (2006/07).

O presente trabalho de pesquisa da cadeira de bioestatística, curso de licenciatura em


Agropecuária 1º ano. Importa referir que o trabalho obedecera a seguinte sequência:
conceito de estatística não paramétrica, teste binominal, teste de aderência do
qui˗quadrado

1.2 Objectivo geral

 Estudar a estatística não paramétrica.

1.3 Objectivo especifico

 Conhecer o teste binominal;


 Conhecer as vantagens e as desvantagens;
 Conhecer o teste de aderência do qui˗quadrado;

1.4 Metodologia

Para realizacao deste trabalho foram usados os seguintes metodos de consulta de


manuais, pesquisa nas plataformas digitais (internet).

1
2.1 Estatística não paramétrica

A estatística não paramétrica pode ser definida como uma coleção alternativa de
métodos estatísticos aplicada a conjuntos de dados onde as condições necessárias para
aplicação de uma técnica clássica inferencial por exemplo: (nível de Confiança, Teste
de Hipótese) não são satisfatoriamente atendidas. É também bastante útil no tratamento
de dados onde o nível de mensuração das observações não é dos melhores. ANA M.
ABREU – (2006/07)

Na estatística, o termo Estatística não paramétrica refere se as estatísticas que não


possuem dados ou população com estruturas ou parâmetros característicos.

O primeiro significado de ‘’Não paramétrica ‘’ abrange técnicas que não dependem de


dados pertencentes a nenhuma distribuição particular.

2.2 Parâmetro

É um valor desconhecido, associado à uma população, que se deseja estimar ou estudar.

2.3 Nível de Confiança

É a probabilidade de abrangência do intervalo de confiança para certo parâmetro.

2.4 Hipótese Nula (H0)

É uma afirmação acerca do parâmetro (ou parâmetros) em questão que expressa sempre
uma posição conservadora, em forma de igualdade, que geralmente se deseja rejeitar.
No caso não-paramétrico estas afirmações nem sempre se referirão a parâmetros,
estando associadas ao interesse do pesquisador.

2.5 Hipótese Alternativa (Ha)

É a hipótese que se deseja testar, expressa sempre em oposição à hipótese nula. As


evidencias amostrais auxiliam a sua definição.

2.6 Teste de Hipótese

É uma regra de decisão que, com base na amostra, irá rejeitar ou não H0.

2.7 Região Crítica

É um subconjunto de valores tão extremos, que nos leva a rejeição da hipótese nula.

2
2.8 Erro Tipo I

Ocorre quando se rejeita H0 quando na verdade esta hipótese é verdadeira. A


probabilidade do Erro Tipo I (α) é chamada nível de significância.

2.9 Erro Tipo II

Ocorre quando H0 não é rejeitada quando na verdade deveria ter sido. A probabilidade
do Erro Tipo II é representada por β.

 Posto (Rank)

Quando se atribui às observações originais, números correspondentes às suas posições


na classificação (ranking em ordem crescente). Cada número é chamado de posto.

3
3.1. Vantagens

 Dispensam Normalidade dos dados;


 O valor é exato (no caso paramétrico o cálculo do p-valor se baseia na
distribuição Normal);
 São testes mais simples;
 São úteis quando é difícil estabelecer uma escala de valores quantitativa para os
dados;
 São mais eficientes que os paramétricos quando não existem normalidade.

3.2 Desvantagens

 Proporcionam um desperdício de informações, já que em geral não consideram


a magnitude dos dados;
 Quando as suposições do modelo estatístico são atendidas são menos eficientes
que os paramétricos;
 A utilização das tabelas dos testes.
 São testes mais simples;
 São úteis quando é difícil estabelecer uma escala de valores quantitativa para os
dados;
 São mais eficientes que os paramétricos quando não existem normalidade.
 Proporcionam um desperdício de informações, já que em geral não consideram a
magnitude dos dados;
 Quando as suposições do modelo estatístico são atendidas são menos eficientes
que os paramétricos;
 A utilização das tabelas dos testes.

3.3 Níveis de mensuração

 Escala Nominal

É o mais baixo nível de mensuração. Utiliza símbolos ou números simplesmente para


distinguir elementos em diferentes categorias (como um nome), não havendo entre eles,
geralmente, possibilidade de comparação do tipo maior-menor, melhor-pior).
Estatística Não paramétrica. ANA M. ABREU – (2006/07)

4
Exemplos:

• masculino (M), feminino (F)

• Perfeito (1), Defeituosa (0)

•. Europeu (1), Americano (2), Africano (3), Asiático (4)

 Escala Ordinal

Utiliza números apenas para classificarmos elementos numa ordem crescente ou


decrescente. Existe assim algum tipo de relação entre as categorias embora a diferença
entre elas seja de difícil quantificação.

Exemplos:

• Classes sócio - econômicas: (A, B, C, D, E)

• Patentes do Exército (soldado, cabo, sargento,)

• Opinião de um determinado produto (Ruim, Regular, Bom, muito bom, Excelente)

 Escala intervalar (Intervalo de medida)

Ocorre quando a escala tem as características da escala ordinal e ainda é possível


quantificar a diferença entre dois números desta escala.

Exemplo: Temperatura, Peso, Altura, Rendimentos

obs.: alguns autores apontam ainda a existência de outra escala: a Escala de Razão,
equivalente a escala intervalar, porém, o valor zero é o verdadeiro ponto de origem.

5
4.1 Teste binomial

É aplicado em amostras provenientes de populações que se constituem de apenas 2


categorias (variáveis dicotômicas). Os experimentos binomiais se caracterizam por nas
repetições independentes com probabilidade constante de sucesso.

Exemplo: (masculino, feminino), (negativo, positivo), (defeituoso, perfeita) é útil para


verificar se a proporção de sucesso p observada na amostra indica que ela pode
pertencer a uma população com uma determinada probabilidade de sucesso. PAULO
GUIMARÃES (2003)

 Pressupostos

Cada observação é classificada como sucesso ou fracasso;

A probabilidade p de sucesso não se altera com a repetição do experimento as tentativas


são independentes.

 O Método

Este método irá calcular a probabilidade da variável de interesse apresentar resultados


mais extremos do que os observados.

Inicia-se com a formulação das hipóteses:

Determinar n, número de repetições;

Determinar a frequência observada (x);

Esta probabilidade equivale ao p-valor. Caso p < α, rejeita-se H0.

Exemplo 1 - 0,5 :0,5:0 =< Hpp versus H a; x = 5 (número de sucessos em n=11


tentativas). Considera-se x como sendo o número de sucessos observados.

Não se rejeita a hipótese nula. O p-valor (0,5) é considerado alto, muito superior aos
níveis usuais de significância.

Obs: Caso 25 >n e 2 1≈p ou 9 ≥npq, deve-se utilizar a aproximação pela distribuição
Normal:

Obs: neste caso, os procedimentos para pequenas e grandes amostras, devem fornecer
resultados muito próximos. Deve-se enfatizar, no entanto, que o p-valor exato será
aquele obtido utilizando a metodologia para pequenas amostras, sem utilizar

6
aproximação para uma distribuição de probabilidade teórica. Com o desenvolvimento
de recursos computacionais cada vez mais precisos, muitas vezes perde o sentido
utilizar a aproximação pela Normal. Isto vale para todas as demais situações
apresentadas neste material, onde se apresenta o procedimento para grandes amostras. E
também na Estatística Não paramétrica encontramos os
Comentários que é a técnica mais poderosa aplicável a dados medidos em escala
nominal e ainda por cima dicotômicos. Quando a variável aleatória em estudo é
contínua e procede-se uma dicotomizacão haverá certamente perda de eficiência.
PAULO GUIMARÃES (2002).

4.2 Teste de qui-quadrado (x²)

É um teste amplamente utilizado em análise de dados provenientes de experimentos


onde o interesse está em observar frequências em diversas categorias é igual a 2 (k=2).
É uma prova de aderência útil para comprovar se a frequência observada difere
significativamente da frequência esperada, esta geralmente especificada por uma
distribuição de probabilidade.

 Exigências do Teste

Quando o número de categorias é igual a 2 (k=2) as frequências esperadas devem ser


superiores a 5;

Quando k > 2, não deve haver mais de 20% das frequências esperadas abaixo de 5 e
nenhuma frequência esperada igual a zero;

Para evitar frequências esperadas pequenas deve-se combinar as categorias (juntar) até
que as exigências sejam atendidas;

Caso as categorias sejam combinadas em apenas duas e mesmo assim as exigências não
tenham sido atendidas, deve-se utilizar o Teste Binomial;

As observações devem ser independentes.

 O Método

Após se definir a hipótese nula como a proporção esperada definida pela distribuição de
probabilidade em questão, testa-se se as frequências observadas diferem muito das
frequências esperadas da seguinte forma:

7
Quanto maior o valor de χ² maior é a probabilidade das frequências observadas

divergirem das frequências esperadas. A estatística do teste χ² tem distribuição Qui-


Quadrado

com ν graus de liberdade onde:

as frequências esperadas puderam ser calculadas sem precisar estimar os parâmetros


distribucionais;

se as frequências esperadas só puderem ser calculadas após a estimação dos m


parâmetros populacionais. ANA M. ABREU – (2006/07)

4.3 Teste de kolmogorov – (Smirnov)

Este teste de aderência proposto em 1933 avalia a concordância entre a distribuição


observada da amostra e uma determinada distribuição teórica. Avalia se os dados
amostrais se aproximam razoavelmente de uma determinada distribuição. Para isso
utiliza-se a função distribuição acumulada observada, compara-se com a teórica,
determina-se o ponto em que estas distribuições mais divergem, e testa-se se essa
divergência é significativa ou não.

 Exigência do Teste

Os dados devem seguir ao menos uma escala ordinal.

O método seja FX 0 uma distribuição teórica acumulada e SX n uma distribuição


acumulada observada em uma amostra de nas observações. Encontra-se a seguir o
maior valor das diferenças entre FX 0 e SX n, ou seja, SXFXD Max n=− 0

4.4 Estatística Não paramétrica

Exemplo 1: num experimento para calibrar a luminosidade adequada de uma nova


máquina fotográfica, foram tiradas 5 fotos de cada uma das 10 pessoas que participaram
do experimento. A cada pessoa perguntou-se qual das fotos apresentava uma qualidade
maior, de 1 a 5, onde 1 representa um grau baixo e 5 um grau alto de luminosidade.
PAULO GUIMARÃES (2003).

indivíduos apresentam preferência significativa em relação ao grau de luminosidade.

Exemplo 2: verifique se os dados abaixo podem ser ajustados por uma distribuição de
Poisson com média igual a 1,2.
8
Como vimos no exemplo acima os dados foram agrupados em classes (x), onde era
associado a cada valor x1 a sua respectiva frequência x é. Este teste também pode ser
aplicado quando as classes são definidas por intervalos; no entanto desta forma ele
perde em precisão.

4.5 Teste de lilliefors

No caso em que se deseja testar normalidade e a média e a variância não são


previamente especificadas, mas sim estimadas através dos dados da amostra, deve-se
utilizar o teste de Lilliefors. Este teste tem procedimento análogo ao Kolmogorov –
Smirnov porém utiliza uma tabela própria e mais adequada a este tipo de situação.

4.6 Teste de aleatorização das iterações

Para comprovar a propriedade de aleatoriedade de uma amostra utilizamos o teste de


aleatorização, que faz uso da análise das iterações (sequência de símbolos idênticos).

Este teste, basicamente, verifica o número de iterações existentes na amostra; se o


número de iterações é muito grande ou muito pequeno sugere-se falta de aleatoriedade.
PAULO GUIMARÃES (2002).

 Exigência do Teste

Exige-se ao menos que os dados sigam uma escala nominal e que eles possam ser
divididos em duas categorias.

 Método

Seja n1 o número de elementos da categoria 1, n2 o número de elementos da categoria 2


e N = n1 + n2.

Se n1 e n2 < 20 verificamos o número é de iterações, obtemos os limites inferior e


superior, que definem o número aceitável de iterações em caso de aleatoriedade (Tábua
F1 e F2 – Siegel) se n1.

9
4.7 Testes para duas amostras relacionadas (dependentes)

Muitas vezes se tem interesse na avaliação do efeito de um tratamento. No entanto,


utilizando dois grupos independentes para isso, é possível que ocorram disparidades
entre os elementos dos grupos. Para evitar isso, é comum proceder algum tipo de
pareamento entre os indivíduos. O tipo mais comum de pareamento é utilizando cada
indivíduo como seu próprio controle, submetendo-o aos dois tratamentos em momentos
diferentes. Outro tipo de pareamento é tentar selecionar, para cada par, indivíduos que
sejam tão semelhantes quanto possível. Por exemplo: Gêmeos, órgãos (ouvidos, braços,
pés etc..). Os testes não paramétricos apropriados a experimentos com amostras
relacionadas são os seguintes:

4.8 Teste de mcnemar

É um teste aplicável a situações do tipo “antes e depois” onde cada indivíduo é


observado duas vezes: antes e depois de certo tratamento e deseja-se testar a sua
eficiência. Cada indivíduo se encaixa em uma das duas categorias de resposta, antes e
depois do tratamento. Este teste avalia se as mudanças de uma categoria para outra são
significativas. PAULO GUIMARÃES (2003).

 Exigências do Teste

Dados em escala nominal ou ordinal (dicotômicos);

Os pares (ii XY,) são mutuamente independentes onde i X representa a situação “pré” e
i Y representa a situação “pós” do i-ésimo indivíduo.

 Método

As frequências observadas no experimento devem ser classificadas no quadro abaixo:

Depois Antes A B A a b a + b B c d c + d a + c b + d

A hipótese nula afirma que as mudanças ocorridas nos dois sentidos não são
significativamente diferentes. PAULO GUIMARÃES (2002).

10
5.1 Conclusão

A partir do momento no qual se optou por trabalhar com o tema: estatísticas não
paramétricas concluiu-se que a estatística não paramétrica pode ser definida como uma
coleção alternativa de métodos estatísticos aplicada a conjuntos de dados onde as
condições necessárias para aplicação de uma técnica clássica inferencial, também que
na estatística não paramétrica existem lá vários testes que são teste binominal, teste
quiquadrado.

11
Referência bibliográfica

PAULO GUIMARÃES estatísticas não paramétricas (2003)

LIVRO: Grande Maratona de Estatística no SPSS Andreia Hall, Cláudia Neves e


António Pereira Teste Binomial PAULO GUIMARÃES (2002)

ANA M. ABREU – (2006/07) manual de estatísticas não paramétricas 1ª edição

12

Você também pode gostar