Bio 3
Bio 3
Bio 3
Unidade 3
Noções de Inferência
estatística
CEO
Diretora Editorial
ALESSANDRA FERREIRA
Gerente Editorial
Projeto Gráfico
TIAGO DA ROCHA
Autoria
4 BIOESTATÍSTICA
Esses ícones aparecerão em sua trilha de aprendizagem nos seguintes casos:
ÍCONES
No início do Caso haja a
desenvolvimento necessidade de
de uma nova apresentar um novo
OBJETIVO competência. DEFINIÇÃO conceito.
Quando são
Se as observações
necessárias
escritas tiverem que
observações ou
IMPORTANTE ser priorizadas.
NOTA complementações.
Se existirem
Se algo precisar ser curiosidades e
Unidade 3
melhor explicado ou indagações lúdicas
EXPLICANDO detalhado. sobre o tema em
MELHOR VOCÊ SABIA?
estudo.
Se houver a
necessidade de Quando for preciso
chamar a atenção fazer um resumo
sobre algo a cumulativo das últimas
REFLITA ser refletido ou RESUMINDO abordagens.
discutido.
BIOESTATÍSTICA 5
Teste de hipótese .................................................................... 10
SUMÁRIO
Teste de hipóteses............................................................................... 12
6 BIOESTATÍSTICA
Você sabia que a capacidade de interpretar dados e
APRESENTAÇÃO
aplicar métodos de inferência estatística está se tornando cada
vez mais valiosa no mercado de trabalho atual? Em um mundo
dominado por big data e análise preditiva, as habilidades em
bioestatística abrem portas para oportunidades de carreira em
diversos setores, desde a saúde pública e pesquisa biomédica
até a indústria farmacêutica e organizações de saúde. Esses
profissionais são fundamentais para traduzir números em
insights que podem moldar políticas de saúde, direcionar
inovações médicas e melhorar resultados de tratamentos.
A demanda por especialistas capazes de realizar análises
estatísticas complexas e interpretar seus resultados está em
ascensão, tornando a bioestatística uma área promissora para
Unidade 3
estudantes de graduação.
BIOESTATÍSTICA 7
Prepare-se para uma jornada pelo fascinante mundo
da inferência estatística em bioestatística, onde a matemática
encontra a medicina, e os números contam histórias que podem
salvar vidas. Este é um campo dinâmico e desafiador, que promete
não só enriquecer seu conhecimento acadêmico, como também
equipá-lo com habilidades práticas altamente valorizadas no
mercado de trabalho. Vamos começar?
Unidade 3
8 BIOESTATÍSTICA
Olá. Seja muito bem-vindo à Unidade 3. Nosso objetivo
OBJETIVOS
é auxiliar você no desenvolvimento das seguintes competências
profissionais até o término desta etapa de estudos:
Unidade 3
BIOESTATÍSTICA 9
Teste de hipótese
Neste capítulo, abordaremos a competência
essencial em bioestatística: definir os testes de
hipóteses. Esse conceito é a pedra angular na
OBJETIVO análise de dados e interpretação de resultados em
pesquisa científica. Compreender os fundamentos
dos testes de hipóteses, os diferentes tipos
de testes disponíveis e como tomar decisões
estatísticas baseadas em dados é importante para
qualquer profissional que trabalha com pesquisa
em ciências da saúde. Ao dominar esses conceitos,
você estará equipado para avaliar a significância
de seus achados de pesquisa de forma confiável e
precisa. Muitos pesquisadores enfrentam desafios
Unidade 3
10 BIOESTATÍSTICA
Aprofundando-nos, Siqueira e Tibúrcio (2011) discorrem
sobre a terminologia específica dessa área, como os erros do
tipo I e II, que são relevantes para o entendimento dos riscos
associados às decisões estatísticas. A distinção entre esses erros,
onde o tipo I representa a rejeição incorreta da hipótese nula e o
tipo II a falha em rejeitar uma hipótese nula falsa, é fundamental
para a definição de estratégias de análise e para a interpretação
correta dos resultados de uma pesquisa.
Unidade 3
dos resultados obtidos em pesquisas científicas, em que a decisão
de rejeitar ou não a hipótese nula deve ser tomada com base em
critérios estatísticos rigorosos.
BIOESTATÍSTICA 11
Teste de hipóteses
No cerne da bioestatística, os testes de hipóteses
representam uma ferramenta indispensável para a análise de
dados e a tomada de decisões baseada em evidências científicas.
Sampaio (2010) nos introduz a essa temática ao destacar a
aplicação dos testes de hipóteses em experimentação animal,
ressaltando sua importância para assegurar a aplicabilidade e
relevância desses resultados no contexto mais amplo da pesquisa
em saúde.
Quantitativa Qualitativa
12 BIOESTATÍSTICA
Quadro 3.2 – Variáveis quantitativas x qualitativas
Unidade 3
um procedimento padrão para testar uma afirmativa sobre uma
propriedade da amostra. A construção de afirmativas com base na
observação de fenômenos é parte essencial do método científico.
Logo, antes de apresentar as etapas de um teste de hipótese
primeiramente é importante definir alguns conceitos.
BIOESTATÍSTICA 13
• σ: desvio padrão populacional, definido como a raiz
quadrada dos somatórios dos desvios elevados ao
quadrado divididos pelo número elementos da amostra.
14 BIOESTATÍSTICA
utilizados em todos os testes estatísticos. As etapas de um teste
de hipótese são:
a. Estabelecer as hipóteses:
I) Teste unilateral:
H0: μ ≥3,32
H1: μ<3,32
Unidade 3
H0: μ=3,32
H1: μ≠3,32
BIOESTATÍSTICA 15
possibilita a tomada de decisão sobre as hipóteses traçadas
previamente. O valor de probabilidade (“p - valor”) é definido
como a probabilidade de se obter um valor da estatística de teste
que seja, no mínimo, tão extremo quanto o que representam os
dados amostrais, supondo a hipótese nula verdadeira. Sendo
assim, fixando o nível de significância em 0,05 (5%), se o p-valor
for menor que 0,05, rejeita-se a hipótese nula.
16 BIOESTATÍSTICA
A capacidade de definir e aplicar corretamente os
testes de hipóteses é indispensável no campo da
bioestatística, servindo como base para a tomada
RESUMINDO de decisões informadas em pesquisas. Este capítulo
inicia com uma exploração dos fundamentos
dos testes de hipóteses, estabelecendo uma
compreensão sólida dos conceitos-chave, como
hipótese nula e alternativa, e a importância de
distinguir entre erros tipo I e II. Segue-se uma
análise dos tipos de testes de hipóteses, onde
discutimos as diferenças e aplicações de testes
paramétricos e não paramétricos, além de quando
utilizar abordagens unilaterais ou bilaterais.
Por fim, a seção sobre decisão estatística e
interpretação orienta sobre como interpretar
resultados estatísticos, enfatizando a importância
Unidade 3
da significância estatística e do valor-p na validação
de conclusões de pesquisa.
Este capítulo é projetado para cultivar uma
compreensão profunda dos testes de hipóteses,
equipando você com as ferramentas necessárias
para aplicá-los de maneira eficaz em sua própria
pesquisa. Ao longo da leitura, questionamos: como
a escolha entre diferentes tipos de testes influencia
os resultados da pesquisa? E qual a relevância da
interpretação correta dos resultados para a ciência
como um todo?
Entender os princípios e práticas detalhados aqui
não apenas aprimora sua habilidade em realizar
análises estatísticas robustas, mas também
prepara você para enfrentar os desafios comuns
encontrados na pesquisa científica. Ao dominar
esses conceitos, você garante a integridade e a
confiabilidade dos resultados de suas investigações,
contribuindo significativamente para o avanço do
conhecimento na sua área de especialização. E
então? Gostou do que lhe mostramos? Aprendeu
mesmo tudinho? Agora, só para termos certeza de
que você realmente entendeu o tema de estudo.
BIOESTATÍSTICA 17
Intervalo de confiança da
média
Neste capítulo, nos aprofundamos em como
interpretar o que é o intervalo de confiança da
média, uma habilidade essencial para profissionais
OBJETIVO que trabalham com análise de dados na área da
saúde. O entendimento correto do intervalo de
confiança permite avaliar a precisão de estimativas
estatísticas e tomar decisões informadas baseadas
em dados coletados. Muitos profissionais
enfrentam desafios ao interpretar resultados
de pesquisa sem uma compreensão adequada
deste conceito, o que pode levar a conclusões
errôneas e decisões mal-informadas. Ao término
Unidade 3
18 BIOESTATÍSTICA
associada a uma estimativa de parâmetro. Sampaio (2010) aborda
esse tema enfatizando a importância do intervalo de confiança
na experimentação animal, em que a precisão das estimativas é
importante para a interpretação correta dos resultados e para a
tomada de decisões informadas.
Unidade 3
Siqueira e Tibúrcio (2011) complementam essa discussão,
detalhando o significado do nível de confiança associado ao
intervalo. Eles explicam que um intervalo de confiança de 95%, por
exemplo, significa que, em 95% das amostras, o intervalo conterá
o verdadeiro valor do parâmetro. Essa interpretação ajuda os
pesquisadores a compreenderem e comunicarem a incerteza de
suas estimativas de forma clara e objetiva.
BIOESTATÍSTICA 19
tomada de decisões baseadas em evidências na área da saúde.
Sampaio (2010), Shahbaba (2012), Siqueira e Tibúrcio (2011),
Pagano e Gauvreau (2004) e Zar (1999) fornecem uma base sólida
para a compreensão desse conceito, destacando sua importância
na bioestatística e na pesquisa em saúde.
20 BIOESTATÍSTICA
necessidade de considerar tanto a precisão das estimativas
quanto a confiabilidade dessas estimativas. A compreensão desses
conceitos é vital para a interpretação apropriada dos resultados
de pesquisa e para a tomada de decisões baseadas em evidências
na prática da saúde.
Unidade 3
e desvio padrão de 190, e que a partir desses valores originais,
geraremos vários valores correspondentes às médias de 9 e 25
observações sorteadas aleatoriamente do conjunto original,
representados na segunda e terceira colunas da tabela a seguir:
Tabela 2.1 – Demonstração do número de observações de uma variável
Desvio Desvio
Média de 9 Média de 25
Simulação Padrão de 9 Padrão de 25
Observações Observações
Observações Observações
BIOESTATÍSTICA 21
com a distribuição de médias obtidas a partir de 25 valores iniciais,
com uma instabilidade (desvio padrão) ainda menor. Entretanto,
as médias para as 3 distribuições serão as mesmas, pois retratam
sempre o mesmo fenômeno. O valor do desvio, porém, diminui à
medida que o número de observações (n), utilizadas para o cálculo
do valor médio, aumenta.
Mas Var (X1) = Var (X2) = Var (Xn) pois se trata da mesma
resposta que está sendo estudada e Var(X) = s2, logo:
22 BIOESTATÍSTICA
Entretanto, na experimentação, o valor médio encontrado
se baseia em um número restrito de observações. Como o valor
de 1,96 se refere à distribuição de valores médios de grandes
grupos (n≥120), e o desvio da distribuição de médias aumenta à
medida que n diminui, uma correção no valor de z = 1,96 deverá
ser feita para garantir a definição precisa de uma área central de
95% que constituir-se-á no intervalo de confiança da média obtida
de n observações.
Logo, a distribuição de médias obtidas de 10 observações
terá um desvio padrão maior (s√10) do que aquelas obtidas de
120 observações (s√120). Nesse sentido, a distribuição normal
apresentar-se-á com maior dispersão e os 95% dos valores médios
Unidade 3
possíveis estarão inclusos em um intervalo mais amplo que o de
-1,96 a 1,96, no caso de -2,262 a 2,262.
BIOESTATÍSTICA 23
Imagem 3.1 – Vetor de dados planta A
> PlantaA <- c(2.20, 3.83, 3.71, 3.49, 3.87, 2.59, 4.72,
+ 3.72, 1.15, 0.68, 0.35, 5.43, 5.66, 1.66, 1.83, 0.81,
+ 2.93, 1.22, 4.01, 4.53, 1.69, 3.50, 2.59, 5.63, 4.27,
+ 1.05, 1.97, 1.36, 2.83, 0.76, 3.09, 4.06, 2.85, 5.92,
+ 5.23, 2.53, 2.37, 5.78, 2.64, 0.81, 2.99, 2.54, 2.11,
+ 2.45, 0.98, 3.71, 1.86, 4.01, 3.06, 4.28)
> qqnorm (PlantaA)
> qwline (PlantaA, lty=2)
> shapiro.test (PlantaA)
Shapiro-Wilk normality test
Data: PantaA
W = 0.96767, p-value = 0.1858
Unidade 3
24 BIOESTATÍSTICA
compreensão mais profunda da variabilidade e da incerteza
associadas às estimativas estatísticas.
Sampaio (2010) enfatiza que o intervalo de confiança
fornece mais do que uma simples estimativa de parâmetro; ele
oferece uma faixa dentro da qual o verdadeiro valor do parâmetro
de interesse é esperado estar com um determinado nível de
confiança. Essa interpretação é fundamental na prática clínica e
na pesquisa em saúde, onde decisões muitas vezes precisam ser
tomadas sob condições de incerteza.
A interpretação do intervalo de confiança deve considerar
o contexto dos dados e do estudo. Por exemplo, um intervalo de
confiança estreito pode indicar uma estimativa precisa da média,
mas também deve ser avaliado em relação ao tamanho da amostra
e à variabilidade dos dados. Um intervalo mais amplo, por outro
Unidade 3
lado, pode refletir maior incerteza sobre a estimativa, mas isso
não diminui necessariamente o valor dos resultados se o intervalo
ainda indicar uma diferença ou efeito clinicamente significativo.
Outro ponto é a necessidade de comunicar claramente
a interpretação dos intervalos de confiança aos stakeholders
da pesquisa, incluindo colegas de profissão e formuladores de
políticas. Eles argumentam que uma compreensão clara do que o
intervalo de confiança realmente representa pode ajudar a evitar
mal-entendidos e a promover decisões mais informadas.
A interpretação prática do intervalo de confiança envolve
compreensão dos limites numéricos fornecidos pelo intervalo,
além da avaliação de sua relevância clínica ou de pesquisa. Isso
significa considerar o intervalo de confiança no contexto das
questões de pesquisa específicas, dos objetivos do estudo e das
implicações potenciais dos resultados.
Portanto, essa interpretação na prática transcende a
simples análise numérica. Ela exige uma integração da análise
estatística com o raciocínio clínico e científico, permitindo aos
pesquisadores e profissionais da saúde fazer inferências mais
BIOESTATÍSTICA 25
robustas e fundamentadas sobre seus dados. Ao aplicar essa
competência com eficácia, pode-se melhorar significativamente a
qualidade da pesquisa em saúde e a tomada de decisões baseada
em evidências.
26 BIOESTATÍSTICA
Testes para inferência sobre
uma amostra
Neste capítulo, mergulhamos na competência de
preparar testes de hipóteses sobre uma amostra,
um pilar fundamental na pesquisa científica e
OBJETIVO na análise de dados. A habilidade de planejar,
executar e analisar corretamente os testes de
hipóteses valida teorias e hipóteses com rigor
estatístico. Muitos pesquisadores e profissionais
encontram desafios significativos ao tentar
aplicar esses conceitos sem uma compreensão
aprofundada, levando a interpretações errôneas
dos dados e, consequentemente, a conclusões
inválidas. Ao término deste capítulo, você será
Unidade 3
capaz de entender como funciona o processo de
teste de hipóteses, desde seu planejamento até
a análise dos resultados. Isso será fundamental
para o exercício de sua profissão, permitindo que
você conduza pesquisas com maior confiança e
precisão. As pessoas que tentaram realizar testes
de hipóteses sem a devida instrução tiveram
problemas ao interpretar os resultados e ao
tomar decisões baseadas em dados. E então?
Motivado para desenvolver esta competência?
Vamos lá. Avante!
Planejamento do Teste de
Hipóteses
Em um estudo sobre um determinado tipo de planta
específica do cerrado, após o plano de amostragem, foram medidas
as alturas de cada planta. Deseja-se, então, uma estimativa
pontual do valor médio da altura, ou seja, uma estimativa da altura
média populacional. É de interesse, ainda, obter uma estimativa
BIOESTATÍSTICA 27
intervalar e verificar se a média encontrada é equivalente à média
apresentada em outros estudos teóricos. Mas, então, como
responder a essas questões? Quais são as possibilidades de teste
que existem para responder se a média encontrada é equivalente
à média apresentada em outros estudos teóricos? Quais são as
suposições dos testes? Observe o fluxograma a seguir:
Imagem 3.2 – Suposições dos testes para uma amostra
Teste ‘‘Z’’
A variância populacional
é conhecida?
Teste ‘‘T’’
Unidade 3
A população
respeita um
distribuição
normal?
Utilizar métodos
não paramétricos
Teste “Z”
Em um primeiro momento, veja a seguir as alturas
da planta “A” armazenadas em um vetor da Imagem 3.2.
O conhecimento sobre a variância de uma amostra possivelmente
não existe na prática, porém, a título teórico, suponha que a
28 BIOESTATÍSTICA
variância populacional seja de 2,25, ou seja, o desvio padrão
populacional da altura da planta “A” de 1,5. Deve-se verificar se os
dados da altura da planta “A” são normalmente distribuídos. Para
isso, foram utilizados o quantile-quantile plot (Q-Q plot) e o teste
de Shapiro-Wilk. Com o gráfico de Q-Q plot e o teste de Shapiro-
Wilk, pode-se afirmar que existem evidências de que a amostra
da planta “A” tem distribuição normal, pois, ao nível de 5% de
significância, não foi rejeitada a hipótese nula de normalidade,
com o p – valor = 0,1858.
Imagem 3.3 – Intervalo de confiança da média
Unidade 3
Fonte: Elaborado pela autoria (2023).
BIOESTATÍSTICA 29
Hipóteses:
H0: μ=3,32
H1: μ≠3,32
Estatística de teste:
30 BIOESTATÍSTICA
funções para realizar os cálculos, a partir de um computador com
internet, denominado “BSDA” e escolher o servidor de instalação:
Imagem 3.5 – Cálculo do teste “z” em ambiente R
Unidade 3
Fonte: Elaborado pela autoria (2023).
Teste “t”
Em uma segunda situação, surge outra questão: e
se a variância não fosse conhecida? Qual seria a decisão e o
procedimento adotado? Conforme a imagem 3.1, aplica-se o teste
“t”. Nesse caso, a mudança, basicamente, reside na estatística
de teste e na distribuição de probabilidade a ser utilizada, a
distribuição de “t” de Student. A diferença entre a distribuição
normal padronizada e a distribuição de “t” de Student é que esta
última é diferente para tamanhos amostrais diferentes. A sua
forma é um pouco mais larga, refletindo uma maior variabilidade.
No entanto, à medida que o tamanho amostral aumenta a
distribuição “t” de Student se aproxima da normal. Os valores das
duas distribuições são idênticas para tamanhos amostrais maiores
que 2.000 observações, mas dependendo da referência adotada,
BIOESTATÍSTICA 31
tem sido considerado que, para amostras maiores de 30, parece
ser razoável adotar o teste “z” ao invés de “t”, pois é diferença é
muito pequena.
Tabela 3.1 – Distribuição “t” de Student: tabela
Unidade 3
32 BIOESTATÍSTICA
“t” reside no valor observado na casela comum à coluna (nível de
significância) e linha (graus de liberdade).
Hipóteses:
H0: μ=3,32;
Unidade 3
H1: μ≠3,32;
Estatística de teste:
BIOESTATÍSTICA 33
com os graus de liberdade (degrees of freedom) df=49, gera um
p-valor = 0,08487. Como foi encontrado um p-valor associado
ao teste de 0,08487, a hipótese nula a 5% de significância
não é rejeitada.
34 BIOESTATÍSTICA
Avançamos para a execução do teste de hipóteses,
em que discutimos o processo de coleta de
dados, a aplicação do teste estatístico escolhido
e a importância de utilizar programas estatísticos
para uma análise precisa. A execução cuidadosa
dos testes de hipóteses é essencial para minimizar
erros e para a obtenção de resultados confiáveis.
Por fim, abordamos a análise dos resultados
obtidos, enfatizando a interpretação dos valores-p,
a significância estatística e como esses elementos
contribuem para a aceitação ou rejeição das
hipóteses iniciais. Esta etapa final é decisiva para
a compreensão do estudo e para a contribuição de
novos conhecimentos à área de estudo. O domínio
dessas competências não apenas aprimora a
Unidade 3
qualidade da sua pesquisa, mas também fortalece
sua capacidade de tomar decisões baseadas em
evidências científicas. E então? Confidente em sua
compreensão sobre como preparar e interpretar
testes de hipóteses sobre uma amostra? Avante na
jornada do conhecimento em bioestatística.
BIOESTATÍSTICA 35
Teste para inferência sobre
duas ou mais amostras
Neste capítulo, dedicamo-nos a preparar testes de
hipóteses sobre duas ou mais amostras, um aspecto
da bioestatística que permite a comparação entre
OBJETIVO grupos distintos. Essa habilidade é indispensável
para analisar se diferenças observadas em
amostras são de fato significativas ou se podem
ser atribuídas ao acaso. Muitos profissionais e
pesquisadores enfrentam dificuldades ao aplicar
esses testes sem o conhecimento adequado, o
que pode levar a conclusões imprecisas e afetar
a integridade de suas pesquisas. Ao término
deste capítulo, você será capaz de entender como
Unidade 3
36 BIOESTATÍSTICA
caso. A situação apresentada adiante é considerada como a mais
frequente em pesquisas científicas.
Geralmente, o interesse é comparar o valor médio de
uma variável quantitativa entre as categorias de uma variável
qualitativa, como o nível de colesterol entre faixas de idade, entre
sexo, entre raças etc.
A seguir, exceto para a análise longitudinal, que não é o
escopo desta disciplina, evidenciaremos, para cada situação,
como interpretar e realizar o teste. Iremos iniciar com os testes
apresentados na Imagem 3.8 para o caso de duas variáveis
quantitativas. Em primeiro lugar, serão apresentados os testes
paramétricos para amostras independentes.
Imagem 3.8 – Suposições dos testes para duas amostras para variáveis qualitativas vs.
variáveis quantitativas
Unidade 3
Teste ‘‘t’’
Qualitativa:
possui mais de
2 níveis
Anova
Apresenta
(1 fator)
Qualitativa distribuição
vs. normal.
Quantitativa Amostras
pareadas: Teste ‘‘t’’
pareado
Qualitativa:
possui mais de
2 níveis
Análise
longitudinal*
BIOESTATÍSTICA 37
Teste “t” (amostras
independentes)
Para apresentar o teste “t” e a análise de variância, será
utilizado o experimento em que um estudo observacional em
mulheres que realizavam um tratamento especial de fertilização.
Ao iniciar o tratamento foram coletadas as idades das mulheres
e o tipo de infertilidade que cada paciente apresentava. Após o
tratamento, as mulheres foram acompanhadas durante dois
anos e, no final desse período, verificou-se quais pacientes que
tinham engravidado e quais não tinham. Suponha que o objetivo
do estudo seja analisar a influência da idade sobre a gravidez
e se existe alguma relação entre idade e o tipo de infertilidade.
Unidade 3
38 BIOESTATÍSTICA
Pode-se observar que a variável idade apresenta
distribuição normal. Dessa forma, para verificar o efeito da idade
sobre a gravidez, pode-se utilizar o teste “t”, porque a variável idade é
normalmente distribuída, a variável gravidez apresenta dois níveis
e o estudo é independente, pois somente observa-se uma medida
de cada paciente. Para realizar o teste “t”, primeiramente, deve ser
realizado um teste para verificar se as variâncias são iguais. Antes
de apresentar os testes e os resultados, segue o boxplot dessas
variáveis para se ter uma visão de como são os dados.
Nota-se com o boxplot que a idade mediana é
aparentemente diferente entre o grupo de pacientes que
conseguiu engravidar e o que não consegui. Pode-se observar
também que aparentemente as pacientes que possuíam o tipo
I de infertilidade, apresentam a idade mediana maior do que
Unidade 3
as pacientes que possuíam os tipos II e III de infertilidade. Para
utilizar o teste “t”, em primeiro lugar, será verificado o efeito da
idade sobre a gravidez.
Imagem 3.10 – Gráficos boxplot para as variáveis gravidez e infertilidade
BIOESTATÍSTICA 39
Hipóteses:
H0: As idades são estatisticamente iguais entre grupos (µG = µNG);
Hipóteses:
H0: = ;
H1: ≠ ;
40 BIOESTATÍSTICA
Estatística de teste:
Unidade 3
Fonte: Elaborado pela autoria (2023).
BIOESTATÍSTICA 41
Passemos às comparações entre as médias dos grupos
A e B, utilizando o intervalo de confiança da diferença ẋA - ẋB.
Considerando que a estimativa é calculada a partir de 8 graus de
liberdade e as variâncias populacionais são iguais temos que o
intervalo de confiança, baseado na Fórmula 7, será:
42 BIOESTATÍSTICA
que não conseguiram engravidar tinham em média 28,38 anos,
sendo essa diferente significativa ao nível de 5% de significância.
Unidade 3
As situações experimentais envolvem muitos fatores,
nem sempre totalmente controlados, além dos tratamentos
que desejamos testar, variações de idade de indivíduos, sexo,
temporalidade ou, ainda, instalações que, se não identificadas
e controladas, serão incorporadas na estimativa da variação
individual (variância). Basicamente, o propósito da análise de
variância é o domínio dos efeitos dessas fontes de variação, de
modo que o valor estimado como variância entre indivíduos
corresponda à sua própria natureza, sem a interferência de fatores
estranhos.
BIOESTATÍSTICA 43
É possível realizar um teste para verificar a
homogeneidade de variâncias, testando a igualdade entre a
maior e a menor variância dos níveis da variável qualitativa por
meio do teste “F”. No entanto, apesar de não ser o escopo desta
disciplina, um teste de homogeneidade de variâncias deve ser
empregado por ser mais apropriado para essa situação, em que
a hipótese nula do teste é que as variâncias são homogêneas,
como o teste de Bartlett.
44 BIOESTATÍSTICA
“F”, também denominada distribuição de probabilidade de Fisher.
Para informações mais detalhadas sobre os procedimentos
adotados na análise de variância, recomendamos o livro
de Zar (1999).
Total n-1 -
Unidade 3
Tratamentos k-1
Erro n-k
Sendo “k” o número de tratamentos (níveis do fator) da variável qualitativa; “n”, o tamanho
amostral total; “ri” número de repetições do nível “i”; “Ti” repetições do nível “i”; e “xi”,
cada elemento “i” amostral.
Fonte: Elaborado pela autoria (2023).
Estatística de teste:
BIOESTATÍSTICA 45
algum teste para comparações múltiplas de médias. Existem
diversos testes de comparações múltiplas, mas será utilizado,
nesse exemplo, o teste de Tukey, que é o mais utilizado entre os
diversos testes que estão disponíveis. O comando para executá-lo
é mostrado também a seguir.
Imagem 3.13 – Análise de variância e teste de comparações múltiplas de médias
(ambiente “R”)
Unidade 3
46 BIOESTATÍSTICA
pessoa antes e após da realização de uma determinada dieta.
A Imagem 3.15 mostra os comandos empregados, o banco de
dados e a verificação da distribuição normal de probabilidade.
Hipóteses:
Unidade 3
H1: µd = µANTES - µDEPOIS≠0;
BIOESTATÍSTICA 47
EXEMPLO: No combate a verminoses, na tentativa de
selecionar um antígeno identificador da Schistosomíase,
foram testados dois antígenos (A e B) em 11 pacientes,
um em cada braço, e, após 8 minutos, a área de
reação epidérmica foi medida em cm2 (Quadro 6).
Considerando as 11 observações da nova variável d,
teremos: dmédio=0,73 e sdiferenças=0,24.
Logo o intervalo de confiança da dmédio será:
Temos:
48 BIOESTATÍSTICA
Para realizar o teste “t” pareado no R utilizamos o comando
apresentado na Imagem 3.15. Nota-se que como o p-valor
é menor que 0,05, podemos rejeitar a hipótese nula,
ou seja, não existem evidências de que os pesos antes
e depois da dieta são iguais. Além disso, verifica-se que
a média das diferenças é de 7,19. Isso significa que em
média os indivíduos perdem 2,05 kg com a dieta aplicada
e que a 95% de confiança, as médias das diferenças estão
entre 4,38 e 10,00.
Imagem 3.14 – Teste “t” para amostras dependentes (pareadas)
Unidade 3
BIOESTATÍSTICA 49
E então? Gostou do que lhe mostramos? Aprendeu
mesmo tudinho? Agora, só para termos certeza
de que você realmente entendeu o tema de
RESUMINDO estudo, vamos recapitular os pontos-chave deste
capítulo. Inicialmente, exploramos o teste “t”
para amostras independentes, uma ferramenta
estatística fundamental para avaliar se existem
diferenças significativas entre as médias de dois
grupos distintos. Esse teste é essencial quando se
deseja comparar as medidas de dois tratamentos
ou condições diferentes em pesquisa.
Avançamos para a análise de variância, que se
aplica quando estamos diante da necessidade de
comparar as médias de três ou mais grupos. A
ANOVA nos permite determinar se pelo menos um
Unidade 3
50 BIOESTATÍSTICA
CRAWLEY, M. J. The R book. San Francisco: John Wiley & Sons,
REFERÊNCIAS
2009. 942 p.
SAMPAIO, I. B. Estatística aplicada à experimentação animal.
Belo Horizonte: FEPMZ, 2010. 264 p.
SHAHBABA, B. Biostatistics with R. New York: Springer,
2012. 352 p.
SIQUEIRA, A. L.; TIBÚRCIO, J. D. Estatística na área da saúde:
conceitos, metodologia, aplicações e prática computacional. Belo
Horizonte: Coopmed, 2011. 520 p.
PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. 2. ed.
São Paulo: Pioneira Thompson Learning, 2004. 522 p.
ZAR, J. H. Biostatistical analysis. New Jersey: Prentice-
Hall.1999. 718 p.
Unidade 3
BIOESTATÍSTICA 51