(Apostila) - Curso de Análise de Dados Com Epi Info 7
(Apostila) - Curso de Análise de Dados Com Epi Info 7
(Apostila) - Curso de Análise de Dados Com Epi Info 7
2
EMENTA
CARGA HORÁRIA
OBJETIVOS
3
O EPI INFO
O Epi Info 7 está disponível para download gratuito no site do Centers for Disease
Control and Prevention (CDC) neste link: http://www.cdc.gov/epiinfo.
4
SUAS FERRAMENTAS
Conforme visto na figura 1, o Epi Info 7 possui 6 ferramentas, são elas: create forms,
enter data, create maps, statcalc, analyze data classic e visual dashboard.
Vejamos abaixo a função de cada uma:
Ferramenta Função
Esta opção abrirá uma nova janela onde você poderá criar um
formulário para armazenar as informações da sua pesquisa.
Existem várias opções de campos de entrada de dados para
cada tipo de variável requerida.
Deve ser utilizada após você ter criado um formulário e já
houverem dados disponíveis para digitação. Aqui você pode
também consultar todos os registros já salvos e fazer
qualquer modificação.
Permite visualizar em um mapa dados de coordenadas
geográficas (latitude e longitude), bastante utilizado quando
os dados foram coletados em locais diferentes e se deseja
avaliar um padrão na distribuição geográfica dos casos de
uma doença.
Trata-se de uma calculadora epidemiológica que pode ser
utilizada a qualquer momento. É onde você pode fazer o
cálculo do tamanho de amostra de um estudo ou descobrir o
p-valor dos dados de uma tabela 2x2.
Esta é a ferramenta de análise estatística de dados mais
completa, onde você pode gerar tabelas e gráficos, calcular
médias e realizar os modelos de regressão linear, logística e
Cox, incluindo a curva de Kaplan-Meier.
Possui um visual mais intuitivo para análise de dados que a
ferramenta “classic” e, portanto, ótimo para os que estão
iniciando o uso do Epi Info 7, mas não gera a curva de Kaplan-
Meier e a regressão de Cox.
Na tela inicial do Epi Info 7 (figura 1) existe este ícone localizado no canto
superior direito. Ao clicar ali você encontrará outras informações sobre o
aplicativo e também o item options onde você pode mudar o idioma para português
e fazer outros ajustes.
O CDC disponibiliza em inglês um manual completo do Epi Info 7 com 369 páginas
detalhando todas as suas funcionalidades. Ele pode ser encontrado neste link:
https://www.cdc.gov/epiinfo/support/userguide.html
5
CREATE FORMS
INICIANDO UM NOVO PROJETO
O Epi Info 7 criará no destino determinado no campo 2 uma pasta com dois
arquivos, um de extensão PRJ (formulário) e outro MDB (banco de dados) que
devem permanecer sempre na mesma pasta.
6
CRIANDO UM FORMULÁRIO
7
UTILIZANDO O CHECK CODE
COMANDO 1: Calcular tempo de internação (em dias) com base na data da saída e
data da internação:
8
4. Onde está //add code here iremos digitar:
TempodeInternacao=DatadaSaida-DatadaInternacao.
5. Dê um enter e escreva GOTO Diabetes para pular o campo que será
preenchido automaticamente pelo cálculo do passo 4.
Caso queira que o intervalo de tempo calculado seja mostrado em anos, a fórmula
deverá ser acrescida de /365.25, ou seja: TempodeInternacao=(DatadaSaida-
DatadaInternacao)/365.25.
Figura 7. Comando para condicionar a resposta de uma variável de acordo com a resposta de outra variável.
Se a fórmula for digitada com algum erro isso será mostrado no campo Messages
ao se clicar em Validate Check Code. Não se esqueça de salvar antes de sair.
9
EXERCÍCIOS DE FIXAÇÃO n.º 1
a) Create Forms
b) Statcalc
c) Classic
d) Visual Dashboard
a) XLS e MDB
b) MDB e PRJ
c) PRJ e XLS
d) PDF e PPT
a) Yes/No
b) Text
c) Checkbox
d) Legal Values
10
VISUAL DASHBOARD
IMPORTANDO BANCO DE DADOS EM EXCEL
11
Morningness–eveningness
Questionnaire (MEQ) que avalia o
cronótipo
cronotipo Interpretação da variável “scoremeq” Categórica 1 = Matutino
2 = Intermediário
3 = Vespertino
scoreep Escore obtido da aplicação daEscala de Discreta Numérica
Sonolência de Epworth (ESE) que
avalia SDE
sde Interpretação da variável “scoreep” Categórica 0 = Não
1 = Sim
Acesse: Epi Info 7 → Visual Dashboard → Set a data source now (figura 9)
Figura 10. Tela de seleção do arquivo a ser importado para o Epi Info 7.
12
Deixe a caixa de seleção marcada em First row contains header information caso
em sua planilha a primeira linha contenha o nome das variáveis do seu banco de
dados.
Figura 11. Tela inicial do Visual Dashboard após importação de banco de dados.
13
Figura 12. Tela de opções de análise de dados no Visual Dashboard do Epi Info 7.
A tabela de frequência da variável desfecho sde (figura 13) nos informa que a
prevalência de sonolência diurna excessiva foi igual a 56,27% e esteve presente em
637 estudantes. O Epi Info 7 lista suas variáveis por ordem alfabética, por isso
muito provavelmente elas não estarão na mesma ordem que foram dispostas na
planilha do Excel.
14
informam, respectivamente, os valores inferiores e superiores do intervalo de
confiança a 95% (IC95%) do percentual da mesma linha.
15
Figura 15. Cálculo de medidas de tendência central e dispersão.
Observamos que o escore médio da ESE foi maior entre os alunos de medicina do
que entre os alunos de outros cursos da área da saúde, embora, ainda não
saibamos se essa diferença é estatisticamente significante ou não porque fizemos
apenas a estatística descritiva desses dados.
16
(respostas = 1) devem sempre estar posicionadas na coluna à esquerda e na
primeira linha, respectivamente (figura 17).
Figura 18. Análise estatística de variável categórica com diferença estatística entre os grupos.
O “Risk Ratio” foi igual a 1,33 com IC95%=1,07-1,65, o que significa que a prevalência
de SDE foi 33% maior entre os estudantes que utilizaram celular momentos antes
de dormir quando comparado com aqueles estudantes que não tem esse hábito. A
captação do brilho da tela do smartphone inibe a secreção de melatonina pela
glândula pineal, causando sonolência diurna excessiva.
17
Figura 19. Algoritmo para interpretação de análise estatística de variáveis categóricas no Visual Dashboard do Epi Info 7.
ANÁLISE ESTATÍSTICA DE VARIÁVEIS CONTÍNUAS/DISCRETAS
Figura 20. Comparação de duas médias pelo test t no Visual Dashboard do Epi Info 7.
Na figura 20 comparamos os escores médios da ESE entre os estudantes de
medicina e de outros cursos da área da saúde por meio de um test t para amostras
independentes. Já havíamos visto essas médias na figura 16, mas agora
realizamos um teste de hipóteses, cujo p-valor = 0,03 nos permite rejeitar a
hipótese nula que afirma “as médias são semelhantes estatisticamente”.
USANDO FILTROS
20
3. Em Value digite o número 1;
4. Clique em Add Filter.
Para remover o filtro geral, clique novamente no ícone do filtro, no campo Data
Filters clique em cima de The value of [medicina] is equal to 1 e depois clique em
Remove Selected.
Sem nenhum filtro geral, gere uma tabela de frequência da variável cronotipo.
Lembre-se que 1 significa o cronótipo matutino, 2 intermediário e 3 vespertino.
Siga os passos abaixo para utilizar a opção de filtro específico:
A tabela agora nos mostra que entre os estudantes de medicina e dos demais
cursos da área da saúde o cronótipo mais prevalente (57,90%; n=590) foi o
intermediário. É possível que esses estudantes estejam migrando de um cronótipo
21
matutino (pessoas que dormem mais cedo) para um cronótipo vespertino
(pessoas que dormem mais tarde), mas apenas um estudo de coorte poderia
observar essa mudança ao longo do tempo.
22
2) O teste Qui-quadrado de Mantel-Haenszel é utilizado para avaliar a
associação entre:
a) Exposure
b) Weight
c) Stratify by
d) Cross-tabulate by
GABARITO
23
ANALYZE DATA CLASSIC
IMPORTANDO BANCO DE DADOS EM EXCEL
Acesse: Epi Info 7 → Classic → Read → Recent Data Sources → SDE [sde.xls]
1 2
24
REGRESSÃO LOGÍSTICA
O objetivo de uma análise multivariada é, como o próprio nome sugere, avaliar em
conjunto o efeito de múltiplas variáveis sobre um mesmo desfecho. Esse método é
útil para controlar o viés de confundimento de um estudo.
Acesse: Epi Info 7 → Classic → Advanced Statistics → Logistic Regression (figura 24)
Figura 24. Tela de seleção das variáveis para ajuste de análise multivariada através de regressão logística.
25
Figura 25. Output do Analyze Data Classic de um modelo de regressão logística.
Ao consultarmos o dicionário das variáveis deste banco de dados (p. 11) vamos
perceber que sexo = 1 é masculino e sexo = 0 é feminino. Logo, a prevalência de sde
foi 29% menor (1-0,71x100) entre os homens do que entre as mulheres.
26
REGRESSÃO DE COX
O modelo de riscos proporcionais de Cox é uma regressão multivariada aplicada
na análise de sobrevida, inferindo risco relativo de várias exposições e um
desfecho sendo o intervalo de tempo até a ocorrência de um evento.
Este banco de dados (figura 26) foi construído para avaliar a sobrevida em 90 dias
de pacientes internados em UTI adulto e neonatal de um hospital de Cuiabá entre
os anos 2014-2016 e fatores preditores para o óbito.
27
Acesse: Epi Info 7 → Classic → Advanced Statistics → Cox Proportional Hazards
(figura 27)
28
internados em UTI adulto tiveram risco de óbito 149% maior (2,49-1x100) do que os
pacientes de UTI neonatal. Uso de suporte ventilatório aumentou o risco de óbito
em 222% (3,22-1x100).
CURVA DE KAPLAN-MEIER
Acesse: Epi Info 7 → Classic → Advanced Statistics → Kaplan-Meier Survival (figura
29)
Figura 29. Tela de configuração para estimar as funções de sobrevida pelo método de Kaplan-Meier.
29
O gráfico (figura 30) apresenta a curva de Kaplan-Meier, que estima a
probabilidade de sobreviver ao longo do tempo de seguimento deste grupo de
pacientes. Por exemplo, a linha laranja nos informa que após 20 dias de internação
a probabilidade de sobrevida entre pacientes da UTI neonatal foi > 90%, enquanto
que na UTI adulto < 75%.
Para termos evidência mais concreta que a sobrevida entre os grupos seja
estatisticamente diferente, o Epi Info 7 realiza o teste de Log-rank, cujo valor de
p<0,05 nos permite rejeitar a hipótese nula de que “as funções de sobrevida são
semelhantes entre os grupos”. Sendo assim, podemos afirmar que pacientes de
UTI adulto apresentaram sobrevida mais baixa que pacientes de UTI neonatal.
a) Data
b) Variables
c) Statistics
d) Advanced Statistics
a) Contínua
b) Dicotômica
c) Dummy
d) Discreta
a) Make Dummy
b) Other Variables
c) Outcome Variables
d) Confidence Limits
30
4) Você realizou uma pesquisa para avaliar os fatores associados ao óbito em
pacientes internados em uma UTI e analisou os dados por meio de uma
regressão logística. Marque a alternativa que apresenta a interpretação
correta dos dados abaixo:
GABARITO
31
AVALIAÇÃO FINAL
Regras:
32